在这篇文章中,将探讨2021年数据科学家应该研究的十大开源数据集,这些数据集在机器学习的对象检测领域具有重要价值。这些数据集不仅为提供了丰富的学习资源,还帮助更好地理解和应用机器学习模型。
理解一个模型本身并不困难,难的是如何知道数据科学家应该在何处应用它,因为不同的数据集有不同的应用场景。因此,必须在不同类型的数据和数据集上遵循端到端的机器学习方法。使用的多样化数据集越多,对模型设计的理解就越深入。这也是一个绝佳的方式,让持续自挑战,探索全球范围内收集的有趣信息。
计算机视觉中的一个挑战性课题——对象检测,帮助组织通过数字图片作为输入来理解和识别实时对象。在这里,发布了完整的开源数据集,可以用于对象检测项目。
还准备了一些优秀的资源,供学习和获取更多数据集进行研究。(列表没有特定的顺序)
CIFAR-10是一个包含60,000张彩色图像的综合数据集,分为10个不同的类别。数据集包含10,000张测试图像和50,000张训练图像,分为五个训练组。
了解更多关于数据集的信息,请点击。这里是的链接。
LISA或智能与安全汽车实验室交通标志数据集是一组包含美国交通标志的注释帧和视频。数据集包括从不同相机收集的图像,47种美国标志类型,以及在6610个边界上的7855个注释。LISA分为两个阶段发布,一个是仅包含照片的阶段,另一个是包含视频和照片的阶段。
了解更多关于数据集的信息,请点击。这里是的链接。
Open Images是一个大约有900万张图片的数据集,这些图片都带有图像级别的标签、对象边界框、对象分割掩码、视觉关系和本地化叙述。
数据集包括在190万张图像上的600种对象类型的1600万个边界框,使其成为当前最大的具有对象位置注释的数据集。这些框基本上由专家注释者手动勾勒,以确保效率和一致性。
Open Images还提供视觉关系注释,指示相关关系中的成对对象、对象属性和人类活动。
了解更多关于数据集的信息,请点击。这里有一个包含Python脚本和Jupyter笔记本的,用于构建基于Google Open Images数据集的自定义子集的卷积神经网络机器学习分类器。
MS COCO是一个大规模的对象检测数据集,它涉及场景识别中的三个核心分析问题。检测非标志性场景(或非规范视角)的对象,对象内部的上下文推理,以及对象的准确2D定位。
数据集具有特定的特点,如对象分割、上下文中的识别、超像素材质分割、150万对象实例、80个对象类别等。
了解更多关于数据集的信息,请点击。这里是的教程链接,用于GluonCV。
Exclusively Dark (ExDARK)是一个独特的低光照图像数据集,它提供了一组基准图像,用于基准测试低光照分析工作,并使不同领域能够集中关注低光照条件,例如图像理解、图像增强、对象检测等。
数据集结合了从极低光照条件到黄昏(即十种不同状态)的7,363张低光照照片,以及在图像分类级别和本地目标边界框上注释的12个对象类别(与PASCAL VOC相关)。
了解更多关于数据集的信息,请点击。这里有一个使用TensorFlow的Object Detection API实现Faster R-CNN模型的项目链接,用于识别来自ExDark数据集的。
20BN-SOMETHING-SOMETHING是一个大规模的数据集。该数据集汇集了标记的视频剪辑,显示人们执行预定义的基本动作,涉及许多对象。20BN-SOMETHING-SOMETHING允许机器学习模式展示对日常物质世界中必要动作的细粒度知识。
了解更多关于数据集的信息,请点击。这里是的教程链接,用于GluonCV。
ImageNet是一个根据WordNet层次结构分类的图像数据集。在这个数据集中,系统的每个链接都由成百上千的图片表示。
数据集产生于计算机视觉研究中的两个基本需求。第一是建立计算机视觉的北极星难度的需求。第二,有一个显著的需求,需要更多的额外数据来促进更通用的机器学习技术。
了解更多关于数据集的信息,请点击。这里是的链接。
BDD100K是一个独立的多任务学习驾驶数据集。数据集包括十个任务和100K视频,以评估图像识别算法在自动驾驶中的进展。
这个数据集上的功能包括多对象分割跟踪、图像标记、道路对象检测、语义分割、车道检测、可行驶区域分割、实例分割、多对象检测跟踪、领域适应和模仿训练。
了解更多关于数据集的信息,请点击。这里是通过收集来攻击任务的链接,提出了一个FCN+LSTM模型,并使用TensorFlow实现。
DOTA是一个大规模的航空视觉对象检测数据集。它可以用于开发和评估航空照片中的对象检测器。这些图片是从各种传感器和阶段收集的。每张图片的尺寸从800×800到20,000×20,000像素不等,包括各种规模、方向和模式的对象。
专家在航空图像解释中注释DOTA插图。
了解更多关于数据集的信息,请点击。这里是的链接。
COVID相关的数据在计算机视觉类别中也占有一席之地。为此目的,一个标准有用的数据集是MaskedFace-Net数据集。
这个精心注释的数据集包含近60K张图像,每张图像都是正确和错误佩戴口罩的人。即使是错误佩戴的面部也被分类为暴露的鼻子、下巴等类型。这个独特的全球资源展示了真实的面孔,并提供了口罩佩戴方式的进一步分类。
了解更多关于数据集的信息,请点击。
今天,看到了2021年迄今为止有趣的对象检测数据集。然而,这些数据集证明了研究人员和数据科学家在所有领域都付出了努力,收集和维护用户数据,以促进AI分析的发展。