使用AWS Rekognition自定义标签标记计算机视觉数据集

AWS Rekognition提供了一系列的解决方案,包括即插即用的模型用于特定目的,以及一个选项来训练自定义模型。通过AWS Rekognition自定义标签产品,可以使用自定义数据集来训练模型。本指南将指导如何使用AWS Rekognition自定义标签来标记计算机视觉数据集。将创建一个S3存储桶来存储数据,将数据导入AWS Rekognition,然后进行数据标记。将标记一个用于太阳能板检测模型的对象检测数据集。

开始之前

要按照本指南操作,需要一个AWS账户。如果对在AWS Rekognition自定义标签上训练模型感兴趣,请查看AWS Rekognition自定义标签训练指南。自定义训练指南还介绍了如何在Roboflow中可选地标记数据并导入到自定义标签中。

步骤1:创建S3存储桶并上传数据

虽然可以直接将图像上传到自定义标签中,但一次可以上传的图像数量有限。不会直接上传图像,而是将图像数据集上传到S3存储桶中,然后将其连接到自定义标签。首先,在AWS搜索栏中搜索“S3”并创建一个存储桶。选择一个名称和存储桶应该部署的区域。

创建存储桶后,点击“上传”按钮上传数据:通过拖放文件或文件夹到S3中。待上传的文件列表将出现在“文件和文件夹”部分。当准备好上传数据时,点击“上传”按钮。将出现一个进度条,显示上传作业状态。在数据上传时请不要关闭页面。一旦图像上传完成,请继续进行下一步。

步骤2:创建AWS Rekognition项目

打开AWS控制台,搜索“Rekognition”并打开Amazon Rekognition。接下来,在Rekognition侧边栏中导航到“使用自定义标签”并点击“项目”。在这里,可以创建一个项目。点击“创建项目”来创建一个项目。接下来,为项目选择一个名称,然后点击“创建项目”。项目将在自定义标签中的项目列表和自定义标签仪表板的侧边栏中可用。

步骤3:将数据连接到Rekognition项目

AWS Rekognition自定义标签中打开项目。将出现一个面板,显示需要完成的四个步骤来训练和评估模型:创建数据集、标记图像、训练模型、检查性能指标。对于本指南,将专注于创建数据集和标记图像。要创建数据集,请点击“创建数据集”按钮。在数据集反应页面上,选择“从单个数据集开始”选项。

选择“从S3存储桶导入图像”选项。在S3 URI选项中,粘贴在S3存储桶中保存图像的文件夹的URI。在这个例子中,URI是s3://solar-panels-data/。粘贴完S3 URI后,点击按钮上传数据。数据将可供AWS Rekognition自定义标签使用。当图像开始导入时,将出现一个通知栏。当图像准备好后,将被带到自定义标签项目首页,可以开始标记图像。

步骤4:标记图像

一旦图像上传完成,它们将在自定义标签仪表板中可用。要开始标记,请点击页面顶部的“开始标记”按钮。接下来,点击“添加标签”按钮以创建用于注释的标签。对于这个项目,将创建一个标签:“solar-panel”。为项目创建所需的标签。添加完标签后,点击“保存”。

要开始标记对象检测数据,请点击想要标记的图像,然后点击“绘制边界框”按钮。要标记一个图像,按键盘上的“b”键。在页面上点击想要框开始的地方,然后拖动以绘制一个框。绘制完框后,系统将要求为标签选择一个类别。

AWS自定义标签提供了一些标记图像的实用工具,包括:亮度调整、对比度调整、放大和缩小、撤销和重做标签。如果选择了多个图像进行标记,可以按shift键和向前或向后的箭头键来分别注释下一个和上一个图像。要退出注释会话,请点击左上角的“完成”按钮,或按shift键和“d”键。

在本指南中,已经介绍了如何使用AWS Rekognition自定义标签来标记计算机视觉数据集。一旦标记了数据,可以从数据集首页训练模型:要了解如何在AWS Rekognition自定义标签中训练模型,请按照在AWS Rekognition中训练模型的指南操作。

Roboflow维护了一个名为supervision的开源包,其中包含用于计算机视觉模型的工具。可以使用supervision来根据一系列选项(类别、边界框区域、置信度等)过滤预测,绘制图像上的边界框等。要了解更多关于supervision的信息,请查看supervision文档。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485