在本文中,将介绍如何使用Vertex AI平台来标注计算机视觉数据集。这包括创建数据集、上传图片、以及在图片中绘制边界框等步骤。Vertex AI提供了一套工具,涵盖了从自然语言处理到计算机视觉,再到构建基于文本的生成式搜索体验的机器学习领域。
在开始标注之前,首先需要在Vertex AI中创建一个数据集。数据集是用于存储所有用于训练模型的数据的地方。首先,打开Google Cloud Platform中的Vertex AI。如果之前没有使用过Vertex AI,系统会提示启用该服务。启用后,通过搜索栏导航到Vertex AI的仪表板。接下来,点击侧边栏中的“数据集”链接,然后点击“创建”按钮来创建一个新的数据集。为项目提供一个名称,并选择与项目相关的模型类型。在本指南中,将为对象检测模型标注数据。
有三种方法可以将图片上传到Vertex AI:
在本指南中,将直接从计算机上传图片。如果需要图片,可以访问Roboflow Universe,这是一个用于训练计算机视觉模型的公共数据社区。可以在Universe中找到超过1.5亿张图片,涵盖20万个数据集。此外,还可以使用Roboflow Collect在边缘收集数据。Roboflow Collect提供了一个智能的数据收集解决方案,可以:
选择“从计算机上传图片”,点击“选择文件”按钮并选择想要上传的文件。可以一次性上传多达500张图片。上传确认后,文件将上传到Vertex AI数据集中。这个过程所需的时间将根据上传的图片数量而有所不同。保持页面打开,可以在等待上传完成的同时切换到另一个标签页做其他事情。当数据集准备好使用时,将收到GCP的电子邮件通知。
在项目页面的侧边栏点击“添加新标签”按钮,添加用于标注的新标签。在本指南中,将添加“太阳能板”以反映太阳能电池板。添加完所有标签后,点击图片列表中的一张图片开始标注。要绘制边界框,请点击图片中的一个点,然后拖动光标覆盖想要标注的对象。
# 绘制边界框的步骤
1. 点击图片中的一个点。
2. 拖动光标覆盖对象。
3. 选择与边界框关联的类别。
一旦为图片中的所有感兴趣对象绘制了边界框,按下键盘上的右箭头键导航到下一张图片。要导航到上一张图片,按左箭头键。如果需要更快的标注图片的方法,可以查看Roboflow Annotate。Roboflow Annotate提供了标签助手功能,可以使用这些功能来加速标注过程。有了标签助手,可以通过点击对象而不是手动绘制框或多边形来绘制边界框或多边形标注。
Vertex AI具有协作标注功能,允许邀请他人协助标注。要使用此功能,请返回到图片列表并点击“创建标注任务”按钮。按照弹出窗口中的说明创建一个标注任务。
在本指南中,已经介绍了如何使用Vertex AI标注计算机视觉数据集。创建了Vertex AI中的数据集,上传了图片,并在图片中绘制了边界框。标注后的数据集可以用来在Vertex AI上训练对象检测模型。要了解更多关于在Vertex AI上训练自定义模型的信息,请查看Vertex AI训练指南。还可以将数据导出以在另一个应用程序中进行训练。点击Vertex AI左上角的三个点,然后选择“导出标注集”选项。
# 导出数据集的步骤
1. 选择Google Cloud Storage目的地以保存数据集。
2. 点击“导出”以导出数据集。
3. 导航到Google Cloud Storage仪表板并选择导出数据的存储资源。
4. 选择要导出的文件夹,然后点击“下载”按钮以导出数据。