在处理大规模数据集时,找到合适的数据进行标注并以此提升模型性能至关重要。使用主动学习将现实世界的数据重新引入训练流程的团队需要一种方法来寻找并标注那些能够提升模型性能的数据。最近推出了“分配”标签页,以帮助更容易地找到应该标注以提升模型性能的特定图像。
将特定类型的数据分配给标注,可以让通过改善数据集中的数据来集中精力提升模型性能。此外,对于专门的标注团队来说,这也有助于提高效率,因为对相似图像的标注使得数据更加熟悉,并且专门化于具有独特技能或对被标注数据有特定知识的人。
左侧导航栏有新的“分配”视图供在账户中访问。一旦打开了“分配”标签页,将能够看到任何尚未被标注或分配给标注者图像。
从这个视图中,可以点击图像来创建作业,并将这些作业分配给项目中的用户。根据图像库的大小,可以通过增加视图中的图像数量或切换到下一组图像来定位需要分配的图像。
如果只对分配具有独特属性的图像感兴趣,可以使用基于文本的搜索来定位具有这些属性的图像。使用搜索栏就像使用谷歌一样。重要的是,这是对非结构化图像数据的语义搜索——不需要事先对它们进行标注或分类,搜索将通过查看它们的像素数据自动索引图像内容。让看一些例子。
可以寻找具有特定组件的图像,例如红色的安全帽或橙色的安全背心。也可以根据场景中的对象或活动来寻找图像,如电话杆或浇筑混凝土。图像搜索使用先进的自然语言处理和最新的机器学习模型来对图像库进行搜索。尝试使用详细的搜索词,如“多云的夜间城市街道,有很多汽车”,而不是简单的关键词。
// 假设这是一段用于图像搜索的代码示例
function searchImages(query) {
// 使用先进的自然语言处理技术来解析查询
let parsedQuery = parseQuery(query);
// 在图像库中搜索匹配的图像
let matchingImages = searchImageLibrary(parsedQuery);
// 返回搜索结果
return matchingImages;
}