计算机视觉模型在品牌识别中的应用

在数字时代,视频内容的海洋为品牌提供了宝贵的机遇。对于品牌而言,了解其在何时何地被提及,意味着能够识别其在市场中的声音份额,向可能高度相关的观众进行市场营销,等等。旧金山的软件工程师查尔斯·赫林注意到了这一点。查尔斯着手构建一个计算机视觉模型,使工具品牌能够识别自己或竞争对手何时获得免费曝光。对于一些公司来说,电动工具代表了数千万的年销售额。增加它们的曝光度、市场份额,并最终从观看自己动手(DIY)YouTube视频的观众中转化,代表着一个有利可图的机会。

查尔斯敏锐地指出,许多YouTube创为一些品牌提供了数小时的免费曝光时间,因为工具在镜头中被积极使用,甚至只是闲置在工作台上。提供对这一未知渠道的洞察,使品牌能够意识到自己的在线存在,同时为YouTube创开辟了赞助机会。在YouTube视频中获得免费曝光的各种工具。查尔斯着手创建一个可以在浏览器中运行的计算机视觉模型,以识别工具及其相应的品牌。最初,查尔斯在Google Cloud Platform的基础设施中管理他所有的源数据和训练。他会上传未标记的图片,标记工具,并使用Google AutoML来训练模型。

然而,查尔斯发现了一些关键问题。首先,很难识别他图片的数据集级别的统计信息。他的类别有多具代表性?他应该合并或删除一些类别标签吗?每个帧中的对象是否分布在图片的不同位置?其次,查尔斯的数据集相当有限,但电动工具视频可能在更广泛的条件下出现工具:钻头在不同角度旋转,不同的照明条件,工具与摄像机的距离不同,等等。

查尔斯发现Roboflow是他计算机视觉训练数据的选择系统。Roboflow Pro支持Google Cloud Vision AutoML格式的CSV和注释,因此上传数据就像放下他的CSV图片进行检查一样简单。查尔斯的训练数据样本。此外,Roboflow的Dataset Health Check使查尔斯能够轻松跟踪他的类别代表性,并且本体管理使他能够轻松合并类别,删除代表性不足的标签等。为了增加数据集的大小,查尔斯利用Roboflow增强功能翻转、调整亮度,并随机改变输出图像以进行训练。训练数据集的大小增加了一倍多,使模型能够学习更广泛的YouTube视频条件。

查尔斯利用Roboflow的Google Cloud AutoML Cloud Vision CSV导出功能,无缝地继续训练。在Roboflow之前,查尔斯看到的Google Cloud Vision mAP是0.817。使用Roboflow之后,查尔斯的mAP提高到了0.885,增长了8%。查尔斯在使用Roboflow前后的AutoML mAP。查尔斯看到了8%的增长。

由于将Roboflow Pro纳入查尔斯的工作流程,他看到了更高质量的模型,并且花在数据集管理上的时间更少,而更多地花在他的领域问题上,包括向大型电动工具零售商销售他的服务。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485