山露主题乐园广告中的瓶数挑战

观看广告,找出隐藏的山露瓶子,有机会赢取一百万美元大奖。

在山露的超级碗广告中,挑战观众找出广告中出现的瓶子数量,首位正确回答的观众将有机会赢得一百万美元。为了帮助观众更好地完成这个挑战,利用计算机视觉技术训练了一个对象检测模型来识别广告中出现的山露瓶子。

首先,需要准备一个包含广告图像的数据集。可以通过将广告视频文件分割成单独的图像帧来实现这一点,以便对图像进行标注和模型训练。创建了一个数据集,并将山露的视频放入Roboflow中,选择了每秒三帧的采样率,从而从大约30秒的超级碗广告中生成了92张图像。

选择每秒三帧的采样率对于广告来说非常有帮助,因为它意味着可以更仔细地查看所有可能出现山露瓶子的地方。一旦有了这些图像,就需要在每个场景中标注所有能找到的瓶子。虽然这与手动计数所有瓶子非常相似,但请记住,用自己的眼睛可能无法完美地找到所有瓶子。因此,希望通过教授计算机视觉模型瓶子的外观,然后让同一个模型为找到瓶子,可能会发现可能错过的一些瓶子。

在标注了所有图像中的山露瓶子之后,有869个标注跨越91张图像。已经开源了这个最终的山露瓶子图像数据集:。

一旦收集并标注了图像,就可以训练一个模型来为找到瓶子。然而,在训练之前,可以使用图像增强来增加训练数据集的大小。通过应用随机扭曲,如亮度变化、透视变化、翻转等,可以增加训练数据集的体积和多样性,以便模型有更多的例子来学习。

增强图像已经进行了增亮、剪切、翻转、旋转等操作,以增加数据集的大小和多样性。然后使用了Roboflow Train,它提供了一键训练模型的选项。至关重要的是,在开始模型训练时,可以从之前的模型检查点开始。这种迁移学习将加速模型训练并提高模型的准确性。对于这个数据集,从COCO数据集(一个“上下文中的常见对象”数据集)开始训练将为模型提供一个健康的起点。

模型训练结果显示,平均精度达到了89.5%。使用模型,一旦模型完成训练,就有一个API可以调用,以在原始视频上执行检测。通过一些shell脚本,可以逐帧传递原始广告视频,并用存在的边界框重建结果。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485