在开发车牌识别模型之前,首先需要收集大量的车牌图片数据。这些数据可以从Google图片和中佛罗里达州的公园中获取。数据集和模型可以用于多种场景,例如警察工作、收费道路、银行免下车服务和快餐免下车服务。例如,像Chick-fil-A这样的快餐免下车服务可能会记录车牌号码,以确定将订单交付给哪位顾客。
对于数据集中的第一批迭代,只检测一个对象——车牌,因此标注过程快速且简单。未来,如果需要用于警察工作、收费道路或银行免下车服务等场景,可以对数据集中的其他对象进行标注,例如检测标签和州。此外,将模型与OCRAPI结合使用,可以提取以JSON格式返回的文本结果,这对于上述任何场景都非常有用。
在数据集的v4版本中,使用了以下预处理和增强技术:
自动定向(Auto-orient),以避免计算机视觉中最常见的错误之一。没有为了速度优化而关闭此选项,并且知道这个模型可能在不同的设备上运行,这些设备上的图像可能有不同的EXIF方向。
调整大小(Resize),以确保数据集中的所有图像大小相同。
使用的增强技术包括:
- 裁剪(Crop),以提高在驾驶过程中可能遇到的遮挡车牌的检测能力。
- 旋转(Rotation),用于事故和难以放置摄像头的位置。
- 亮度调整(Brightness),用于摄像头设置和照明变化。
- 模糊(Blur),(5px)用于移动摄像头(如警车)和汽车。
- 噪声(Noise),以防止过拟合。
最新模型使用快速训练选项进行训练,该选项适用于学生和工程专业人员进行概念验证项目。模型的精度为95.7%,召回率为90.4%,平均精度均值(mAP)为94.9%。
精度(Precision)是衡量“当模型进行猜测时,它猜测正确的概率”。召回率(Recall)是衡量“模型是否每次都能猜测到应该猜测的情况”。平均精度均值(mAP)通过结合精度和召回率,让一目了然地了解模型的整体性能。
部署与使用
在示例网页应用中,测试图像的推断是在至少85%的置信度下进行的。可以在这里尝试!在浏览器中使用模型页面检测车牌。
在将数据集和模型发布到Roboflow Universe之前,必须确保遵守以下准则:
- 原创性 - 大部分在Universe上展示的项目应该是用户自己的工作或创作。即使使用了另一个数据集中的一些照片,也确保只使用与想要检测的内容相关的美国车牌照片。然后当然会添加更多自己的数据,包括来自中佛罗里达州公园的汽车和车牌照片。
- 非重复性 - 没有复制或分叉这个项目以使其成为重复项。
- 良好的工作空间名称 - 工作空间名称“野外物体”描述了发布的项目。默认的新工作空间名称-xxxx将不具备描述性或对用户有帮助。
- 良好的项目名称 - 类似地,项目名称对一般受众来说是有意义的。它是描述性的,并且不包含“数据集”或“项目”(Roboflow在某些地方会自动添加这些词)。项目名称在URL中很重要,对SEO很重要,并且用于API访问项目,因此拥有一个简单且相关的名字非常重要。
- 良好的README - 所有在Universe上突出显示的项目都应该有一个良好的README,描述项目是什么,它可以用于什么,包含相关链接到更多信息或相关的开源项目、博客文章、视频、行业页面等。可视化模型可以检测到的照片是一个非常好的方法!这对于用户和SEO目的都很重要。
- 有用的标签和本体论 - 考虑模型将如何被最终用户使用。希望模型以希望的方式预测这些对象吗?类别是否合理?有时用户可能需要帮助思考这个问题。
- 生成(原始)版本 - 用户只能下载数据集的生成版本。至少,每个在Universe上展示的项目必须包含一个没有增强的生成版本(可能只有“自动定向”预处理选项),否则将无法使用。如果需要,也可以包括额外的版本,但每个突出显示的项目都应该有一个“原始”版本。
- 训练好的模型 - 最好具有高性能的mAP。Universe的愿景是成为数百个特定用例的高质量“现成”计算机视觉API的来源。如果一个项目有一个训练好的模型,它可以立即被最终用户使用,而无需经历整个训练过程。获得一个好的训练模型通常意味着尝试预处理和增强步骤。
- 许可证 - 所有公共项目必须选择一个许可证;较旧的项目(或从私有转换为公共的项目可能缺少一个)。对于Universe的用户来说,知道他们是否能够在他们的工作中合法使用数据非常重要。
- 健康检查 - 健康检查必须在核心应用程序中生成,然后才会出现在Universe中。如果项目自健康检查首次生成以来已经进行了大量修改,请在底部点击“重新生成”以更新它。