在计算机视觉领域,重复编写相同的代码是一件令人疲惫的事情。为了解决这一问题,决定开发一个名为“监控工具箱”的开源工具包。无论是想要处理视频、在帧上绘制检测框,还是将标签从一个格式转换为另一个格式,监控工具箱都能为提供全面的解决方案。
选择在MIT许可下发布监控工具箱,这意味着可以在任何公共或私有的项目中自由使用这个库。开始使用监控工具箱非常简单,只需要运行以下命令:
pip install supervision
如果在使用过程中遇到任何问题,可以查阅文档,或者在GitHub问答区提出问题。
示例
一个文档齐全的库是必不可少的,但没有什么比现成的示例更好了。因此,整理了一些项目,帮助熟悉监控工具箱的API。
学习如何使用监控工具箱、YOLOv8和ByteTrack来统计穿越线条的对象数量
使用YOLOv5 / YOLOv8 / Detectron2在多边形区域内检测和统计对象数量
利用监控工具箱进行实时视频分析
路线图
在开始开发监控工具箱库时,决定公开构建它。希望与社区一起创建,而不是只构建一个满足自己团队需求的工具包。以下是一些令人兴奋但尚未实现的功能,可以期待在接下来的几个月内交付:
支持实例分割模型 - 已经做了很多工作,使监控工具箱和对象检测模型的集成尽可能无缝。在不久的将来,希望确保所有高级监控工具箱功能,如LineZoneCounter或PolygonZoneCounter,也能与实例分割模型一样良好地工作。
多边形区域计时器 - 这个功能将告诉区域内有多少对象,以及它们在那里待了多久。
通用标签转换器 - 在不同格式之间转换注释标签既耗时又可能引起许多难以修复的错误。目标是为节省麻烦,并提供现成的工具。
为监控工具箱做出贡献
监控工具箱是一个开源项目,希望与社区成员一起构建它。如果刚开始编程或计算机视觉之旅,不要气馁;贡献并不一定意味着提交数十个拉取请求和编写数千行代码。每一个bug报告或功能请求对来说都是巨大的帮助。