自然界是一切的基础,它支撑着全球经济、福祉和生存。然而,正面临一场生物多样性危机,数以百万计的植物和动物面临灭绝的风险。野生动物面临的问题错综复杂,但数据可以帮助穿透噪音。野生动物种群数量的数据可以帮助将有限的资源引导到正确的地方,正确的时间,类似于医生在大流行中治疗病人。最终,数据有助于增加可以被拯救的物种数量。
然而,数据的收集成本高昂。在自然界中,很少能准确统计动物的数量,而是使用各种技术,包括相机陷阱和无人机,来进行估计。这些技术的成本使得监测工作难以在空间和时间上进行扩展。如果不知道外面有什么,那么基于数据的保护决策就变得不可能。
就是Kasim,加州大学圣克鲁斯分校的野生动物生物学家。2019年,发现游客拍摄的照片可以用来以其他常用方法97%的成本获得非洲食肉动物的准确计数。当时表示,“通过协调努力收集游客照片……有真正的机会对高价值旅游区的野生动物种群进行持续、快速的评估。”
今天,转向计算机视觉和边缘机器学习来解决规模问题,并将这种调查方法引入非洲一些最具标志性的景观。这个想法很简单。使用车载摄像头在野生动物园游猎中自动检测和拍摄野生动物。使用这些数据进行物种调查。
这个想法足够吸引人,让从ConservationX获得了一个快速原型设计资助,这是一个致力于使用技术解决地球上一些最大挑战的组织,在过去的三个月里,一直在构建这个原型。
要构建一个拍摄豹子的系统,首先需要教它豹子长什么样。为此,不得不收集和标记足够的数据来训练算法,让它知道什么让豹子成为豹子。(也许是生活中的一个未解之谜。)
豹子的挑战在于,它们不是最容易找到的猫科动物。它们喜欢独自闲逛,拥有大片的家园领地,更喜欢能想到的最厚、最恶心的灌木丛。幸运的是,和在博茨瓦纳食肉动物保护的合们花了很多时间寻找它们,这意味着有来自研究人员、游客和相机陷阱的丰富数据集。总共,有超过1800张40只豹子的各种姿势的图片。
一旦图片被WildMe标记,下一个挑战就是将其转换为训练所需的正确格式。最终,决定使用Google Cloud AI平台进行模型训练。它简单,不需要编码,也不需要专业硬件。
对来说,挑战是将标记的数据集从COCO转换为Google所需的格式。对于拥有领域专业知识的任何人来说,这可能很简单,但作为一个局外人,花了几个小时寻找答案,却陷入了困境。这就是Roboflow进入故事的地方。
Roboflow Pro
除了允许数据被平滑预处理、增强和健康检查的功能外,还具有一个导出功能,允许将数据集直接转换并导出到像Google Cloud这样的模型训练平台。以前需要几个小时Google搜索的事情,用Roboflow不到十分钟就完成了。
还利用了Roboflow的增强功能,测试了模拟真实世界场景的增强,如照片中的相机模糊,可能会如何提高训练模型(稍后会有更多内容)。
由于这些模型需要在设备上运行,提供实时推理,选择了使用Google Cloud的AutoML Vision Edge模型。这些是低延迟、高准确性的模型,针对在边缘运行进行了优化,可以导出到TensorFlow Lite,这使得它们非常适合快速、轻松地与硬件堆栈集成。
还测试了Roboflow增强数据集与非增强数据集的表现。答案是相当不错的。通过数据增强,训练集增加了67%,平均模型精度从0.90提高到0.92——对于没有额外努力的小幅提升来说,这是相当不错的。
为了部署,模型被加载到一个Raspberry Pi pan-tilt
设置中,以创建一个低保真原型,用于ConservationX奖。然后,模型被带到了一次社交距离隔离的狩猎旅行中,以挑选出豹子。
对于接下来要去的地方,有许多新的里程碑。接下来的障碍是扩大模型训练,以检测更广泛的野生动物,并迭代硬件,以便能够构建足够坚固的东西,以在非洲丛林的冒险中生存下来。
如果是一名软件或硬件开发人员、初创公司或技术爱好者,并且有兴趣使用技术来支持自然保护,很想听到消息。
要联系,或者只是想跟踪这个项目和其他的豹子工作,可以在Twitter上关注,或者给发电子邮件(kasim.rafiq [at] hotmail.co.uk)。作为回报,相信将一窥非洲一些最具标志性的物种,也许还能为客户提供一两个故事。