计算机视觉技术,作为人工智能领域的一个重要分支,已经深入到日常生活的方方面面。从社交媒体到交通出行,从在线购物到云端存储的照片,几乎每天都在与机器学习算法进行互动。尽管如此,由于技术的不断进步,往往不会注意到计算机视觉技术的应用。这是因为,随着技术的成熟,它越来越能够模仿人类的行为,对其的感知也就越不明显。计算机视觉技术,本质上是自动化了人类的视力,这是最基本、最本能的感觉之一。
如果在iPhone上启用了面部识别功能(Apple Face ID),那么每次解锁手机时,都在本地(在设备上)运行一个计算机视觉模型。生物识别认证功能最早在2016年发布的iOS 10中引入,而这一功能的真正了不起之处在于,苹果成功地解决了在iPhone上运行深度学习算法的挑战,而不是通过云端。这项技术使用关键点检测或实例分割,这两种在计算机视觉中常见的模型格式,来识别面部的独特特征。关键点检测是像苹果FaceID这样的产品运作的核心技术。
Facebook是计算机视觉领域的领先公司,它在其产品中广泛使用这项技术。例如,Facebook使用计算机视觉技术来提高可访问性。如果用户是盲人或视力受损,Facebook能够识别照片中发生的事情,并提供该场景的听觉描述。另一个例子是,当Facebook帮助识别照片中应该标记的正确人物时。通过识别(或朋友),Facebook还可以在有人使用照片创建欺诈账户时通知用户。
当疫情爆发时,Uber寻求找到方法确保其司机和乘客遵守新建立的健康和安全指南。该公司创建了一个口罩检测模型,要求其司机在每次轮班开始时拍摄一张自拍照。这些自拍照被输入到一个经过训练的计算机视觉模型中,该模型能够检测面部口罩的存在。可以使用公共口罩数据集创建自己的口罩检测器。
Airbnb每年都会收到数百万用户上传的照片。虽然平台上的每个列表可能包含也可能不包含提供的所有便利设施,但Airbnb工程团队在2019年开发的机器学习算法旨在填补这些空白。照片中可见的物品——包括浴室里的吹风机、厨房柜台上的压力锅以及室内外游泳池——即使房东忘记了勾选相应的复选框,也会在在线列表中被标注出来。这项工作需要对40个类别的50,000多张图片进行注释。这在看来是五星级的评论!
流行的照片分享应用Instagram是视觉技术的沃土,特别是在更有效地(和有效地)审核发布到平台上的内容方面。毕竟,将垃圾邮件降到最低是确保用户有积极体验的关键优先事项。研究人员已经确定了一种特别成功的技术:将图片的标题与计算机视觉模型生成的预测进行比较。如果两者严重不匹配,照片很可能是垃圾邮件。Instagram还采用了更尖端的技术,如生成模型。也就是说,能够创建完全有机图像的机器学习模型。虚拟时尚模特(被称为数字男女)正在逐渐取代他们在出版物、网站、广告甚至社交媒体上的真人同行。
在线购物的世界很快就会充斥着计算机视觉模型,这些模型将帮助从“试穿”新衣服和鞋子到评估新沙发是否与客厅的装饰相匹配。像Madison Reed这样的公司已经在利用计算机视觉技术,用它来帮助女性克服选择新发色时最常见的反对意见:这会好看吗?Madison Reed在2016年推出了一个名为Madi的AI驱动的个性,这是一个注入了计算机视觉的聊天机器人,能够识别女性的发色,并根据她独特的肤色和肤色推荐匹配。可以在Facebook Messenger应用中找到她。这项技术与女性的专业造型师/染发师咨询相媲美,并且可以在消费者最终想要人类触感时,随时加入第三方。
即使是Pinterest也在进入计算机视觉游戏。有了新的Lens Your Look应用,Pinterest用户可以上传自己的照片,他们最喜欢的蓝色牛仔夹克,卧室的快照或珍贵的复古花瓶,Pinterest将做出预测性的推荐,推荐跟随的pins或类似的板子以获得更多灵感。这项技术的不同之处在于,它使用风格、颜色、图案和其他标识符对类似物品进行主题分组。