随着模型和机器的复杂性不断增加,构建这些机器所需的资源以及收集、标注和标记训练数据的成本也在不断上升。正如所知,如果没有正确标记的数据,模型几乎无法存在。为了训练这些复杂的模型,通常需要手动标记和注释算法将要使用的图像。一群研究人员声称他们找到了一种解决方案,可以即兴解决这一耗时的过程。谷歌的DeepMind研究团队创建了一个算法,可以根据少量2D快照创建三维物体。换句话说,AI算法能够使用2D图像来理解或“想象”物体从各种角度(在图像中未看到的)看起来如何。
研究人员发表了一篇研究论文,解释了算法的工作原理。这个系统被称为生成查询网络(Generative Query Network,简称GQN),可以像人类一样思考和想象。它能够在没有被训练成了解物体各种角度的情况下渲染三维物体。正如团队所提到的,AI系统有两个部分:
// 表示网络:用于将样本图像转换为计算机可以理解的代码。因此,表示网络以代码的形式向计算机描述场景。
// 生成网络:使用代码创建初始图像中不可见的物体的其他角度。