微软的绘图机器人技术

微软最近发布了一项名为“绘图机器人”的新技术,这项技术能够根据文本提示生成各种图像,从动物到风景,甚至是一些奇异的物体,如飞行汽车和扭曲的街灯。这可以看作是人工智能版的画猜游戏,用户只需输入文本,机器人就会运行算法并生成图像。

这项技术最令人兴奋的地方在于,生成的图像可能并非真实存在的事物。例如,上面提到的鸟类图像可能并不存在于现实世界中,它们只是机器根据文本描述想象出来的鸟类形象。此外,每张生成的图像中还包含了文本描述中未提及的其他细节。

微软预见这项技术未来将被画家和室内装饰师所使用。它还可以作为一个语音激活工具,用于创建或完善照片(也许这里可以融入Cortana的角色)。为了使AI能够理解哪些词汇与哪些图片相匹配,绘图机器人在图像和标题对上进行了训练。算法分为两个部分:

生成对抗网络(GAN)

生成器 - 负责根据输入的文本生成图像 判别器 - 负责评估生成图像的质量
沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485