Imagen 2:AI图像生成技术的革新

近期,Google推出了Imagen 2,这是一款基于文本到图像扩散技术的先进工具。它能够根据用户的提示生成高质量、与自然分布紧密相关的图像,摒弃了预设风格,使得生成的图像更加逼真。与传统方法不同,Imagen 2利用其训练数据中的自然分布,生成没有预设风格的生动图像。

Imagen 2图像生成示例

以下是一些使用Imagen 2生成的图像示例:

  • 在黑色背景上的水母
  • 沙发上的长发迷腊肠犬
  • 小画布上的油画,画着一个放在砧板上的橙子。光线穿过橙子的切片,在砧板的一部分上投下橙色的光。背景中有蓝白色的布。焦散、反射光、富有表现力的笔触。

这项功能可以在Gemini、搜索生成体验以及Google实验室的ImageFx实验中找到。开发者和云客户可以通过Google Cloud Vertex AI中的Imagen API访问它。

Imagen 2的特点

改进的图像标题理解:Imagen-2是一个强大的文本到图像模型,它学习从训练数据集中的图像和标题细节中创建与用户提示相匹配的图像。但需要注意的是,这些配对中的详细程度和准确性可能会有很大的差异。以下是Imagen-2的提示理解示例:

  • “柔和的潺潺溪流,鸟儿更新了它们的音符,它们混合的音乐在空中飘荡。”
  • “知更鸟从他摇摆的常春藤上飞到墙顶,他张开喙,唱出了一个响亮、悦耳的颤音,只是为了炫耀。世界上没有什么比知更鸟炫耀时更可爱了——它们几乎总是在这样做。”(摘自弗朗西斯·霍奇森·伯内特的《秘密花园》)

Imagen 2背后的技术

  • Imagen 2可以通过图像修复在原始图像中生成新内容。
  • Imagen 2可以通过图像扩展将原始图像扩展到其边界之外。
沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485