Gemini 1.5 Pro：人工智能领域的新突破

Google最近推出的Gemini 1.5 Pro模型在人工智能领域树立了一个新的里程碑。这款新模型具备原生音频理解能力，能够处理系统指令，并支持JSON模式，为全球开发者带来了前所未有的新机遇。

增强的输入模式与视频分析

Gemini 1.5 Pro模型引入了原生音频理解功能，扩展了其输入模式，包括语音识别。此外，该模型现在能够跨图像和音频输入对视频进行推理，为更全面的数据的分析和解释铺平了道路。

响应开发者的反馈，Google对Gemini API进行了几项改进。开发者现在可以访问系统指令，根据特定用例引导模型的响应。此外，新的JSON模式便于从文本或图像中提取结构化数据，提供了更大的灵活性和控制力。

本文介绍了谷歌云创新大会2024上展示的AI技术新进展，包括Gemini AI的扩展、Gemini Code Assist的增强、Google Workspace的升级以及AI在网络安全中的应用。

本文探讨了谷歌可能对AI增强搜索功能收费的潜在变化，以及这一变化对用户访问服务方式的影响。