在人工智能领域,谷歌的研究者们最近取得了一项令人瞩目的成就:大型语言模型(LLMs)现在能够仅通过工具文档来利用机器学习模型和API。这一发现引发了关于人工智能与类似人类能力融合的讨论。
想象一下,正在教一个名叫Audrey的四岁小孩骑自行车。从辅助轮开始,引导她经历各种情况,最终,Audrey能够自信地骑行。类似地,谷歌的研究者通过文档向LLMs介绍了工具的功能,使它们能够在没有事先训练的情况下操作这些工具。这就像是Audrey通过阅读一本书就学会了骑自行车——令人印象深刻且独立。
历史上,AI模型通过演示(demos)学习工具,需要大量的示例。谷歌的突破性进展改变了这种方法。他们使用工具文档(docs)来教授LLMs,描述工具的功能而不是演示每个用例。这种新方法旨在扩展AI对工具的理解,并使其能够更有效地探索工具的功能。
为了评估这种新方法的强大之处,谷歌的研究者让LLMs参与了各种任务,包括多模态问题回答、表格数学推理、多模态推理、API的未见使用、图像编辑和视频跟踪。被称为ChatGPT的模型经历了严格的测试,结果令人惊叹。