近期,大型语言模型ChatGPT在放射学领域的应用引起了广泛关注。一项发表在《放射学》杂志上的研究揭示了将ChatGPT整合到放射学中的成功与挑战。ChatGPT以其快速增长的消费应用历史而闻名,其在搜索引擎如谷歌和必应中的集成进一步推动了这一趋势,从而彻底改变了医生和患者获取医疗信息的方式。医学界的放射科医生Rajesh Bhayana博士解释了ChatGPT在放射学中的表现的重要性。
为了评估ChatGPT在放射学中的专业能力,Bhayana博士及其同事使用最常用的版本GPT-3.5进行了全面测试。研究人员精心设计了150个多项选择题,严格遵循加拿大皇家学院和美国放射学委员会的风格、内容和难度水平。这些题目不包含图像,并被分类为不同类型的问题,以确定其能力。研究人员旨在深入了解低阶思维(知识回忆和基本理解)和高阶思维(应用、分析、综合)问题。在高阶思维问题中,进一步的子类别涉及影像学发现的描述、临床管理、计算和分类以及疾病关联。
ChatGPT基于GPT-3.5的回答结果显示,其正确回答了69%的问题,在低阶思维问题上表现尤为出色(84%)。然而,在高阶思维问题上,它的表现不佳,仅正确回答了60%的问题。具体来说,ChatGPT在描述影像学发现、计算和分类以及应用概念方面面临挑战。这一结果在意料之中,因为该模型缺乏放射学特定的预训练。