《自然》杂志最新发表的研究成果,标志着自主医疗AI智能体在能力上取得了显著进步:两个独立的AI模型能够为患者提供从诊断到治疗决策等多个阶段的全面辅助。由德国海德堡大学医院开发的MIRA和谷歌公司研发的AMIE,其当前表现至少已达到人类内科医生的水平,这证明了对话式AI工具在疾病管理方面的巨大潜力。
MIRA,由德国海德堡大学医院推出,是一个能够接入独立电子病历系统并访问患者数据的AI模型。该模型在处理了超过500例急诊科临床病例的真实世界数据后,通过与患者AI智能体进行互动和信息收集,其反馈与临床记录中的病史信息高度吻合。MIRA可以在85000多项选项中进行选择,以安排诊断性检查、解读检测结果以及制定治疗计划,包括开具处方、安排手术和办理入院。其平均诊断准确率为87.8%,超越了由六位跨专科医生组成的专家组78.1%的准确率。研究团队强调,未来需要进一步研究以提升准确性,并在实际应用中验证其泛化能力。
谷歌团队则展示了AMIE,一个针对临床管理和对话流程进行优化的、基于大型语言模型的系统。该模型能够对多次就诊的数据进行连续推理,从而跟踪疾病发展和治疗效果。AMIE利用谷歌的Gemini技术分析从患者处收集的信息,并确保其输出结果与最新的临床实践指南以及药物目录(包含获批且临床首选的药物列表)保持一致。
在一项模拟临床检查研究中,AMIE与21名全科医生在超过100个就诊场景和五个医学专科领域进行了比较。这些场景的设计旨在反映英国国家卫生与临床优化研究所的指导意见及《英国医学杂志》的最佳实践指南。在推理和管理能力方面,AMIE的表现与真实医生相当;而在治疗和检查的准确性、对临床指南的遵守程度以及基于指南制定管理方案的合理性方面,AMIE均表现优于医生。在最新的药物推理基准测试中,AMIE在处理复杂病例时也优于医生。研究团队指出,AMIE的出现是利用对话式AI工具协助医生进行疾病管理的重要一步。
大型语言模型在临床领域的应用已显示出令人期待的发展趋势,尽管此前它们多专注于特定任务。然而,患者的临床管理需要多方面的综合考量,包括详细的病史了解、恰当的检查、精准的诊断、周密的治疗方案规划、药物剂量的确定、手术进程的安排,以及在多次就诊中对治疗效果的持续监测。如果AI智能体能够胜任这些任务并实现有效的管理,它们将能成为人类医生的有力助手,承担起日常的常规工作,甚至有望缓解全球部分地区内科医生短缺的困境。