《自然》杂志的最新一期报道了一项在自主医疗AI智能体能力方面取得的显著进展:两个独立开发的AI模型,分别来自德国的MIRA和谷歌的AMIE,在患者管理的多个关键阶段展现出强大的辅助能力,覆盖了从诊断到治疗决策的全过程。这些系统的表现已能媲美人类内科医生,凸显了对话式AI工具在疾病管理领域的巨大潜力。
海德堡大学医院推出了MIRA,一个能够接入独立电子病历系统以获取患者数据的AI模型。该模型在超过500例急诊科临床病例的真实世界数据上进行了测试。结果表明,MIRA通过与患者AI智能体进行信息交互,能够准确匹配临床记录中的病史信息。MIRA拥有超过85000种诊断检测、结果解读和治疗方案(包括处方、手术安排及入院流程)的选项。其平均诊断准确率高达87.8%,超越了由六位跨专科医生组成的专家组的78.1%。研究团队指出,未来需要进一步的研究来提升准确性,并在实际应用中验证其通用性。
谷歌团队开发的AMIE,是一个为临床管理和对话流程而优化的、基于大型语言模型的系统。该模型具备对多次就诊数据进行连续推理的能力,从而能够追踪疾病的发展和治疗的响应情况。AMIE利用谷歌的Gemini技术分析从患者处获得的信息,并确保其输出结果与最新、相关的临床实践指南以及药物目录(包含已批准且临床首选的药物清单)保持一致。
在一项虚拟临床检查研究中,AMIE与21名全科医生在100多个就诊场景以及五个医学专科领域进行了比较。这些场景的设计参考了英国国家卫生与临床优化研究所的指导意见以及《英国医学杂志》的最佳实践指南。在管理推理能力方面,AMIE的表现与真人医生相当;而在治疗和检查的精确度、对临床指南的遵循程度以及基于指南制定管理方案的合理性方面,AMIE均表现出优于医生的能力。在最新的药物推理基准测试中,AMIE在处理复杂病例时也胜过了医生。研究团队表示,AMIE的出现标志着利用对话式AI工具协助医生进行疾病管理迈出了重要一步。
大型语言模型在临床应用领域已展现出令人振奋的发展势头,尽管此前它们多专注于特定任务。然而,患者的临床管理需要一个多层面的方法,这包括深入的病史了解、审慎的检查、精确的诊断、周密的治疗计划、恰当的药物剂量确定、以及手术进程的安排,同时还需要在多次随访中监测治疗效果。如果AI智能体能够胜任这些任务并实现有效的管理,它们将能够成为人类医生的得力助手,承担起这些日常繁重的工作,甚至可能有助于缓解全球部分地区内科医生短缺的困境。