论文浅读-A Simulacrum of Hospital with Evolvable Medical Agents

摘要

本文介绍了一种模拟医院诊疗全过程的Agent医院仿真系统。所有的病人、护士和医生都是由大型语言模型(llm)驱动的自主代理。我们的中心目标是使医生代理能够学习如何在模拟中治疗疾病。为此,我们提出了一种称为MedAgent-Zero的方法。由于simulacrum可以基于知识库和llm来模拟疾病的发生和发展,医生代理可以不断地从成功和不成功的案例中积累经验。仿真实验表明,医生代理在各种任务上的处理性能不断提高。更有趣的是,医生代理人在代理医院获得的知识适用于现实世界的医疗保险基准。在治疗了大约1万名患者(现实世界的医生可能需要两年多的时间)之后,进化的医生代理在MedQA数据集的一个子集上达到了93.06%的最先进的准确率,该数据集涵盖了主要的呼吸系统疾病。这项工作为推进llm驱动的代理技术在医疗场景中的应用铺平了道路。

代理医院中,目标是训练熟练的“医生”来处理医疗任务,如诊断和治疗建议,传统的研究通常将医学知识整合到llm /agent中,通过预训练、监督微调或检索增强生成策略来构建强大的医学模型。然而,我们提出了一种新的策略,通过在模拟环境中模拟医患互动来训练医生代理。由于没有使用手动标记的数据,我们将提出的策略命名为MedAgent-Zero。在agent Hospital中,医生agent与各种患者agent相互作用,从成功案例中积累记录,从失败案例中汲取经验,成为更加优秀的agent。由于医生代理培训的低成本和高效率,我们可以让代理在短短几天内轻松处理数万个病例,实现这一目标需要现实世界的医生几年的时间才能做到。