【从会做题到会看病，蚂蚁如何训出真正好用的医疗智能体？】4月22日，上海交通大学

【从会做题到会看病，蚂蚁如何训出真正好用的医疗智能体？】4月22日，上海交通大学医学院附属仁济医院（以下简称“仁济医院”）展示其与蚂蚁集团合作AI医疗的最新成果。这也是全国首个用疾病结构化数据训练、在真实医疗场景运行的专科智能体。

仁济医院泌尿科主任潘家骅向观察者网谈到：优质医疗资源供需失衡，仍然是中国医疗体系面临的结构性难题。随着人工智能技术的发展，如何让大模型真正服务于医生诊疗过程，成为业内的迫切需求。

仁济医院和蚂蚁团队的研究发现，当下的通用大模型尽管在医师考试等场景下能够取得超过80%的准确率，比人类表现更好，是一个很会答题的“好学生”，但还不是一个“好医生”。

研究数据显示，在真实场景的开放性医疗问答中，如果以仁济医院泌尿科专科医生的水平为基准，ChatGPT-4o的得分0.4-0.6之间，略高于仁济医院实习生的水平，但还不如普通的社区医院全科医生，更是显著低于普通专科医生。

为此，仁济医院专家利用真实的临床病例，构造了2000余条数据的推理数据集，然后再通过人工智能进行迭代和复制，最后达到10万量级的大样本数据集构建。借助这样基于真实病例的数据集，并为大模型引入思考链条，最终人工智能就能够更好地模拟医生在实际就诊过程中的思维路径。

观察者网获悉，仁济医院与蚂蚁集团合作的医疗智能体，在测试中已经接近于普通专科医生的准确率水平。而在智能体能够独立进行诊疗之前，其更大的用武之地在于辅助人类医生，提高医生的诊断水平。评测显示，上述智能体能够让基层医生诊断正确率提升4%-8%，已初步具备“下基层”的能力。

仁济医院副院长、泌尿科学科带头人薛蔚认为，在医疗领域，精准的知识训练比注入规模化数据更重要，除了教给AI医学文献和指南，关键还在让AI学会医生的逻辑和思维，因此在这个过程中顶尖医生与技术应该成为搭档。

另据公开资料显示，蚂蚁医疗大模型在MedBench医疗大模型评测中，曾连续斩获医学知识问答等多项第一，也是业内应用场景最丰富、与医疗机构、医生、医院共建最深的垂类大模型之一，目前已完成基于强化学习的新一代医疗推理模型研发。

仁济医院、蚂蚁集团正与人民卫生出版社合作建设人工智能数据库，进一步丰富专业语料库、持续提升医疗智能体的医学逻辑能力。同时，围绕泌尿专科大模型的开发更多应用，并探索将AI能力投射到更多基层医疗机构。

0 阅读：1

特朗普彻底慌了？！！世界首富马斯克彻底揭开美国的”遮羞布“，他再次语出惊人：“中