【从会做题到会看病,蚂蚁如何训出真正好用的医疗智能体?】4月22日,上海交通大学

科学制造的力量 2025-04-22 17:54:30

【从会做题到会看病,蚂蚁如何训出真正好用的医疗智能体?】4月22日,上海交通大学医学院附属仁济医院(以下简称“仁济医院”)展示其与蚂蚁集团合作AI医疗的最新成果。这也是全国首个用疾病结构化数据训练、在真实医疗场景运行的专科智能体。

仁济医院泌尿科主任潘家骅向观察者网谈到:优质医疗资源供需失衡,仍然是中国医疗体系面临的结构性难题。随着人工智能技术的发展,如何让大模型真正服务于医生诊疗过程,成为业内的迫切需求。

仁济医院和蚂蚁团队的研究发现,当下的通用大模型尽管在医师考试等场景下能够取得超过80%的准确率,比人类表现更好,是一个很会答题的“好学生”,但还不是一个“好医生”。

研究数据显示,在真实场景的开放性医疗问答中,如果以仁济医院泌尿科专科医生的水平为基准,ChatGPT-4o的得分0.4-0.6之间,略高于仁济医院实习生的水平,但还不如普通的社区医院全科医生,更是显著低于普通专科医生。

为此,仁济医院专家利用真实的临床病例,构造了2000余条数据的推理数据集,然后再通过人工智能进行迭代和复制,最后达到10万量级的大样本数据集构建。借助这样基于真实病例的数据集,并为大模型引入思考链条,最终人工智能就能够更好地模拟医生在实际就诊过程中的思维路径。

观察者网获悉,仁济医院与蚂蚁集团合作的医疗智能体,在测试中已经接近于普通专科医生的准确率水平。而在智能体能够独立进行诊疗之前,其更大的用武之地在于辅助人类医生,提高医生的诊断水平。评测显示,上述智能体能够让基层医生诊断正确率提升4%-8%,已初步具备“下基层”的能力。

仁济医院副院长、泌尿科学科带头人薛蔚认为,在医疗领域,精准的知识训练比注入规模化数据更重要,除了教给AI医学文献和指南,关键还在让AI学会医生的逻辑和思维,因此在这个过程中顶尖医生与技术应该成为搭档。

另据公开资料显示,蚂蚁医疗大模型在MedBench医疗大模型评测中,曾连续斩获医学知识问答等多项第一,也是业内应用场景最丰富、与医疗机构、医生、医院共建最深的垂类大模型之一,目前已完成基于强化学习的新一代医疗推理模型研发。

仁济医院、蚂蚁集团正与人民卫生出版社合作建设人工智能数据库,进一步丰富专业语料库、持续提升医疗智能体的医学逻辑能力。同时,围绕泌尿专科大模型的开发更多应用,并探索将AI能力投射到更多基层医疗机构。

0 阅读:1
科学制造的力量

科学制造的力量

感谢大家的关注