复旦大学团队发布中文医疗健康个人助手，开源47万高质量数据集|样本|大模型

文章编号：2085 应用软件 2023-09-02 样本医疗大模型复旦大学个人助手

用微信扫码二维码

分享至好友和朋友圈

患者感到身体不适时，可以向模型问诊，描述自身症状，模型会给出可能的病因、推荐的治疗方案等作为参考，在信息缺乏时会主动追问症状的详细描述。

图2：问诊场景下的对话

用户还可以询问与自身无关的医学知识，此时模型会尽可能专业地作答，使用户全面准确地理解。

图4：与自身无关的医学知识询问对话

DISC-MedLLM是基于我们构建的高质量数据集DISC-Med-SFT在通用领域中文大模型Baichuan-13B上训练得到的医疗大模型。值得注意的是，我们的训练数据和训练方法可以被适配到任何基座大模型之上。

DISC-MedLLM具有三个关键特点：

3、方法：数据集DISC-Med-SFT的构造 复旦大学团队发布中文医疗健康个人助手开源4

在模型训练的过程中，我们向DISC-Med-SFT补充了通用领域的数据集和来自现有语料的数据样本，形成了DISC-Med-SFT-ext，详细信息呈现在表1中。

数据集。分别从两个公共数据集MedDialog和cMedQA2中随机选择40万个和2万个样本，作为SFT数据集构建的源样本。

重构。为了将真实世界医生回答调整为所需的高质量的统一格式的回答，我们利用GPT-3.5来完成这个数据集的重构过程。提示词（Prompts）要求改写遵循以下几个原则：

图6展示了一个重构的示例。调整后医生的回答与AI医疗助手的身份一致，既坚持原始医生提供的关键信息，又为患者提供更丰富全面的帮助。

图6：对话重新改写的例子

医学知识图谱包含大量经过良好组织的医学专业知识，基于它可以生成噪声更低的QA训练样本。我们在CMeKG的基础上，根据疾病节点的科室信息在知识图谱中进行采样，利用适当设计的GPT-3.5模型Prompts，总共生成了超过5万个多样化的医学场景对话样本。

在训练的最终阶段，为了进一步提高模型的性能，我们使用更符合人类行为偏好数据集进行次级监督微调。从MedDialog和cMedQA2两个数据集中人工挑选了约2000个高质量、多样化的样本，在交给GPT-4改写几个示例并人工修订后，我们使用小样本的方法将其提供给GPT-3.5，生成高质量的行为偏好数据集。

通用数据。为了丰富训练集的多样性，减轻模型在SFT训练阶段出现基础能力降级的风险，我们从两个通用的监督微调数据集moss-sft-003和alpacagpt4datazh随机选择了若干样本。

MedMCQA。为增强模型的问答能力，我们选择英文医学领域的多项选择题数据集MedMCQA，使用GPT-3.5对多项选择题中的问题和正确答案进行了优化，生成专业的中文医学问答样本约8000个。

训练。如下图所示，DISC-MedLLM的训练过程分为两个SFT阶段。

图7：两阶段训练过程

评测。在两个场景中评测医学LLMs的性能，即单轮QA和多轮对话。

比较模型。将我们的模型与三个通用LLM和两个中文医学对话LLM进行比较。包括OpenAI的GPT-3.5,GPT-4,Baichuan-13B-Chat;BianQue-2和HuatuoGPT-13B。

单轮QA结果。单项选择题评测的总体结果显示在表2中。GPT-3.5展现出明显的领先优势。DISC-MedLLM在小样本设置下取得第二名，在零样本设置中落后于Baichuan-13B-Chat，排名第三。值得注意的是，我们的表现优于采用强化学习设置训练的HuatuoGPT(13B)。

表2：单项选择题评测结果

多轮对话结果。在CMB-Clin评估中，DISC-MedLLM获得了最高的综合得分，HuatuoGPT紧随其后。我们的模型在积极性标准中得分最高，凸显了我们偏向医学行为模式的训练方法的有效性。结果如表3所示。

在CMD样本中，如图8所示，GPT-4获得了最高分，其次是GPT-3.5。医学领域的模型DISC-MedLLM和HuatuoGPT的整体表现分数相同，在不同科室中表现各有出色之处。

CMID的情况与CMD类似，如图9所示，GPT-4和GPT-3.5保持领先。除GPT系列外，DISC-MedLLM表现最佳。在病症、治疗方案和药物等三个意图中，它的表现优于HuatuoGPT。

各模型在CMB-Clin和CMD/CMID之间表现不一致的情况可能是由于这三个数据集之间的数据分布不同造成的。CMD和CMID包含更多明确的问题样本，患者在描述症状时可能已经获得了诊断并表达明确的需求，甚至患者的疑问和需求可能与个人健康状况无关。在多个方面表现出色的通用型模型GPT-3.5和GPT-4更擅长处理这种情况。

DISC-Med-SFT数据集利用现实世界对话和通用领域LLM的优势和能力，对三个方面进行了针对性强化：领域知识、医学对话技能和与人类偏好；高质量的数据集训练了出色的医疗大模型DISC-MedLLM，在医学交互方面取得了显著的改进，表现出很高的可用性，显示出巨大的应用潜力。

该领域的研究将为降低在线医疗成本、推广医疗资源以及实现平衡带来更多前景和可能性。DISC-MedLLM将为更多人带来便捷而个性化的医疗服务，为大健康事业发挥力量。

本文地址： https://www.gpxz.com/article/a592ea5658b4eef9aa25.html

上一篇：AndrejKarpathy大模型有内存限制，这个妙招挺

下一篇：大模型时代，百度智能云迎来空前机遇千帆云计

网站源码下载

新一代站长综合门户网(www.Downzz.com-站长下载网)专注服务于互联网站长和广大用户，提供各类最新最全的免费网站源码下载(PHP、ASP、JSP、.NET)，现已全新改版的下载网站，致力为广大站长24小时更新提供国内外最新的绿色免费软件下载中心，其中包含电脑软件、苹果应用、安卓应用等免费PC电脑软件/手机APP应用以及手机游戏下载，同时还有精品游戏攻略、软件教程等技术文章，致力为站长打造一个更好更全面的游戏软件应用下载网站。

游戏网游 2026-01-20 22:30:43

TOPYS

抢先知晓全球最新鲜、最棒的创意资讯，扩充你的灵感库。

电影视频 2026-01-21 11:15:04

中文精选小游戏,中文精选小游戏大全,4399中文精选小游戏全集,4399小游戏

4399中文精选小游戏大全收录了国内外中文游戏精选类小游戏、中文版小游戏、中文做饭小游戏、中文塔防小游戏、中文小游戏下载。好玩就拉朋友们一起来玩吧！

游戏网游 2024-08-16 23:08:33

江苏迅软

信息安全产品与整体解决方案提供商

手机软件 2026-01-25 01:03:32

意林乐器

意林乐器意林乐器经过过去和世界知名品牌日本YAMAHA公司、德国B&S公司、法国BUFFET公司以及台湾KHS集团等的直接合作，在四川及西南区域建立了完善的销售服务体系，并同YAMAHA合作建立了西南唯一的一家雅马哈管乐CUSTOM专家售后服务中心。

音乐歌曲 2026-01-28 19:41:11

官网

朝阳医院自一九九九年三月二十六日开诊以来，始终坚持“以病人为中心，以质量为根本，以社会效益为准则”，树立“尊重、理解、关爱”的服务理念，为患者提供全方位、高档次、高水平、高质量的医疗保健体系，赢得了社会的广泛赞誉和普遍好评。

商业服务 2026-01-28 23:05:20

工业平板电脑显示器

深圳佳维视(Jawest)是一家集研发、生产、销售为一体的源头厂家,主要产品工业平板电脑,工业显示器,工业一体机,工控一体机,工业触摸屏,工业触摸显示器等,为全球客户提供优质的工业平板电脑,工业显示器,工业一体机,工控一体机,工业触摸屏,工业触摸显示器等产品及应用解决方案。

网络应用 2026-01-29 14:45:40

山东一互

fullPage-smallersectionsinsidefullpage.js.

电影视频 2026-01-29 18:17:53

租号玩

租号玩是国内正规租号平台，玩家无需帐号密码即可畅玩LOL（英雄联盟），CF（穿越火线）等游戏的极品号，同时租号软件还有防外挂等安全防护功能，能从根源上保证游戏帐号安全

游戏网游 2025-02-15 15:47:02

瑜伽教练培训

瑜伽联盟是瑜伽行业教练考证机构，为规范瑜伽教练资格标准，对各个瑜伽流派研发创建中国瑜伽联盟教练课程体系，是目前瑜伽教练认定课程体系的瑜伽教练考证机构。

行业信息 2026-02-11 23:16:42

山东宝翔工程材料有限公司

电影视频 2026-02-28 20:25:40

专注展厅中控系统,展厅互动软件

炬人智能科技专业整体设计展厅数字多媒体网络方案，联系我们立即开始为你烧脑。

网络应用 2026-03-03 11:11:56

历届tga年度最佳游戏2022 tga年度最佳游戏排行榜前五 (历届TGA年度最佳游戏奖)

每一年都会出现非常多的游戏，出现了那么多游戏，自然也是有好有坏的了，很多喜欢玩游戏的小伙伴对于历届tga年度最佳游戏2022游戏非常的感兴趣，小编在这里也是将排行榜前五款游戏给大家带来了，如果不知道前五都有哪些游戏的小伙伴可以来了解一下哦，1、，原神，这款游戏能够排上第一相信大家都不会有意见的吧，这款游戏除了完美的剧情玩法和独特的战斗...。

2025-02-11 21:56:14

中国银行AI全布局 (中国银行查开户行怎么查)

中国银行董事长刘连舸认为，金融科技正在引领全球金融业新格局，作为中国经营最久的银行，2019年，中行信息科技投入116.54亿元，同比增长15.15%，前中行董事长、现任工行行长的陈四清则直接表态，金融科技不是互联网独角兽的专利，在陈四清、刘连舸等历任中行领导高度重视下，中行在金融科技的多个前沿领域，走在国内前列，结盟互联网巨头，...。

2024-11-30 19:58:30

明基投影仪怎么连接wifi 轻松几步就能观看海量影片 (明基投影仪怎么样)

发表在明基投影仪2021，9，2214，38明基是老牌投影仪厂商，近两年也逐渐向智能投影仪行业进军，一台投影仪连接上wifi就能够观看无数影片，使得更多的家庭在装修时更愿意选择投影仪，那么明基投影仪怎么连接wifi呢，下面教大家详细的步骤，1、进入，智能系统，2、按遥控器方向键，选中，设置，，再选择进入，更多设置，3、选择进入第一...。

2024-11-29 02:37:35

索尼投影仪怎么调画面大小 (索尼投影仪怎么样)

ZHANGWWW大神级投影控发表于2024，11，23调整索尼投影仪画面大小的方法有以下三种，方法一，移动投射位置，1.投影仪和幕布、墙壁保持垂直，2.通过投影仪遥控器操作，将画面调整到适合大小，3.移动投影仪位置，保证投影画面的清晰和亮度，同时根据自己的需求进行画面大小的调整，方法二，使用手动摇焦轮调节，1.先按投影机菜单键，然后左...。

2024-11-28 13:06:16

育致远教育好不好 (育致远教育口碑怎么样)

每年的师资考试都好似千军万马过独木桥，想要平稳安稳的，唯有强化自身的水平，育致远教育就是致力于提高考生的水平与知识的储备能力，它以丰富的课程资源以及专业的师资力量给考生送去如沐春风般的教育，让考生在面对师资考试时能够更加得心应手，致力于让每一位考生都考试是它的目标，那这样是否可说明育致远教育好不好，想要了解这个问题，当从课程和师资两方...。

2024-11-22 21:42:16

材质是高速钢但我在网上查了钛金外表是一层黄色镀层咱们经常使用了一种金属压块求教一下厂商说是钛 (高速钢哪个材质好)

高速钢上黄色镀层是现代的一种镀膜工艺，应该是钛涂层，是CVD镀层的一种，关键作用是耐磨，耐高平和参与经常使用寿命，但碰到溶剂发生胶状物就不了解了，呵呵金属压块破碎机的开展背景动力的少量开采使得我国经济水平继续坚持着良好开展的态势，但也日益显示出开采适度、资源无余、环境污染等干流矛盾，在现代化树立的脚步中，钢铁工业也已由04年的钢铁大国...。

2024-07-07 05:08:28

2600PRO H10 看高清硬解的疑问七彩虹白金版 (2600PRO显卡支持2K么)

首先，确定的通知你配件解码h.264的规范cpu占用率也就是在25%，35%间接，不要看网上的那些测试，那都是如许高性能的机器能力够5%，7%啊，一部电影并不是光显示图像，首先要将视频跟音频启动分别，这局部是须要cpu计算的，并且分别进去的音频也须要cpu启动解决，除非你是独立声卡，并且还允许这些解码，关于hd2600pro来说只需装...。

2024-07-06 17:41:02

求哪位大侠可以提供油罐车的正面图片谢谢！不要有水印的 (求哪位大侠可以帮助他)

大体看看吧，网络图片有很多，差不多的自己截一下就行3吨油罐车5吨油罐车有那些可以决定3吨油罐车和5吨油罐车最罕用的只要西风多利卡油罐车，可做3吨，也可做5吨，只是通告不同，它的图片和性能如下，3，5吨油罐车性能说明，西风多利卡底盘，3308mm轴距，玉柴140马力，朝柴130国六发起机，五挡变速箱，带方向助力，气刹，前桥盘式制动器，限...。

2024-07-06 17:38:49

怎样下载装置360手机助手 (怎样下载装置app)

随着自动手机的遍及，APP曾经成为人们日常生存中必无法少的一局部，而360手机APP，作为市场上备受欢迎的一个品牌，被越来越多的用户所青眼，假设您也想尝试经常使用360手机APP，无妨看看以下的装置下载攻略，方法一，经过360手机助手360手机助手是360手机APP团队推出的官方运行商店，相比拟其余运行商店而言愈加安保、牢靠，装置步骤...。

2024-07-05 13:15:44

将对因实验缺点遭受财富损失的居民给予抵偿天兵科技向巩义市民致歉 (以下因素对实验结果有何影响仪器未清零)

尊崇的巩义市居民、整体同行同伴及广阔社会群众，关于6月30日出现的我司天龙三号液体运载火箭一子级火箭因实验缺点坠落起火事情，在此向允许和关注咱们的广阔社会群众致以最诚挚的歉意，咱们孤负了大家的等候，本次实验地点远离巩义城市，实验开局前，我司已与外地政府联结完善安保保证措施并提早组织周边人员撤退，此次坠落箭体散落在大山深处的安保布控区内...。

2024-07-03 23:26:37

包含两家中国实体又打压！外媒美商务部选择对6家实体实施贸易限度 (包含两家中国银行的卡)

[全球网报道]综合路透社、塔斯社等多家媒体7月2日报道，依据美国商务部下属机构工业和安保局颁布的信息，该部门选择把6家来自中国、南非、阿联酋以及英国的实体列入无关，实体清单，，要素与所谓，国度安保，和外交政策疑问无关，据路透社报道，上述6家实体中，来自中国和阿联酋的实体各有两家，来自南非和英国的实体各有1家，报道称，美方选择对这些实体...。

2024-07-03 21:08:11

暗影战姬任务攻略分享_暗影战姬资源获取攻略

相信最近上线的暗影战姬手游一定有部分小伙伴已经玩上了，这款游戏有着十分多的玩法，本次小编就给大家带来暗影战姬任务攻略，帮助大家可以更好的进入游戏，快速获得自己想要的角色道具，拥有更好的游戏体验。暗影战姬任务攻略一、奥瑞克遗迹攻略早期即可开放

2023-10-11 03:04:04

文章推荐

IDC 2026年国内市场近半终端将搭载硬件层面的AI引擎技术 (IDC2024)

7月26日消息，市场研究机构IDC预测，随着近年来人工智能的快速迭代与发展，数据大模型日益完善，AI的场景化落地将成为未来发展的重要突破口，终端的AI化也成为了AI发展与落地的重要支持方向，众多厂商目前已经推出了许多搭载硬件AI引擎的移动处理器，新技术在增强笔记本电脑本地AI运算能力的同时，也能够促使消费者更新换代手中的设备，终端设备...。

2025-02-02 19:04:49

资讯动态

那些年被AOL收购毁掉的好产品 20年前网景遭毒手 (那些年被奥特曼欺负的小怪兽视频)

如果你是一名资深网民，那么应该会记得网景浏览器的鼎鼎大名，在20年前的1998年11月，AOL宣布以42亿美元免税换股的方式收购网景浏览器，从此网景的名号渐渐消逝于江湖——被AOL看上买下来的牌子，基本就没哪个有好日子过的，借着网景浏览器被AOL收购20周年的时机，我们这就来回顾一下那些惨遭AOL毒手的业界大咖吧，网景浏览器首先要提到...。

2025-01-31 01:51:56

网络百科

葫芦岛化工中学老师名单 (葫芦岛化工中学校长)

葫芦岛化工中学老师名单，沈春丽、郭蕾、周立英、赵琳、董文光等，葫芦岛化工中学介绍如下，葫芦岛化工中学简称为学院附中，是市唯一一所直属初中，学校的前身是锦西炼油化工总厂完全中学，学校占地面积平方米，校舍建筑面积为平方米，学校建有教学楼、科技馆、室内体育馆，2000年划归地方，市财政局、教育局每年投入800多万元资金保证学校教育教学活动的...。

2024-12-06 15:51:44

资讯动态

Redmi投影仪怎么看电视 (redmi投影仪)

发表在专业问答2024，4，1117，50展示机型信息，品牌型号，RedmiLite版系统版本，MIUITV3.0Redmi投影仪看电视可以通过手机投屏进行观看电视台节目，总共可以分为三步，下面为Redmi投影仪怎么看电视的详细步骤做具体说明，Redmi投影仪怎么看电视1.连接同一网络将手机和Redmi投影仪连接到同一无线网络中；2....。

2024-11-28 19:05:40

网络百科

6块钱那个声音是app (6块钱的)

6块钱那个声音是爱聊app，爱聊app只需要六块钱，就有声音好听的酷哥，甜姐陪你聊天，哄你睡觉，这价格和服务，让我十分心动，毕竟失眠是每一位新媒体工作者的宿命，在每个疯狂码字的夜晚，我都会因为大脑过于兴奋，失眠到凌晨两点，6块钱那个声音是爱聊app，哄睡陪聊标准聊天话术晚安这样回复，想你一整晚霸道总裁型，晚什么安，我巴不得你想我想的睡...。

2024-11-18 19:42:19

资讯动态

复旦大学团队发布中文医疗健康个人助手，开源47万高质量数据集|样本|大模型

相关文章

文章推荐