复旦大学团队发布中文医疗健康个人助手，开源47万高质量数据集|样本|大模型

文章编号：2085 应用软件 2023-09-02 样本医疗大模型复旦大学个人助手

用微信扫码二维码

分享至好友和朋友圈

患者感到身体不适时，可以向模型问诊，描述自身症状，模型会给出可能的病因、推荐的治疗方案等作为参考，在信息缺乏时会主动追问症状的详细描述。

图2：问诊场景下的对话

用户还可以询问与自身无关的医学知识，此时模型会尽可能专业地作答，使用户全面准确地理解。

图4：与自身无关的医学知识询问对话

DISC-MedLLM是基于我们构建的高质量数据集DISC-Med-SFT在通用领域中文大模型Baichuan-13B上训练得到的医疗大模型。值得注意的是，我们的训练数据和训练方法可以被适配到任何基座大模型之上。

DISC-MedLLM具有三个关键特点：

3、方法：数据集DISC-Med-SFT的构造 复旦大学团队发布中文医疗健康个人助手开源4

在模型训练的过程中，我们向DISC-Med-SFT补充了通用领域的数据集和来自现有语料的数据样本，形成了DISC-Med-SFT-ext，详细信息呈现在表1中。

数据集。分别从两个公共数据集MedDialog和cMedQA2中随机选择40万个和2万个样本，作为SFT数据集构建的源样本。

重构。为了将真实世界医生回答调整为所需的高质量的统一格式的回答，我们利用GPT-3.5来完成这个数据集的重构过程。提示词（Prompts）要求改写遵循以下几个原则：

图6展示了一个重构的示例。调整后医生的回答与AI医疗助手的身份一致，既坚持原始医生提供的关键信息，又为患者提供更丰富全面的帮助。

图6：对话重新改写的例子

医学知识图谱包含大量经过良好组织的医学专业知识，基于它可以生成噪声更低的QA训练样本。我们在CMeKG的基础上，根据疾病节点的科室信息在知识图谱中进行采样，利用适当设计的GPT-3.5模型Prompts，总共生成了超过5万个多样化的医学场景对话样本。

在训练的最终阶段，为了进一步提高模型的性能，我们使用更符合人类行为偏好数据集进行次级监督微调。从MedDialog和cMedQA2两个数据集中人工挑选了约2000个高质量、多样化的样本，在交给GPT-4改写几个示例并人工修订后，我们使用小样本的方法将其提供给GPT-3.5，生成高质量的行为偏好数据集。

通用数据。为了丰富训练集的多样性，减轻模型在SFT训练阶段出现基础能力降级的风险，我们从两个通用的监督微调数据集moss-sft-003和alpacagpt4datazh随机选择了若干样本。

MedMCQA。为增强模型的问答能力，我们选择英文医学领域的多项选择题数据集MedMCQA，使用GPT-3.5对多项选择题中的问题和正确答案进行了优化，生成专业的中文医学问答样本约8000个。

训练。如下图所示，DISC-MedLLM的训练过程分为两个SFT阶段。

图7：两阶段训练过程

评测。在两个场景中评测医学LLMs的性能，即单轮QA和多轮对话。

比较模型。将我们的模型与三个通用LLM和两个中文医学对话LLM进行比较。包括OpenAI的GPT-3.5,GPT-4,Baichuan-13B-Chat;BianQue-2和HuatuoGPT-13B。

单轮QA结果。单项选择题评测的总体结果显示在表2中。GPT-3.5展现出明显的领先优势。DISC-MedLLM在小样本设置下取得第二名，在零样本设置中落后于Baichuan-13B-Chat，排名第三。值得注意的是，我们的表现优于采用强化学习设置训练的HuatuoGPT(13B)。

表2：单项选择题评测结果

多轮对话结果。在CMB-Clin评估中，DISC-MedLLM获得了最高的综合得分，HuatuoGPT紧随其后。我们的模型在积极性标准中得分最高，凸显了我们偏向医学行为模式的训练方法的有效性。结果如表3所示。

在CMD样本中，如图8所示，GPT-4获得了最高分，其次是GPT-3.5。医学领域的模型DISC-MedLLM和HuatuoGPT的整体表现分数相同，在不同科室中表现各有出色之处。

CMID的情况与CMD类似，如图9所示，GPT-4和GPT-3.5保持领先。除GPT系列外，DISC-MedLLM表现最佳。在病症、治疗方案和药物等三个意图中，它的表现优于HuatuoGPT。

各模型在CMB-Clin和CMD/CMID之间表现不一致的情况可能是由于这三个数据集之间的数据分布不同造成的。CMD和CMID包含更多明确的问题样本，患者在描述症状时可能已经获得了诊断并表达明确的需求，甚至患者的疑问和需求可能与个人健康状况无关。在多个方面表现出色的通用型模型GPT-3.5和GPT-4更擅长处理这种情况。

DISC-Med-SFT数据集利用现实世界对话和通用领域LLM的优势和能力，对三个方面进行了针对性强化：领域知识、医学对话技能和与人类偏好；高质量的数据集训练了出色的医疗大模型DISC-MedLLM，在医学交互方面取得了显著的改进，表现出很高的可用性，显示出巨大的应用潜力。

该领域的研究将为降低在线医疗成本、推广医疗资源以及实现平衡带来更多前景和可能性。DISC-MedLLM将为更多人带来便捷而个性化的医疗服务，为大健康事业发挥力量。

谷普下载提醒您

本文链接：http://www.gpxz.com/article/a592ea5658b4eef9aa25.html

上一篇：AndrejKarpathy大模型有内存限制，这个妙招挺

下一篇：大模型时代，百度智能云迎来空前机遇千帆云计

360门口安全产品

360商城是奇虎360公司的官方电商平台，主要经营360安全智能设备，以及相关领域消费品。提供最新的360智能设备，最贴心的售后服务，360社区一手评测资讯，享受360安全、安心、放心的购物体验。

新闻资讯 2024-09-15 01:01:54

郑州幸福到家教育咨询有限公司

幸福到家家庭教育是由ITT国际教练型培训师、ICF国际教练联盟认证PCC专业教练、著名的亲子教育家、家庭教育专家张豪导师创立的教育培训机构。旨在为社会提供家庭教育和亲子教育理念，并开设家长教育培训、青少年内在动力激发、梦想植入培训、以及教师、班主任、校长培训等相关课程。

商业服务 2024-11-13 01:10:20

YXBLOG

YXblog初创于2017年，博客蕴含CTF丶信息安全丶渗透测试等多个板块内容，分享原创技术干货文章。

博客日志 2024-08-17 00:56:46

山东众远建设有限公司

山东众远建设有限公司专业承包：建筑工程、幕墙工程、钢构工程、装饰装修工程、市政工程、防水防腐保温工程、消防设施工程、环保工程、电子智能化工程。

房产装修 2024-08-18 15:26:20

重庆太阳能电池板

重庆驰硕电子科技股份有限公司是重庆、四川、云南、贵州、陕西、新疆、西藏地区具有竞争优势的太阳能电池板、太阳能监控、太阳能路灯、太阳能发电系统，及承接分布式光伏发电站的建设和维护项目的厂家。

科技创新 2024-07-16 12:31:26

茅山泉常州桶装水,矿泉水,纯净水,饮用水,涌泉水,一次性包装水,送水公司厂家

茅山泉-天然自涌泉水，主营桶装水、矿泉水、纯净水、饮用水、瓶装水、一次性包装水等，常州送水及小区水站业务覆盖金坛,溧阳,邹区,天宁区,新北区,湖塘,武进区,戚墅堰区及周边区域，欢迎联系我们！

电影视频 2024-07-16 22:01:30

AI宇宙

AI宇宙是一站式人工智能资源聚合平台，集合了众多AI工具，精心收录了广泛的AI相关网站，包括最新的AI研究成果、实用工具以及行业新闻。旨在为开发者、研究人员和AI技术爱好者提供最全面的AI学习资源、工具和最新科技资讯。无论是AI初学者还是资深开发者，都能在这里找到所需的信息和工具。

新闻资讯 2024-08-18 18:49:27

滨海人才网

滨海人才网,滨海县人才网,盐城市滨海县人才网,滨海人才市场,滨海县人才市场，盐城市滨海县人才市场

招聘求职 2024-11-18 22:58:40

压力表厂家

无锡市海天特种压力表厂是一家专业生产电接点压力表、不锈钢压力表、数显压力表、微压表、耐震压力表等各种压力表厂家。其中耐震压力表销往全国、深受客户好评；双金属温度计质量保证、价格合理；测压软管品质保障、经久耐用；不锈钢压力表广泛应用于石化、冶金、机械等行业。咨询热线：18861601720

网络应用 2024-11-28 14:22:53

乐采云

“政采云”是政府采购云计算服务平台的简称。以互联⽹为基础，充分运⽤云计算和⼤数据技术，以政府采购电⼦化交易和管理为重点，涉及政府采购全流程、各领域、多用户，集政府采购、网上交易、⽹上监管和⽹上服务为一体的综合性云服务平台。

互联资讯 2024-12-03 15:42:00

国家高新技术企业

激光打标机激光焊接机激光清洗机专业生产厂家

企业品牌 2025-01-29 21:29:06

可道云

可道云KodExplorer（原芒果云）提供私有云存储/企业网盘/企业云盘和在线文档管理解决方案，助力企业实现办公协作、Office在线编辑、安全存储访问和组织权限控制。

下载资源 2025-02-06 21:49:42

小编今天给大家带来的是2024有趣的挖掘机模拟驾驶手机版真实的介绍，挖掘机在生活当中非常的常见，每当在工人们修建房子时就能看到许多挖掘机，我猜有许多人都喜欢玩挖掘机，那挖掘机的手机版游戏有小伙伴玩过吗，今天就由小编给大家带来挖掘机游戏的解说，感兴趣可以往下看看，挖掘世界，游戏具有非常的自由度，玩家需要在陆地驾驶挖掘机到地底下去探索未...。

2025-02-11 16:44:42

迷茫就这么赚钱 (迷茫就这么赚钱的说说)

老师，我很迷茫，不知道该干点什么赚钱，我说，你迷茫，我比你还迷茫，整天都有人让我给指条路，我也不是指南针，我会指个屁路，你先说下自己情况吧，回答说，大专学历，进厂拧螺丝太累，职场跟人相处不会，3个月开了两个老板，搞得现在很迷茫，目前在家待业，年轻人啊，真是牛批，以前都是老板说啥是啥，一点不满意就被开，现在是员工咋舒服咋办，一言不合就开...。

2025-01-30 23:57:37

你知道几个 5个新的公众号流量入口 (你知道几个中国的世界之最)

在这篇文章中，作者介绍了微信官方推出的公众号增粉的5个方法，希望对你有所帮助，大量自媒体公司撤离公众号是不争的事实，这些自媒体公司撤离公众号的原因并不是公众号的变现能力下滑，而是因为获取粉丝的难度越来越大，对于很多小量级的玩家而言，想在其它平台获取粉丝也并不容易，所以变现效率最好的公众号仍应该是首选，对于小量级玩家而言，如何用低成本获...。

2025-01-30 22:35:07

2017饮水机什么品牌好 2017饮水机品牌排行榜 (饮水标达标标准)

随着人们生活水平的提高，饮水机逐渐走进了千家万户，成为人们日常生活中经常使用的居家电器之一，它可以将桶装水升温或者降温，方便大家饮用，然而市面上饮水机品牌众多，很多人在挑选时经常眼花缭乱，不知道怎么办才好，那么，究竟饮水机什么品牌好饮水机品牌排行榜饮水机品牌排行榜很好安吉尔1992年，是首批净饮水企业之一，有着非常先进的生产技术，在行...。

2025-01-16 01:04:24

易法通法律服务的价位如何 (易法通法务工作怎么样)

人们的法律意识逐渐的增加，在遇到了纠纷之后更加青睐于专业的法律服务机构，在全国众多的城市中都能够看到法律服务机构的身影，为消费者们带来了便捷的法律服务，也为创业者们带来了商机，易法通法律服务是一家有名的企业法律顾问项目，为众多的企业和单位提供了高品质的法律服务，在市场中有着不错的影响力，那么易法通法律服务的价位如何，易法通法律服务的价...。

2025-01-15 23:57:58

首小时大家电成交大涨765% 政府补贴叠加天猫双11优惠 (小家电大家电)

10月14日晚8点，天猫双11正式开启，今年政府补贴首次叠加天猫双11优惠，带动家电品类大涨，首小时天猫大家电成交同比去年双11预售首日大涨765%，海尔、美的、小天鹅等品牌快速破亿，海尔超薄冰箱、海信电视、美的酷省电空调、松下白月光洗烘套装等单品成交快速破千万，...。

2024-12-10 01:10:13

西藏那曲6.6级地震严重吗 (西藏那曲6.1级地震新闻)

西藏那曲6.6级地震来的也太突然了！这是今年有史以来，中国发生的最大地震，还是比较严重的，好在这个地方比较偏僻，没多少人，震感强烈，但暂无人员伤亡，具体西藏那曲6.6级地震情况如何可以看看本站提供的介绍，西藏那曲6.6级地震严重吗07月23日04时07分在西藏那曲市尼玛县，北纬33.19度，东经86.81度，发生6.6级地震，震源深度...。

2024-11-29 16:18:05

卯是什么生肖 (时逢吉兆在寅卯是什么生肖)

子属鼠；丑属牛；寅属虎；卯属兔；辰属龙；巳属蛇；午属马；未属羊；申属猴；酉属鸡；戌属狗；亥属猪，卯是哪个生肖子鼠，丑牛，寅虎，卯兔，辰龙.....十二生肖中卯所对应的是哪个生物十二生肖中，卯，所对应的是哪个生物，A.鼠B.兔正确答案，B十二生肖，子鼠、丑牛、寅虎、卯兔、辰龙、巳蛇、午马、未羊、申猴、酉鸡、戌狗、亥猪，...。

2024-07-10 08:44:11

八字测算姓名 (八字测算姓名免费测算)

姓名测试打分生辰八字姓名，张琳晰三才五格总评，81分五行区分是，火木金笔画区分是，111312天格.人格.地格.总格.外格数区分，12，木，24，火，25，土，36，土，13，火，姓名，张淋晰三才五格总评，92分五行区分是，火水金笔画区分是，111212天格.人格.地格.总格.外格数区分，12，木，23，火，不适宜女性24，火，35，...。

2024-07-09 19:08:06

地城邂逅记忆神往台服官方 (地城邂逅记忆憧憬日服怎么改中文)

下载地址，类型，安卓游戏，卡牌战略版本，v5.0.2大小，933.00M言语，中文平台，安卓APK介绍星级，评分，★★★★★游戏标签，地城邂逅记忆神往卡牌手游rpg格调类型的游戏，在整个市场中那是占着极大的比重，不过要是说谁制造的最好，那么必要求是日本了，你想感触地道的日式格调吗，那就快来地城邂逅记忆神往手游台服吧，从画面到剧情再到...。

2024-07-01 01:19:01

每日推荐||令人上头的废土丧尸手游

今天完美小编为大家带来一款像素风格的废土生存动作游戏——《像素危城》，游戏时间设定在2035年，地外生物突然出现几天之内就将街道吞没，人类逃离家园苟活存活，而主角作为一名退役特...

2023-10-18 00:53:05

缤智报价_最低价_底价买车_缤智值得买

网易汽车值得买为您提供十堰市缤智最低报价、团购。为您全方位评估推荐最优车型，网易汽车值得买您指尖上的购车顾问！

2023-09-19 01:00:25

文章推荐

你被呼死为何运营商却见死不救 (被呼死了攻击可以报警吗)

虽然现实生活中，电话轰炸骚扰非常少见，但在报纸电视等媒体上却屡见不鲜，北京青年报，近日又报道了一起相关事件，一位整容外科医生拒绝某公司的广告推广业务，随后遭到可能由对方报复的电话轰炸，图片来自网络，一款非常常见的，呼死你，软件报道还称，记者在网上搜索，发现有许多商家在售用于电话轰炸的，呼死你，软件，价格在100，500元之间不等，市...。

2024-12-09 20:21:30

资讯动态

苹果开放机器学习API 但是没有看到苹果的机器学习开发平台 (苹果开放机器怎么开)

雷锋网消息，今天凌晨的苹果WWDC主题演讲无疑是果粉的狂欢，它很有可能被捧为最棒的WWDC，这次大会苹果有6大更新，包括了iOS11、新macOS、升级版Macbook、惊艳的iMacPro以及智能音箱HomePod等软件硬件产品，除了新硬件和新系统，苹果在机器学习方面的动作终于给大家展示了成果，这次，苹果不仅在iOS的自家应用中更多...。

2024-12-09 19:56:06

资讯动态

国际奥委会和阿里国际站合作用AI全面支持运动员创业 (国际奥委会和国际足联关系)

图，国际奥委会主席巴赫在发布会上致辞消息北京时间7月31日晚，国际奥委会与阿里国际站在巴黎共同宣布，将全面支持全球运动员创业，国际奥委会主席巴赫表示，阿里国际站是完美的合作伙伴，该合作基于国际奥委会的，Athlete365商业加速器，计划，阿里国际站是其独家合作伙伴，据悉，阿里国际站将为运动员提供电商经营、全球贸易等多个领域的创...。

2024-11-30 16:32:16

资讯动态

金与正严峻正告！朝鲜稀有地下焚毁韩国传单照片 (金与正是什么职务)

据朝中社14日报道，朝鲜指导人金正恩的妹妹、朝鲜休息党中央委员会副部长金与正宣布说话称，朝鲜边陲地区再次发现韩方分发的反朝传单，正告韩方将付出，十分高的代价，金与正说，今天上午接衔接到朝鲜黄海北道长丰郡及其邻近的17个地域发现韩方散布的传单和恶浊东西的通报，她示意，朝鲜军方人员，目前正在全力搜寻，将发现的渣滓扔进火中并解决掉，虽...。

2024-07-16 00:27:26

心得分享

4399游戏盒下载方法 (4399游戏盒)

1、关上4399官方或运行商店，搜查，4399游戏盒，2、点击，下载，按钮，期待下载实现，3、下载实现后，点击装置并依照揭示启动装置，4、装置实现后，关上4399游戏盒，即可开局游戏，4399游戏盒如何下载1、首先关上手机运行商店，例如苹果手机的AppStore或安卓手机的运行市场，在运行商店的搜查栏中输入4399游戏盒，点击搜查按...。

2024-07-13 21:12:23

电子书库

复旦大学团队发布中文医疗健康个人助手，开源47万高质量数据集|样本|大模型

相关文章

文章推荐