中医大模型来了！临床诊疗和养生调理一步到位，发布现场训练过程大公开，超1100万条知识图谱数据

发表于 2023/8/1 下午3:20:27 阅读（5083）

　　白交发自凹非寺

　　量子位 | 公众号 QbitAI

　　国内医疗大模型，现在又迎来了位新玩家。

　　还是以中医为核心的大模型——

　　岐黄问道·大模型，大经中医出品。

　　作为国内智慧中医的代表企业，以往它的个中进展或许并不被广泛熟知。

　　但它核心产品中医临床智能辅助诊疗系统，实现了从基层村级卫生室到三甲中医院的应用覆盖，积累了400多家等级医院、8000多家基层医疗机构的用户。

　　这也就意味着，一旦大模型规模化落地，就可快速实现到基层的应用。

　　结果在发布会现场，它直接甩出三个子模型，还进行了现场演示。

基于已确诊疾病的临床诊疗大模型；
仅仅基于症状、体征的临床诊疗大模型；
中医养生调理大模型。

　　以中医养生调理大模型为例，只需输入症状、体征信息。比如输入怕冷及相关症状。

　　大模型就能输出一系列多维度的养生方案来。包括中药、经络穴位、食疗、茶饮等一步到位。

　　△输入怕冷及相关症状，给出系列养生方案

　　年轻人养生的第一个大模型，来了？！！

　　本以为这样就结束了，但没想到的是演示之后，大经中医竟然还直接公开了正在进行的训练过程？！

　　这个玩家究竟什么来头？中医GPT首秀实力究竟如何？

　　中医GPT实力如何？

　　那就来看看，这个岐黄问道·大模型的首秀能力如何？

　　主要分布两大场景：中医辅助诊疗、中医健康养生服务。

　　首先是知病场景——基于已确诊疾病的临床诊疗大模型的现场演示，即输入患者“疾病-症状-体征”信息，让大模型输出辨证结果、治则治法和中药方剂。

　　一上来，它就会自称「小经医生」，询问需要咨询的疾病。现场输入慢性胃炎后，它会进一步要求你提供相关的病情。

　　患者3年前出现胃痛，隐隐地痛，有时候会有胃热的感觉。前年9月份去当地人民医院做了胃镜检查，当时诊断为浅表性胃炎。患者平时吃的比较少，胃口一般，口干，大便干，睡眠一般，舌红，脉细数。

　　最终可以看到，它成功地推断出了证型「脾胃阴虚型」，并给出了治法、处方以及用药和用法。

　　目前该模型已经通过“大经数智中医”微信公众号，向医疗机构开放内测申请。

　　而即便是那种没有明确诊断的疾病，只输入症状和体征信息。大模型也能输出完整的结果来，即第二个子模型知症。比如输入“盗汗”以及相关病情。

　　而在健康养生场景下，只需输入最近困扰你的亚健康问题，就能快速获取一整套涵盖艾灸、按摩、膏方、茶饮、膳食、汤羹等内容的养生建议。

　　这样的能力，离不开行业数据的支撑和训练。据大经中医技术总监王祺表示，在大模型的训练中，主要用了这些数据集——

　　1100万条中医知识图谱数据；1500本中医古籍和文献数据；10万份真实中医专家医案数据；10万条脉象、舌象、经络、穴位数据；200万条真实的中医临床诊疗数据。

　　而为了这些高质量数据，大经中医过去投入了数千万研发费用。

　　具体训练方式也在这场发布会上，得到了公开呈现。

　　主要采用四层递进的训练方式：预训练→监督微调→奖励模型→强化学习。目前，前两个阶段已经完成，后两个阶段正在持续迭代中。

　　目前该训练系统正在由中医和AI两方面的专家协作完成。中医专家评估的ID，已经达到了1704605，足以见其数据规模。

　　敢一下子放出三个子模型，并在现场直接公开训练过程，大经中医底气从何而来？

　　岐黄问道大模型如何炼成？

　　大模型最直观的范式变革，就是新型人机交互关系的诞生。

　　不管是通用场景下的搜索引擎，还是垂直场景下的交互模式——

　　从UI、OS、EMR（电子病历）等转变为自然语言。已预见到的是，「流量入口」、「知识获取路径」等都在这场变革中得到重新定义。

　　既然落地价值显性，那具体到大模型在垂直场景应用，大经中医CEO李文友认为取决于这三个要素：

　　数据：高质量行业数据的获取；
　　专家：业内高水平专家对预训练模型的调整、反馈；
　　场景：具体场景的业务深耕，对具体场景的业务理解，以此实现大模型与行业的有效结合。

　　归结起来，就是行业Know-how，多年领域深耕积攒下来的行业壁垒。

　　于大经中医而言，这种“壁垒”可以具体展现在三个方面：

　　数据。

　　相较于其他医疗分支，中医知识更为庞杂和个性化，而且历来有“道不传非人，法不传六耳”的传统，这就导致高质量数据非常私密，公开数据质量又比较低，因而更需要垂直领域深耕。

　　据介绍，基于大量真实名老中医的诊疗经验和中医文献中的诊疗知识，大经中医构建了中医诊疗知识图谱，涵盖内外妇儿等全学科、经方时方、孟河岭南等全流派。据称是目前业内最高质量的行业数据。

　　与此同时，还建立了包含25000+个词条的中医症状、体征术语规范化词典。据介绍，这也是行业中唯一大规模、覆盖全病种的术语规范化词典。这样一来，能够减少因为措辞差异导致答案不一致的影响。

　　目前，大经中医已经积累了400多家等级医院、8000多家基层医疗机构用户，形成了大量专业的中医诊疗数据。

　　人才。

　　据了解，大经中医拥有全行业规模最大的中医-AI跨界研发团队，也拥有行业最大的名老中医团队，他们通过协议方式合作展开中医AI研究，可在此次大模型研发中，协助开展RLHF工作提高性能。

　　此外，大经中医还与上海交大计算机科学与工程系等机构专家合作，集成多方技术优势，共同开展中医大模型的研究。

　　应用。

　　场景应用越丰富，客户数据越庞杂，越有助于训练出更理解行业场景和业务的垂直大模型，并且在后续迭代中也能快速形成飞轮效应，更新速度越来越快。

　　大经中医现有的AI应用场景实现了B端和C端的覆盖——

　　包括广东省中医院、上海中医药大学附属龙华医院在内的等级医疗机构；南京市江宁区、淄博市高青县等区域中医医联体，亦或是在上海长宁区“为老服务中心”这种大健康机构应用，以及下沉到山东、吉林等地村卫生室这种基层医疗机构的应用。

　　而在C端，则以学习强国里的中医智能健康助手为例，只需要选择一些不舒服的表现，就能推荐中医调理方案。目前用户已接近300万人。

　　基于这三点核心优势，“岐黄问道·大模型”的技术路径也就明晰起来。发布会现场，李文友透露大模型是这样炼成的。

　　首先，从名老中医临床诊疗数据+中医文献数据到中医诊疗知识图谱。

　　用知识图谱将这些数据结构化、规范化，从而表达和存储名老中医诊疗经验和文献诊疗知识。

　　随后，从中医诊疗知识图谱到中医领域预训练模型。

　　利用千万级的中医知识图谱数据和临床诊疗数据，微调通用预训练模型。

　　最后，从中医领域预训练模型到岐黄问道大模型。

　　由中医专家共同参与，利用奖励模型-强化学习机制，最终形成岐黄问道大模型。

　　为什么需要大模型？

　　大模型发展到现在，不管从个中进展还是业内聚焦探讨，已经从对技术本身的展望，逐渐具象到行业落地中去。

　　像华为盘古大模型在气象上的应用登上Nature顶刊，它可以在1.4秒就能完成24小时全球气象预报，比传统方法快1万倍。

　　在教育、游戏、广告营销以及矿山、药物研发等领域，大模型都有相应的落地应用。

　　这两天，北京交通大学还联合发布了国内自主研发首款综合交通大模型TransGPT·致远，并开源。

　　李文友认为，在垂直领域乃至具体场景的应用，正是大模型最大生命力所在。

　　关于「中医大语言模型」打造，大经中医也透露了这两个方面的原因。

　　从行业中看，中医大语言模型有助于中医药「数智化」发展。

　　首先，中医临床诊疗数据、中医文献数据大多都是文本数据的形式。擅长自然语言识别处理的大语言模型则有助于中医传承发展。

　　其次，中医临床诊疗既具有完善的理论体系，又具有较强的经验属性，因此学中医素来有“读经典、跟名师”之说。

　　这些经验深藏于中医文献、典籍中，以及大量历代医家的医案、医话、医论中，但理解、记忆、应用这些经验是一项艰难的任务，中医大语言模型的出现，将大大改变中医学习和人才培养的模式。

　　最后，从中医的终极思维出发，中医不仅仅是医学，也是中国人的生活方式，这也就决定中医不仅存在于医院，也存在于家庭，以及各种与健康有关的空间。

　　而在更广泛场景中，自然语言的交互方式更符合普通人的沟通习惯。这样来看，中医大语言模型，能更加推动中医AI更广泛落地。

　　而除了行业维度，对于大经中医本身而言，还有更深层次的价值。

　　早在7年前，大经中医就提出：数智化是中医药发展的必由之路，并以此为实践。

　　核心产品中医临床智能辅助诊疗系统（CDSS）建立起从三甲中医院到社区卫生服务中心和乡镇卫生院，再到诊所、门诊部、卫生室的各级医疗机构的应用生态。

　　今年开始，进一步集成了中医临床智能辅助诊疗系统（中医智脑）、中医智能脉诊仪（中医智指）、中

　　用他们的话来讲，大经数智中医一体化诊疗系统已经从“严肃医疗”的生态圈，扩展到“中医大健康”的生态圈。

　　而现在，随着岐黄中医GPT的发布，大经“中医大健康”的生态圈将进一步做大，加速更多健康场景的拓展。

　　发布会上，李文友演讲最后还呼吁更多生态伙伴加入。

　　大模型加速企业生态圈建设，也将进一步加速行业领域发展，朝着更广泛场景落地——

　　日常生活中，中医也将随处可见。

　　从企业出发，到行业，最后再普惠到每个人当中，这也是大模型落地更多细分领域的变革范式。

　　大模型还可以在哪些领域碰撞出火花？不妨在这里期待一下。

原文链接：https://mp.weixin.qq.com/s/twS9En83b8WCewYX_8IobQ

电子技术应用专栏作家量子位

« 上一篇：ChatGPT被「神秘代码」攻破安全限制！毁灭人类步骤脱口而出，羊驼和Claude无一幸免

» 下一篇：GPT-4V被曝离谱bug：突然执行神秘代码，空白图片读出打折信息，网友们都看呆了

量子位

电子技术应用专栏作家——量子位。追踪人工智能新趋势，关注科技行业新突破！

中医大模型来了！临床诊疗和养生调理一步到位，发布现场训练过程大公开，超1100万条知识图谱数据

作者

标签

量子位

电子技术应用专栏作家——量子位。追踪人工智能新趋势，关注科技行业新突破！

中医大模型来了！临床诊疗和养生调理一步到位，发布现场训练过程大公开，超1100万条知识图谱数据

作者

标签

关注微信公众号