量子位

电子技术应用专栏作家——量子位。追踪人工智能新趋势,关注科技行业新突破!

中医大模型来了!临床诊疗和养生调理一步到位,发布现场训练过程大公开,超1100万条知识图谱数据

0
阅读(2216)

  白交 发自 凹非寺

  量子位 | 公众号 QbitAI

  国内医疗大模型,现在又迎来了位新玩家。

  还是以中医为核心的大模型——

  岐黄问道·大模型,大经中医出品。

image.png

  作为国内智慧中医的代表企业,以往它的个中进展或许并不被广泛熟知。

  但它核心产品中医临床智能辅助诊疗系统,实现了从基层村级卫生室到三甲中医院的应用覆盖,积累了400多家等级医院、8000多家基层医疗机构的用户。

  这也就意味着,一旦大模型规模化落地,就可快速实现到基层的应用。

  结果在发布会现场,它直接甩出三个子模型,还进行了现场演示。

  • 基于已确诊疾病的临床诊疗大模型;

  • 仅仅基于症状、体征的临床诊疗大模型;

  • 中医养生调理大模型。

  以中医养生调理大模型为例,只需输入症状、体征信息。比如输入怕冷及相关症状。

  大模型就能输出一系列多维度的养生方案来。包括中药、经络穴位、食疗、茶饮等一步到位。

 图片

  △输入怕冷及相关症状,给出系列养生方案

  年轻人养生的第一个大模型,来了?!!

image.png

  本以为这样就结束了,但没想到的是演示之后,大经中医竟然还直接公开了正在进行的训练过程?!

  image.png

  这个玩家究竟什么来头?中医GPT首秀实力究竟如何?

  中医GPT实力如何?

  那就来看看,这个岐黄问道·大模型的首秀能力如何?

image.png

  主要分布两大场景:中医辅助诊疗、中医健康养生服务。

  首先是知病场景——基于已确诊疾病的临床诊疗大模型的现场演示,即输入患者“疾病-症状-体征”信息,让大模型输出辨证结果、治则治法和中药方剂。

  一上来,它就会自称「小经医生」,询问需要咨询的疾病。现场输入慢性胃炎后,它会进一步要求你提供相关的病情。

 image.png

  患者3年前出现胃痛,隐隐地痛,有时候会有胃热的感觉。前年9月份去当地人民医院做了胃镜检查,当时诊断为浅表性胃炎。患者平时吃的比较少,胃口一般,口干,大便干,睡眠一般,舌红,脉细数。

  最终可以看到,它成功地推断出了证型「脾胃阴虚型」,并给出了治法、处方以及用药和用法。

  目前该模型已经通过“大经数智中医”微信公众号,向医疗机构开放内测申请。

image.png

  而即便是那种没有明确诊断的疾病,只输入症状和体征信息。大模型也能输出完整的结果来,即第二个子模型知症。比如输入“盗汗”以及相关病情。

图片

  而在健康养生场景下,只需输入最近困扰你的亚健康问题,就能快速获取一整套涵盖艾灸、按摩、膏方、茶饮、膳食、汤羹等内容的养生建议。

图片

  这样的能力,离不开行业数据的支撑和训练。据大经中医技术总监王祺表示,在大模型的训练中,主要用了这些数据集——

  1100万条中医知识图谱数据;1500本中医古籍和文献数据;10万份真实中医专家医案数据;10万条脉象、舌象、经络、穴位数据;200万条真实的中医临床诊疗数据。

 image.png

  而为了这些高质量数据,大经中医过去投入了数千万研发费用。

  具体训练方式也在这场发布会上,得到了公开呈现。

  主要采用四层递进的训练方式:预训练→监督微调→奖励模型→强化学习。目前,前两个阶段已经完成,后两个阶段正在持续迭代中。

image.png

  目前该训练系统正在由中医和AI两方面的专家协作完成。中医专家评估的ID,已经达到了1704605,足以见其数据规模。

  敢一下子放出三个子模型,并在现场直接公开训练过程,大经中医底气从何而来?

  岐黄问道大模型如何炼成?

  大模型最直观的范式变革,就是新型人机交互关系的诞生。

  不管是通用场景下的搜索引擎,还是垂直场景下的交互模式——

  从UI、OS、EMR(电子病历)等转变为自然语言。已预见到的是,「流量入口」、「知识获取路径」等都在这场变革中得到重新定义。

image.png

  既然落地价值显性,那具体到大模型在垂直场景应用,大经中医CEO李文友认为取决于这三个要素:

  •   数据:高质量行业数据的获取;

  •   专家:业内高水平专家对预训练模型的调整、反馈;

  •   场景:具体场景的业务深耕,对具体场景的业务理解,以此实现大模型与行业的有效结合。

  归结起来,就是行业Know-how,多年领域深耕积攒下来的行业壁垒。

image.png

  于大经中医而言,这种“壁垒”可以具体展现在三个方面:

  数据。

  相较于其他医疗分支,中医知识更为庞杂和个性化,而且历来有“道不传非人,法不传六耳”的传统,这就导致高质量数据非常私密,公开数据质量又比较低,因而更需要垂直领域深耕。

  据介绍,基于大量真实名老中医的诊疗经验和中医文献中的诊疗知识,大经中医构建了中医诊疗知识图谱 ,涵盖内外妇儿等全学科、经方时方、孟河岭南等全流派。据称是目前业内最高质量的行业数据。

image.png

  与此同时,还建立了包含25000+个词条的中医症状、体征术语规范化词典。据介绍,这也是行业中唯一大规模、覆盖全病种的术语规范化词典。这样一来,能够减少因为措辞差异导致答案不一致的影响。

  目前,大经中医已经积累了400多家等级医院、8000多家基层医疗机构用户,形成了大量专业的中医诊疗数据。

  人才。

  据了解,大经中医拥有全行业规模最大的中医-AI跨界研发团队,也拥有行业最大的名老中医团队,他们通过协议方式合作展开中医AI研究,可在此次大模型研发中,协助开展RLHF工作提高性能。

  此外,大经中医还与上海交大计算机科学与工程系等机构专家合作,集成多方技术优势,共同开展中医大模型的研究。

  应用。

  场景应用越丰富,客户数据越庞杂,越有助于训练出更理解行业场景和业务的垂直大模型,并且在后续迭代中也能快速形成飞轮效应,更新速度越来越快。

  大经中医现有的AI应用场景实现了B端和C端的覆盖——

  包括广东省中医院、上海中医药大学附属龙华医院在内的等级医疗机构;南京市江宁区、淄博市高青县等区域中医医联体,亦或是在上海长宁区“为老服务中心”这种大健康机构应用,以及下沉到山东、吉林等地村卫生室这种基层医疗机构的应用。

  而在C端,则以学习强国里的中医智能健康助手为例,只需要选择一些不舒服的表现,就能推荐中医调理方案。目前用户已接近300万人。

图片

  基于这三点核心优势,“岐黄问道·大模型”的技术路径也就明晰起来。发布会现场,李文友透露大模型是这样炼成的。

  首先,从名老中医临床诊疗数据+中医文献数据到中医诊疗知识图谱。

  用知识图谱将这些数据结构化、规范化,从而表达和存储名老中医诊疗经验和文献诊疗知识。

  随后,从中医诊疗知识图谱到中医领域预训练模型。

  利用千万级的中医知识图谱数据和临床诊疗数据,微调通用预训练模型。

  最后,从中医领域预训练模型到岐黄问道大模型。

  由中医专家共同参与,利用奖励模型-强化学习机制,最终形成岐黄问道大模型。

image.png

  为什么需要大模型?

  大模型发展到现在,不管从个中进展还是业内聚焦探讨,已经从对技术本身的展望,逐渐具象到行业落地中去。

  像华为盘古大模型在气象上的应用登上Nature顶刊,它可以在1.4秒就能完成24小时全球气象预报,比传统方法快1万倍。

image.png

  在教育、游戏、广告营销以及矿山、药物研发等领域,大模型都有相应的落地应用。

  这两天,北京交通大学还联合发布了国内自主研发首款综合交通大模型TransGPT·致远,并开源。

  李文友认为,在垂直领域乃至具体场景的应用,正是大模型最大生命力所在。

  关于「中医大语言模型」打造,大经中医也透露了这两个方面的原因。

  从行业中看,中医大语言模型有助于中医药「数智化」发展。

  首先,中医临床诊疗数据、中医文献数据大多都是文本数据的形式。擅长自然语言识别处理的大语言模型则有助于中医传承发展。

  其次,中医临床诊疗既具有完善的理论体系,又具有较强的经验属性,因此学中医素来有“读经典、跟名师”之说。

  这些经验深藏于中医文献、典籍中,以及大量历代医家的医案、医话、医论中,但理解、记忆、应用这些经验是一项艰难的任务,中医大语言模型的出现,将大大改变中医学习和人才培养的模式。

  最后,从中医的终极思维出发,中医不仅仅是医学,也是中国人的生活方式,这也就决定中医不仅存在于医院,也存在于家庭,以及各种与健康有关的空间。

  而在更广泛场景中,自然语言的交互方式更符合普通人的沟通习惯。这样来看,中医大语言模型,能更加推动中医AI更广泛落地。

image.png

  而除了行业维度,对于大经中医本身而言,还有更深层次的价值。

  早在7年前,大经中医就提出:数智化是中医药发展的必由之路,并以此为实践。

  核心产品中医临床智能辅助诊疗系统(CDSS)建立起从三甲中医院到社区卫生服务中心和乡镇卫生院,再到诊所、门诊部、卫生室的各级医疗机构的应用生态。

  今年开始,进一步集成了中医临床智能辅助诊疗系统(中医智脑)、中医智能脉诊仪(中医智指)、中image.png

  用他们的话来讲,大经数智中医一体化诊疗系统已经从“严肃医疗”的生态圈,扩展到“中医大健康”的生态圈。

  而现在,随着岐黄中医GPT的发布,大经“中医大健康”的生态圈将进一步做大,加速更多健康场景的拓展。

  发布会上,李文友演讲最后还呼吁更多生态伙伴加入。

  大模型加速企业生态圈建设,也将进一步加速行业领域发展,朝着更广泛场景落地——

  日常生活中,中医也将随处可见。

  从企业出发,到行业,最后再普惠到每个人当中,这也是大模型落地更多细分领域的变革范式。

  大模型还可以在哪些领域碰撞出火花?不妨在这里期待一下。

原文链接:https://mp.weixin.qq.com/s/twS9En83b8WCewYX_8IobQ

量子位.jpg

电子技术应用专栏作家  量子位