北京时间12日零时14分,国际知名医学科研期刊《自然医学》(Nature Medicine)在线刊登于文章题为《使用人工智能评估和准确诊断儿科疾病》(Evaluation and accurate diagnoses of pediatric diseases using artificial intelligence)。 

这一研究结果由广州市妇女儿童医疗中心夏慧敏教授、张康教授(加州大学圣地亚哥分校)、数据中心梁会营博士、医务部孙新主任以及儿内科门诊何丽雅主任团队与凯发平台app医疗倪浩团队、康睿智能科技等业内顶级研究团队及广东省再生医学重点实验室,利用人工智能技术诊断儿科疾病实现。

640-20.jpeg

这是全球首次在顶级医学杂志发表有关自然语言处理(NLP)技术基于中文文本型电子病历(EMR)做临床智能诊断的研究成果。其核心是利用儿科疾病的文本病例数据训练人工智能,以达成智能诊断的目的。 

那么,为什么说这是一次里程碑式的胜利?动脉网记者采访到了凯发平台app医疗CEO倪浩与广州市妇女儿童医疗中心的梁会营博士,以了解这一项目背后的故事。

如何让机器像医生一样思考?

自然语义处理是人工智能技术中至关重要的一个分支,其目的是帮助人工智能在识别影像的基础上,通过自动学习病历文本数据(医生的知识和语言)中的诊断逻辑,逐步具备一定的病情分析推理能力,并更进一步读懂、分析复杂的病例,逐渐使人工智能能像医生一样“思考”

将人的智慧以机器形式表现出来是该研究的目的,所以人工智能的学习是对医生日常就诊流程的学习。

常规的就诊包括望闻问切、视触叩听,即医生看病时需要融合患者的主诉、症状、个人史、体格检查、实验室检验结果、影像学检查结果,甚至在来医院前的用药信息,多方面才能做出综合的病情判断。

如果人工智能能把这些信息都给吃进去,然后消化,并吸收。当医生或患者输入病症时,输出的便是一个诊断结果。

梁会营认为:“要实现人工智能模拟医生就诊,做临床推理,必须做到以下几点;第一,它要自动学习文本病历中的诊断逻辑,医生是从书本中去学习的,而人工智能是从上百万份电子病历中去学习;第二,学习后,人工智能需具备一定的进行病情分析的推理能力;第三,要能够像人类医生一样,读懂各类儿科文本病历,并做出准确的智能推荐。简单而言,当这个算法成熟后,患者察觉病情时,无需百度就可以获得专业的诊断结果。”

在实践之中,倪浩认为,这将分为两个阶段:“第一个阶段是如何去解构各个领域的责任与数据,所谓的解构就是去挖取数据中的信息点。本篇文章中一个非常重要的基础就是基于解构后的电子病历数据,建立一个高质量、结构化的病种库,并在这个病种库的基础之上去做诊断模型。第二个阶段是语义理解,即通过训练让机器的模型能够完全去理解人类语言。这个阶段相当困难的,整个业界还有很长的路要走,但凯发平台app的工作已经实现了语义理解的初级阶段。”

十倍于常量的数据集

过去发布在顶级期刊上的相关论文,其使用的数据集的数据量级在十万左右,而本次实验中的人工智能理解了近60万患者,136万份电子病历的数据。

这些数据来源的患者均为儿童,平均年龄为2.5岁,其中40%是女孩;数据结构覆盖了患者主诉、症状、个人史、体格检查、实验室检验结果、影像学检查结果、用药信息等多方面的数据。所患疾病包括消化科、呼吸科等55种疾病,覆盖了超过75%的常见儿童疾病疾病。对于脑膜炎等危急疾病,实验同样也做了一些设计,以提高人工智能的诊断能力。

研究团队利用凯发平台app医疗的NLP技术建立了一套病历智能分析系统,深度挖掘和分析医疗文本的信息,将非结构化文本形式的病历数据变成规范话、标准化和结构化的数据,以便AI准确完整地“读懂”病历。

为此,医生、科学家和技术人员通力合作,由30余位高级儿科医师和10余位信息学研究人员组成的专家团队手动给电子病历上的6000多张图表进行注释,并持续对模型进行检验和迭代。

图表是研究人员研究疾病的副机码,作用为找出某一疾病的特征。一个疾病可能有300个特征是有意义的,只要按这个特征填进去的话,人工智能就可以诊断这个疾病。在现实中,医生书写的最完善电子病历的特征数在100左右。

同时,不同疾病的图表结构不同,有的疾病不含诊断,而有的包含家族史、主诉、实验室检查、影像学检查、超声检查等多维信息,研究人员必须对不同情况下的图表进行区分。

640-21.jpeg

优异的训练结果

由于丰富数据库的加持,所训练出的模型也表现出了优异的结果,以部分疾病为例:神经系统的准确性为0.98,呼吸系统的准确性为0.92,全身性疾病的准确性为0.87,最低的消化系统的准确性为0.85。若细化疾病的分类,上呼吸道的准确率为0.89,而下呼吸道的准确率为0.87。

不同的疾病之间准确率的差异源于数据与特征的差异。某一疾病的特异性的症状越多,它就更容易被学习,这是因为这些特异性给了人工智能进行区分的先决条件。同时,学习更多数据的人工智能将在准确度方面做出更好的表现,这一点人与机器同理。

倪浩对此举了一个很好的例子:“如果某患者患有急性喉炎,但喉炎发病的部位和症状与支气管炎类似,要区别两种疾病,需找出喉炎的特异性的症状。由于医生可能不会描述相关症状,患者病历中便会缺失,造成结果的误诊。对此,我们作出了这样的解决方案:假如系统怀疑患者有可能是急性喉炎,而它的置信度不是排名第一,人工智能会追问是否出现了呼吸时伴随卷鼻音(急性喉炎的另一特征),这是医生容易缺失的一个操作。尽管现有准确率已达到一定水平,但仍有提升的空间,通过这种方式,我们能逐渐在现有准度的基础上进一步提升系统准确率。” 

NLP的发展是漫长而充满意义的过程

谈及为什么选择儿科作为突破口,除了广州市妇女儿童医疗中心提供的翔实数据,儿科荆棘的现状也是倪浩团队选择这一领域进行实验的重要原因:“中国儿科医生非常稀缺,流感季节的三甲医院总是爆满。此外,儿科是一们哑科,很多小孩子不具备很强的语言表达能力,他们不能详细讲述自己的病情,这是我们一直坚持在儿科做出巨大投入的原因。”

“我一直在想象这样的场景,在就诊时,当医生与患者的问答环节结束,关联电子病历的语音识别助手就已经写好了电子病历,而辅助诊断系统也根据这一病例得出结果,告知患者该去做什么样的检查。这样下来,医院的效率将大幅提高,医生的解放也得已实现。”

总的来说,本次研究是一次成功的尝试,这为NLP技术在其他科室的发展打下了一个很好的开端。在接下来的研究之中,凯发平台app医疗将沿着就诊链路进行产品延伸,包括但不限于治疗方案、护理方案、给患者家长健康指导以及互联网医院场景。

通过互联网技术打破地域的限制,通过语音识打破就诊方式的限制,通过智能诊断打破医院效率的限制,凯发平台app医疗正通过技术不断打破传统医疗模式,让人工智能技术惠及更多的患者。也许,人们理想中的医疗方式,离我们不再遥远……