现在的位置:主页 > 综合新闻 >

大数医达林玥煜:在中文医学NLP上,我们有哪些(2)

来源:医学信息 【在线投稿】 栏目:综合新闻 时间:2020-09-09

【作者】:网站采编
【关键词】:
【摘要】:。 这首先需要医疗大数据挖掘,病历的电子化是一个长期的过程。电子病历也是大数医达最大的优势,我们有长时间、连续的病历数据积累。 电子病历、

这首先需要医疗大数据挖掘,病历的电子化是一个长期的过程。电子病历也是大数医达最大的优势,我们有长时间、连续的病历数据积累。

电子病历、入院记录、手术记录,术前术后小结这些文本资源,我们利用这些数据训练出模型,帮助经验不足的医生学习和诊断。

但这些海量的文本,在使用之前还需经过几轮处理。

首先,对病历进行结构化提取,把病历里的临床表现、体征检查、化验值、家族史、既往史或者吸烟史、婚育史提取出来。接着,对同一个症状、不同描述做归一,最终形成结构化电子病历。

虽然,电子病历系统已经越来越完善,也同时导致医生选择模板变得困难,经常都是直接选择默认值,导致阳性或阴性症状都没有被重点突出,也就需要根据不同疾病模型获得更高权重。

其次,根据一些医学典籍,把电子病历中的错误进行过滤,过滤虽然非常简单粗暴,但也比较有效。

我们在训练模型的时候,也可以把典籍里面的重点症状权重调高。例如阿兹海默症、癫痫和偏瘫症状,就这些症状的权重调高,让模型更好判断当前症状、化验结果、体格检查。

但典籍给出的,永远都是模糊的建议,而没有哪个病人会按照教科书生病。

院内的智慧服务有哪些核心环节?

我们利用上一步提取的病历,可以很容易把这些疾病分级、分类。

首先,把疾病分为常见病和罕见病两类,常见病种类就包括4000多个ICD、300多个种类,涵盖95%的就诊患者,剩下为罕见病,存在上万个ICD,但仅占总数5%。

大数医达的AI问诊模型可以像医生一样不停追问患者当前症状,根据患者年龄、性别等生命体征,从模型里动态生成问题,而不是像其他厂商问题非常固定。

利用这种动态模型的建立,可以在问诊过程中,很容易收集到患者当前症状。

为什么只涉及症状?

这是因为,整个医疗过程,症状是最重要的部分之一,特别对于科室分诊有着重要意义。

对于患者来说,导诊非常困难,一种疾病对应多个科室。而一旦选错不仅耽误治疗时间,还会产生过度医疗行为。

回过头来看,导诊过程本身就可以在就诊前完成,甚至通过有效导诊可以避免简单疾病的过度医疗。如果这个病需要挂号,大数医达的AI问诊助手也可以跟医院打通挂号系统后,把AI医生收集的所有病症,同步给医院HIS和EMR系统,这样医生在见到病人前就能看到病人的主诉。

如果是罕见病,模型也可以结合症状判断疾病严重程度。例如,一个患者什么症状都没有,只有发热,而且不明原因发热,持续时间比较长,就可能判断为新冠肺炎。医生可以通过互联网医院平台,和患者一对一对话,尽快做进一步检查。

目前,人工智能的发展并不能够代替医生,只能辅助医生,特别是疑难杂症,原因在于疑难杂症数据量非常少,每个医院可能就几份病历,这么少的数据很难训练出模型来辅助医生决策,最多只能实现检索和参考。

这是一个智能门诊案例,功能包括根据患者状况进行提问,根据问题给出患某种疾病的概率。

现实过程中,很多患者看病时间平均也就两三分钟,如果能帮助医生节省一分钟,就相当于提高了33%的效率,对医疗资源利用率提升非常有帮助。

接下来,我和大家分享一下医疗数据挖掘对于医院管理质量提升的作用。

目前,大量医疗资料都是以病历形式存在,优质病历对医生、患者、医保,以及整个医疗过程参与者都非常重要,特别对于医院管理段,如果医生自身没有注意,后续就需要在病历归档时候进行全量扫描,一步步来找出病理的问题,给医生做反馈。

目前,大数医达已经积攒了大量医疗文本处理经验,并且根据经验设计了病历质控系统。

病历质控系统分为两部分。首先,利用十几个模型对不同病历部分做结构化,一边书写、一边进行结构化,结构化之后再做机器质控。

使用结构化质控的原因在于医生书写病历的形式多种多样,仅仅通过自然语言进行对错判断,误判率会非常高。而且,目前深度学习技术还无法分清对错。

目前,大数医达病历质控系统最核心的技术就是医疗文本结构化,根据医学团队总结出的医学规则,在结构化数据上进行质控。

文章来源:《医学信息》 网址: http://www.yxxxbjb.cn/zonghexinwen/2020/0909/702.html

上一篇:致力睡眠疾病防控 “广东省预防医学会睡眠障碍
下一篇:开封市妇产医院与郑大一附院精准医学实验室合

医学信息投稿 | 医学信息编辑部| 医学信息版面费 | 医学信息论文发表 | 医学信息最新目录
Copyright © 2018 《医学信息》杂志社 版权所有
投稿电话: 投稿邮箱: