近来,记者得悉,自然言语处理范畴世界尖端会议 ACL 2020 (Association for Computational Linguistics)论文接纳成果发布。云知声-中科院主动化所“言语与常识核算联合实验室”共有3篇论文被录入,分别在医疗对话的主动信息抽取、世界疾病分类(ICD)主动编码,以及 ICD 主动编码可解释性等范畴获得打破。
云知声表明,这些最新的自然言语处理算法将为后续研讨供给有价值的经历和方向。现在,已在云知声医疗事务首先运用。
云知声介绍,现在,电子病历渐渐的变成了现代医疗的重要组成部分,可是现在书写电子病历费时吃力,渐渐的变成了医师的沉重负担。经过面向医患对话文本的信息抽取体系,可从对话中抽取出症状、查看、手术、一般信息及其相应的状况。这些抽取出的信息将有利于医师书写病历,或许更进一步地运用于病历的主动生成。
在临床医学决议计划方面,云知声表明,为了缓解人工编码耗时、吃力、简单犯错的问题,许多作业开端研讨运用机器进行主动的 ICD 编码。研讨团队经过结合中文的言语特点,提出了一种根据空泛卷积和N-gram言语模型的ICD主动编码方法,运用空泛卷积捕获非严厉匹配的语义片段依据,运用 N-gram 捕获严厉匹配的语义片段依据,从而二者联合运用,一起提高猜测成果的可解释性。可解释的成果对临床医学决议计划具有极端重大意义。
在医疗范畴,云知声-中科院主动化所言语与常识核算联合实验室根据自然言语处理技能构建的医疗常识图谱已储藏约 50万医学概念,超越169万医学术语库和398万医学联系库,涵盖了绝大部分药品、疾病、科室与查看,规划达世界抢先水准,并在语音病历,病历生成、病历质控、辅佐诊断体系等详细运用中发挥重要支撑。