中文期刊网,快速职称论文发表权威机构

中文期刊网

您的位置:首页 > 论文 > 医学论文 > 医学文献诊疗风险语句的语义模型与提取

医学文献诊疗风险语句的语义模型与提取

来源:期刊网  作者: 喻鑫;  导师:张矩;  时间:2018-09-10 15:20:34  点击:

  •   随着生物医学的迅猛发展,医学文献呈现指数级、爆炸式的增长趋势。面对医学文献这座巨大医学知识宝库,对医学文献知识的挖掘越来越重要。其中医学文献风险知识的抽取是现在极具挑战的方向,因为风险表达方式与循证医学的特点紧密相关。当前,医学文献风险语句语义模型构建方面的研究还比较少。目前,医学文献风险知识的抽取工作主要在于两方面,一是医疗人员人工分析大量医学文献中的风险知识,然后综合风险知识并构建文献综述;二是自然语言处理研究人员对医学文献摘要进行处理,抽取其中关于风险百分数的影响说明元素和被影响说明元素,但准确率和召回率都比较低,准确率在50-70%之间,召回率在30-50%之间,准确率和召回率都有提升的空间。

      本文聚焦乳腺癌医学文献风险知识的挖掘,对乳腺癌医学文献文本中的风险事件进行抽取,风险事件包括影响说明元素、被影响说明元素、关键词说明元素、来源说明元素、程度说明元素和时间说明元素。首先,通过构建风险语句句式对文献文本中的风险语句进行抽取;接着,以词典加序列标注算法(隐马尔可夫模型和条件随机场)对风险语句中风险事件抽取的结果为baseline,对比角色BIO标注加序列标注算法(隐马尔可夫模型和条件随机场)的抽取。通过对比baseline,可以看到角色BIO标注加条件随机场的方法效果最好,各种事件的准确率都高于70%,平均F1值达到70.6%。

    本文关键词: 医学(150) 文献(7) 诊疗风险(1) 语句(1) 语义(1) 模型(4) 提取(1)

    收缩
    • 电话咨询

    • 400-801-3439