面向PICO模型的医学实体链接方法的设计与实现文献综述

 2022-09-14 08:09

  1. 文献综述(或调研报告):

1、MetaMap介绍

MetaMap是一个把生物医学文本与UMLS超级词表中的概念匹配起来的程序,该程序可以设置很多参数,这些参数用于控制MetaMap的输出以及内部运行(如单词变形的程度、是否忽略超级词表中含有常见词的字串,是否考虑字母的顺序等等)。

(1)切分

任一文本都被切分成简单的名词短语,这样就限定了下一步处理的范围,匹配的工作也更加易于管理。使用“专家”系统中的最小承诺切分器对文本进行浅显句法分析[这一句翻译专业术语不够专业,请专家指正],对于在“专家”词典中没有唯一标签的单词,该切分器使用Xerox句子成分标签器标出句子结构(如名词、动词)。例如,对于“ocular complication of myasthenia gravis”(重症肌无力的眼部并发症),切分器发现两个名词短语:“ocular complication”和“of myasthenia gravis”经过简单的句法分析,将“ocular complication”分为“[mod(ocular),head(complication)],指明了complication是短语的中心部分(head),对于标为介词、连词、限定词的单词,以后的处理将忽略之。

(2)产生变形体

对于每一个短语,利用“专家”词典以及同义词补充数据库中的知识,产生这些短语的变形体。所谓变形体包括这个短语本身(称之为发源词)以及首字母缩写词、缩写词、同义词和词源变异词,这些词的组合,最后是词形和拼写变形体。其基本过程如下图所示(不包括词形变异计算和拼写变异计算,为了提高效率,这些计算最后进行)。对于ocular这个发源词的变形体产生如下图:

Ocular{[adj],0=””}

Eye{[noun],2=”s”}

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。