基于深度学习的生物医学命名实体识别研究开题报告

 2021-12-14 09:12

1. 研究目的与意义(文献综述)

随着生物医学文档数量的快速增长,生物医学文本挖掘变得越来越重要。

随着自然语言处理(nlp)的发展,从生物医学文献中提取有价值的信息越来越受到研究者的青睐,深度学习促进了有效的生物医学文本挖掘模型的发展。

然而,将自然语言处理技术的发展直接应用于生物医学文本挖掘往往会产生不理想的结果。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

本次研究的主要内容是:基于深度学习的生物医学命名实体识别研究。

目标是:对生物命名实体的识别。

拟采用的技术方案以及步骤:1.获取语料,2.语料预处理,拟采用基于统计最大概率输出词性和基于 hmm 的词性标注,3.进行特征工程,建立词袋模型,将字符串转换成数字,4.进行特征选择,构造特征向量,得出特征子集,拟采用df,ig等方法,5.进行模型训练,拟采用bilstm-crf,stm,mtms网络等,6.评价指标采用f1衡量。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

第一周到第二周:查阅有关深度学习有关资料,了解cnn和rnn的神经网络,并且学习python以及nltk工具包的使用,了解nlp的基本步骤。

第三周到第四周:继续学习python和nltk的使用,对文献中的数据集进行数据标注,预计采用bioes的标注方式。

对语料库进行处理。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(不低于12篇)

[1]wang, x., et al. (2019). "cross-type biomedical named entity recognition with deep multi-task learning." bioinformatics 35(10): 1745-1752.

[2]lee j, yoon w, kim s, et al. (2019). biobert: a pre-trained biomedical language representation model for biomedical text mining. bioinformatics. sep 10 2019

[3] kaewphan s, hakala k, miekka n, salakoski t, ginter f. wide-scope biomedical named entity recognition and normalization with crfs, fuzzy matching and character level modeling. database (oxford). jan 1 2018;2018:1-10.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。