1. 研究目的与意义(文献综述)
1.1 设计目的及意义
电子病历结构化是让计算机理解病历、应用病历的基础。基于对病历的结构化,可以计算出症状、疾病、药品、检查检验等多个知识点之间的关系及其概率,构建医疗领域的知识图谱,进一步优化医生的工作。
中文电子病历命名实体识别算法,是对于给定的一组电子病历纯文本文档,识别并抽取出其中与医学临床相关的实体,并将它们归类到预先定义好的类别中。针对收集到的600份标注好的电子病历文本,算法的主要目的是识别治疗方式treatment,身体部位body,疾病症状sign,医学检查check和疾病disease这5类实体。
2. 研究的基本内容与方案
2.1 研究目标
项目预期的设计成果是一个完整的程序。只要输入一句话,就能够准确地对treatment,body,sign,check和disease这5类实体,进行bio三元标记,例如:
输入:他最近头痛,流鼻涕,估计是发烧了
3. 研究计划与安排
第1-2周,撰写开题报告;
第3周,学习python类,复习深度学习知识体系;
第4周,重读深度学习参考书,搭建数据集转化部分代码;
4. 参考文献(12篇以上)
[1](印)尼基尔·盖德卡尔. python深度学习[m]. 杜长营,苏辉,译. 北京:清华大学出版社,2018.
[2]c. sutton, a. mccallum.an introduction to conditional random fields[j]. foundations and trends in machinelearning, 2012, 4(4).
[3] y. altun, i.tsochantaridis, t. hofmann. hidden markov support vector machines[c],international conference on machine learning, 2003.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。