基于图神经网络的医疗领域命名实体识别系统研究与实现开题报告

 2022-04-13 19:57:58

1. 研究目的与意义

1.1 研究的背景

(1) 图神经网络(graph neural networks,gnn)是用于学习包含大量连接的图的联结主义模型,当信息在图的节点之间传播时gnn会捕捉到图的独立性。与标准神经网络不同的是,gnn会保持一种状态,这个状态可以代表来源于人为指定的深度上的信息。

在过去几年里,神经网络的兴起与应用成功推动了模式识别和数据挖掘的研究。许多依赖于手工提取特征的机器学习任务(如目标检测,机器翻译和语音识别),如今都被各种端到端的深度学习模式(例如卷积神经网络cnn,长短期记忆lstm和自动编码器)彻底改变。传统的深度学习方法被应用在提取欧式空间数据的特征发面取得了巨大的成功,但许多实际应用场景中的数据是从非欧式空间生成的,传统的深度学习方法在出理非欧式空间数据上的表现仍然难以令人满意。例如,在电子商务中,一个基于图(graph)的学习系统能够利用用户和产品之间的交互来做出非常准确的推荐,但图的复杂性使得现有的深度学习算法在处理时面临着巨大的挑战。这是因为图是不规则的,每个图都有一个大小可变的无序节点,图中的每个节点都有不同数量的相邻节点,导致一些重要的操作(例如卷积)在图像(image)上很容易计算,但不再适合直接用于图。此外,现有深度学习算法的一个核心假设是数据样本之间彼此独立。然而,对于图来说,情况并非如此,图中的每个数据样本(节点)都会有边与图中其他实数据样本(节点)相关,这些信息可用于捕获实例之间的相互依赖关系。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容和预期目标

2.1研究内容

采用图神经网络技术,对电子病历文本进行实体识别,将繁杂的非结构化医疗文本转化为结构化数据形式存储,作为后续医学数据的分析、研究和决策提供重要基础支撑。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与步骤

3.1 研究方法

运用图神经网络的方法对电子病历进行命名实体识别,深入数据结构,可视化软件开发实现等基本理论和方法基础上,通过所掌握的java或python等编程语言,并结合数据库技术以及软件工程等相关理论,技术,研究实现命名实体识别原型系统。将系统开发分为可行性分析、需求分析、系统设计(概要设计、详细设计)、编码、测试、运行维护等几个阶段。

3.2 研究步骤

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1] 陈勤,自然语言处理基本理论和方法[m],哈尔滨工业大学出版社,2013.08.

[2] chris manning/hinrich schütze 著,苑春法/李伟/李庆中 译,统计自然语言处理基础[m],电子工业出版社, 2005.12

[3] 米歇尔(mitchell t.m.) (作者),曾华军(译者),等(译者),机器学习[m],机械工业出版社, 2008.03

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 计划与进度安排

(1)1月11日至2月15日分析课题,查找资料。

(2)2月16日至2月28日完成需求分析。

(3)3月01日至3月16日完成开题报告。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付