基于图神经网络的金融领域篇章级事件主题抽取系统研究与实现开题报告

 2022-04-13 19:57:51

1. 研究目的与意义

深度学习彻底改变了许多机器学习任务近年来,从图像分类和视频处理到语音识别和自然语言理解。这些任务中的数据通常表示在欧几里德空间。然而,有越来越多的数据从非欧几里德域生成并表示为具有复杂关系的图形的应用程序和对象之间的相互依赖性。图形的复杂性数据对现有机器提出了重大挑战学习算法。

“事件抽取”是舆情监控领域和金融领域的重要任务之一,“事件”在金融领域是投资分析,资产管理的重要决策参考;事件也是知识图谱的重要组成部分,事件抽取是进行图谱推理、事件分析的必要过程。“事件抽取”的挑战体现在文本的复杂和任务的复杂。文本的复杂体现在事件抽取的输入文本可能是句子、段落或者篇章,不定长度的文本使得限制文本长度的模型无法使用;任务的复杂体现在事件识别的任务包括:事件类型识别,事件主体抽取和事件要素抽取。

由于近些年来,图神经网络的流行和大范围的应用,可以看出它的处理非欧几里得形数据上,表现出了很好的性能,于是我想着可以把金融领域篇章级事件主题抽取可以用图神经网络的方式实现一下,看看它处理的结果与基于Bert-NER主体抽取等其他方法比较,或许能够得出不错的结果。

2. 研究内容和预期目标

本课题评测任务的文本范围包括互联网上的新闻文本,上市公司发布的公告文本(PDF文档已转成无结构化的文本内容)。 本次评测任务的事件类型包括:财务造假、偿付能力不足、高层失联/去世、企业破产、重大资损、重大赔付、重大事故、股权冻结、股权质押、增持、减持等。本课题评测任务把发生特定事件类型的主体称为事件主体,如“公司A向公司B赔付”对于事件类型“重大赔付”的事件主体是“公司A”。事件要素为该事件类型的所有属性信息,如事件类型“破产清算”的事件要素包括“发布公告时间”、“破产清算的公司”、“受理法院”、“公司所属行业”、 “裁定时间”。

该任务旨在从文本中抽取事件类型和对应的事件主体。即给定文本T,抽取T中所有的事件类型集合s,对于S中的每个事件类型s,从文本T中抽取s的事件主体。其中各事件类型的主体实体类型为公司名称或人名或机构名称。

  • 输入:一段文本T。
  • 输出:事件类型和事件主体。示例:样例1输入:“法院裁定公司A需向公司B一次性赔付500万” 。输出:事件类型:“重大赔付”。 事件主体:“公司A”。样例2输入:“公司A高管将100万股股权质押给银行,质押开始日期为2018年6月1日,期限为5年”。输出: 事件类型:“股权质押”。事件主体:“公司A”。

3. 研究的方法与步骤

对于事件主体的识别,考虑到新闻中可能存在多个实体,故将其作为一个序列标注任务,即简化版的命名实体识别任务。第二步事件类型分类则是关于文本的多标签分类任务。

一、事件主体的识别---命名实体识别

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1] 陈勤,自然语言处理基本理论和方法[m],哈尔滨工业大学出版社,2013.08.

[2] chris manning/hinrich schütze 著,苑春法/李伟/李庆中 译,统计自然语言处理基础[m],电子工业出版社,2005.12

[3] 米歇尔(mitchell t.m.) (作者),曾华军(译者),等(译者),机器学习[m],机械工业出版社, 2008.03

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 计划与进度安排

(1)1月11日至2月15日 分析课题,查找资料。

(2)2月16日至2月28日 完成需求分析。

(3)3月01日至3月16日 完成开题报告。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版