1. 研究目的与意义、国内外研究现状(文献综述)
1、本课题的意义
命名实体识别是文本信息处理的一项关键基础技术,在信息检索、信息抽取等诸多领域得到了广泛的应用。而模型的性能直接影响语料命名实体识别程度的优劣,对语料的理解与分析均有深远的意义。本课题以条件随机场为模型对命名实体进行识别,通过与其他模型的识别指标对比来研究条件随机场模型关于命名实体识别方向的整体性能。
2、国内外研究概况
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究的基本内容和问题
1、研究目标
通过对食品安全语料的预处理将命名实体进行标注,选取命名实体的识别特征,分别使用条件随机场模型和最大熵模型对命名实体进行识别,通过特征模板中选取的评价指标,分析出两种模型的性能进行比较。
2、研究内容
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
3. 研究的方法与方案
1、研究方法
(1)文献调研法
对国内外的相关研究成果进行调查整理,对命名实体识别的相关的研究论文、发展动态报道文献进行利用,为本研究奠定基础;
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
4. 研究创新点
1、对语料的选取选自当前关注热度较高的食品安全方向的网站。
2、针对人名和机构名作为命名实体识别的方向。
3、对于语言学特征选取:实体长度分布、实体本身统计、内部后词、内部前词、内部后字、内部前字、外部后词、外部前词、外部后字、外部前字十个方面。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
5. 研究计划与进展
1、第一阶段,对国内外的相关研究成果进行文献调研。
2、第二阶段,针对语料语言学特征进行命名实体识别实验。
3、第三阶段,对实验结果数据进行整理、统计及分析。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
