1. 研究目的与意义、国内外研究现状(文献综述)
1 意义随着统计自然语言处理技术的发展,双语平行语料库在统计机器翻译和跨语言检索领域中的作用已不容忽视。
现有双语平行语料库仍然无法满足实际应用的要求,双语语料库成为统计机器翻译系统和跨语言信息检索的发展瓶颈。
现在双语语料库的进一步研究成为国内外研究者关注的焦点。
2. 研究的基本内容和问题
1 研究目标及内容本系统的目标是用户可以随意的通过输入关键词,检索到文本(即本人自己构建的语料库)中其所在的相关句子及对应的译文,以便相关语言的学习及翻译参考。
系统中文本信息来源于网络,通过相关双语平行语料库对齐技术将内容整理并存入数据库,用户通过php编写的web来检索信息,通过php与数据库链接,从数据库中提取所需信息,并在网页中向用户展示出来。
2 拟解决的关键问题(1)双语语料收集和对齐整理(2)对双语文本的检索及相关算法(3)后台数据库的建立和维护(4)web和后台数据库之间的连接(5)服务器的设置与网站设计
3. 研究的方法与方案
研究方法、技术路线、实验方案及可行性分析1 研究方法通过功能分析法来确定和改进本系统的功能,通过信息研究方法和文献研究法获得相关技术信息和系统所需数据信息。
2 实验方案采用php对web进行设计编写,使用mysql作为数据库存储双语文本信息。
php与mysql具有很好的连接性。
4. 研究创新点
(1)本系统可以通过关键字,查询到相关文本中包含关键字的语句及其对应译文,中英逐句对应。
(2)本系统既是文本查询系统,又是一个小型的双语平行语料库,可以帮助语言的学习及研究。
(3)该系统拟采用php mysql进行开发,以web形式呈现,便于用户使用。
5. 研究计划与进展
(1)2015.1.20-2015.2.20:PHP,MySQL相关知识学习;(2)2015.2.21-2015.2.25:总体设计,设计系统模块; (3)2015.2.26-2015.3.9:设计数据库; (4)2015.3.10-2015.4.9:编写代码;(5)2015.4.10-2015.4.25:系统测试和运行,改进完善;(6)2015.4.26-2015.4.30:完成毕业论文。
