1. 研究目的与意义
近年来,自然语言处理的研究已经成为热点,而机器翻译作为自然语言研究领域的一个重要研究,同时也是人工智能领域的一个课题,在历来的研究中都占据着重要的位置。
纵观整个机器翻译的历史,从上个世纪40年代英国工程师booth和美国工程师weaver提出利用计算机进行翻译的点子,到50年代欧美等国投入大量的人力、物力致力于机器翻译的研究,再到60年代alpac置疑报告的提出,机器翻译走向了滑铁卢。
最近的十几年,随着自然语言学理论的发展,以及计算机技术的进步以及统计学和机器学习方法在自然语言处理领域中的广泛应用,人们对机器翻译本身应用背景下取得了长足的发展,基于统计、实例等新的机器翻译方法都是在这一时期出现,一些机器翻译实验室开始走向市场。
2. 课题关键问题和重难点
本课题的第一个难点就是漏译,很多时候,原语言句子有些词没有被翻译出来,这确实是神经网络翻译面临的一个问题。
翻译模型把原文句子整体读进去以后形成了一个向量,然后再对这个向量进行解码。
翻译模型认为有些词不应该产生,从而漏掉了译文。
3. 国内外研究现状(文献综述)
一、文献综述(或调研报告)1 机器翻译产品的现状总体上说,机器翻译产品可以归为如下几类,一是传统的文本自动翻译产品;二是网页翻译,它常常与网上搜索引擎捆绑在一起;三是机器辅助翻译产品,它主要是帮助专业翻译人员提高翻译效率;四是电子版的双语词典,如著名的金山词霸,它主要是帮助熟悉外语的用户在计算机上阅读外语信息;五是口语自动翻译。
基于个人的机器翻译系统从1990年代初期开始出现,systran pro(专业版),systran classic(家庭版)环球衔接公司(globalink)研制的power translator,语言工程公司(language engineering corporation)研制的logo vista等,从大型机系统改造而来的有systran pro(专业版),systran classic(家庭版),langescheidt(源自metal)等,国内的系统有译星、通译、环宇通、华建译通、东方快译、金山译霸等。
基于网络的机器翻译系统从1990年代中期开始大量出现,目前提供在线机器翻译服务的知名公司有:systran,logos,fujitsu,lant,altavista,compuserve以及国内著名的华建、桑夏等公司。
4. 研究方案
四、方案(设计方案、研制方案)论证设计方案:1.查阅相关文献并深入了解本课题的主旨以及其功能的设计思路2.掌握机器翻译系统的配置、安装、开发应用3.对该课题进行系统的需求分析,并确定系统的基本功能,同时建立项目规划完成模块设计4.根据对该系统的需求分析制订系统的流程图和结构图,根据分析结果建立相应的数据表,完成系统功能模块的E-R图并完成相关功能的代码编写5.然后对其进行系统测试,检查系统错误并修改以完善系统,用修复工具捕获系统性能、可用性、版本兼容性的问题6.将各模块的分析设计结合下来,整理成文档
5. 工作计划
本课题主要研究基于transformer的课堂考勤系统,在整个过程中主要完成以下工作:1.了解目前机器翻译的发展现状和趋势,研究并分析该系统的目标与定位。
2.深入学习研究本课题所涉及的相关技术和理论知识,利用软件工程的的理论知识作为指导思想,分析系统的功能需求、性能需求和安全需求,并对该课题进行系统的总体设计。
3.根据需求分析、总体设计,去实现基于transformer的课堂考勤系统的开发,运用微信开发者工具开发。
