来源:期刊VIP网所属分类:免费文献发布时间:2021-06-05浏览:次
摘要:为保证机器翻译准确性,本文提出了基于短语翻译模型的英语翻译计算机智能校对方法,通过发现可代替待校对词汇的正确词汇,以实现英语翻译的自动智能校对。同时详细设计了英语翻译计算机智能校对具体流程,分析了基于最大熵模型的分词模式。最后通过计算机智能校对代码实现与测试,得出结论,英语翻译结果校对之前准确率最高只能达到72.9%,而通过英语翻译计算机智能校对方法完成校对之后,准确率全部保持于99.0%以上,二者准确率差异显著,表明基于短语翻译模型的英语翻译计算机智能校对方法具有显著有效性与良好稳定性,值得大力推广与应用。
关键词:短语翻译模型:英语翻译;计算机,智能校对
Abstract: In order to ensure the accuracy of machine translation, this paper proposes an intelligent proofreading method of English translationlbased on phrase translation model. By finding the correct words that can replace the words to be proofread, the automatic intelligent proofreading of English translation can be realized. At the same time, the specific process of intelli-
gent proofreading of English translation computer is designed in detail, and the word segmentation mode based on the maximum entropy model is analyzed. Finally, through the implementation and test of the computer intelligent proofread-
ing code, it is concluded that the highest accuracy rate of English translation results can only reach 72.9% before proof-
reading, but after the completion of proofreading by the computer intelligent proofreading method of English translation. the accuracy rate is all kept above 99.0%. The difference between the two accuracy rates is significant, which shows that the computer intelligent proofreading method of English translation based on the phrase translation model is effective. It has significant effectiveness and good stability, and is worth promoting and applying
Key words: phrase translation model; English translation; computer; intelligent proofreading
1引言
译文质量是衡量英语翻译结果的重要标准,主要通过译文字符或拼写错误、表达不一致、词法语法错误等加以表征。目前除机器翻译之外,各式各样的计算机辅助翻译工具如雨后春笋不断衍生,很多企业研发了与自身需要相符的辅助翻译工具,但是工具过于侧重于翻译准确性,产品轻量级,良好使用体验等,在一定程度上忽视了译文质量,导致后期需耗费大量人工进行校对。而人工校对存在既有缺陷,即速度慢、工作量大,由此便衍生了各种英语翻译计算机智能校对方法。
斯·劳格劳通过基于字形与语音的词法分析器设计了以不确定有限自动机与有限自动机为载体的自动拼写校对算法;赵军基于音节设计了统计语言模型的自动校对方法,着重分析了模型设计与可行性;冉婕与漆丽娟开发了基于语义与统计的英文机器翻译改进方法,通过构建英文模型与语义分析模型获取约束规则语义的规则,以此改进优化英文机器翻译,此方法虽然时间复杂度偏低,却难以建立精确的语法规则库,翻译效果相对较差;冯志伟通过基于短语与句法的英语翻译校对系统,对英语翻译结果进行校对分析,注重短语与句法精确性,但是忽视了语境连贯性"。在此基础上,本文基于短语翻译模型提出了英语翻译计算机智能校对方法。
2英语翻译计算机智能校对方法设计不同形式文本的转换时英语翻译与翻译校对的共性,所以英语翻译计算机智能校对流程即面向待翻译语句进行翻译,比较并替换校对结果与翻译结果,从而实现智能化校对。
设定K为英语翻译错误结果,P为英语翻译正确结果,实现从K向P的转换,便是英语翻译校对。基于改进短语翻译模型的计算机翻译方法即:
E(P')代表已校对词汇。
通过机器翻译所获取的英语翻译结果中词汇翻译精确性需提高,而计算机智能翻译校对方法注重词汇翻译精确性,所以,基于公式(1)优化改进实现计算机智能校对,即:
在英语翻译计算机智能校对方法阐述中,以K代表待校对词汇,P'代表已校对词汇。假设待校对词汇中包含q个字符,以K9代表,字符分别对应短语翻译模型中词汇,且在已校对词汇中包含1个字符,以P,"代表。假设划分K,为随机d个字符串,以K,"代表,字符串分别对应短语翻译模型中短语。相应的,待校对词汇生成的校对词汇包括d个字符串,以P,"代表。综述可获得公式(2)扩展模式,即:
英语翻译计算机智能校对时,着重寻求待校对词汇的最佳划分方式,并详细校对划分结果,从而获得P'排列顺序的校对结果,通过上式所描述方法发现与待校对词汇相应的词汇P,从而完成英语翻译计算机智能校对2。
3英语翻译计算机智能校对流程设计基于短语翻译模型的英语翻译计算机智能校对流程设计主要包含计算机翻译与智能校对两部分。
就翻译而言,在系统接收输入源文本之后,进行分句预处理分析,分句结果应保持整句或者短语状态,以其为检索单元输入检索。基于数据库匹配与所寻短语类似的短语,将其与对应译文同时返回,并根据相似度进行排序。为有效提升检索效率与准确度,且便于评估相似度,系统通过辅助翻译记忆库索引源文本与译文相应语料库。此外,翻译人员所翻译的短语可能与其他翻译员曾翻译的短语存在较高相似度,或受上下文语境影响,翻译人员所翻译短语在文本后续部分中出现大量类似复现,所以需索引储存已翻译短语"。
就校对而言,加载待校对的源文本-译文本,可通过数据库读取。面向文本,先分句处理,切分源文本与已翻译目标文本为短语。在翻译时切分文本遵循切分为最简短语言片段的原则,而在校对时文本需切分为短语。英文文本的空格为自然分隔符号,所以不需分词处理,只需对中文分句文本进行分词处理既可。中文分词方式各式各样,本文选择基于最大熵模型的中文分词模式。文本分词之后,针对命名实体识别可解析出名词或短语,以此信息作为英汉词汇对齐的锚点。同时面向文本标注词性,以便于识别出形容词与数词等成分,其中数词作为文本片段的关键信息,实现英汉词汇对齐;形容词与副词是丰富短语片段情感色彩的重要载体,也是英汉词汇对齐的重要标志。
在文本片段完成以上处理之后,成为已划分词边界,且词汇、短语已通过命名实体识别与词性标注的短语片段集,然后开始提出短语特征,以实现英汉词汇对齐。短语特征提取流程具体如图1所示。
就英汉短语而言,根据以上流程进行特征信息提取,并采用数字化形式加以描述。英汉双语词汇对齐时,通过面向各维度增加权重的方式,计算获取英汉短语的距离,基于动态规划法对短语距离进行评价,以此把短语最小距离的英汉对齐模型作为最终对齐结果。以寻找源文本与目标文件间对齐的短语,发现可能会存在的不一致性表达,即翻译时的编辑性错误或者漏译等,以实现错误智能检测。
自下向上的校对模块体系结构具体如图2所示。
4基于最大熵模型的分词模式
通过最大熵模型分词,本质在于最大熵模型的分类问题。将文本分词问题转变为顺次扫描字符,在扫描字符后是否分词或是否到达到词边界问题。就词问题而言,可将最大熵模型输出明确为两类,即扫描的位置不是词边界,不进行切分,继续扫描;扫描的位置是词边界,进行切分。扫描的字符后续是否需要切分,直接受已出现的,特别是相邻字符的影响。
最大熵模型问题是求解基于约束条件可促使熵函数达到最大的随机变量概率值,则:
T(S)代表熵函数;R,(t)代表随机变量分布理论期望值;R.(t)代表基于约束条件的期望估计值。通过拉格朗日乘子法求解最优解问题的数学描述,引进了向量参数,以调节特征函数,即约束条件作用强弱。一般情况下,明确向量参数的算法主要是GIS算法与改进IIS算法。通过测试最大熵模型,明确向量参数,并运用到未处理文本,可确定中文字符边界,从而实现中文分词"。
5计算机智能校对代码的实现
基于最大熵模型的分词模式算法相应的伪代码,即:
6测试分析
为了进一步测试基于短语翻译模型的英语翻译计算机智能校对方法的有效性,进行英语翻译校对测试分析,详细记录测试数据信息,以评估此方法有效性。在测试过程中,选择800字符校对词汇,1000篇校对短文,其中校对与识别速率分别为15Kb/s,、20Kb/s,基于此测试集比较分析英语翻译结果校对前后的准确率,对比结果具体M如图3所示。
由图可知,英语翻译结果校对之前准确率最高只能达到72.9%,而通过英语翻译计算机智能校对方法完成校对之后,准确率全部保持于99.0%以上,二者准确率差异显著,这就表明本文提出的英语翻译计算机智能校对方法具有显著有效性与稳定性。而就英语翻译准确率均值可以看出,在校对之前,翻译结果准确率均值只达到70.0%,而引进英语翻译计算机智能校对方法之后,翻译结果准确率均值高达99.4%,提高了29.4%,进一步证明了基于短语翻译模型的英语翻译计算机智能校对方法的有效性。
7结束语
综上所述,本文提出了基于短语翻译模型的英语翻译计算机智能校对方法。通过测试表明,英语翻译结果校对之前准确率相对偏低,而通过英语翻译计算机智能校对方法完成校对之后,准确率明显较高,二者准确率差异显著,说明基于短语翻译模型的英语翻译计算机智能校对方法具有显著有效性与良好稳定性;就英语翻译准确率均值而言,在校对之前,翻译结果准确率均值只达到70.0%,而引进英语翻译计算机智能校对方法之后,翻译结果准确率提高了29.4%,进而说明了本文提出的英语翻译计算机智能校对方法的有效性。
参考文献:
[1]卫娜,英语翻译软件视角下的翻译改正算法研究1J.现代科学仪器,2019(3):15-18.
[2]黄登娴,英语翻译软件翻译准确性矫正算法设计[J].现代电子技术,2018,41(14):170-172,177.
[3]湘南学院,英语翻译交流学习台:CN201720646432.9P].2018-07-17.
[4]苏传捷,侯宏旭,杨萍,等,基于统计翻译框架的蒙古文自动拼写校对方法J.中文报,2013,27(6):175-179.
[5]刘练.基于WebTM的辅助翻译工具校对子系统设计与实现D].南京:东南大学,2017.
[6]姜赢,李金威,谢湘贵,等,面向机器翻译的假朋友语义自动校对[].电子设计工程,2017,25(11):222-26.
[7]崔丹.英语翻译计算机智能校对系统设计[J].现代电子技术,2019,42(4):179-182,186.
[8]薛鑫·基于机器翻译模型的汉语近音错别字校对方法研究D].哈尔滨:黑龙江大学,2017.
期刊VIP网,您身边的高端学术顾问
文章名称: 基于短语翻译模型的英语翻译计算机智能校对方法
文章地址: http://www.qikanvip.com/mianfeiwx/57832.html
* 填写需求信息,或选择平台现有SCI/SSCI选题(如下)。