机器翻译

计算机把一种自然语言翻译为另一种自然语言,又称自动翻译。被翻译的语言称为源语,译出的语言称为目标语。机器翻译不仅和人工智能研究关系密切,而且还涉及语言学研究(特别是应用语言学研究)。它是有一定代表性的计算机非数值应用研究。机器翻译过程和人翻译有某些类似之处,也要通过查词典、源语分析和目标语综合等几个阶段。机器翻译系统一般包括词典、语法分析、语义分析和转换与综合等4个子系统。

词典子系统

机器词典是存储在计算机系统内的一部双语或多语大词典,其中对每个源语词不仅指出对应的目标语的译法,而且还给出翻译过程中需要使用的其他一系列信息,例如词类信息、词组信息、语法信息、语义信息和目标语综合信息等。机器词典是机器翻译工作的基础,词典子系统的任务就是在计算机内建立并使用这样一部大词典。在翻译过程开始时,通过自动查找这部机器词典,提供源语句子中每个词的有关信息。

语法分析子系统

求得源语词汇和词组信息之后,计算机还要对源语句子进行语法分析,求出源语句子的语法结构,即查明句中各词之间的语法关系。通常,这种语法结构用一种倒置的树状图来表示,称为语法树。例如,英语句子“I read a book”,通过翻译系统的语法分析子系统,可得到语法结构描述(见图)。

图

语义分析子系统

为了得到正确的译文,不能仅仅进行形式语法分析。例如有些词汇具有多种词义,即所谓多义词;有些句子脱离上、下文的语义就可能有一种以上的不同语法解释,形成多值语法结构。为解决这些多义和多值问题,必须使用语义手段进行一定的语义分析。在机器翻译研究中,语义分析是一个比较薄弱的环节,还需要结合人工智能和语言理解的研究进行深入的探讨。

转换和综合子系统

根据求得的词汇信息、语法信息和语义信息,计算机进行翻译的最后一个阶段是目标语译文的综合。译文的产生考虑源语与目标语之间在词汇和语法等方面的差异,找出对应的规则,进行必要的词汇转换和语法结构转换,综合出合乎目标语语言规范的译文。转换和综合子系统是翻译过程的主要完成者,其他子系统都是在为机器翻译提供必要的信息准备。

特点

机器翻译的特点是速度快,计算机能在较短的时间内“不知疲倦地”完成大量的文字翻译工作;但是机器翻译质量尚不理想,译文比较生硬呆板,有些译句不通顺,甚至译错。机器翻译只适用于翻译语法结构比较严谨、词汇含义比较明确的文献,例如科技文献。为保证机器翻译具有一定的译文质量,往往还需要人从旁协助,进行所谓的“译前加工”(源语句子输入计算机时,对机器难于处理的某些语言现象由人先提供一定的注释和解法)或“译后编辑”(对计算机翻译出来的译文由人再去校对和润色),甚至要求建立人机合作式的机器翻译系统,对计算机翻译过程中出现的疑难问题,随时由人提供解答。