语言信号处理

研究语言的发音过程、语言信号的传送过程和统计特征、语言的自动识别和机器合成以及语言的感知特性等。它是整个数字信号处理学科中最为活跃的分支之一。语言信号处理大都采用数字计算机技术,所以又称为语言数字处理。

语言信号处理的研究起源于对发音器官的模拟,即建立发音过程的数字模拟系统,亦即声道数字模型的研究。利用这一模型,可对语言信号进行分析与合成,借以发展各种通信频带压缩技术和保密通信的新体制。在语言分析合成的基础上,研制出了各种语言自动识别装置,赋予计算机以听觉功能。语言的信息主要包含在语言信号的参数之中。因此,准确而迅速地提取语言信号的参数是进行语言信号处理的关键。常用的语言信号参数有:共振峰频率、音调和嗓音噪音的判别等。后来又提出线性预测系数、声道等效反射系数等参数。这类参数仅反映发音过程的一些平均特性,而实际语言的发音变化相当迅速,需要用非平稳的随机过程来描述。因此,80年代以来,研究语言信号动态的非平稳的参数分析方法迅速发展,人们提出一整套快速自回归、滑动平均自回归以及自适应最小均方格形等算法,并且取得了很好的效果。当语言信号处理向实用化发展时,人们发现许多算法抗环境干扰的能力较差。因此,在噪声环境下保持语言信号处理能力成为一个重要课题。这促进了语言增强的研究。当前,语言信号处理日益同智能机器人和智能计算机的研究紧密结合。语言理解系统的研究正是在这种情况下出现的。

语言信号处理与许多学科有着密切的关系。它是在信息论的指导下,以数字信号处理和计算技术为基础发展起来的。语言信号处理广泛利用通信理论、控制理论,以及随机过程方面的概念和方法。它的发展和推广应用直接受到器件水平的制约。在60年代大部分工作是在通用机上进行的;70年代采用了微型计算机;80年代将大量采用单片信号处理机。语言信号处理的研究与语言学语音学有密切关系,也与生理学心理学直接相关。人工智能的研究使语言信号处理进入新的阶段。可以预见,语言信号处理将会随着计算机技术以及各门学科的发展而日臻成熟并获得更广泛的应用。

语言信号处理的研究成果可以直接应用于国民经济各个领域。在工业部门中,话控技术可进一步提高生产的自动化水平。工业机器人具有听说能力之后,将能大大提高生产效率。国防部门利用语言处理,可实现高度保密的通信,同时还可以实现指挥员直接口呼命令。公安部门可利用发音特征的鉴别对作案人进行鉴定。文教部门可借助语言合成,实现人机语音对讲式的计算机辅助教学。医疗部门可通过语言信号处理对聋哑病人进行病情诊断。

参考书目
  1. L.R.Rabiner,R.W.Schafer,Speech Digital SignalProcessing,Prentice Hall,Englewood Cliffs,N.J., 1978.
  2. Renato De Mori,Computer Models of Speech UsingFuzzy Algorithms,Plenum Press,New York,1983.