自然语言处理

浏览

人工智能领域的主要内容,即利用电子计算机等工具对人类所特有的语言信息(包括口语信息和文字信息)进行各种加工,并建立各种类型的人—机—人系统。

自然语言与人造(或人工)语言不同,前者是人类社会中自然形成的语言,人们借助它进行各种交际活动,如汉语、英语、俄语等;后者是通过人工设计创造出来的语言,如国际辅助语和计算机语言。自然语言处理是一个比较广泛的概念。自然语言理解是其核心,其中包括语音和语符的自动识别以及语音的自动合成。语言之间的自动翻译是另一种高级的人工智能,涉及两种或多种自然语言的理解和处理问题。上述项目目前都还处于研究实验或初步应用阶段。自然语言处理中智能较低的工作,如语料的统计、分类、检索、分析等,早已付诸应用(见计算机情报检索、频率词典、统计语言学)。

在自然语言处理的领域内,计算语言学工作者所研究的只是它的一般理论和方法,以及与语文信息加工有关的基础性工作。随着计算机科学和语言学的发展,自然语言处理的条件将逐步改善,它的技术将逐步提高,同时,它所起的作用也会越来越大。可以说,自然语言处理是计算机文化的开路先锋。只有在自然语言处理这门工程技术推广普及之后,计算机在人类生活中的广泛应用才能得以实现。