概念依存理论

用若干语义基元来表示所有行动和状态的一种思想。这种理论是R.香克在70年代初期提出的,目的在于为自然语言的机器处理提供比较全面的手段(包括对输入原文的释意、翻译、推理和回答问题),同时也为研究人的语言处理提供一种直观理论。采用概念依存理论自然语言处理程序,将语义作为首要的考虑因素,而几乎摒弃传统语法的一切形式,其效果则是用精确性来换得灵活性,因此有人称之为无语法型分析程序。

基本内容

概念依存理论包含四方面的基本内容:

(1)对于任意两种语言中的任意两个句子,只要它们的意义相同,则此意义在概念依存模型下的表示方式是惟一的。

(2)概念依存模型由若干基本语义单元组成,分行动基元和带特征值的状态基元两大类。

(3)将概念依存模型中的因果联系归结为五条规则。即行动可以导致状态变化,状态可以促成行动,状态可以制止行动,状态或行动可以引起思想活动,思想活动可成为行动的原因。

(4)在语义的表示形式中必须将原来隐含于句内的信息显式表示出来。

概念依存模型的语义基元 图1

按行动的性质可将行动基元分为若干类型。

(1)表示直接产生物理运动的行动单元:例如MOVE(移动一物体),PROPEL(在物体上施加一个力)。

(2)表示能导致对象的状态发生变化的行动单元:例如PTRANS(使物体的位置发生变化),ATRANS(使某种抽象的关系发生变化)。

(3)表示能促成另一行动的行动单元:例如 SPEAK(讲话的目的总是期望能得到某种反应)。

(4)能表示思想活动的行动单元:例如MTRANS(传送信息),MBUILD(从已有信息获得新信息)。概念依存理论试图用若干种行动基元来表示人的所有活动,例如“走”就是自己PTRANS自己,“看”则是自己MTRANS自己,“给予”则是ATRANS一种称之为所有权的抽象关系等。概念依存模型的语义基元除了行动基元以外尚有带特征值的状态基元,例如WANG MENTAL STATE(+10),VASE PHYSICAL STATE(-10),前一例表示王的精神状态极好(非常兴奋),后一例则表示花瓶的物理状态极坏(花瓶碎了)。概念依存模型也可用有向图表示,图上的节点标号代表概念而不是事物本身,节点之间的有向弧则代表概念之间的依存关系。例如The teacher gaveme a book。(先生给了我一本书)可用图1表示。其中关系O表示book(书)是 ATRANS的对象,R 则代表复杂的授受关系。状态和行动也可不用图的形式表示,如:

The nurse MTRANS (the patient BE HEALTH-STATE(5))to the physician(护士告诉医生病人健康情况尚属良好)。

MARGIE系统 图2

采用概念依存模型的自然语言处理系统的一个实验系统。它运用概念依存理论对输入语句进行语义分析、推理并生成所需要的响应。这个系统主要由三部分组成。

(1)概念分析部分:将输入的英文句子转换成运用概念依存模型的内部表示形式。

(2)推理部分:把所需知识存储于修正的语义网络内。例如输入“教师表扬学生”,系统可作出许多可能的推理。如学生一定很高兴,学生愿意帮助别人,学生的学习成绩好,等等。

(3)响应生成部分:将运用概念依存模型的内部形式转换为英文表层结构形式而输出。在概念依存模型中,吃、喝、吸入都被归入INGEST行动单元(使某种东西进入生物体内的行动),可以利用一种鉴别网技术来区分不同词义,并用扩展转移网络技术将概念依存模型的内部表示形式转换为语句的表层结构(图2)。

概念依存理论的一个引人注目之处就是可用统一的标准内部形式来表示意义相同但属于不同语言的原文,因而对文献释意系统、问答系统的研制提供了方便条件。

参考书目
  1. R.C.Schank, Conceptual Information Processing, North-Holland Publ.Co., New York, 1975.