计算风格学

浏览

数理语言学的一个分支。采用计算机技术和统计方法,编制特定的数学程序和数量模型来研究文章风格的学科。主要研究内容有:

(1)根据语言单位之间的数量关系,对不同的比率进行比较,归入不同的类型,确定文章风格的差异;

(2)把语言成分看作变量,研究语言变量之间的相关程度,推断风格的变异情形;

(3)把语言集团的语言变异与语言集团的地理位置结合起来研究,测定不同地理区域的人群之间的语言关系,确定相关性最高的区域;

(4)通过语言单位出现频率的统计,揭示语言成分在较大序列中的分布特征,了解不同文章的风格,判断文章的作者或写作年代。目前,在电子计算机上一般可以采用相关矩阵的方法来确定作者的文体风格特征。

设某一作者m 的二阶相关矩阵为m(ij),则他的语言与标准语之间的偏离指数δ(m)可按如下公式计算:

公式 符号

其中E(ij)为标准语的二阶相关矩阵,δ(m)的值越小,作者m 的语言就越接近标准语。

设有两个作者mn,作者m的二阶相关矩阵为m(ij),作者 n的二阶相关矩阵为n(ij),则这两个作者的风格的接近程度可用相关指数S来表示:

公式 符号

S的值越大,两个作者的风格就越接近。