数据处理的分组方法

对结构未知的复杂非线性系统的一种启发式自组织建模方法,简称GMDH法。这种方法是用输入变量的多项式来近似地表示非线性系统的输入输出关系。一般的非线性输入输出关系可表示为

式中y是输出变量;是输入变量;的多项式。直接计算十分困难,甚至是不可能的。60年代末期,苏联生物控制论学者И,赫宁柯借鉴生物控制论中的自组织化的方法提出GMDH法。它的思路不同于其他任何优化算法。这个算法是多层型的,每一层用输入输出数据拟合得到输入变量两两组合而成的部分表示。它是两个变量的函数,一般可取G为二次完全多项式:

然后将所得到的部分表示,用误差平方和按一定的阈值淘汰一部分,将留下的部分表示作为下一层的输入变量,再按同样的办法得到新的一层的部分表示。在新的一层再对部分表示进行筛选,保留一部分作为下一层的输入。这样一层一层地选下去直到选出符合要求的部分表示。将最后选到的部分表示回代成原始的输入变量,即得到最终的模型,这就是多层型信息处理的建模方法。

GMDH算法可归结为以下的基本步骤:

(1)对原始的输入变量进行预备性选择。

(2)为了决定部分表示的系数和对每一层的中间变量的正确的选择,将数据分成拟合组(用于决定系数)和检验组(用于选择部分表示),并给出数据分组的原则和方法。

(3)产生两个变量为基础的部分表示。

(4)按多层结构给出各层的阈值,使得算法过程中能自动选择部分表示。

(5)选出最终模型。

GMDH算法对于难以从先验知识得到模型结构的复杂的非线性系统的建模是很有效的。特别是在输入变量多而数据很少的情况下,其他建模方法很少能奏效,GMDH算法的优越性就更为明显。它在许多方面,例如在宏观经济模型、人口模型、大气污染模型、水质模型、各种预报模型、工业过程控制模型等方面都得到了成功的应用。

参考书目
  1. 夏天长著,熊光楞、李芳芸译:《系统辨识》,清华大学出版社,北京,1983。(T.C.Hsia,Identification: Least-Squeres Methods,Lexington books, Lexington, Mass.,1977.)