因子分析

浏览

研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。

因子分析的数学模型

因子分析把实际观测到的变量x1x2,…,xp看作是该变量与其他变量有关的共性因子F1F2,…,Fm和与其他变量无关的唯一性因子E(包括测量误差)共同作用的结果,并假定这些因子的作用是线性可加的:

公式 符号

式中公式 符号,称作xi的共性部分;fijxi在因子Fj上的负荷量;γixi在唯一性因子Ei的负荷量;p为变量数;m为因子数,mp

在因子分析的模型中,一般假定共性因子F1F2,…,Fm之间,以及共性因子Fj和独立因子Ei之间都是独立的。并假定模型中所有变量和因子都已标准化,即均值为 0、方差为1,变量的层次要求定距以上。

因子分析方法

因子分析的目的在于找出共性因子的数目和各因子系数值公式 符号,并在公式 符号的基础上,通过因子轴的旋转,找出共性因子所代表的实际含意。

因子分析的方法约有10多种,如重心法、影像分析法,最大似然解、最小平方法、阿尔发抽因法、拉奥典型抽因法等等。这些方法本质上大都属近似方法,是以相关系数矩阵为基础的,所不同的是相关系数矩阵对角线上的值,采用不同的共同性h2估值。在社会学研究中,因子分析常采用以主成分分析为基础的反覆法。

主成分分析为基础的反覆法

主成分分析的目的与因子分析不同,它不是抽取变量群中的共性因子,而是将变量x1x2,…,xp进行线性组合,成为互为正交的新变量y1y2,…,yp,以确保新变量具有最大的方差: 公式 符号在求解中,正如因子分析一样,要用到相关系数矩阵或协方差矩阵。其特征值λ1λ2,…,λp,正是y1y2,…,yp的方差,对应的标准化特征向量,正是方程中的系数公式 符号公式 符号,…,公式 符号。如果λ1λ2,…,λp,则对应的y1y2,…,yp分别称作第一主成分,第二主成分,……,直至第p主成分。如果信息无需保留100%,则可依次保留一部分主成分y1y2,…,ym(mp)。

当根据主成分分析,决定保留m个主成分之后,接着求m个特征向量的行平方和,作为共同性公式 符号

公式 符号

并将此值代替相关数矩阵对角线之值,形成约相关矩阵。根据约相关系数矩阵,可进一步通过反复求特征值和特征向量方法确定因子数目和因子的系数。

因子旋转

为了确定因子的实际内容,还须进一步旋转因子,使每一个变量尽量只负荷于一个因子之上。这就是简单的结构准则。常用的旋转有直角旋转法和斜角旋转法。作直角旋转时,各因素仍保持相对独立。在作斜角旋转时,允许因素间存在一定关系。

Q型因子分析

上述从变量群中提取共性因子的方法,又称R型因子分析和R型主要成分分析。但如果研究个案群的共性因子,则称Q型因子分析和Q型主成分分析。这时只须把调查的n个方案,当作n个变量,其分析方法与R型因子分析完全相同。

因子分析是社会研究的一种有力工具,但不能肯定地说一项研究中含有几个因子,当研究中选择的变量变化时,因子的数量也要变化。此外对每个因子实际含意的解释也不是绝对的。