统计推断

根据带随机性的观测数据(样本)以及问题的条件和假定(模型),而对未知事物作出的、以概率形式表述的推断。它是数理统计学的主要任务,其理论和方法构成数理统计学的主要内容。统计推断的一个基本特点是:其所依据的条件中包含有带随机性的观测数据。以随机现象为研究对象的概率论,是统计推断的理论基础。

在数理统计学中,统计推断问题常表述为如下形式:所研究的问题有一个确定的总体,其总体分布F未知或部分未知。设在该总体中抽得样本,X=(x1x2,…,xn),要根据x1x2,…,xn作出与未知分布F有关的某种结论。例如,某一群人的身高构成一个总体,通常认为身高是服从正态分布N(μσ2)的,这就是问题的基本假定;从这群人中随机抽出n人,量得其身高为x1x2,…,xn,这就是观测数据,它受到随机性的影响。若要估计这群人的平均身高,即上述正态分布的均值(见数学期望)μ ,这种估计就是一种推断形式。此处估计的对象是总体分布中的未知参数 μ,故又称为参数估计。若感兴趣的问题是“平均身高是否超过 1.7(米)”就需要通过样本检验关于总体分布的命题“μ≤1.7”是否成立,则问题称为假设检验,它也是一种推断形式。参数估计和假设检验是两种基本的统计推断问题。还有一些其他的重要的统计推断问题。例如,从五个生产同一产品的工厂中,各抽查若干件产品,据以推断哪一个工厂产品质量最优,或者要对这五个工厂的产品优劣排一个次序。在这类问题中,可能的结论的个数是有限的,但多于2个,称为多决策问题。

由于统计推断是由部分(样本)推断整体(总体),因此根据样本对总体所作的推断,不可能是完全精确的和可靠的,其结论要以概率的形式表达。如在上述估计平均身高的问题中,根据具体数据和模型,用有关理论和方法,可能得出像“可以用95%的概率保证某一群人的平均身高在1.68米到1.72米之间”这样的结论,它是用概率形式表述的。统计推断理论的研究对象,是如何利用问题的基本假定及包含在观测数据中的信息,作出尽量精确和可靠的结论。可以根据直观的想法提出推断方法,例如用样本均值和样本方差(见统计量)估计总体分布的均值和方差,或者,先提出关于推断的优良性准则,然后设法求出满足该准则的推断方法,或证明某个依直观提出的推断方法适合该准则。点估计中的一致最小方差无偏估计及假设检验中的一致最大功效检验,都是推断优良性准则的重要例子。

在统计应用中,首先要整理和加工观测数据,这部分工作有时称为描述性统计。而统计推断则还要在这个基础上作出有关总体的论断,这是它与描述性统计不同的地方。

参考文章