总体

又称母体。一个统计问题所研究的对象的全体。总体中的每一单元成员称为个体。例如,研究工厂生产的某种产品质量时,该工厂的全体产品是总体,每件产品是个体;调查某县农民家庭情况时,该县的全体农户是总体,每一农户是个体;为治理某一江水的污染问题,以500毫升水为单位进行各种化验,这一条江的江水是总体,每 500毫升的水是个体。当总体中所含的个体总数是有限时,称为有限总体,否则,称为无限总体。若总体所包含的个体很多,或者调查所用的手段是毁损性的,那么要调查所有的个体去了解总体常不可能,因此常用抽取部分个体进行观测,这样抽取出的一组个体称为样本。

从样本推断总体是统计推断的基本任务。为了进行统计推断,需要对总体给出数学描述。一般的统计问题中只涉及个体的一个或几个数量指标,因此在数学上常把个体的数量指标 x(一维的或多维的)取值的全体作为总体,指标值x为个体。x在总体中分布的情况,可用分布函数(见概率分布)描述,称之为总体分布。数量指标x 就看作是服从这个分布的随机变量。这样,一个总体就可以用一个随机变量 x(数量指标)或其分布函数F(x)表示。在实际问题中,总体分布一般为未知或分布中所含的部分参数为未知,需要通过样本去估计。

例如,在产品质量问题中,若产品只分为合格品(记为0)和不合格品(记为1),则总体就是一些0和1组成的集合。若1在总体中所占的比例为p,则0占的比例就是1-p,总体分布就可用概率p(x=0)=1-pp(x=1)=p表示。又如在污染问题中,若水的污染程度用有机物质和毒性元素的含量作为指标,则化验每500毫升的水可得两个数:有机物含量x和毒性元素含量Y,总体就可用二维随机变量(xY)或二维分布函数F(xy)表示。

参考文章