条件期望

浏览

随机变量按条件概率(见概率)的平均。研究随机事件之间的关系时,在已知某些事件发生的条件下来考虑另一些事件的统计规律是十分重要的。在概率论发展的初期就已引进并应用了简单情形下的条件概率,一般情形下的条件概率与条件期望的严格定义则是1933年由Α.Η.柯尔莫哥洛夫给出的,这才使概率统计的一些重要内容建立在严密的基础上,例如数理统计学中的充分统计量(见统计量)、贝叶斯统计都用到这一概念。马尔可夫过程和鞅论的整个内容更是离不开对条件概率和条件期望的研究。因而它已成为近代概率论与数理统计学中重要的基本概念。

简单情形

如果仅以单个事件的发生作为“条件”,这种情形称为简单情形。在已知正概率事件(即概率不为0的事件)B发生的条件下,定义随机变量x关于事件B的条件分布函数为F(xB)=p({xx}│B),由条件概率定义知其等于p({xx}∩B)/p(B)。这时,相应于这一条件分布函数的数学期望为

称为x关于事件B的条件期望。

初等情形

将简单情形加以推广,即把“已知”理解为通过观测或安排试验所能确切了解到的全部信息。例如,若事件B“已知”,它的对立事件也“已知”;若事件B1B2,…都已知,则事件也都已知。在这样的意义下,“已知”的随机事件全体构成一个σ。如果是由有限个互不相容的事件{B1B2,…,Bn}生成的,这种情形称为初等情形。这时自然把事件A关于的条件概率 p(A)看成是一族简单情形的条件概率,它按照哪一个Bi发生而取值p(ABi);于是随机变量x关于的条件期望E(x)也是一族简单情形的条件期望,它按照哪一个Bi发生而取值E(xBi),即当ω落入Bi时,E(x|)(ω)=E(xBi),i=1,2,…,n。由此可知,E(x|)是ω的函数,而且是可测的随机变量,即是概率空间(Ωp)上的随机变量。如果每个Bi都具有正概率,上述的定义是完整的;若某些Bi的概率为0,则从整体上E(x)没有明确意义的部分只是一个零概率事件。

密度存在的情形

许多实际问题需要考虑比初等情形更复杂的。例如为了预报明天是否下雨这个随机事件,可以测量空气的相对湿度,而湿度本身可以看作一个连续型的随机变量Y。这时“已知”的σ就是Y所生成的σσ(Y),且常简记E(xσ(Y))=E(xY)。若随机变量xY有联合密度函数ƒ(xy),则x关于事件{Y=y}的条件密度为,而x关于{Y=y}的条件期望就是

这时E(xY)是Y波莱尔可测函数,即σ(Y)可测的随机变量,当ω满足Y(ω)=y 时,

一般情形

根据以上的想法,把“已知”条件理解为给定了概率空间(Ω,F,p)中F的一个子σ,定义随机变量x关于的条件期望E(x)是这样的可测的随机变量,它在每一个“已知”的随机事件A上的平均同原随机变量xA上的平均相等,即

根据测度论中的拉东-尼科迪姆定理,在数学期望Ex存在的场合,这样的随机变量E(x)一定存在,虽不惟一,但彼此之间只在一个零概率事件上有差异。对于初等情形和密度存在的情形,前述的特殊定义方法与这里的一般定义是一致的。若是仅由═与Ω组成的最简单的子σ域,则E(x)就以概率1等于Ex

条件期望具有类似于数学期望的性质。如设xY为数学期望有穷的随机变量,α为常数,则以概率1成立以下关系式:E(x+Y)=E(x)+E(Y);E(α)=α;E(αx)=αE(x);x≥0蕴含E(x)≥0;又若Z为可测随机变量,且 E(ZX)存在,则以概率1成立E(ZX|)=ZE(x|)。此外还有E(E(x|))=Ex;又若x的方差有穷,则对一切可测随机变量Z有E(X-Z)2,换言之,E(x|)是所有可测随机变量中最“接近”x的。

条件概率与正则条件概率

任何事件 A的示性函数IA(即IA(ω)=1或0,视ωA或唘A而定)都是随机变量,其条件期望 E(IA)称为A关于的条件概率,记作p(A)。条件概率具有类似于通常概率的性质:如0≤p(A)≤1,p(Ω)=1,对两两不相容的事件列。但所有这些关系都只能以概率1成立,而不一定处处成立。因此对于固定的ω,{p(A)(ω):A ∈F}不一定是F上的概率测度。如能通过调整随机变量p (A)在零概率事件上的值,使{p(A):A∈F}对每一ω 都是F上的概率测度,则把p(A|)(ω)记成,称为关于的正则条件概率。这时条件期望可表成对正则条件概率的积分。对于性质比较好的概率空间,例如Ωn维实空间Rn,F是波莱尔域,则关于任意的子σ,正则条件概率总存在。

条件独立性

相应于条件概率的独立性称为条件独立性。 设F1,F2是F的子σ域,F1和F2关于条件独立,是指任给F1∈F1F2∈F2,以概率1成立

这个关系式等价于:任给F2∈F2,以概率1成立

这正是马尔可夫过程在已知现在()的条件下,过去(F1)和将来 (F2)条件独立的一种严格的数学表述。又如果是仅由═与Ω组成的子σ域,则关于的条件独立性就是通常意义下的独立性(见随机变量)。

参考书目
  1. 严士健、王隽駺、刘秀芳著:《概率论基础》,科学出版社,北京,1982。