2.4 随机变量的数字特征
前面我们介绍的分布函数、概率函数以及密度函数,都是用来描述随机变量X的概率分布的。但在许多情况下,随机变量的概率分布不易确定,而在实际问题中,往往只需知道显示随机变量概率分布特征的一些数字就够了,这些数字称为随机变量的数字特征。随机变量的数字特征主要有下列几种。
2.4.1 数学期望
设X是一个离散型随机变量,P(X=xi)=pi, i=1,2, …, n为X的概率函数,则称
为X的数学期望。
若X是一个连续型随机变量,其概率密度为f(x),则称
为X的数学期望。
从式(2-38)及式(2-39)可知,随机变量X的数学期望,就是X所能取的一切可能值,以其相应的概率为权重的加权和。因此,数学期望有时称为均值。数学期望是随机变量取值的变动中心,是概率分布的位置特征值。
数学期望具有下列性质:性质1:若a≤x≤b,则a≤E(x)≤b,特别地E(c)=c,这里a, b, c是常数。性质2(线性性):对任意常数ci, i=1,2, …, n,及b,有+。
若随机变量X的概率密度为f(x), Y=g(X)为随机变量 X的函数,则E(Y)=,若X为离散型随机变量,则。
2.4.2 方差、离势系数
设X是一个随机变量,若E[X-E(X)]2存在,则称E[X-E(X)]2为X的方差,记为D(X),即
对于离散型随机变量
对于连续型随机变量
方差是反映随机变量所有可能值在其数学期望周围分布离散程度的一个指标。它刻画了随机变量取值的稳定性。当随机变量的可能取值密集在数学期望附近时,方差较小;反之,方差较大。
根据数学期望的性质,不难证明:
上式也常被利用来计算方差D(X)。
由方差的定义可知,方差不会出现负值,称
为随机变量X的均方差也称为标准差。
均方差虽然说明随机变量分布的离散程度,但对于两个不同的随机变量分布,如果它们的平均数不同,用均方差来比较这两种分布的离散程度就不合适了。例如,甲地区年雨量的分布均值E(X1)=1200mm,均方差σ1=360mm;乙地区年雨量的分布均值E(X2)=800mm,均方差σ2=320mm,这时就难以用σ来判断这两个地区年雨量分布的离散程度哪一个大。因为尽管σ1>σ2,但是E(X1)>E(X2),所以应从相对观点来比较这两个分布的离散程度,现用一个无因次的数字Cv来表示
Cv称为变差系数,在我国水文界习惯称它为离势系数。
由上式可以算得上述两个地区的年雨量的离势系数,=0.30,=0.40,这就说明甲地区的年雨量离散程度较乙地区的为小。也就是说,甲地区降雨量的年际间变化比乙地区稳定。
2.4.3 偏态系数
设X是一个随机变量,σ是其均方差,则称
为随机变量X的偏态系数。
对于离散型随机变量
对于连续型随机变量
通常丨Cs丨越大,分布越不对称;丨Cs丨越小,分布越接近对称;Cs=0,分布完全对称。
2.4.4 相关系数
设(X, Y)为二元连续型随机变量,联合分布密度为f(x, y), X与Y的边际密度分别为fX(x)、fY(y),则称
为X与Y的协方差。其中E(X), E(Y)为X、Y的数学期望。
为X与Y的相关系数。其中D(X), D(Y)为X、Y的方差。
对二元离散型随机变量,只要用联合概率函数、边际概率函数代替相应的联合分布密度、边际密度,以累加代替积分即可。
相关系数是两个随机变量 X与Y间线性关系密切程度的一种量度,并有丨ρ丨≤1。当丨ρ丨=1时,则Y=aX+b(a、b为常数),即X与Y存在线性函数关系,若ρ=0,则称X与Y不相关。