2020年统计学考研题库【章节题库+名校考研真题+模拟试题】
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第7章 参数估计

一、单项选择题

1.在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为(  )。[山东大学2015研]

A.无偏性

B.有效性

C.一致性

D.充分性

【答案】B

【解析】有效性是指对同一总体参数的无偏估计量,有更小标准差的估计量更有效,即估计量与总体参数的离差越小越好。

2.一项研究表明,大公司的女性管理人员与小公司的女性管理人员颇为相似。该项研究抽取了两个独立的随机样本,小公司抽取86名女性经理,大公司抽取91名女性经理,根据若干个与工作有关的变量做了比较,其中所提出的一个问题是“如果有机会的话,你是否会改变所从事的工作?”小公司的86名经理中有65人作了否定回答,大公司的91名经理中有51人作了否定回答。两组女性经理中有机会改变工作的比例之差的95%的置信区间为(  )。[山东大学2015研]

A.0.195±0.017

B.0.195±0.117

C.0.195±0.127

D.0.195±0.137

【答案】D

【解析】当两个总体比例π1和π2未知时,可用样本比例p1和p2来代替,根据正态分布建立的两个总体比例之差π1-π2在1-α置信水平下的置信区间为:

3.关于最大似然估计量和无偏估计量的叙述,下列正确的是(  )[中山大学2014研]

A.若T为参数θ的最大似然估计量,则g(T)为g(θ)的最大似然估计量

B.若T为参数θ的无偏估计量,则g(T)为g(θ)的无偏估计量

C.最大似然估计量和无偏估计量总是唯一的

D.以上皆非

【答案】D

【解析】A项,由最大似然估计的不变性,若的最大似然估计,g(θ)是的连续函数,则g(θ)的最大似然估计为。B项,无偏估计不具有不变性。C项,无偏估计量不是唯一的。

4.设X1,X2,…,Xn正态总体的样本,则μ2+σ2的矩法估计量为(  )[中山大学2014研]

A.

B.

C.

D.

【答案】C

【解析】

为总体矩,于是μ2+σ2的矩法估计量为

5.假设其他条件不变,把α从5%降低到2.5%,则总体均值μ的置信程度1-α的置信空间的宽度将(  )[中山大学2014研]

A.增加

B.不变

C.降低

D.可能增加,也可能降低

【答案】A

【解析】总体均值μ的置信程度1-α的置信区间为

当其他条件不变,α降低时,增加,因而置信空间的宽度将增加。

6.从某大学城20万名大学生中采取简单随机抽样方式抽取了500人进行调查,发现其中参加过各类校内社团的学生有320人,则在95.45%的置信度下,可以认为20万大学生中参加过社团的学生所占比例高于(  )[浙江工商大学2014研]

A.55%

B.62%

C.68%

D.70%

【答案】C

【解析】总体比例的置信区间为:

其中为样本比例。根据抽样结果计算得

因此置信区间为

其中

所以该题中总体参加过社团的学生所占比例高于

7.以下关于置信区间的说法正确的是(  )。[中央财经大学2014研]

A.置信区间一定包含待估总体参数的真值

B.置信区间只能以一定概率包含真值

C.置信区间越宽越好

D.以上都不对

【答案】B

【解析】置信区间又称估计区间,用来估计参数的取值范围。AB两项,在某种程度上,置信区间会包含真正的总体参数;C项,置信区间越宽,参数估计的精确性越低。但是对于固定的置信区间,它包含真值的概率为0或者1,换句话说,要么包含真值,要么不包含真值。

8.未知参数θ的两个估计量的方差分别为。如果

则称为(  )。[东北财经大学2014研]

A.有效估计量

B.一致性估计量

C.无偏估计量

D.数学期望

【答案】A

【解析】有效性是指对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。假定有两个用于估计总体参数的无偏估计量,分别用表示,它们的抽样分布的方差分别用表示,如果的方差小于的方差,即,就称是比更有效的一个估计量。在无偏估计的条件下,估计量的方差越小,估计也就越有效。

9.已知一总体服从正态分布,其均值为,方差为,取样本,得到样本均值和样本方差为

以下说法错误的是(  )。[华东师范大学2013研]

A.的矩估计和极大似然估计都是

B.的无偏估计

C.的矩估计和极大似然估计都是

D.的无偏估计

【答案】C

【解析】记总体的一阶原点矩和二阶原点矩分别为

最后可求得的矩估计为

的矩估计为

使用似然函数,最后可求得的极大似然估计为

的极大似然估计为

求期望可得到

10.设X1,X2,…,Xn总体X的样本,则总体均值μ的相合估计量为(  )[中山大学2014研]

A.Xn

B.

C.max{X1,X2,…,Xn}

D.min{X1,X2,…,Xn}

【答案】B

【解析】 为参数的估计量,若对于任意,当时,依概率收敛于,则称的相合估计量。由大数定律知,,有

所以是μ的相合估计量。

11.估计量的含义是指(  )。

A.用来估计总体参数的统计量的名称

B.用来估计总体参数的统计量的具体数值

C.总体参数的名称

D.总体参数的具体数值

【答案】A

【解析】在参数估计中,用来估计总体参数的统计量的名称为估计量,用符号表示。而根据一个具体的样本计算出来的估计量的数值称为估计值。

12.根据一个具体的样本求出的总体均值的95%的置信区间(  )。

A.以95%的概率包含总体均值

B.有5%的可能性包含总体均值

C.一定包含总体均值

D.要么包含总体均值,要么不包含总体均值

【答案】D

【解析】一个特定的区间“总是包含”或“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”的问题。

13.无偏估计是指(  )。

A.样本统计量的值恰好等于待估的总体参数

B.所有可能样本估计值的数学期望等于待估总体参数

C.样本估计值围绕待估总体参数使其误差最小

D.样本量扩大到和总体单元相等时与总体参数一致

【答案】B

【解析】估计量的无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。

14.总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以(  )。

A.样本均值的抽样标准差

B.样本标准差

C.样本方差

D.总体标准差

【答案】A

【解析】边际误差的计算公式为:

因此边际误差等于所要求置信水平的临界值乘以样本均值的标准误差。

15.置信水平为95%的置信区间是指(  )。

A.总体参数有95%的概率落在这一区间内

B.总体参数有5%的概率未落在这一区间内

C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数

D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数

【答案】C

【解析】对于置信区间的理解,要注意:置信水平为95%的置信区间指在用某种方法构造的所有区间中,有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值;总体参数的真值是固定的,未知的,而样本构造的区间则是不固定的。置信区间是一个随机区间;95%这个概率不是用来描述某个特定的区间包含总体参数真值可能性的,而是针对随机区间而言。

16.一个估计量的一致性是指(  )。

A.该估计量的数学期望等于被估计的总体参数

B.该估计量的方差比其他估计量小

C.随着样本量的增大,该估计量的值越来越接近被估计的总体参数

D.该估计量的方差比其他估计量大

【答案】C

【解析】估计量的一致性是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。

17.置信系数(1-α)表达了置信区间的(  )。

A.准确性

B.精确性

C.显著性

D.可靠性

【答案】D

【解析】置信系数又称置信度或置信水平,指的是如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例,表达了置信区间的可靠性。

18.在总体均值和总体比例的区间估计中,边际误差由(  )。

A.置信水平确定

B.统计量的抽样标准差确定

C.置信水平和统计量的抽样标准差确定

D.统计量的抽样方差确定

【答案】C

【解析】以总体均值的区间估计为例,其边际误差的计算公式为:

通过公式可知边际误差由置信水平和统计量的抽样标准差确定。

19.在置信水平不变的条件下,要缩小置信区间,则(  )。

A.需要增加样本量

B.需要减少样本量

C.需要保持样本量不变

D.需要改变统计量的抽样标准差

【答案】A

【解析】以总体方差σ2已知的总体均值区间估计为例,其置信区间宽度为2,可见在置信水平不变的条件下,要缩小置信区间,需要增加样本容量。

20.当正态总体的方差未知时,在小样本条件下,估计总体均值使用的分布是(  )。

A.正态分布

B.t分布

C.χ2分布

D.F分布

【答案】B

【解析】当正态总体方差未知,在小样本条件下,可用样本方差代替总体方差,样本均值经过标准化以后的随机变量服从自由度为分布,即

在大样本条件下,样本均值经过标准化以后的随机变量服从标准正态分布,即

21.当正态总体的方差已知时,在小样本条件下,估计总体均值使用的分布是(  )。

A.正态分布

B.t分布

C.χ2分布

D.F分布

【答案】A

【解析】当总体方差已知,在小样本条件下时,样本均值的抽样分布为正态分布,样本均值经过标准化以后的随机变量服从标准正态分布,即

22.对于非正态总体,在大样本条件下,估计总体均值使用的分布是(  )。

A.正态分布

B.t分布

C.χ2分布

D.F分布

【答案】A

【解析】如果总体并不服从正态分布,只要是在大样本条件下,总体方差都可以用样本方差来代替,样本均值的经标准化以后的随机变量服从标准正态分布,以此来估计总体均值,建立总体均值的置信区间。

23.根据两个独立的大样本估计两个总体均值之差时,当两个总体的方差未知时,使用的分布是(  )。

A.正态分布

B.t分布

C.χ2分布

D.F分布

【答案】A

【解析】如果两个总体不服从正态分布,但两个独立的样本都是大样本,当两个总体的方差已知时,两个样本均值之差经标准化后服从标准正态分布;当两个总体方差未知时,可用两个样本方差来代替,两个样本均值之差经标准化后服从标准正态分布,以此来估计两个总体均值之差。

24.根据两个独立的小样本估计两个总体均值之差时,当两个总体的方差未知但相等时,使用的分布是(  )。

A.正态分布

B.t分布

C.χ2分布

D.F分布

【答案】B

【解析】当两个总体的方差未知但相等时,需要用两个样本的方差来估计,两样本均值之差经标准化后服从自由度为(n1+n2-2)的t分布(其中n1、n2分别为两个样本的样本量),以此来估计两个总体均值之差。

25.根据两个匹配的小样本估计两个总体均值之差时,使用的分布是(  )。

A.正态分布

B.t分布

C.χ2分布

D.F分布

【答案】B

【解析】使用匹配样本进行估计时,在小样本情况下,两个样本均值之差经标准化后服从自由度为(n-1)的t分布,以此来估计两个总体均值之差。

26.估计两个总体方差比的置信区间比时,使用的分布是(  )。

A.正态分布

B.t分布

C.χ2分布

D.F分布

【答案】D

【解析】由于两个样本方差比的抽样分布服从F分布,因此可以用F分布来构造两个总体方差比的置信区间。

27.在其他条件不变的情况下,总体数据的方差越大,估计时所需的样本量(  )。

A.越大

B.越小

C.可能大也可能小

D.不变

【答案】A

【解析】根据公式

可知,在其他条件不变的情况下,样本量n与总体数据的方差σ2成正比,总体数据的方差越大,估计时所需的样本量越大。此外,还可知在其他条件不变的情况下,样本量n与可以接受的边际误差成反比,边际误差越大,估计时所需的样本量越小。

28.对于非正态总体,使用统计量

估计总体均值的条件是(  )。

A.小样本

B.总体方差已知

C.总体方差未知

D.大样本

【答案】D

29.对于非正态总体,在大样本条件下,总体均值在1-α置信水平下的置信区间可以写为(  )。

A.

B.

C.

D.

【答案】C

【解析】如果总体并不服从正态分布,只要是在大样本条件下,总体方差都可以用样本方差来代替,样本均值的经标准化以后的随机变量服从标准正态分布,以此来估计总体均值,建立总体均值的置信区间。

30.正态总体方差未知时,在小样本条件下,总体均值在1-α置信水平下的置信区间可以写为(  )。

A.

B.

C.

D.

【答案】B

【解析】对于正态总体,在小样本条件下,当方差已知时,总体均值在1-α置信水平下的置信区间为

当方差未知时,可用样本方差代替总体方差σ2,样本均值经过标准化以后的随机变量服从自由度为(n-1)的t分布,则总体均值在(1-α)置信水平下的置信区间为

31.在其他条件相同的情况下,95%的置信区间比90%的置信区间(  )。

A.要宽

B.要窄

C.相同

D.可能宽也可能窄

【答案】A

【解析】总体均值在方差已知的情况下,估计区间为

当其他条件相同的情况下,由于,所以95%的置信区间比90%的置信区间要宽。

32.指出下面的说法哪一个是正确的(  )。

A.置信水平越大,估计的可靠性越大

B.置信水平越大,估计的可靠性越小

C.置信水平越小,估计的可靠性越大

D.置信水平的大小与估计的可靠性无关

【答案】A

【解析】将构造置信区间的步骤重复多次,其中包含总体参数真值的次数所占的比例称为置信水平,也称为置信度、置信系数或可靠度。置信水平反映的是估计的可靠程度,置信水平越大,说明构造的置信区间中包含总体真值的区间越多,则估计的可靠性越大;反之,估计的可靠性越小。

33.指出下面的说法哪一个是正确的(  )。

A.在置信水平一定的条件下,要提高估计的可靠性,就应缩小样本量

B.在置信水平一定的条件下,要提高估计的可靠性,就应增大样本量

C.在样本量一定的条件下,要提高估计的可靠性,就降低置信水平

D.在样本量一定的条件下,要提高估计的准确性,就提高置信水平

【答案】B

【解析】置信水平反映估计的可靠程度,置信区间表达了估计的精确性。置信水平一定,说明构造置信区间的步骤重复多次,其中包含总体参数真值的次数所占的比例一定。因此应增大样本量,使样本与总体更加接近,以提高估计的可靠性;在样本量一定的条件下,要提高估计的可靠性,就提高置信水平;要提高估计的准确性,就要缩小置信区间,即缩小置信水平。

34.将构造置信区间的步骤重复多次,其中包含总体参数真值的次数所占的比例称为(  )。

A.置信区间

B.显著性水平

C.置信水平

D.临界值

【答案】C

35.在用正态分布进行置信区间估计时,临界值1.96所对应的置信水平是(  )。

A.85%

B.90%

C.95%

D.99%

【答案】C

【解析】。此时,即置信水平为95%。90%的置信水平对应的临界值为1.645。

36.随机抽取一个由290名教师组成的样本,让每个人对一些说法表明自己的态度。第一种说法是“年龄偏大的学生对班上的讨论比年龄偏小的学生更积极”。态度按5分制来衡量:1=非常同意;2=同意;3=没有意见;4=不同意;5=很不同意。对这一看法,样本的平均态度得分为1.94,标准差为0.92。用98%的置信水平估计教师对这一看法的平均态度得分的置信区间为(  )。

A.1.94±0.13

B.1.94±1.13

C.1.94±1.96

D.1.94±2.58

【答案】A

【解析】由于样本容量为大样本,因此,总体均值的置信区间为

=0.02,所以总体均值的99%的置信区间为

即(1.94±0.13)。

37.从某地区中随机抽出20个企业,得到20个企业总经理的年平均收入为25964.7元,标准差为42807.8元。构造企业总经理年平均收入μ的95%的置信区间为(  )。

A.25964.7±20034.3

B.25964.7±21034.3

C.25964.7±25034.3

D.25964.7±30034.3

【答案】A

【解析】在小样本条件下且总体方差未知时,总体均值的置信区间为

据题意知,=0.05,所以企业总经理年平均收入μ的95%的置信区间为

即(25964.7±20034.3)。

38.在n=500的随机样本中,成功的比例为p=0.20,总体比例的95%的置信区间为(  )。

A.0.20±0.078

B.0.20±0.028

C.0.20±0.035

D.0.20±0.045

【答案】C

【解析】由于样本容量为大样本,因此,总体比例的置信区间为

=0.05,所以总体比例的95%的置信区间

即(0.2±0.035)。

39.税务管理官员认为,大多数企业都有偷税漏税行为。在对由800个企业构成的随机样本的检查中,发现有144个企业有偷税漏税行为。根据99%的置信水平估计偷税漏税企业比例的置信区间为(  )。

A.0.18士0.015

B.0.1±士0.025

C.0.18±0.035

D.0.18±0.045

【答案】C

【解析】偷税漏税企业的比例为

由于样本容量为大样本,因此,总体比例的置信区间为

=0.01,所以总体比例的99%的置信区间

即(0.18±0.035)。

40.从均值分别为的总体中抽出两个独立随机样本,当时,两个样本均值之差的抽样标准差为(  )。

A.1.21

B.1.31

C.1.41

D.1.51

【答案】B

【解析】因为是大样本,所以

代入数据得,=1.31。

41.一项研究表明,大公司的女性管理人员与小公司的女性管理人员颇为相似,该项研究抽取了两个独立的随机样本,小公司抽取86名女性经理,大公司抽取91名女性经理,根据若干个与工作有关的变量做了比较。其中所提出的一个问题是:“最近三年内你被提升了几次?”两组女性经理的回答结果如表7-1所示:

表7-1

大公司和小公司女性经理平均提升次数之差的90%的置信区间为(  )。

A.0.1±0.27

B.0.01±0.27

C.0.1±0.37

D.0.01±0.37

【答案】A

【解析】在大样本下,两个总体均值之差的置信区间为(),α=0.1,代入数据计算得,大公司和小公司女性经理平均提升次数之差的90%的置信区间为(0.1±0.27)。

42.一项研究表明,大公司的女性管理人员与小公司的女性管理人员颇为相似,该项研究抽取了两个独立的随机样本,小公司抽取86名女性经理,大公司抽取91名女性经理,根据若干个与工作有关的变量做了比较。其中所提出的一个问题是:“如果有机会的话,你是否会改变所从事的工作?”小公司的86名经理中有65人作了否定回答,大公司的91名经理中有51人作了否定回答。两组女经理中有机会改变工作的比例之差的95%的置信区间为(  )。

A.0.195±0.017

B.0.195±0.117

C.0.195±0.127

D.0.195±0.137

【答案】D

【解析】大公司女经理中有机会改变工作的比例为

小公司女经理中有机会改变工作的比例为

由于是大样本,两个总体比例之差的置信区间(),=0.05,代入数据计算得,大公司和小公司女性经理中有机会改变工作的比例之差的95%的置信区间为(0.195±0.137)。

43.若边际误差E=5,σ=40,要估计总体均值的95%的置信区间所需的样本量为(  )。

A.146

B.246

C.346

D.446

【答案】B

【解析】样本容量≈246

44.若边际误差E=5,,要估计两个总体均值之差()的95%的置信区间所需的样本量为(  )。

A.37

B.47

C.57

D.67

【答案】C

【解析】≈57。

45.某大型企业要提出一项改革措施,为估计职工中赞成该项改革的人数的比例,要求边际误差不超过0.03,置信水平为90%,应抽取的样本量为(  )。

A.552

B.652

C.752

D.852

【答案】C

【解析】

因为总体比例未知,可取=0.5,代入数据计算得

46.为估计自考学生的平均年龄,随机抽出一个n=60的样本,算得样本均值=25.3岁,总体方差,总体均值的95%的置信区间为(  )。

A.(22.29,24.31)

B.(23.29,25.31)

C.(24.29,26.31)

D.(25.29,27.31)

【答案】C

【解析】在大样本条件下总体均值的置信区间为

已知α=0.05,所以总体均值的95%的置信区间为

即(24.29,26.31)。

47.在一项对学生资助贷款的研究中,随机抽取480名学生作为样本,得到毕业前的平均欠款余额为12168元,标准差为2200元。则贷款学生总体中平均欠款额的95%的置信区间为(  )。

A.(11971,12365)

B.(11971,13365)

C.(11971,14365)

D.(11971,15365)

【答案】A

【解析】在大样本条件下且总体方差未知时,总体均值的置信区间为

已知α=0.05,所以贷款学生总体中平均欠款额的95%的置信区间为

即(11971,12365)。

48.从一个正态总体中随机抽取n=20的一个随机样本,样本均值为17.25,样本标准差为3.3。则总体均值μ的95%的置信区间为(  )。

A.(15.97,18.53)

B.(15.71,18.79)

C.(15.14,19.36)

D.(14.89,20.45)

【答案】B

【解析】在小样本条件下且总体方差未知时,总体均值的置信区间为

已知α=0.05,所以总体均值μ的95%的置信区间为

即(15.71,18.79)。

49.某地区的写字楼月租金的标准差为80元,要估计总体均值的95%的置信区间,希望的边际误差为25元,应抽取的样本量为(  )。

A.20

B.30

C.40

D.50

【答案】C

【解析】样本容量≈40。

50.随机抽取400人的一个样本,发现有26%的上网者为女性。女性上网者比例的95%的置信区间为(  )。

A.(0.217,0.303)

B.(0.117,0.403)

C.(0.217,0.403)

D.(0.117,0.503)

【答案】A

【解析】总体比例π的置信区间为

,α=0.05,代入数据得,女性上网者比例的置信区间为

)=(0.217,0.303)

51.一项调查表明,有33%的被调查者认为她们所在的公司十分适合女性工作。假定总体比例为33%,取边际误差分别为10%,5%,2%,1%,在建立总体比例的95%的置信区间时,随着边际误差的减少,样本量会(  )。

A.减少

B.增大

C.可能减少也可能增大

D.不变

【答案】B

【解析】因为样本量

在其条件不变的情况下,随着边际误差E的减小,样本量会增大。

52.一项调查表明,在外企工作的员工每周平均工作52小时,随机抽取一个由650名员工组成的样本,样本标准差为8.2小时,在外企工作的员工平均每周工作时间的95%的置信区间为(  )。

A.(50.37,52.63)

B.(51.37,52.63)

C.(52.37,53.63)

D.(51.37,53.63)

【答案】B

【解析】据题意知,总体均值的置信区间为(), α=0.05,所以总体均值μ的95%的置信区间为,即(51.37,52.63)。

53.某城市为估计A,B两个区家庭年平均收入之差,在两个区抽取两个独立的随机样本,样本信息如表7-2所示。

表7-2

两个区家庭年平均收入之差的95%的置信区间为(  )。

A.1200±562

B.1200±662

C.1200±762

D.1200±862

【答案】C

【解析】本题属于小样本情形下两个样本均值之差的区间估计。估计区间为

其中

代入数据计算得,两个区年平均收入之差的95%的置信区间为(1200±762)。

54.在对两个广告效果的电视评比中,每个广告在一周的时间内播放6次,然后要求看过广告的人陈述广告的内容。记录的资料如表7-3所示:

表7-3

两个总体回想比例之差的95%的置信区间为(  )。

A.(0.01,0.22)

B.(0.02,0.22)

C.(0.03,0.32)

D.(0.04,0.42)

【答案】B

【解析】两个总体比例之差()在1-α置信水平下的区间估计为

,代入数据,计算得两个总体回想比例之差的95%的置信区间为(0.02,0.22)。

二、多项选择题

1.在进行区间估计时,影响区间宽度的因素有(  )。[西安交大2007研]

A.置信水平(1-α)

B.数据的离散程度

C.点估计值

D.样本容量

E.以上都是

【答案】ABD

【解析】置信区间的宽度为2或2,与置信水平(1-α)、数据的离散程度σ或s、样本容量n有关。

2.抽样估计中估计量的评选标准主要有(  )。

A.无偏性

B.一致性

C.可靠性

D.有效性

E.及时性

【答案】ABD

【解析】抽样估计中估计量的评选标准:无偏性,即有效性,若都是的无偏估计量,且,那么则称是较有效的估计量;一致性,为任意小正数),那么则称的满足一致性标准要求的估计量。

3.点估计的优点有(  )。

A.能够提供总体参数的具体估计值

B.能够提供总体参数的估计范围

C.表达更直观、简练

D.提供信息量大

E.能提供估计的误差和把握程度方面的信息

【答案】AC

【解析】点估计的优点在于它能够提供总体参数的具体估计值,其表达更直观、简练,并可以作为行动决策的数量依据。但其不足之处也很明显:点估计所提供的信息量比较少,尤其不能提供估计的误差和把握程度方面的信息。

4.区间估计的三要素包括(  )。

A.点估计值

B.抽样平均误差

C.估计的可靠度

D.抽样极限误差

E.总体的分布形式

【答案】ABC

5.一盒中装有大量的红、蓝两色的弹子,但比例未知,现随机摸出100粒弹子,发现53颗是红的,盒子中红弹子的百分比估计为53%,标准差为5%,下列陈述正确的有(  )。

A.53%是盒中红弹子比例的点估计

B.5%度量了抽样误差的可能大小

C.可能偏离盒子中红弹子的百分数在5%左右

D.盒子中红弹子百分数的近似95%置信区间为从43%到63%

E.样本中红弹子百分数的近似95%置信区间为从43%到63%

【答案】ABCD

【解析】D项,盒子中红弹子百分比的置信区间为:

代入数据可得,其95%的置信区间为[43%,63%];E项,样本中红弹子百分数为53%,是个确定的数。

6.在其他条件不变时,抽样估计的置信度(1-)越大,则(  )。

A.允许误差范围越大

B.允许误差范围越小

C.抽样估计的精确度越高

D.抽样估计的精确度越低

E.抽样估计的可靠性越高

【答案】ADE

【解析】置信度表达了区间估计的可靠性,置信区间表达了区间估计的精确性。在其他条件不变时,置信度越大,抽样估计的置信区间就越宽,允许误差范围越大,可靠性越高;同时,由于误差的大小与估计的精确度是反向变化的关系,所以置信度越大,估计的精确度就越低。

三、判断题

1.当样本容量给定时,置信区间的宽度会随着置信水平的增大而增大。(  )[对外经济贸易大学2015研]

【答案】

【解析】置信水平是指总体参数值落在样本统计值某一区间内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。在样本量相同的情况下,置信水平越高,置信区间越宽。

2.设总体ξ~N(μ,0.92),样本容量n=9,样本均值,则在保留三位小数下,未知参数μ的置信度为0.95的置信区间是[4.412,5.588]。(  )[东北财大2004研]

【答案】

【解析】样本方差已知,且总体服从正态分布,故而未知参数μ的置信度为0.95的置信区间为:

3.参数和统计量是没有区别的。(  )[西南财大2000研]

【答案】×

【解析】参数是研究者想要了解的总体的某种特征值。而统计量是样本的函数,其中不含未知参数。参数估计就是利用样本统计量去估计总体参数。

4.总体X的数学期望µ和方差σ2均存在,X1,X2,…,是来自X的样本,当σ2≠0时,尽管是µ的无偏估计,但并非µ2的无偏估计。(  )[西南财大2002研]

【答案】

【解析】由于

所以

不是µ2的无偏估计。

5.设总体X具有分布密度

其中是未知参数。X1,X2,…,Xn为一个样本,参数a的矩估计为。(  )[西南财大2002研]

【答案】

【解析】,则根据矩估计方法令,可得

6.设是总体的一个样本,则

都是总体均值的无偏估计,且更有效。(  )[东北财大2005研]

【答案】×

【解析】令总体的均值为,方差为,则有:

同理可以计算得

于是有

所以更有效。

7.点估计是用样本的统计量直接估计和代表总体参数。(  )

【答案】

8.有50个调查者分别对同一个正态总体进行抽样,样本量都是100,总体方差未知。他们分别根据各自的样本数据得到总体均值的一个置信度为90%的置信区间(双侧),则这些置信区间中正好有45个区间会覆盖总体均值。(  )

【答案】×

【解析】从大量样本来看,约有90%的置信区间会覆盖总体真值,但对50次抽样的结果来看,不一定刚好占90%。

9.在设计一个抽样方案时,样本量应该越大越好。(  )

【答案】×

【解析】样本量过大,会造成人力、物力和财力的浪费;样本量过小,会造成抽样误差增大,影响抽样推断的可靠程度。在组织抽样调查时,应根据具体情况确定合理的样本量。

四、简答题

1.什么是极大似然法估计?它与矩法估计有何异同?[暨南大学2013研]

答:(1)极大似然估计的定义:

极大似然估计是参数估计的一种方法。

为从具有概率函数的总体中抽取的样本,θ为未知参数或者参数向量。

为样本的观察值。若在给定时,满足下式:

则称为参数的极大似然估计值,而称为参数的极大似然估计量。若待估参数为的函数,则称的极大似然估计量为

(2)极大似然估计与矩法估计的异同:

相同点:极大似然估计和矩法估计都是对参数的估计方法,都是点估计方法;

不同点:矩法估计是用样本原点矩估计相应的总体原点矩,简单易行,并不需要事先知道总体是什么分布,但是,当总体分布类型已知时,没有充分利用分布提供的信息,一般情况下,矩估计量不唯一;而极大似然估计是在总体类型已知条件下使用的一种参数估计方法,它的优点是:当存在一个有效估计量时,似然方程就有一个等于有效估计量的唯一解,当n→∞时,极大似然估计法的解依概率收敛于真值。

2.评价估计量的主要标准有哪些?请对每一个标准做出说明。[对外经济贸易大学2016研;厦门大学2014研;西安交大2007研]

答:(1)无偏性

无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为θ,所选择的估计量为,如果,则称为θ的无偏估计量。

(2)有效性

一个无偏的估计量并不意味着它就非常接近被估计的参数,它还必须与总体参数的离散程度比较小。有效性是指对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。

(3)一致性

一致性是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。换言之,一个大样本给出的估计量要比一个小样本给出的估计量更接近总体的参数。

3.如何解决推断统计中的精度(误差范围)与置信度(可靠程度)之间的矛盾?[首经贸2007研]

答:一般地,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为置信水平,也称为置信度或置信系数。当样本量给定时,误差范围随着置信度的增大而增大,即精度随置信度的增加而减小;当置信度固定时,误差范围随样本量的增大而减小。因此,可通过选取较大的样本量来解决精度与置信度之间的矛盾。

4.什么是置信区间?说明置信区间对应的置信度的含义。[中央财大2010研]

答:置信区间是指在区间估计中,由样本统计量所构造的总体参数的估计区间。

如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比率称为置信度,或称为置信水平。

置信度1-α的含义:在随机抽样中,若重复抽样多次,得到样本的多个样本值,对应每个样本值都确定了一个置信区间,每个这样的区间要么包含了θ的真值,要么不包含θ的真值。根据伯努利大数定理,当抽样次数充分大时,这些区间中包含θ的真值的频率接近于置信度(即概率),即在这些区间中包含的真值的区间大约有占总数的100(1-α)%个,不包含的真值的区间大约有占总数的100α%个。

5.参数的点估计与区间估计有什么区别?[中南财经政法大学2002研]

答:点估计与区间估计的区别是:

(1)点估计也称定值估计,它是以抽样得到的样本统计量的某个取值直接作为总体参数θ的估计值;

((2)区间估计也是参数估计的一种形式。区间估计是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到;

(3)与点估计不同,进行区间估计时,根据样本统计量的抽样分布可以对样本统计量与总体参数的接近程度给出一个概率度量。点估计得出的是一个具体的值,而区间估计是一个区间。

五、计算题

1.设正态总体X~N(0,σ2),从中抽取容量为4的随机样本,令

(1)分别求常数b1,b2,b3,使b1Q1,b2Q2,b3Q3是方差σ2的无偏估计量;

(2)对(1)中3个无偏估计量,比较其优劣;

(3)基于Q2构建σ2的一个95%的置信区间。[中山大学2014研]

解:(1)欲使b1Q1,b2Q2,b3Q3为方差的无偏估计量,则需证明

由于是来自总体X的随机样本,因此之间相互独立且其均值与方差和总体相同,于是有:

,因此

(2)因为X~N(0,σ2),故

其中用到了X、Y独立时D(XY)>D(X)D(Y)的性质。

所以以及更有效。

(3)

由于服从正态分布X~N(0,σ2),所以

因此

于是有

据此可推导出σ2在95%置信水平下的置信区间为:

2.设X1,X2,,X3为来自总体X的随机样本,X的概率密度函数为

其中θ>0为未知参数。令

(1)求θ的矩估计和最大似然估计

(2)求Yi的分布

(3)给定检验水平α=0.05,以为检验统计量,对假设问题

构建假设检验。[中山大学2014研]

解:(1)矩法估计

解得的矩估计为

最大似然估计

构造似然函数

取对数

建立似然方程

求解得最大似然估计为

(2)

时,

的分布为

由此可见Y服从参数为θ的指数分布,即

(3)由题(2)知:

的分布密度函数为

于是的联合密度函数为:

构造似然比统计量且当

拒绝原假设,由于似然比统计量是关于的增函数,因此本题的拒绝域等价于

其中的上1—α分位数。

3.某纤维强力服从正态分布,标准差稳定在σ=1.09,现抽取了一个容量n=100的样本,求得样本均值,试求该化纤强力均值μ的置信水平为0.95的置信区间。[暨南大学2013研]

解:当总体服从正态分布且已知时,样本均值的抽样分布服从均值为μ,方差为的正态分布。此时采用统计量,即

则总体均值μ在置信度为0.95下的置信区间为:

根据样本数据可求得,又已知,代入数据,可得该化纤强力总体均值μ在置信度为0.95下的置信区间为:

4.设X1X2…Xn是来自总体X的一组样本,且

试确定常数C,使得

为σ2的无偏估计。[首都经济贸易大学2014研复试]

解:

由于X1,X2…Xn是来自总体X的一组样本,因此均值与方差和总体相同,且相互独立,故

因此

欲使

的无偏估计,则

5.从均值为μ,方差为的正态总体中分别抽取容量为n1和n2的两组独立样本,分别为两组样本的样本均值。

(1)试证明对于任何常数a,b都是μ的无偏估计;

(2)求a,b的值,使在此形式的估计量中最有效。[东北财大2008研]

证明:(1)由于分别为两组独立样本的样本均值,所以

,则

即当

是μ的无偏估计。

(2)由于分别为容量为n1和n2的两组独立样本,所以

要使)在此形式的估计量中最有效,需使D(Y)达到最小,即达到最小。所以

6.设X1,X2,…,Xn是来自总体X~N(μ,σ2)的一个样本,为使

为σ2的无偏估计,试确定常数c。[华中科大2004研]

解:由于X1,X2,…,Xn是来自总体X~N(μ,σ2)的一个样本,所以

要使

的无偏估计,需要

,因此

7.设总体X~N(μ,σ2),其中μ未知,x1,x2,x3为其样本。有下述统计量:

(1)试验证上述量都是μ的无偏估计量;

(2)指出哪个估计量“最有效”。[深圳大学2004研]

解:(1)

即这四个统计量均为μ的无偏估计量。

(2)

最小,因此是最有效的统计量。

8.从一批零件中,抽取9个零件,测得其直径(mm)为19.7、20.1、19.8、19.9、20.2、20.0、19.9、20.2、20.3。设零件直径服从正态分布,求这批零件直径的均值μ对应于置信度0.95的置信区间。[首经贸2002研]

解:根据抽样结果计算得:

根据α=0.05查t分布表得,所以这批零件直径的均值的置信区间为:

因此这批零件直径的均值95%的置信区间为19.856~20.164mm。

9.某灯泡厂对生产的10000只日光灯进行质量检验,随机抽取100只,测得灯管的平均发光时间为2000小时,发光时间的标准差为50小时。在95.45%的概率保证下,试估计这批灯管平均发光时间的范围。如果要求最大允许误差不超过15小时,试问这批灯管的平均发光时间范围又是多少?其估计的概率保证程度又是多大?[江西财经大学2006研]

解:(1)在95.45%的概率保证下,这批灯管平均发光时间的置信区间为:

即(1990,2010)小时。

(2)假如最大允许误差不超过15小时,则这批灯管的平均发光时间范围是2000±15,即(1985,2015)小时。

,所以估计的概率保证程度为1-α=99.73%。

10.假定某高校学生的日常消费服从正态分布,抽取了100名同学的月消费总额构成了一随机样本,现:

(1)若已知总体标准差为160元、样本均值为605元,求总体均值μ在95%的置信水平下的置信区间;

(2)若总体标准差为未知,样本标准差s为170元,求总体标准差σ在95%的置信水平下的置信区间。[首经贸2008研]

解:(1)根据题意可知,总体服从正态分布,且方差已知,样本均值也服从正态分布。

,可得总体均值在95%的置信水平下的置信区间为:

即(573.64,636.36)。

(2)根据样本方差的抽样分布可知,样本方差服从自由度为分布,即

已知,查分布表可得

所以,总体标准差σ的置信区间为:

11.某校某期“统计学”期末考试后,按不重复抽样方法随机抽取了5%即36份试卷进行分析。这些试卷平均得分为78分,标准差为12分,有四份试卷不及格。试以95%的置信度估计该校参加本次“统计学”考试的所有同学的平均分数的置信区间和及格人数的置信区间。[西南财大2002研]

解:由题意。由于n/N=5%,故可以按重复抽样进行估计。α=1-95%=5%,zα/2=1.96。

(1)95%的置信度估计该校参加本次“统计学”考试的所有同学的平均分数的置信区间为:

(2)样本的及格率为:

则以95%的置信度估计该校参加本次“统计学”考试的及格率的置信区间为:

故95%的置信度估计该校参加本次“统计学”考试的及格人数的置信区间为:(720×0.7862,720×0.9916)=(566,714)。

12.某地区有1000名外事服务人员,随机抽选100名,其月工资情况如表7-4所示。

表7-4

试以95.45%(t=2)的可靠性推断;

(1)平均每名外事服务人员的月工资范围是多少?

(2)估计月工资在3000元以上的外事服务人员比重的区间范围。[首经贸2009研]

解:(1)由分组数据求平均值计算公式为:

(元)

s=647

根据区间估计公式得

即(2470.6,2729.4),该地区平均每名外事服务人员的月工资范围是2470.6~2729.4元。

(2)根据抽样结果计算的样本比例为:

由比例估计公式得

即0.28±0.045=(0.192,0.368),故月工资在3000元以上的外事服务人员比重的区间范围是(0.192,0.368)。

13.为比较A、B两城市居民的生活水平,分别调查150户和100户家庭的人均生活费支出。按所得数据算得样本均值分别是55.91元和67.76元(2004年统计资料),样本方差分别为64.91元2和69.37元2。假设两城市家庭人均生活费支出都可以认为服从正态分布且方差相等,试以95%的置信概率估计两城市人均生活费支出相差的幅度。(t0.025(248)=1.96)[中南财经政法大学2006研]

解:已知两总体均服从正态分布,且方差相等,则合并估计量为:

已知

所以B城市与A城市人均生活费支出相差的幅度在95%下的置信区间为:

即(9.78,13.92)。

14.某住宅调查居民用水情况,该区共有N=1000户,采用无放回抽样随机抽取了n=100户,测得吨,,其中有40户用水超过了规定标准。要求计算(列出计算公式):

(1)该住宅区的总用水量及95%的置信区间。

(2)若要求估计的相对误差不超过10%,应抽多少户作样本?

(3)以95%的可靠性估计用水超过标准的户数。

(4)若认为估计用水的超标户的置信区间过宽,要求缩短一半,这时应抽多少户作样本?[人大2002研]

解:(1)由于是无放回抽样,则抽样平均误差为

由于总体的方差未知,故用样本方差代替,则该住宅区平均用水量的95%的置信区间为:

即(11.842,13.158)。

(2)若要求估计的相对误差不超过10%,即要求

代入数据解得,即至少应抽取828户作样本。

(3)设用户超过标准的比例为p,由于是无放回抽样,从而p的95%的置信区间为

其中,代入数据解得:(0.3089,0.4911),所以以95%的可靠性估计用水超过标准的户数在309与491之间。

(4)若要求置信区间的宽度缩小为原来的一半,即要求应抽取的户数满足方程:

代入数据解得。即若使用水的超标户的置信区间缩短一半,则应取308户作样本。

15.政府部门想了解当地群众的收入状况,为此进行了一次小样本抽样调查,其数据如表7-5所示。如果希望调查拥有95%的可靠性,而且使得调查数据与实际收入的差距在50元以内,请计算,这样的调查需要多大的样本?()[西安交大2006研]

表7-5

解:根据已知样本数据,计算样本的均值为:

标准差为:

又已知

所以需要的调查样本量为:

16.对某地打土方的工人按重复抽样的方法抽取144个工人进行调查,得出平均每人完成工作量为4.95立方米,标准差为1.5立方米。

要求计算:

(1)以0.9545的概率保证,计算全部工人平均完成工作量将落在什么范围之内。

(2)按上述(1)的条件,当抽样误差不超过0.1立方米时,应抽取多少工人。

(3)按照上述(2)的条件,如果准确性增加一倍,又应抽取多少工人?说明它与(2)的结果有何关系。[南京大学2001研]

解:(1)在95.45%的概率保证下

则全部工人平均完成工作量的置信区间为:

即(4.7,5.2)立方米。

(2)

,故应至少抽取900人。

(3)准确性增加一倍,即缩小到原来的,所以n应该扩大到原来的四倍,即应抽取3600人。

17.为比较两位银行职员为新顾客办理个人结算账目的平均时间长度,分别给两位职员随机安排了10位顾客,并记录下每位顾客办理账单所需的时间(单位:分钟),相应的样本均值和方差为:

假定每位职员办理的时间服从正态分布,且方差相等,试求两位职员办理账单的服务时间之差的95%的置信区间。

解:两总体均服从正态分布,且方差相等,所以两位职员办理账单的服务时间之差的95%的置信区间为:

其中

代入数据可得的95%的置信区间为:

即(-1.03,6.43)。