统计学课后习题答案 - (第四版) - 贾俊平

发布时间:2011-12-26 12:50:34

《统计学》第四版

第四章练习题答案

4.1 1)众数:M0=10; 中位数:中位数位置=n+1/2=5.5Me=10;平均数:

(2)QL位置=n/4=2.5, QL=4+7/2=5.5QU位置=3n/4=7.5QU=12

3

4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。

4.2 1)从表中数据可以看出,年龄出现频数最多的是1923,故有个众数,即M0=19M0=23

将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为Me=23

2QL位置=n/4=6.25, QL==19QU位置=3n/4=18.75QU=26.5

(3)平均数600/25=24,标准差

4)偏态系数SK=1.08,峰态系数K=0.77

5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。由于峰态系数为正值,所以为尖峰分布。

4.3 1)茎叶图如下:

频数

5

6

7

5

6 7 8

1 3 4 8 8

1

3

5

263/9=7,

3)由于两种排队方式的平均数不同,所以用离散系数进行比较。

第一种排队方式:v1=1.97/7.2=0.274;v2=0.714/7=0.102.由于v1v2,表明第一种排队方式的离散程度大于第二种排队方式。

4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。

4.4 18223/30=274.1

中位数位置=n+1/2=15.5Me=272+273/2=272.5

2QL位置=n/4=7.5, QL==(258+261)/2=259.5QU位置=3n/4=22.5QU=(284+291)/2=287.5

(3)

4.5 1)甲企业的平均成本=总成本/总产量=

乙企业的平均成本=总成本/总产量=

原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

4.6 1(计算过程中的表略) 51200/120=426.67

SK=0.203 K=-0.688

4.7 (1)两位调查人员所得到的平均身高应该差不多相同,因为均值的大小基本上不受样本大小的影响。

2)两位调查人员所得到身高的标准差应该差不多相同,因为标准差的大小基本上不受样本大小的影响。

3)具有较大样本的调查人员有更大的机会取得最高或最低者,因为样本越大,变化的范围就可能越大。

4.8 1)要比较男女学生体重的离散程度应该采用离散系数。女生体重的离散系数为v=5/50=0.1,男生体重的离散系数为v=5/60=0.08,所以女生的体重差异大。

2)男生: 60×2.2=132(磅),s=5×2.2=11(磅)

女生: 50×2.2=110(磅),s=5×2.2=11(磅)

3)假定体重为对称分布,根据经验法则,在平均数加减1个标准差范围内的数据个数大约为68%。因此,男生中大约有68%的人体重在55kg-65kg之间。

4)假定体重为对称分布,根据经验法则,在平均数加减2个标准差范围内的数据个数大约为95%。因此,男生中大约有95%的人体重在40kg-60kg之间。

4.9 通过计算标准分数来判断:

该测试者在A项测试中比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准分数高于B项测试,所以,A项测试比较理想。

4.9 通过标准分数来判断,各天的标准分数如下表:

日期 周一 周二 周三 周四 周五 周六 周日

标准分数Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0

周一和周六两天失去了控制。

4.11

1)应该采用离散系数,因为它消除了不同组数据水平高低的影响。

2)成年组身高的离散系数:

幼儿组身高的离散系数:

由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。

4.12

1)应该从平均数和标准差两个方面进行评价。在对各种方法的离散程度进行比较时,应该采用离散系数。

2)下表给出了各种方法的主要描述统计量。

方法A

方法B

方法C

平均 165.6

中位数 165

众数 164

标准差 2.13

极差 8

最小值 162

最大值 170

平均 128.73

中位数 129

众数 128

标准差 1.75

极差 7

最小值 125

最大值 132

平均 125.53

中位数 126

众数 126

标准差 2.77

极差 12

最小值 116

最大值 128

从三种方法的集中趋势来看,方法A的平均产量最高,中位数和众数也都高于其他两种方法。从离散程度来看,三种方法的离散系数分别为:。方法A的离散程度最小,因此,应选择方法A

4.13

1)用方差或标准差来评价投资的风险。

2)从直方图可以看出,商业类股票收益率的离散程度较小,说明投资风险也就较小。

3)从投资风险角度看,应该选择风险较小的商业类股票。当然,选择哪类股票还与投资者的主观判断有很大关系。

第五章练习题答案

5.1 1)平均分数是范围在0-100之间的连续变量,Ω=[0,100]

(2)已经遇到的绿灯次数是从0开始的任意自然数,Ω=N

3)之前生产的产品中可能无次品也可能有任意多个次品,Ω=[10,11,12,13…….]

5.2 设订日报的集合为A,订晚报的集合为B,至少订一种报的集合为AB,同时订两种报的集合为AB

P(AB)=P(A)+ P(B)-P(AB)=0.5+0.65-0.85=0.3

5.3 P(AB)=1/3P(A)=1/9, P(B)= P(AB)- P(A)=2/9

5.4 P(AB)= P(B)P(AB)=1/3*1/6=1/18

P()=P()=1- P(AB)=17/18

P()=1- P(B)=2/3

P()=P()+ P()- P()=7/18

P()= P()/P()=7/12

5.5 设甲发芽为事件A,乙发芽为事件B

1)由于是两批种子,所以两个事件相互独立,所以有:P(AB)= P(B)P(B)=0.56

2P(AB)=P(A)+P(B)-P(AB)=0.94

3P(A)+ P(B)= P(A)P()+P(B)P()=0.38

5.6 设合格为事件A,合格品中一级品为事件B

P(AB)= P(A)P(BA)=0.96*0.75=0.72

5.7 设前5000小时未坏为事件A,后5000小时未坏为事件B

P(A)=1/3P(AB)=1/2, P(BA)= P(AB)/ P(A)=2/3

5.8 设职工文化程度小学为事件A,职工文化程度初中为事件B,职工文化程度高中为事件C,职工年龄25岁以下为事件D

P(A)=0.1 P(B)=0.5, P(C)=0.4

P(DA)=0.2, P(DB)=0.5, P(DC)=0.7

P(AD)=

同理P(BD)=5/11, P(CD)=28/55

5.9 设次品为D,由贝叶斯公式有:

P(AD)= =0.249

同理P(BD)=0.112

5.10 由二项式分布可得:Px=0=0.25, Px=1=0.5, Px=2=0.25

5.11 (1) Px=100=0.001, Px=10=0.01, Px=1=0.2, Px=0=0.789

2E(X)=100*0.001+10*0.01+1*0.2=0.4

5.13 答对至少四道题包含两种情况,对四道错一道,对五道。

C54 C65=1/64

5.14 由泊松分布的性质有:

PX=1=PX=2= ,可得=2

PX=4=2/3e

5.15

所以,当k=-1k=Px=k)最大。

5.16 1P(2)= P(x2)+ P(x-2)= (0.5)+1- (2.5)=0.6977

由于N3,4)关于均值3对称,所以Px3=0.5

5.17 P(120x200)=P

5.18 1

2

第七章 练习题参考答案

7.1 1)已知=5n=40 =25 =0.05 =1.96

样本均值的抽样标准差==

2)估计误差(也称为边际误差)E==1.96*0.79=1.55

7.21)已知=15n=49 =120 =0.05 =1.96

2)样本均值的抽样标准差==2.14

估计误差E==1.96*4.2

3)由于总体标准差已知,所以总体均值95%的置信区间为:

=1201.96*2.14=1204.2,即(115.8,124.2

7.31)已知=85414n=100 =104560 =0.05 =1.96

由于总体标准差已知,所以总体均值95%的置信区间为:

=1045601.96*10456016741.144即(87818.856,121301.144

7.41)已知n=100 =81s=12 =0.1 =1.645

由于n=100为大样本,所以总体均值90%的置信区间为:

=811.645*811.974,即(79.026,82.974

2)已知=0.05 =1.96

由于n=100为大样本,所以总体均值95%的置信区间为:

=811.96*812.352,即(78.648,83.352

3)已知=0.01 =2.58

由于n=100为大样本,所以总体均值99%的置信区间为:

=812.58*813.096,即(77.94,84.096

7.51)已知=3.5n=60 =25 =0.05 =1.96

由于总体标准差已知,所以总体均值95%的置信区间为:

=251.96*250.89,即(24.11,25.89

2)已知n=75 =119.6s=23.89 =0.02 =2.33

由于n=75为大样本,所以总体均值98%的置信区间为:

=119.62.33*119.66.43,即(113.17,126.03

3)已知=3.419s=0.974n=32 =0.1 =1.645

由于n=32为大样本,所以总体均值90%的置信区间为:

=3.4191.645*3.4190.283,即(3.136,3.702

7.61)已知:总体服从正态分布, =500n=15 =8900 =0.05 =1.96

由于总体服从正态分布,所以总体均值95%的置信区间为:

=89001.96*8900253.03,即(8646.97,9153.03

(2)已知:总体不服从正态分布, =500n=35 =8900 =0.05 =1.96

虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值95%的置信区间为:

=89001.96*8900165.65,即(8734.35,9065.65

3)已知:总体不服从正态分布,未知, n=35 =8900s=500 =0.1 =1.645

虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值90%的置信区间为:

=89001.645*8900139.03,即(8760.97,9039.03

4)已知:总体不服从正态分布,未知, n=35 =8900s=500 =0.01 =2.58

虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值99%的置信区间为:

=89002.58*8900218.05,即(8681.95,9118.05

7.7 已知:n=36,当=0.10.05,0.01时,相应的=1.645 =1.96 =2.58

根据样本数据计算得: =3.32s=1.61

由于n=36为大样本,所以平均上网时间的90%置信区间为:

=3.321.645*3.320.44,即(2.88,3.76

平均上网时间的95%置信区间为:

=3.321.96*3.320.53,即(2.79,3.85

平均上网时间的99%置信区间为:

=3.322.58*3.320.69,即(2.63,4.01

7.8 已知:总体服从正态分布,但未知,n=8为小样本, =0.05 =2.365

根据样本数据计算得: =10s=3.46

总体均值95%的置信区间为:

=102.365*102.89,即(7.11,12.89

7.9 已知:总体服从正态分布,但未知,n=16为小样本, =0.05 =2.131

根据样本数据计算得: =9.375s=4.113

从家里到单位平均距离的95%的置信区间为:

=9.3752.131*9.3752.191,即(7.18,11.57

7.10 1)已知:n=36 =149.5 =0.05 =1.96

由于n=36为大样本,所以零件平均长度的95%的置信区间为:

=149.51.96*149.50.63,即(148.87,150.13

2)在上面的估计中,使用了统计中的中心极限定理。该定理表明:从均值为、方差为的总体中,抽取了容量为n的随机样本,当n充分大时(通常要求),样本均值的抽样分布近似服从均值为,方差为的正态分布。

7.12 1)已知:总体服从正态分布,但未知,n=25为小样本, =0.01 =2.797

根据样本数据计算得: =16.128s=0.871

总体均值99%的置信区间为:

=16.1282.797*16.1280.487,即(15.64,16.62

7.13 已知:总体服从正态分布,但未知,n=18为小样本, =0.1 =1.74

根据样本数据计算得: =13.56s=7.8

网络公司员工平均每周加班时间的90%的置信区间为:

=13.561.74*13.563.2,即(10.36,16.76

7.14 1)已知:n=44p=0.51 =0.01 =2.58

总体比例99%的置信区间为:

=0.512.58=0.510.19,即(0.32,0.7

2)已知:n=300p=0.82 =0.05 =1.96

总体比例95%的置信区间为:

=0.821.96=0.820.04,即(0.78,0.86

3)已知:n=1150p=0.48 =0.1,, =1.645

总体比例90%的置信区间为:

=0.481.645=0.480.02,即(0.46,0.5

7.15 已知:n=200p=0.230.10.05时,相应的=1.645 =1.96

总体比例90%的置信区间为:

=0.231.645=0.230.05,即(0.18,0.28

总体比例95%的置信区间为:

=0.231.96=0.230.06,即(0.17,0.29

7.16已知: =1000,估计误差E=200 =0.01 =2.58

应抽取的样本量为: ==167

7.17 1)已知:E=0.02 =0.4 =0.04 =2.05

应抽取的样本量为: ==2522

2)已知:E=0.04未知, =0.05 =1.96

由于未知,可以使用0.5(因为对于服从二项分布的随机变量,当0.5时,其方差达到最大值。因此,在无法得到总体比例的值时,可以用0.5代替计算。这样得出的必要样本容量虽然可能比实际需要的容量大一些,但可以充分保证有足够高的置信水平和尽可能小的置信区间)

故应抽取的样本量为: ==601

3)已知:E=0.05 =0.55 =0.1 =1.645

应抽取的样本量为: ==268

7.18 1)已知:n=50p=32/50=0.64 =0.05 =1.96

总体中赞成该项改革的户数比例的95%的置信区间为:

=0.641.96=0.640.13,即(0.51,0.77

2)已知:E=0.1 =0.8 =0.05 =1.96

应抽取的样本量为: =62

2011年四月~~

统计学课后习题答案 - (第四版) - 贾俊平

相关推荐