抽样方法(一)――简单随机抽样

发布时间:2016-09-04 15:30:00

方法(一)――简单随机抽样

教学目的:1.理解简单随机抽样的概念.

     ⒉会用简单随机抽样(抽签法、随机数表法)从总体中抽取样本

教学重点:简单随机抽样的概念.抽签法、随机数表法

教学难点:进行简单随机抽样时,"每次抽取一个个体时任一个体a被抽到的概率""在整个抽样过程中个体a被抽到的概率"的不同

教学过程:

一、复习回顾、创设情境:

⑴在一次考试中,考生有2万名,为了得到这些考生的数学平均成绩,将他们的成绩全部相加再除以考生总数,那将是十分麻烦的,怎样才能了解到这些考生的数学平均成绩呢?

⑵现有某灯泡厂生产的灯泡10000只,怎样才能了解到这批灯泡的使用寿命呢?

要解决这两个问题,就需要掌握一些统计学知识.在初中阶段,我们学习过一些统计学初步知识,了解了统计学的一些基本概念.学习了总体、个体、样本、样本的容量、总体平均数、样本平均数的意义:

在统计学里,我们把所要考察对象的全体叫做总体,其中的每一个考察对象叫做个体,从总体中所抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本的容量.总体中所有个体的平均数叫做总体平均数,样本中所有个体的平均数叫做样本平均数.

统计学的基本思想方法是用样本估计总体,即通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.因此,样本的抽去是否得当,对于研究总体来说就十分关键.究竟怎样从总体中抽取样本?怎样抽取的样本更能充分地反映总体的情况?本节课开始,我们就来学习几种常用的抽样方法

二、基础知识学习与研究:

假定一个小组有6个学生,要通过逐个抽取的方法从中取3个学生参加一项活动,第1次抽取时每个被抽到的概率是?( ),第2次抽取时,余下的每个被抽到的概率都是?( ),第3次抽取时,余下的每个被抽到的概率都是?( )。这样的抽样就是简单随机抽样。

一般地,设一个总体的个体总数为n,如果通过逐个抽取的方法从中抽取样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。

每次抽取时各个个体被抽到的概率是相等的,那么在整个抽样过程中每个个体被抽到的概率是否确实相等?

例如,从含有6个体的总体中抽取一个容量为2的样本,在整个抽样过程中,总体中的任意一个个体 ,在第一次抽取时,它被抽到的概率是?( );若它第1次未被抽到而第2次被抽到的概率是?( )。

由于个体 1次被抽到与2次被抽到是?(填互斥,独立)事件,根据互斥事件的概率加法公式,在整个抽样过程中,个体 被抽到的概率p=?( )。又由于个体 的任意性,说明在抽样过程中每个体被抽到的概率相等,都是?( )。

事实上:用简单随机抽样的方法从个体数为n的总体中逐次抽取一个容量为 的样本,那么每个个体被抽到概率都等于

由于简单随机抽样体现了抽样的客观性和公平性,且这种抽样方法比较简单,所以成为一种基本的抽样方法。

如何实施简单抽样呢?下面介绍两种常用方法

1)抽签法

先将总体中的所有个体编号(号码可以从1n),并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时,每次从中抽出1个号签,连续抽取 次,就得到一个容量为 的样本,对个体编号时,也可以利用已有的编号,例如从全班学生中抽取样本时,可以利用学生的学号、座位号等。

抽签法简便易行,当总体的个体数不多时,适宜采用这种方法。

2)随机数表法

下面举例说明如何用随机数表来抽取样本。

为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,在利用随机数表抽取这个样本时,可以按下面的步骤进行:

第一步,先将40件产品编号,可以编为00,01,02 38,39

第二步,在附录1随机数表中任选一个数作为开始,例如从第8行第5列的数59开始,为便于说明,我们将附录1中的第6行至第10行摘录如下。

16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64

84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76

63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79

33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54

57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28

第三步,从选定的数59开始向右读下去,得到一个两位数字号码59,由于5939,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34。至此,10个样本号码已经取满,于是,所要抽取的样本号码是

16 19 10 12 07 39 38 33 21 34 

注 将总体中的n个个体编号时可以从0开始,例如n100时编号可以是00,01,02 99,这样总体中的所有个体均可用两位数字号码表示,便于运用随机数表。

当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等。

在上面每两位、每两位地读数过程中,得到一串两位数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。由于随机数表中每个位置上出现哪一个数字是等概率的,每次读到哪一个两位数字号码,即从总体中抽到哪一个个体的号码也是等概率的。因而利用随机数表抽取样本保证了各个个体被抽取的概率相等。

三、知识应用与解题研究:

1 对总数为n的一批零件抽取一个容量为30的样本,若每个零件被抽到的概率为0.25,则n的值为(

解:因为从含有n个个体的总体中抽取一个容量为30的样本时,每次抽取一个个体时任一个体被抽到的概率为 ;在整个抽样过程中各个个体被抽到的概率为 ;所以 0.25,从而有n=120. 故选a

四、巩固练习:p7练习12

五、总结提炼:统计的基本思想,简单随机抽样,什么样的总体适宜用简单随机抽样,如何用抽签法或随机数表法获取样本 简单随机抽样的常用方法:⑴抽签法、⑵随机数表法 简单随机抽样是不放回抽样,是一种等概率抽样方法.

六、课后作业:p9习题13

七、检验反馈:

1 . 下列说法正确的是:

(a)甲乙两个班期末考试数学平均成绩相同,这表明这两个班数学学习情况一样

(b)期末考试数学成绩的方差甲班比乙班的小,这表明甲班的数学学习情况比乙班好

(d)期末考试数学平均成绩甲、乙两班相同,方差甲班比乙班小,则数学学习甲班比乙班好

2. 一组数据的方差是 ,将这组数据中的每一个数据都乘以2,所得到的一组数据的方差是(

. . c. d.

3.从某鱼池中捕得1200条鱼,做了记号之后,再放回池中,经过适当的时间后,再从池中捕得1000条鱼,计算其中有记号的鱼为100条,试估计鱼池中共有鱼的条数为( )

4. (1)已知一组数据1210,-1,-20,-1,则这组数数据的平均数为 ;方差为

(2)5,-1,-2x的平均数为1,则x=

(3)已知n个数据的和为56,平均数为8,则n=

(4)某商场4月份随机抽查了6天的营业额,结果分别如下(单位:万元):2.83.23.43.73.03.1,试估算该商场4份的总营业额,大约是__万元。

抽样方法(二)――分层抽样

教学目的:1 理解分层抽样的概念;2.会用分层抽样从总体中抽取样本

教学重点:分层抽样概念的理解及实施步骤

教学难点:分层抽样从总体中抽取样本

教学过程:

一、复习回顾:简单随机抽样、系统抽样。

二、基础知识学习与研究:

一个单位的职工有500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁以上的有95人,为了了解这个单位职工与身体状况有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?

为了使抽出的100名职工更充分地反映单位职工的整体情况,在各个年龄段可按这部分职工人数与职工总数的比进行抽样。

因为抽取人数与职工总数的比为100 500=1 5

所以在各年龄段抽取的职工人数依次是 25,56,19

在各个年龄段分别抽取时,可采用前面介绍的简单随机抽样的方法,将各年龄段抽取的职工合在一起,就是所要抽取的100名职工。

像这样当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽取叫做分层抽样,其中所分成的各部分叫做层。

可以看到,由于各部分抽取的个体数与这一部分个体数的比等于样本容量与总体的个体数的比,分层抽样时,每一个个体被抽到的概率都是相等的。

由于分层抽样充分利用了已知信息,使样本具有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着广泛的应用。

以上我们简单介绍了简单随机抽样和分层抽样,这两种抽样方法的共同特点是:在整个抽样过程中每个个体被抽取的概率相等。简单随机抽样是最基本的抽样方法,当总体由差异明显的几部分组成,采取分层抽样时,其中各层的抽样常采用简单随机抽样。

三、知识应用与解题研究:

1 某单位有老年人28 ,中年人54,青年人81,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36样本,适合的抽取样本的方法是 ( )

  a. 简单的随机抽样 b. 系统抽样

2 一个单位有500名职工,其中不到35岁的有125人,35岁~49岁的有280人,50岁以上的有95人.为了了解这个单位职工与身体状况有关的某项指标,如何从中抽取一个容量为100的样本?

:由于职工年龄与这项指标有关,故适于用分层抽样,抽样过程如下:

⑴确定样本容量与总体的个体数之比100:500=1:5

⑵利用抽样比确定各年龄段应抽取的个体数,依次为

,即255619

⑶利用简单随机抽样或系统抽样的方法,在各年龄段分别抽取255619人,然后合在一起,就是所要抽取的样本.

说明:①分层抽样适用于总体由差异比较明显的几个部分组成的情况,是等概率抽样,它也是客观的、公平的;

②分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,使样本具有较好的代表性,而且在各层抽样时可以根据情况采用不同的抽样方法,因此在实践中有着非常广泛的应用.

3 某学校有职工140人,其中教师91人,教辅行政人员28人,总务后勤人员21. 为了解职工的某种情况,要从中抽取一个容量为20的样本.以下的抽样方法中,依简单随机抽样、系统抽样、分层抽样顺序的是 ( )

方法1:将140人从1140编号,然后制作出有编号1140140个形状、大小相同的号签,并将号签放人同一箱子里进行均匀搅拌,然后从中抽取20个号签,编号与签号相同的20个人被选出;

方法2:将140人分成20组,每组7人,并将每组7人按1-7编号,在第一组采用抽签法抽出 (1 7),则其余各组尾号也被抽到,20个人被选出;

方法3:按20:140=1:7的比例,从教师中抽取13人,从教辅行政人员中抽取4人,从总务后勤人员中抽取3人.从各类人员中抽取所需人员时,均采用随机数表法,可抽到20个人.

  a.方法2,方法1,方法3 b.方法2,方法3,方法1

四、巩固练习:p8练习:13

1 . 统计某区的高考成绩,在总数为3000人的考生中,省重点中学毕业生有300人,区重点中学毕业生有900人,普通中学毕业生有1700人,其他考生有100人.从中抽取一个容量为300的样本进行分析,各类考生要分别抽取多少人?

2. 某农场在三块地种植某种试验作物,其中平地种有150亩,河沟地种有30亩,坡地种有90亩.现从中抽取一个容量为18的样本,各类地要分别抽取多少亩?

3. 一个工厂有若干车间,今采用分层抽样方法从全厂某天的2048件产品中抽取一个容量为128的样本进行质量检查.若一车间这一天生产256件产品,则从该车间抽取的产品件数为________

答案:1. 省重点中学抽取30人,区重点中学抽取90人,普通中学抽取170人,其他考生抽取10  2. 平地抽取10亩,河沟地抽取2亩,坡地抽取6亩。3. 16

五、总结提炼:了解分层抽样的概率,会用分层抽样从总体中抽取样本。

六、课后作业:p945

总体分布的估计

教学目的:1 了解当总体中的个体取不同数值很少时,可用频率分布表或频率分布条形图估计总体分布,并会用这两种方式估计总体分布;

⒉了解当总体中的个体取不同数值较多,甚至无限时,可用频率分布表或频率分布直方图估计总体分布,并会用这两种方式估计总体分布

教学重点:用样本的频率分布估计总体分布

教学难点:频率分布表和频率分布直方图的绘制

教学过程:

一、复习回顾:频率分布

二、探索研究:

阅读p91段后的例1,思考怎样进行总体分布的估计。 

1 为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5岁-18岁的男生的体重情况,结果如下(单位:kg)

56.5

69.5

65

61.5

64.5

66.5

64

64.5

76

58.5

72

73.5

56

67

70

57.5

65.5

68

71

75

62

68.5

62.5

66

59.5

63.5

64.5

67.5

73

68

55

72

66.5

74

63

60

55.5

70

64.5

58

64

70.5

57

62.5

65

69

71.5

73

62

58

76

71

66

63.5

56

59.5

63.5

65

70

74.5

68.5

64

55.5

72.5

66.5

68

76

57.5

60

71.5

57

69.5

74

64.5

59

61.5

67

68

63.5

58

59

65.5

62.5

69.5

72

64.5

75.5

68.5

64

62

65.5

58.5

67.5

70.5

65

66

66.5

70

63

59.5

试根据上述数据画出样本的频率分布直方图,并对相应的总体分布作出估计。

:按照下列步骤获得样本的频率分布.

(1)求最大值与最小值的差.

在上述数据中,最大值是76,最小值是55,它们的差(又称为极差)76-55=21)所得的差告诉我们,这组数据的变动范围有多大.

(2)确定组距与组数.

如果将组距定为2,那么由21÷2=10.5,组数为11,这个组数适合的.于是组距为2,组数为11.

3)决定分点.

根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是"左闭右开".这样,所得到的分组是

54.556.5),[56.558.5),...,[74.576.5.

4)列频率分布表

分组

频数累计

频数

频率

54.556.5

2

0.02

56.558.5

6

0.06

58.560.5

10

0.10

60.562.5

10

0.10

62.564.5

14

0.14

64.566.5

16

0.16

66.568.5

13

0.13

68.570.5

11

0.11

70.572.5

8

0.08

72.574.5

7

0.07

74.576.5

3

0.03

合计

100

1.00

5)绘制频率分布直方图.

体重

54.5

频率/组距

56.5

58.5

74.5

72.5

66.5

68.5

70.5

76.5

62.5

60.5

64.5

  由于图中各小长方形的面积等于相应各组的频率,这个图形的面积的形式反映了数据落在各个小组的频率的大小.

在反映样本的频率分布方面,频率分步表比较确切,频率分布直方图比较直观,它们起着相互补充的作用.

在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计,体重在(64.566.5kg的学生最多,约占学生总数的16%;体重小于58.5kg的学生较少,约占8%;等等.

四、巩固练习:p12练习12

五、总结提炼:用样本的频率分布估计总体分布,可以分成两种情况讨论:

⒈当总体中的个体取不同数值很少(并不是总体中的个数很少)时,其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的条形图;

⒉当总体中的个体取不同值较多、甚至无限时,对其频率分布的研究要用到初中学过的整理样本数据的知识.

它们的不同之处在于:前者的频率分布表中列出的是几个不同数值的频率,相应的条形图是用其高度来表示取各个值的频率;后者的频率分布表列出的是在各个不同区间内取值的频率,相应的直方图是用图形面积的大小来表示在各个区间内取值的频率

六、课后作业:p12习题:12

七、检验反馈:

1 . 为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品14件.

⑴列出样本频率分布表;⑵画出表示样本频率分布的条形图;

⑶根据上述结果,估计此种商品为二级品或三级品的概率约是多少?

解:⑴样本的频率分布表为

产品

频数

频率

一级品

5

0.17

二级品

8

0.27

三级品

13

0.43

次品

4

0.13

⑵样本频率分布的条形图如右:

⑶此种产品为二极品或三极品的概率为0.27+0.43=0.7

2. 如下表:

频数

频数

[10.7510.85)

3

[11.2511.35)

20

[10.8510.95)

9

[11.35 11.45)

7

[10.9511.05)

13

[11.45 11.55)

4

[11.0511.15)

16

[11.55 11.65)

2

[11.1511.25)

26

100

⑴完成上面的频率分布表.⑵根据上表,画出频率分布直方图.

⑶根据上表,估计数据落在[10.9511.35]范围内的概率约为多少?

答案:1、⑶数据落在[10.9511.35)范围的频率为0.13+0.16+0.26+0.20=0.75

总体期望值的估计

教学目标:1、使学生掌握用样本的平均数去估计总体期望值。

2、培养学生分析数据的能力。

教学重点:计算样本(总体)的平均数。

教学难点:适当抽样提高样本的代表性。

教学过程:

一、复习回顾:

在初中,总体平均数(又称为总体期望值)描述了一个总体的平均水平。对很多总体来说,它的平均数不易求得,常用容易求得的样本平均数: 对它进行估计,而且常用两个样本平均数的大小去近似地比较相应的两个总体的平均数的大小。

二、探索研究:

1 在一批试验田里对某早稻品种进行丰产栽培试验,抽测了其中15块试验田的单位面积(单位面积的大小为 hm2)的产量如下:(单位:kg

504 402 492 495 500 501 405 409

460 486 460 371 420 456 395

这批试验田的平均单位面积产量约是多少?

2 某校高二年级进行一次数学测试,抽取40人,算出其平均成绩为80分,为准确起见,后来又抽取50人,算出其平均成绩为83分,通过两次抽样的结果,估计这次数学测试的平均成绩。

3 被誉为"杂交水稻之父" 的中国科学院院士袁隆平,为了得到良种水稻,进行了大量试验,下表是在10个试验点对ab两个品种的对比试验结果:

品种

各试验点亩产量(kg)

1

2

3

4

5

6

7

8

9

10

a

490

509

527

497

520

582

497

489

538

532

b

504

486

463

475

530

473

470

475

453

512

试估计哪个品种的平均产量更高一些?

三、巩固练习:p1512

四、总结提炼 :用样本的平均数去估计总体平均数(总体期望值)简单易行,因而用途十分广泛,但估计的结果具有一定的近似性,甚至可能出现较大的偏差与疏误,这与确定性数学中通过逻辑推理得到肯定的结论的情况有所不同,学习中要注意体会。为了使样本更充分地反映总体的情况,可在条件许可的情况下,适当增加样本容量,并力求使抽样方法更加合理,以提高样本的代表性。

四、课外作业:p17习题12

五、检验反馈:

1、已知10个数据:

1203 1201 1194 1200 1204 1201 1199 1204 1195 1199

它们的平均数是 ( )

2、若m个数的平均数是x, n个数的平均数是y,则这m+n个数的平均数是( )

3、某工厂研制ab两种灯泡,为了比较这两种灯泡的平均使用寿命,从这两种灯泡中各抽10只进行的使用寿命试验,得到如下数据(单位:小时)

a1000 1200 1650 1342 1679 999 1320 1540 1276 1342

b1580 1420 1320 1149 1330 1178 1440 1553 1642 1005

根据上述两个样本,能对两种灯泡的平均使用寿命作出什么样的估计?

4、一个水库养了某种鱼10万条,从中捕捞了20条,称得它们的质量如下:

(单位:kg)

1.15 1.04 1.11  1.07 1.10 1.32 1.25 1.19 1.15 1.21 1.18 1.14 1.09 1.25 1.21 1.29 1.16 1.24 1.12 1.16

计算样本平均数,并根据计算结果估计水库里所有这种鱼的总质量约是多少?

a 25 41 40 37 22 14 19 39 21 42

b 27 16 44 27 44 16 40 16 40 40

(1)哪种棉花的苗长得高?

(2) 哪种棉花的苗长得整齐?

总体方差(标准差)的估计

教学目标:理解方差和标准差的意义,会求样本方差和标准差。

教学重点:计算样本(总体)的方差(标准差)。

教学难点:适当抽样提高样本的代表性。

教学过程:

一、复习回顾:

方差和标准差计算公式:

样本方差:s2= 〔(x1- )2+x2- 2+...+xn- 2

样本标准差:s=

方差和标准差的意义:描述一个样本和总体的波动大小的特征数。标准差大说明波动大。一般的计算器都有这个键。

二、探索研究:

甲: 755  752 757  744  743  729  721  731

778  768  761  773  764  736 741

729  767  744  750 745  753  745  752

769  743  760  755 748  752  747

如何通过对上述数据的处理,来作出选人的决定呢?

s甲>s ,∴乙比甲稳定

∴选拔乙去参加运动会。

三、巩固练习:p17练习12

四、总结提炼:

总体期望值(平均数)描述一总体的平均水平,方差和标准差描述数据的波动情况或者叫稳定程度。

抽样方法(一)――简单随机抽样

相关推荐