2 第2讲 用样本估计总体

2 第2讲 用样本估计总体
2 第2讲 用样本估计总体

第2讲 用样本估计总体

1.统计图表

(1)频率分布直方图的画法步骤

①求极差(即一组数据中最大值与最小值的差); ②决定组距与组数; ③将数据分组; ④列频率分布表; ⑤画频率分布直方图.

(2)频率分布折线图和总体密度曲线

①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. ②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. (3)茎叶图的画法步骤

第一步:将每个数据分为茎(高位)和叶(低位)两部分;

第二步:将最小茎与最大茎之间的数按大小次序排成一列; 第三步:将各个数据的叶依次写在其茎的两侧. 2.样本的数字特征

(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.

(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.

(3)平均数:把a 1+a 2+…+a n n

称为a 1,a 2,…,a n 这n 个数的平均数.

(4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -

,则这组数据的标准差和方差分别是 s =

1n

[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2] s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]

3.与平均数和方差有关的结论

(1)若x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x -

+a ; (2)数据x 1,x 2,…,x n 与数据x ′1=x 1+a ,x ′2=x 2+a ,…,x ′n =x n +a 的方差相等,即数据经过平移后方差不变;

(3)若x1,x2,…,x n的方差为s2,那么ax1+b,ax2+b,…,ax n+b的方差为a2s2;

(4)s2=1

n

i=1

n

(x i-x

)2=

1

n

i=1

n

x2i-x

-2

,即各数平方的平均数减去平均数的平方.

判断正误(正确的打“√”,错误的打“×”)

(1)一组数据的方差越大,说明这组数据的波动越大.()

(2)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.()

(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.()

(4)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.()

(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.()

答案:(1)√(2)√(3)×(4)√(5)√

(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.

根据该折线图,下列结论错误的是()

A.月接待游客量逐月增加

B.年接待游客量逐年增加

C.各年的月接待游客量高峰期大致在7,8月份

D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳

解析:选A.根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都是减少,所以A错误.

重庆市某年各月的平均气温(℃)数据的茎叶图如图,则这组数据的中位数是()

A.19 B.20

C.21.5 D.23

解析:选B.由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,

28,31,32,所以中位数为20+20

2=20.

(2018·郑州第一次质量预测)我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是________.

解析:依题意得,成绩低于60分的相应的频率等于(0.005+0.01)×20=0.3,所以该班的学生人数是15÷0.3=50.

答案:50

甲、乙两人在10天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数

字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.

解析:由茎叶图可知甲的平均数为

19+18+20+21+23+22+20+31+31+35

10=24.

乙的平均数为

19+17+11+21+24+22+24+30+32+30

10=23.

答案:2423

茎叶图

[典例引领]

(2017·高考山东卷)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单

位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )

A .3,5

B .5,5

C .3,7

D .5,7

【解析】 根据两组数据的中位数相等可得65=60+y ,解得y =5,又它们的平均值相等, 所以56+62+65+74+(70+x )5

59+61+67+(60+y )+78

5,解得x =3.故选A .

【答案】 A

茎叶图中的三个关注点

(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一. (2)重复出现的数据要重复记录,不能遗漏.

(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.

[通关练习]

1.(2018·贵州遵义航天高中模拟)某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为( )

A .117

B .118

C .118.5

D .119.5

解析:选B.22次考试中,所得分数最高的为98,最低的为56,所以极差为98-56=42, 将分数从小到大排列,中间两数为76,76,所以中位数为76, 所以此学生该门功课考试分数的极差与中位数之和为42+76=118.

2.为了了解某校教师使用多媒体进行教学的情况,现采用简单随机抽样的方法,从该校400

名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如图所示.据此可估计上学期该校400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为()

A.100 B.160

C.200 D.280

解析:选B.由茎叶图可知在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学的次数在[16,30)内的人数

为400×8

20=160.

频率分布直方图(高频考点)

频率分布直方图是高考的热点,选择题、填空题、解答题都有可能出现.难度一般较小.高考对频率分布直方图的考查主要有以下三个命题角度:

(1)求样本的频率、频数;

(2)求样本的数字特征;

(3)与概率结合的问题.

[典例引领]

角度一求样本的频率、频数

(2016·高考山东卷)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()

A.56B.60

C.120 D.140

【解析】 由频率分布直方图可知,这200名学生每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,故这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.故选D. 【答案】

D

角度二 求样本的数字特征

(2018·云南省11校跨区调研)为了解一种植物果实的情况,随机抽取一批该植物果

实样本测量重量(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示.

(1)求图中a 的值;

(2)估计这种植物果实重量的平均数x -

和方差s 2(同一组中的数据用该组区间的中点值作代表).

【解】 (1)组距d =5,由5×(0.02+0.04+0.075+a +0.015)=1得a =0.05. (2)各组中点值和相应的频率依次为

x =30×0.1+35×0.2+40×0.375+45×0.25+50×0.075=40, s 2=(-10)2×0.1+(-5)2×0.2+02×0.375+52×0.25+102×0.075=28.75. 角度三 与概率结合的问题

(2018·东北四市高考模拟)某手机厂商推出一款6寸大屏手机,现对500名该手机使

用者(200名女性,300名男性)进行调查,对手机进行打分,打分的频数分布表如下:

给出结论即可);

(2)根据评分的不同,运用分层抽样的方法从男性用户中抽取20名用户,再从这20名用户中满足评分不低于80分的用户中任意抽取3名用户,求3名用户中评分小于90分的人数X 的分布列和数学期望.

【解】 (1)女性用户和男性用户的频率分布直方图如图.

由图可知女性用户评分的波动小,男性用户评分的波动大.

(2)运用分层抽样的方法从男性用户中抽取20名用户,评分不低于80分的用户有6人,其中评分小于90分的有4人,

从6人中任取3人,则X 的可能取值为1,2,3,

P (X =1)=C 14C 22C 36=420=15,P (X =2)=C 24C 1

2

C 36=1220=35

P (X =3)=C 34

C 36=420=15.

所以X 的分布列为 E (X )=15+65+35

=2.

频率、频数、样本容量的计算方法

(1)频率组距

×组距=频率.

(2)频数

样本容量=频率,频数

频率

=样本容量,样本容量×频率=频数. [提醒] 制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确.

[通关练习]

1.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个长方形的面积和的2

5,且样本容量为140,则中间一组的频数为( )

A .28

B .40

C .56

D .60

解析:选B .设中间一组的频数为x ,

因为中间一个小长方形的面积等于其他8个长方形的面积和的25,所以其他8组的频数和为

5

2x ,由x +5

2

x =140,解得x =40.

2.(2018·武汉市武昌区调研考试)我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准x (吨),月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解全市居民用水量的分布情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.

(1)求频率分布直方图中a 的值;

(2)已知该市有80万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (3)若该市政府希望使85%的居民每月的用水量不超过标准x (吨),估计x 的值,并说明理由. 解:(1)由频率分布直方图,可得(0.08+0.16+a +0.40+0.52+a +0.12+0.08+0.04)×0.5=1, 解得a =0.30.

(2)由频率分布直方图知,100位居民每人月均用水量不低于3吨的频率为(0.12+0.08+0.04)×0.5=0.12.

由以上样本频率分布,可以估计全市80万居民中月均用水量不低于3吨的人数为800

000×0.12=96 000.

(3)因为前6组的频率之和为(0.08+0.16+0.30+0.40+0.52+0.30)×0.5=0.88>0.85,前5组的频率之和为(0.08+0.16+0.30+0.40+0.52)×0.5=0.73<0.85, 所以2.5≤x <3.

由0.3×(x -2.5)=0.85-0.73,解得x =2.9.

因此,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.

样本数字特征的求解与应用

[典例引领]

(1)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志是“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例的数据,一定符合该标志的是( ) A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3 D .丁地:总体均值为2,总体方差为3

(2)(2018·南昌模拟)若1,2,3,4,m 这五个数的平均数为3,则这五个数的方差为________. (3)(2018·石家庄市教学质量检测(二))设样本数据x 1,x 2,…,x 2 017的方差是4,若y i =2x i -1(i =1,2,…,2 017),则y 1,y 2,…,y 2 017的方差为________.

【解析】 (1)根据标志,要求数据中每个个体不超过7.中位数与众数不能体现个体数据,无法确定.方差体现数据中个体的波动程度,若大于0,则无法确定.若均值为2,方差为3,假设?x i ≥8,则s 2

≥(x i -x -)2

10=6210

>3,故假设不成立.

(2)由1+2+3+4+m 5=3得m =5,所以这五个数的方差为1

5[(1-3)2+(2-3)2+(3-3)2+(4-

3)2+(5-3)2]=2.

(3)设样本数据的平均数为x -,则y i =2x i -1的平均数为2x -

-1,则y 1,y 2,…,y 2 017的方差为

12 017[(2x 1-1-2x -+1)2+(2x 2-1-2x -+1)2+…+(2x 2 017-1-2x -

+1)2]=4×12 017

[(x 1-x -)2+(x 2-x -)2+…+(x 2 017-x -

)2]=4×4=16. 【答案】 (1)D (2)2 (3)16

(1)众数、中位数、平均数及方差的意义

①平均数与方差都是重要的数字特征,是对总体的一种简明地描述. ②平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小. (2)在计算平均数、方差时可利用平均数、方差的有关结论.

[通关练习]

1.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )

A .甲的成绩的平均数小于乙的成绩的平均数

B .甲的成绩的中位数等于乙的成绩的中位数

C .甲的成绩的方差小于乙的成绩的方差

D .甲的成绩的极差小于乙的成绩的极差 解析:选C. x -

甲=15(4+5+6+7+8)=6,

x -

乙=15

(5×3+6+9)=6,

甲的成绩的方差为1

5(22×2+12×2)=2,

乙的成绩的方差为1

5

(12×3+32×1)=2.4.

2.(2018·合肥市第二次教学质量检测)某同学在高三学年的五次阶段性考试中,数学成绩依次为110,114,121,119,126,则这组数据的方差是________.

解析:因为对一组数据同时加上或减去同一个常数,方差不变,所以本题中可以先对这5个数据同时减去110,得到新的数据分别为0,4,11,9,16,其平均数为8,根据方差公式可得s 2=

(0-8)2+(4-8)2+(11-8)2+(9-8)2+(16-8)2

5=30.8.

答案:30.8

3.(2018·贵阳市监测考试)在某校科普知识竞赛前的模拟测试中,得到甲、乙两名学生的6次模拟测试成绩(百分制)的茎叶图(如图).若从甲、乙两名学生中选择一人参加该知识竞赛,你会选哪位?请运用统计学的知识说明理由.

解:学生甲的平均成绩x -甲=68+76+79+86+88+956=82,

学生乙的平均成绩x -

乙=71+75+82+84+86+946

=82,

又s 2

甲=16×[(68-82)2+(76-82)2+(79-82)2+(86-82)2+(88-82)2+(95-82)2]=77,

s 2乙=16×[(71-82)2+(75-82)2+(82-82)2+(84-82)2+(86-82)2+(94-82)2

]=1673,则x -甲=x -乙,s 2甲>s 2乙,说明甲、乙的平均水平一样,但乙的方差小,即乙发挥更稳定,故可选择学生乙参加知识竞赛.

众数、中位数和平均数的异同

相同点:标准差和方差描述了一组数据围绕平均数波动的大小.

不同点:方差与原始数据的单位不同,且平方后可能夸大了偏差程度,标准差则不然. 易错防范

(1)易忽视频率分布直方图中纵轴表示的应为频率

组距

.

(2)在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆

茎叶图中茎与叶的含义.

1.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是( ) A .0.05 B .0.25 C .0.5

D .0.7

解析:选D.由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为14

20=

0.7.

2.(2018·广西三市第一次联考)在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,则被污染的数字为( )

A .1

B .2

C .3

D .4

解析:选B.由题图可知该组数据的极差为48-20=28,则该组数据的中位数为61-28=33,易得被污染的数字为2.

3.(2018·岳阳模拟)某商场在国庆黄金周的促销活动中,对10月2日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为( )

A .6万元

B .8万元

C .10万元

D .12万元

解析:选C.设11时到12时的销售额为x 万元,依题意有2.5x =0.100.40

,解得x =10.

4.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所

示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()

解析:选A.由分组可知C,D一定不对;由茎叶图可知[0,5)有1人,[5,10)有1人,所以第一、二小组频率相同,频率分布直方图中矩形的高应相等,可排除B.

5.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为()

A.1 B.2

C.3 D.4

解析:选D.由题意这组数据的平均数为10,方差为2,可得:x+y=20,(x-10)2+(y-10)2=8,

设x=10+t,y=10-t,由(x-10)2+(y-10)2=8,得t2=4,所以|x-y|=2|t|=4. 6.(2018·湖南省五市十校联考)某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则n-m的值是________.

解析:由甲组学生成绩的平均数是88,可得

70+80×3+90×3+(8+4+6+8+2+m+5)

7=88,解得m=3.由乙组学生成绩的中位数是89,可得n=9,所以n-m=6.

答案:6

7.为了普及环保知识,增强环保意识,某大学有300名员工参加环保知识测试,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.现在要从第1,3,4组中用分层抽样的方法抽取16人,则在第4组中抽取的人数为________.

解析:根据频率分布直方图得,第1,3,4组的频率之比为1∶4∶3,所以用分层抽样的方法抽取16人时,在第4组中应抽取的人数为16×3

1+4+3=6.

答案:6

8.(2018·成都市第二次诊断性检测)在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1 ,那么这组数据的方差s 2可能的最大值是________.

解析:由题意可设两个被污损的数据分别为10+a ,b ,(a ,b ∈Z ,0≤a ≤9),则10+a +b +9+10+11=50,即a +b =10,b =10-a ,所以s 2=15[(9-10)2+(10-10)2+(11-10)2+(10

+a -10)2+(b -10)2]=15[2+a 2+(b -10)2]=25(1+a 2)≤2

5×(1+92)=32.8.

答案:32.8

9.某校1 200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:

(1)求a 、b 、c (2)如果从这1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P (注:

60分及60分以上为及格);

(3)试估计这次数学测验的年级平均分.

解:(1)由题意可得,b =1-(0.015+0.125+0.5+0.31)=0.05,a =200×0.05=10,c =200×0.5=100.

(2)根据已知,在抽出的200人的数学成绩中,及格的有162人.所以P =162200=81

100=0.81.

(3)这次数学测验样本的平均分为

x -=16×3+32.1×10+55×25+74×100+88×62200=73,

所以这次数学测验的年级平均分大约为73分.

10.(2017·高考北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:

(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;

(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.

解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4.

所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为 (0.01+0.02+0.04+0.02)×10=0.9,

分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为400×

5

100

=20.

(3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60,

所以样本中分数不小于70的男生人数为60×1

2

=30.

所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.

所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.

1.(2018·长春模拟)某销售公司为了解员工的月工资水平,从1 000位员工中随机抽取100位员工进行调查,得到如下的频率分布直方图:

(1)试由此图估计该公司员工的月平均工资;

(2)该公司的工资发放是以员工的营销水平为重要依据来确定的,一般认为,工资低于4 500元的员工属于学徒阶段,没有营销经验,若进行营销将会失败;高于4 500元的员工属于成熟员工,进行营销将会成功.现将该样本按照“学徒阶段工资”“成熟员工工资”分成两层,进行分层抽样,从中抽出5人,在这5人中任选2人进行营销活动.活动中,每位员工若营销成功,将为公司赚得3万元,否则公司将损失1万元.试问在此次比赛中公司收入多少万元的可能性最大?

解:(1)估计该公司员工的月平均工资为0.000 1×1 000×2 000+0.000 1×1 000×3 000+0.000 2×1 000×4 000+0.000 3×1 000×5 000+0.000 2×1 000×6 000+0.000 1×1 000×7 000=4 700(元). (2)抽取比为5100=120

从工资在[1 500,4 500)内的员工中抽出100×(0.1+0.1+0.2)×1

20=2人,设这两位员工分

别为1,2;从工资在[4 500,7 500]内的员工中抽出100×(0.3+0.2+0.1)×1

20=3人,设这

三位员工分别为A ,B ,C .

从中任选2人,共有以下10种不同的等可能结果:(1,2),(1,A ),(1,B ),(1,C ),(2,

A ),(2,

B ),(2,

C ),(A ,B ),(A ,C ),(B ,C ).

两人营销都成功,公司收入6万元,有以下3种不同的等可能结果:(A ,B ),(A ,C ),(B ,C ),概率为3

10

其中一人营销成功,一人营销失败,公司收入2万元,有以下6种不同的等可能结果:(1,A ),(1,B ),(1,C ),(2,A ),(2,B ),(2,C ),概率为

610=35

; 两人营销都失败,公司收入-2万元,即损失2万元,有1种结果:(1,2),概率为1

10.

因为110<310<3

5

,所以公司收入2万元的可能性最大.

2.(2018·河北三市第二次联考)某高三毕业班甲、乙两名同学在连续的8次数学周练中,统计解答题失分的茎叶图如图:

(1)比较这两名同学8次周练解答题失分的平均数和方差的大小,并判断哪位同学做解答题相对稳定些;

(2)以上述数据统计甲、乙两名同学失分超过15分的频率作为概率,假设甲、乙两名同学在同一次周练中失分多少互不影响,预测在接下来的2次周练中,甲、乙两名同学失分均超过15分的次数X 的分布列和均值.

解:(1) x -甲 =18(7+9+11+13+13+16+23+28)=15,x -

乙=18(7+8+10+15+17+19+

21+23)=15,

s 2甲=18[(-8)2+(-6)2+(-4)2+(-2)2+(-2)2+12+82+132

]=44.75, s 2乙=18

[(-8)2+(-7)2+(-5)2+02+22+42+62+82]=32.25. 甲、乙两名同学解答题失分的平均数相等;甲同学解答题失分的方差比乙同学解答题失分的方差大.所以乙同学做解答题相对稳定些.

(2)根据统计结果,在一次周练中,甲和乙失分超过15分的概率分别为P 1=38,P 2=12,

两人失分均超过15分的概率为P 1P 2=3

16

X 的所有可能取值为0,1,2.依题意,X ~B (2,3

16

),

P(X=k)=C k2(3

16)

k(13

16)

2-k,k=0,1,2,

则X的分布列为

X的均值E(X)=2×3

16=

3

8.

高三数学一轮复习 用样本估计总体巩固与练习

高三数学一轮复习 用样本估计总体巩固与练习 1.如图是某电视台综艺节目举办的挑战主持人大赛上,七位 评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个 最低分后,所剩数据的平均数和方差分别为( ) A .84,4.84 B .84,1.6 C .85,4 D .85,1.6 解析:选D.由茎叶图可知评委打出的最低分为79,最高分为93,其余得分为84,84,86,84,87,故平均分为84×3+86+875 =85,方差为15 [3×(84-85)2+(86-85)2+(87-85)2]=1.6. 2.(2009 组别 频数 (0,10] 12 (10,20] 13 (20,30] 24 (30,40] 15 (40,50] 16 (50,60] 13 (60,70] 7 A .0.13 B .0.39 C .0.52 D .0.64 解析:选C.由列表知样本数据落在(10,40]上的频数为52, 频率为0.52. 3.为了了解一片经济林的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出样本的频率分布直方图(如图),那么在这100株树木中,底部周长小于110 cm 的株数是( ) A .30 B .60 C .70 D .80 解析:选C.底部周长小于110 cm 的频率: 10×0.01+10×0.02+10×0.04=0.7. 周长小于110 cm 的株数为:100×0.7=70. 4.(原创题)在样本的频率分布直方图中,共有4个小长方形,这4个小方形的面积由小到大构成等差数列{a n },已知a 2=2a 1,且样本容量为400,则小长方形面积最大的一组的频数为________.

用样本估计总体教案

2.2.1用样本的频率分布估计总体分布 一、教学目标分析 1.知识与技能目标 (1)通过实例体会分布的意义和作用。 (2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图。 (3)通过实例体会频率分布直方图的特征,能准确地做出总体估计。 2、过程与方法目标: 通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。 3、情感态度与价值观目标: 通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。 二、教学的重点和难点 重点:会列频率分布表,画频率分布直方图。 难点:能通过样本的频率分布估计总体的分布。 三、教法与学法分析 1、教法:遵循观察、探究、发现、总结式的教学模式。重点以引导学生为主,让他们能积极、主动的进行探索,获取知识。由于内容较繁琐,所以要借助多媒体辅助教学。 2、学法:根据本节知识的特点,由于学生已具备一定的基础知识,可采取研究性学习的学习方法。 四、教学过程 (一)情境引入 1.随机抽样有哪几种基本的抽样方法? 简单随机抽样、系统抽样、分层抽样. 2.随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即 用样本估计总体,是我们需要进一步学习的内容. 3.高二某班有50名学生,在数学必修②结业考试后随机抽取10名,其考试成绩如下: 82,75,61,93,62,55,70,68,85,78. 如果要求我们根据上述抽样数据,估计该班对数学模块②的总体学习水平,就需要有相应的数学方法作为理论指导,本节课我们将学习用样本的频率分布估计总体分布. (二)新课讲解 知识探究(一):频率分布表 【问题】我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费. 通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t): 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2

用样本估计总体

用样本估计总体一、基础知识 1.频率分布直方图 (1)纵轴表示频率 组距 ,即小长方形的高= 频率 组距 ; (2)小长方形的面积=组距×频率 组距 =频率; (3)各个小方形的面积总和等于1 . 2.频率分布表的画法 第一步:求极差,决定组数和组距,组距=极差组数 ; 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. 3.茎叶图 茎叶图是统计中用来表示数据的一种图, 茎是指中间的一列数,叶就是从茎的旁 边生长出来的数. 4.中位数、众数、平均数的定义 (1)中位数 将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. (2)众数 一组数据中出现次数最多的数据叫做这组数据的众数. (3)平均数 一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,…,x n的 平均数x=1 n(x1+x2+…+x n).

5.样本的数字特征 如果有n个数据x1,x2,…,x n,那么这n个数的 (1)平均数x=1 n(x1+x2+…+x n). (2)标准差s=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2]. (3)方差s2=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2]. 二、常用结论 1.频率分布直方图中的常见结论 (1)众数的估计值为最高矩形的中点对应的横坐标. (2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. (3)中位数的估计值的左边和右边的小矩形的面积和是相等的. 2.平均数、方差的公式推广 (1)若数据x1,x2,…,x n的平均数为x,则mx1+a,mx2+a,mx3+a,…,mx n+a的平均数是m x+a. (2)若数据x1,x2,…,x n的方差为s2,则数据ax1+b,ax2+b,…,ax n+b 的方差为a2s2. 考点一茎叶图 [典例](优质试题·山东高考)如图所示的茎叶图记录了甲、 乙两组各5名工人某日的产量数据(单位:件).若这两组数据 的中位数相等,且平均值也相等,则x和y的值分别为() A.3,5B.5,5 C.3,7 D.5,7 [解析]由两组数据的中位数相等可得65=60+y,解得y=5,又它们的平

高考必考题型复习 用样本估计总体

第38练用样本估计总体 [题型分析·高考展望]用样本估计总体在高考中也是热点部分,考查形式主要是选择题、填空题或是与概率结合的综合性解答题,重点是频率分布直方图以及数字特征,属于比较简单的题目. 体验高考 1.(2015·湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:1300345668889 1411122233445556678 15012233 3 若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是() A.3 B.4 C.5 D.6 答案 B 解析由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151]的运动员共有4组,故由系统抽样法知,共抽取4名.选B. 2.(2015·课标全国Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是() A.逐年比较,2008年减少二氧化硫排放量的效果最显著 B.2007年我国治理二氧化硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关 答案 D 解析从2006年起,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,A选项正确; 2007年二氧化硫排放量较2006年降低了很多,B选项正确; 虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减趋势,即C 选项正确;

自2006年以来我国二氧化硫年排放量与年份负相关,D选项错误.故选D. 3.(2016·课标全国丙)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是() A.各月的平均最低气温都在0 ℃以上 B.七月的平均温差比一月的平均温差大 C.三月和十一月的平均最高气温基本相同 D.平均最高气温高于20 ℃的月份有5个 答案 D 解析由题意知,平均最高气温高于20 ℃的有六月,七月,八月,故选D. 4.(2016·山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图知,这200名学生中每周的自习时间不少于22.5小时的人数是() A.56 B.60 C.120 D.140 答案 D 解析由题图知,组距为2.5,故每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7, ∴这200名学生中每周的自习时间不少于22.5小时的人数是200×0.7=140,故选D. 5.(2015·湖北)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示. (1)直方图中的a=________; (2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.

河南省郑州市高考数学一轮复习:55 用样本估计总体

河南省郑州市高考数学一轮复习:55 用样本估计总体 姓名:________ 班级:________ 成绩:________ 一、单选题 (共12题;共24分) 1. (2分) (2016高一下·大连期中) 样本a1 , a2 , a3 ,…,a10的平均数为,样本b1 , b2 , b3 ,…,b10的平均数为,那么样本a1 , b1 , a2 , b2 ,…,a10 , b10的平均数为() A . + B . ( + ) C . 2( + ) D . ( + ) 2. (2分)(2019·石家庄模拟) 甲、乙两人次测评成绩的茎叶图如图,由茎叶图知甲的成绩的平均数和乙的成绩的中位数分别是() A . B . C . D . 3. (2分)一组数据的茎叶图如图所示,则数据落在区间内的概率为()

A . 0.2 B . 0.4 C . 0.5 D . 0.6 4. (2分)从某鱼池中捕得1200条鱼,做了记号之后,再放回池中,经过适当的时间后,再从池中捕得1000条鱼,计算其中有记号的鱼为100条,试估计鱼池中共有鱼的条数为() A . 10000 B . 12000 C . 1300 D . 13000 5. (2分) (2018高一下·长春期末) 抽样统计甲、乙两位同学5次数学成绩绘制成如图所示的茎叶图,则成绩较稳定的那位同学成绩的方差为() A . B . C . D .

6. (2分)(2020·泉州模拟) 每年的台风都对泉州地区的渔业造成较大的经济损失.某保险公司为此开发了针对渔船的险种,并将投保的渔船分为I,II两类,两类渔船的比例如图所示.经统计,2019年I,II两类渔船的台风遭损率分别为15%和5%.2020年初,在修复遭损船只的基础上,对I类渔船中的20%进一步改造.保险公司预估这些经过改造的渔船2020年的台风遭损率将降为3%,而其他渔船的台风遭损率不变.假设投保的渔船不变,则下列叙述中正确的是() A . 2019年投保的渔船的台风遭损率为10% B . 2019年所有因台风遭损的投保的渔船中,I类渔船所占的比例不超过 C . 预估2020年I类渔船的台风遭损率会小于II类渔船的台风遭损率的两倍 D . 预估2020年经过进一步改造的渔船因台风遭损的数量少于II类渔船因台风遭损的数量 7. (2分)一次考试某简答题满分5分,以0.5分为给分区间.这次考试有100人参加,该题没有得零分的人,所有人的得分按(0,1],(1,2],...(4,5]分组所得的频率分布直方图如图所示.设其众数、中位数、平均分最大的可能值分别为m0,mc,,则() A . B . C . D . 8. (2分)如图所示的茎叶图记录了长郡中学的甲、乙两名同学在校级运动会的五次一千米训练成绩(单位:

用样本估计总体(含答案).doc

25.2用样本估计总体 一. 选择题 1. 要了解一批灯泡的使用寿命,从中抽取60只灯泡进行试验,在这个问题中,样本是( ) A. 这一批灯泡 B. 抽取的60只灯泡 C. 这一批灯泡的使用寿命 D. 抽取的这60只灯泡的使用寿命 2. 如果一组数据x 1,x 2,x 3,x 4,x 5,的平均数是x ,那么另一组数据x 1+1,x 2+2,x 3+3,x 4+4,x 5+5的平均数是 ( ) A.x . B. 2x + C.3x +. D.15x + 3. 为了考查某地区初中毕业生的数学毕业会考情况,从中抽查了200名考生的数学成绩,在这个问题中,下面说法错误的是( ) A. 总体是被抽查的200名考生 B. 个体是每一个考生的数学成绩 C.样本是200名考生的数学成绩 D. 样本容量是200 4. 某学校生物兴趣小组11人到校外采集植物标本,其中2人每人采集到6件,4人每人采集到3件,5人每人采集到4件,则这个兴趣小组平均每人采集到的标本是( ) A. 3件 B. 4件 C. 5件 D. 6件 二. 填空题: 1. 样本1,0,2,1,3,5,的平均数是________. 2.某地举行了一次数学竞赛,为了估计平均成绩,在抽取的部分试卷中,有1人得10分,3人得9分,8人得8分,12人得7分,9人得6分,7人得5分,则样本容量是___,样本平均数是_________. 3.某班共有学生50人,平均身高为168cm,其中30名男生平均身高为170cm,则20名女生的平均身高为___________. 三. 解答题: 1.大连是一个严重缺水的城市,为鼓励市民珍惜每一滴水,某居民委员会表彰了100个节约用水模范户,5月份这100户节约用水情况如下表所示,求5月份这100户居民的平均节约用水量. 2.某甲鱼养殖专业户共养甲鱼200只,为了与客户签订购销合同,对自已所养甲鱼的总重量进行估计,随意捞了5只,称得重量分别为1.5, 1.4, 1.6, 2, 1.8,(单位:千克). (1)根据样本平均数估计甲鱼的总重量约是多少千克? (2)如果甲鱼的市场价为每千克150元,那么该专业户卖出全部甲鱼的收入约为多少元?

必修三2.2.用样本估计总体(教(学)案)

. . . .. .. 2.2 用样本估计总体 教案 A 第1课时 教学容 §2.2.1 用样本的频率分布估计总体分布 教学目标 一、知识与技能 1. 通过实例体会分布的意义和作用. 2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图. 3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计. 二、过程与方法 通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法. 三、情感、态度与价值观 通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系. 教学重点、难点 重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图. 难点:能通过样本的频率分布估计总体的分布. 教学设想 一、创设情境 在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50 乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33 请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定? 如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要容——用样本的频率分布估计总体分布. 二、探究新知 探究1:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确

(完整word版)用样本估计总体练习试题

第二节用样本估计总体 时间:45分钟分值:75分 一、选择题(本大题共6小题,每小题5分,共30分) 1.(2013·重庆卷)如下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为() A.0.2 B.0.4 C.0.5 D.0.6 解析由茎叶图可知数据落在区间[22,30)内的频数为4,所以数据落在区间[22,30)内的频率为4 =0.4,故选B. 10 答案 B 2.(2013·陕西卷)对一批产品的长度(单位:毫米)进行抽样检测,下图为检测结果的频率分布直方图. 根据标准,产品长度在区间[20,25)上为一等品,在区间[15,20)和[25,30)上为二等品,在区间[10,15)和[30,35)上为三等品. 用频率估计概率,现从该批产品中随机抽取1件,则其为二等品的概率是()

A.0.09 B.0.20 C.0.25 D.0.45 解析由频率分布直方图的性质可知,样本数据在区间[25,30)上的频率为1-5×(0.02+0.04+0.06+0.03)=0.25,则二等品的频率为0.25+0.04×5=0.45,故任取1件为二等品的概率为0.45. 答案 D 3.(2013·四川卷)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是() 解析由茎叶图知,各组频数统计如下表:

分组 区间 [0,5)[5,10) [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) [35, 40) 频数 统计 1142433 2 答案 A 4.(2014·河南郑州预测)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,下图是据某地某日早7点至晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是() A.甲B.乙 C.甲乙相等D.无法确定 解析由茎叶图可知甲数据比较集中,所以甲地浓度的方差小,选A. 答案 A 5.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:

用样本估计总体测试题

《2.2用样本估计总体(2)》测试题 、选择题 1. (2012安徽理)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图,贝U (). A.甲的成绩的平均数小于乙的成绩的平均数 B.甲的成绩的中位数等于乙 的成绩的中位数 C.甲的成绩的方差小于乙的成绩的方差 D.甲的成绩的极差小于乙的成绩 的极差 考查目的:考查统计图的识读,以及对数字特征的分析与理解能力 答案:C. —J + 5 + 6 + 7^8 工—5x316+9 二+ y- —______________ —Q x —___________ — & j 解析:「匚' - ,甲成绩的方差为:, f >3 + 32xl.— -------------- = 乙成绩的方差为* . 2. (2012江西理)样本("V '二)的平均数为」,样本-'人)的平均数为,C~),若样本(b P =,心P '-)的平均数「」:",其中 Q -C 氓—

2,贝U n,m的大小关系为().

A.;!—; B. : - W C. !八; D.不能确定 考查目的:考查平均数意义的理解和灵活应用 答案:A. 解析:由题意知,样本(“ V 宀'■■-)的平均数为 M - ffl - 咖十M m 十闰P ,又?.? £ = m 丰(1 「即,?—「:,答案应选A. 3. (2012陕西理)从甲乙两个城市分别随机抽取16台自动售货机,对其销售 额进行统计,统计数据用茎叶图表示(如图),设甲乙两组数据的平均数分别为 r -,中位数分别为J ,冷匸,则(). 甲 乙 ?65 0 1 028 75 2 i 2 C2337 E0Q 1 3 12443 3 1 4 238 A.怎甲弋冥己,叨甲 > 叫 B.怎甲丈龙己,丹3甲c 烧乙 C.怎甩〉工邑,用甲〉临己 D.忙甲〉蛊巴,廉零c 烧乙 考查目的:考查茎叶图的结构特征和作用,以及从茎叶图中提取样本数字特征的能力 答案:B. 18+22 解析:根据平均数的概念易计算出",又???「」 上 27 4-31 = ??答案应选B. MJ+JJ27 jn+z! m m +xi

2020年初三数学下30.2用样本估计总体练习题1(华东师大版)

一. .2用样本估计总体 二. 选择题 1. 要了解一批灯泡的使用寿命,从中抽取60只灯泡进行试验,在这个问题中,样本是( ) A. 这一批灯泡 B. 抽取的60只灯泡 C. 这一批灯泡的使用寿命 D. 抽取的这60只灯泡的使用寿命 2. 如果一组数据x 1,x 2,x 3,x 4,x 5,的平均数是x ,那么另一组数据x 1+1,x 2+2,x 3+3,x 4+4,x 5+5的平均数是 ( ) A.x . B. 2x + C.3x +. D.15x + 3. 为了考查某地区初中毕业生的数学毕业会考情况,从中抽查了200名考生的数学成绩,在这个问题中,下面说法错误的是( ) A. 总体是被抽查的200名考生 B. 个体是每一个考生的数学成绩 C.样本是200名考生的数学成绩 D. 样本容量是200 4. 某学校生物兴趣小组11人到校外采集植物标本,其中2人每人采集到6件,4人每人采集到3件,5人每人采集到4件,则这个兴趣小组平均每人采集到的标本是( ) A. 3件 B. 4件 C. 5件 D. 6件 三. 填空题: 1. 样本1,0,2,1,3,5,的平均数是________. 2.某地举行了一次数学竞赛,为了估计平均成绩,在抽取的部分试卷中,有1人得10分,3人得9分,8人得8分,12人得7分,9人得6分,7人得5分,则样本容量是___,样本平均数是_________. 3.某班共有学生50人,平均身高为168cm,其中30名男生平均身高为170cm,则20名女生的平均身高为___________. 四. 解答题: 1.大连是一个严重缺水的城市,为鼓励市民珍惜每一滴水,某居民委员会表彰了100个节约用水模范户,5月份这100户节约用水情况如下表所示,求5月份这100户居民的平均节约用水量. 2.某甲鱼养殖专业户共养甲鱼200只,为了与客户签订购销合同,对自已所养甲鱼的总重量进行估计,随意捞了5只,称得重量分别为1.5, 1.4, 1.6, 2, 1.8,(单位:千克). (1)根据样本平均数估计甲鱼的总重量约是多少千克? (2)如果甲鱼的市场价为每千克150元,那么该专业户卖出全部甲鱼的收入约为多少元?

用样本估计总体知识讲解

用样本估计总体 【学习目标】 1.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图. 2.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计. 3.正确理解样本数据标准差的意义和作用,学会计算数据的标准差. 4.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释. 5.会用样本的基本数字特征估计总体的基本数字特征. 【要点梳理】 要点一、频率分布的概念 频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为: 1.计算一组数据中最大值与最小值的差,即求极差 2.决定组距与组数 3.将数据分组 4.列频率分布表 5.画频率分布直方图 要点诠释: 频率分布直方图的特征: 1.从频率分布直方图可以清楚的看出数据分布的总体趋势. 2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了. 要点二、频率分布折线图、总体密度曲线 1.频率分布折线图的定义: 连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. 2.总体密度曲线的定义: 在样本频率分布直方图中,样本容量越大,所分组数越多,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 要点诠释: 总体密度曲线能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,能够精确的反映一个总体在各个区域内取值的规律. 要点三、茎叶图 当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图. 要点诠释: 茎叶图的特征: (1)用茎叶图表示数据有两个优点:一是在统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示. (2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰. 要点四、众数、中位数与平均数 1.众数 一组数据中出现次数最多的数据叫做众数.如果变量是分类的,用众数是很有必要的.例如班委会要作出

用样本估计总体练习题含答案

用样本估计总体 一. 选择题 1. 要了解一批灯泡的使用寿命,从中抽取60只灯泡进行试验,在这个问题中,样本是( ) A. 这一批灯泡 B. 抽取的60只灯泡 C. 这一批灯泡的使用寿命 D. 抽取的这60只灯泡的使用寿命 2. 如果一组数据x 1,x 2,x 3,x 4,x 5,的平均数是x ,那么另一组数据x 1+1,x 2+2,x 3+3,x 4+4,x 5+5的平均数是 ( ) A.x . B. 2x + C.3x +. D.15x + 3. 为了考查某地区初中毕业生的数学毕业会考情况,从中抽查了200名考生的数学成绩,在这个问题中,下面说法错误的是( ) A. 总体是被抽查的200名考生 B. 个体是每一个考生的数学成绩 C.样本是200名考生的数学成绩 D. 样本容量是200 4. 某学校生物兴趣小组11人到校外采集植物标本,其中2人每人采集到6件,4人每人采集到3件,5人每人采集到4件,则这个兴趣小组平均每人采集到的标本是( ) A. 3件 B. 4件 C. 5件 D. 6件 二. 填空题: 1. 样本1,0,2,1,3,5,的平均数是________. 2.某地举行了一次数学竞赛,为了估计平均成绩,在抽取的部分试卷中,有1人得10分,3人得9分,8人得8分,12人得7分,9人得6分,7人得5分,则样本容量是___,样本平均数是_________. 3.某班共有学生50人,平均身高为168cm,其中30名男生平均身高为170cm,则20名女生的平均身高为___________. 三. 解答题: 1.大连是一个严重缺水的城市,为鼓励市民珍惜每一滴水,某居民委员会表彰了100个节约用水模范户,5月份这100户节约用水情况如下表所示,求5月份这100户居民的平均节约用水量. 2.某甲鱼养殖专业户共养甲鱼200只,为了与客户签订购销合同,对自已所养甲鱼的总重量进行估计,随意捞了5只,称得重量分别为, , , 2, ,(单位:千克). (1)根据样本平均数估计甲鱼的总重量约是多少千克 (2)如果甲鱼的市场价为每千克150元,那么该专业户卖出全部甲鱼的收入约为多少元

用样本估计总体

《§6.2用样本估计总体》学案 一、学习要求: 1、掌握数据整理及其相关图表的制作方法 2、会求样本的平均值和标准差 3、能通过样本的分布和特征值来估计总体的分布和特征值 4、通过具体的实际问题,感受用样本估计总体分布规律的思想 二、学习重点、难点: 重点:数据整理及其相关图表的制作;样本特征值的计算;对总体分布和特征值的估计。 难点:频数频率分布图表和累计频率分布折线图的作用和分析;如何用样本的分布和特征值来估计总体。 三、学时安排:共4学时 第一学时:学习频率分布表,感受如何用样本频率分布表去估计总体分布,亲自体验制作频数频率分布表的过程。 第二学时:学习频率分布直方图,强化制作频率分布直方图的可操作性。 第三学时:学习平均数、方差和标准差的计算,熟悉并会用计算公式。 第四学时:建立用样本的分布估计总体的特征性质的思想,并小结本节内容四、学习过程: 第一学时 (一)课前尝试 1、学法指导: (1)回顾初中已经学过的频数分布表 (2)自学课本上P.8~10介绍的频数频率分布表。 2、尝试练习: 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量 为100的身高样本,数据如下(单位:cm),试作出该样本频率分布表。 168 165 171 167 170 165 170 152 175 174 165 170 168 169 171 166 164 155 164 158 170 155 166 158 155 160 160 164 156 162

160 170 168 164 174 171 165 179 163 172 180 174 173 159 163 172 167 160 164 169 151 168 158 168 176 155 165 165 169 162 177 158 175 165 169 151 163 166 163 167 178 165 158 170 169 159 155 163 153 155 167 163 164 158 168 167 161 162 167 168 161 165 174 156 167 166 162 161 164 166 (二)课堂探究: 1、探究问题:频数频率分布表能较好地反映总体分布情况,在实际中应用很广,因此,如何来制作频数频率分布表呢? 2、知识链接:对总体分布的估计 (1)频数频率分布表 (2)频数频率分布表的制作 3、拓展练习:课本上P.9例1 一般地,编制频率分布表的步骤如下: (1)求全距,决定组数和组距,组距组数 全距 ; (2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; (3)登记频数,计算频率,列出频率分布表。 4、当堂训练: 下面是某职业学校学生随机抽样的40名学生在一个月内的零花钱数据(单

用样本估计总体分布

用样本的频率分布估计总体分布(第1课时) 教学目标: 1.通过实例体会分布的意义和作用,通过对现实生活的探究,感知应用数学知识解决问题的方法. 2.通过表示样本数据的过程,学会列频率分布表,画频率分布直方图,理解数形结合的数学思想. 3.通过对样本分析和总体估计的过程,感受数学在实际生活中的作用,认识数学知识源于生活并指导生活的事实. 教学重点: 会列频率分布表,画频率分布直方图,了解样本频率分布与总体分布之间的关系 教学难点: 掌握频率分布直方图的正确画法,体会分布的意义与作用 教学方法:引导——探究教学法 教学过程: 一、创设情境,呈现问题 问题情境:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,武汉市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费. 如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢? 二、操作讨论,构建新知 <知识探究1 改良频数分布表→频率分布表> 问题1:如果标准太低,会影响居民的日常生活;如果标准太高,则不利于节水.那么你认为,为了较合理地确定出这个标准,需要了解哪些相关信息,做哪些工作? 【学生活动1】探究讨论,得到结论: ①为了制定一个较为合理的标准a,需要知道每个家庭的用水量 ②如何获得家庭用水量的有关信息?对家庭进行调查,采用抽样调查的方式 ③抽样时,样本容量定为多少比较合适?武汉市1000万人口,抽样10000比较合适 课堂上为了处理数据的方便,我们理想化地抽取100个数据的样本,比如: 通过抽样调查,获得100户居民的月均用水量如下表(单位:t) 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 问题2:从表中随意记录下的数据中很难直接看出规律,因此需要对统计数据进行整理分析. 回顾你看到全班的期末考试成绩单后是怎样分析的?

用样本估计总体 训练-答案

1.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是( ) A .0.05 B .0.25 C .0.5 D .0.7 解析:选D.由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为14 20 =0.7. 2.(2014·高考广东卷)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( ) A .200,20 B .100,20 C .200,10 D .100,10 解析:选A.该地区中小学生总人数为3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20,故选A. 3. 某同学进入高三后,4次月考的数学成绩的茎叶图如图,则该同学数学成绩的方差是( ) A .125 B .5 5 C .45 D .3 5 解析:选C.由茎叶图知平均值为114+126+128+1324=125,∴s 2=1 4[(125-114)2+(125-126)2+(125-128)2+(125 -132)2]=45. 4.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a ,中位数为b ,众数为c ,则有( ) A .a >b >c B .b >c >a C .c >a >b D .c >b >a 解析:选D.把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a =110× (10+12+14+14+15+15+16+17+17+17)=14.7,中位数b =15+15 2 =15,众数c =17,则a

用样本估计总体

用样本估计总体 1.作频率分布直方图的步骤 (1)求极差(即一组数据中最大值与最小值的差). (2)决定组距与组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图. 2.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. (2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.

3.茎叶图 统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数. 4.标准差和方差 (1)标准差是样本数据到平均数的一种平均距离. (2)标准差: s=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2]. (3)方差:s2=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2](x n是样本数据,n是样本容 量,x是样本平均数). 知识拓展 1.频率分布直方图的特点 (1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率 组距 ,频率=组距 ×频率组距 . (2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比. (3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. 2.平均数、方差的公式推广 (1)若数据x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mx n +a的平均数是m x+a. (2)数据x1,x2,…,x n的方差为s2. ①数据x1+a,x2+a,…,x n+a的方差也为s2; ②数据ax1,ax2,…,ax n的方差为a2s2.

用样本估计总体练习题

23.4 用样本估计总体习题课 1、随机抽样的三种方法是、、 2、在简单随机抽样中,常用的两种办法是、 3、画频率分布直方图的步骤是: 4、茎叶图的两个优点是: (1) (2) 课内探究一:用样本的平均数估计总体的平均数 【例1】从一种棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:271 273 280 285 285 287 292 294 295 301 303 303 307 308 310 314 319 323 325 325 328 331 334 337 352 计算这25根棉花的纤维的平均长度,并估计这种棉花的纤维的平均长度? 问题一:计算数据的平均数有没有较为简便的方法? 跟踪训练:上图是CBA篮球联赛中,甲乙两名运动员某赛季一些场次得分的茎叶图,则平均得分高的运动员是________. 课内探究二:用样本的标准差估计总体的标准差 【例2】在一次跳远选拔比赛中,甲、乙两名运动员各进行了10次测试,成绩如下: 甲运动员﹕5.85 5.93 6.07 5.91 5.99 6.13 5.89 6.05 6.00 6.19; 乙运动员﹕6.11 6.08 5.83 5.92 5.84 5.81 6.18 6.17 5.85 6.21;

观察上述样本数据,如果你是教练,选哪位选手去参加正式比赛?为什么? 跟踪训练: 1、甲、乙两台机床同时加工直径为100mm的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm): 甲:99,100,98,100,100,103 乙:99,100,102,99,100,100 (1)分别计算上述两组数据的平均数和方差; (2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求. 2、某校开展“爱我海西、爱我家乡”摄 影比赛,9位评委为参赛作品A给出的 分数如茎叶图所示.记分员在去掉一个 最高分和一个最低分后,算得平均分为 91.复核员在复核时,发现有一个数字(茎叶图中的x)无法看清.若记分员计算无误,则数字x应该是________.

(完整版)用样本估计总体练习试题(可编辑修改word版)

第二节 用样本估计总体 时间:45 分钟 分值:75 分 一、选择题(本大题共 6 小题,每小题 5 分,共 30 分) 1.(2013·重庆卷)如下图是某公司 10 个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( ) A.0.2 B .0.4 C .0.5 D .0.6 解析 由茎叶图可知数据落在区间[22,30)内的频数为 4,所以数 据落在区间[22,30) 4 0.4,故选 B. 内的频率为 = 10 答案 B 2.(2013·陕西卷)对一批产品的长度(单位:毫米)进行抽样检测, 下图为检测结果的频率分布直方图. 根据标准, 产品长度在区间[20,25)上为一等品, 在区间[15,20)和[25,30)上为二等品, 在区间[10,15)和[30,35)上为三等品. 用频率估计概率, 现从该批产品中随机抽取 1 件, 则其为二等品的概率是( )

A.0.09 B.0.20 C.0.25 D.0.45 解析由频率分布直方图的性质可知,样本数据在区间[25,30)上的频率为1-5×(0.02+0.04+0.06+0.03)=0.25,则二等品的频率为0.25+0.04×5=0.45,故任取1 件为二等品的概率为0.45. 答案 D 3.(2013·四川卷)某学校随机抽取20 个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5 将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( ) 解析由茎叶图知,各组频数统计如下表: 分组[0,5) [5,10) [10,[15,[20,[25,[30,[35,

11.2用样本估计总体练习题.docx

§11.2用样本估计总体 一、选择题 1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是() A.总体容量越大,估计越精确 B .总体容量越小,估计越精确 C.样本容量越大,估计越精确 D .样本容量越小,估计越精确 2.频率分布直方图中,小长方形的面积等于() A.组距B.频率 C .组数D.频数 3.一个容量为 100 的样本,其数据的分组与各组的频数如下表 组别(0,10](10,20](20,30](30,40](40,50](50,60](60,70] 频数1213241516137则样本数据落在(10,40) 上的频率为() A. 0.13 B . 0.39 C . 0.52 D . 0.64 4.一个容量为 35 的样本数据 , 分组后 , 组距与频数如下: [5,10),5个;[10,15),12 个;[15,20),7个;[20,25), 5 个; [25,30),4个; [30,35),2个.则样本在区间[20,+∞ ) 上的频率为() A. 20%B. 69%C. 31%D. 27% 5.某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重 ( 单位:克) 数据绘制的频率分布直方图, 其中产品净重的范围是 [96,106], 样本数据分组为 [96,98),[98,100),[100,102), [102,104), [104,106],已知样本中产品净重小于100 克的个数是 36, 则样本中净重 大于或等于 98克并且小于 104克的产品的个数是() A. 90B. 75C.60D.45 6. 对某校名学生的体重(单位:kg )进行统计,得到如图所示的频率分布直方图,则学生体重在kg 以上的人数为 () A.B. C.D. 7.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值 为 1,则样本方差为 () . 6 B.6 C.2D.2 A. 5 5 8.为了了解某地区10 000 名高三男生的身体发育情况,抽查了该地 区 100 名年龄为 17~18岁的高三男生体重(kg) ,得到频率分布直方 图如图.根据图示,请你估计该地区高三男生中体重在[56.5,64.5]的学生人数是 () A.40B.400 C.4 000D.4 400

相关文档
最新文档