随机抽样用样本估计总体正态分布

随机抽样用样本估计总体正态分布
随机抽样用样本估计总体正态分布

11.6 随机抽样 用样本估计总体 正态分布

教材细梳理—-知识点 一.随机抽样 1.简单随机抽样

(1).定义:一个总体含有N 个个体,从中逐个①_____地抽取n 个个体作为样本(n ≤N ),如

果每次抽取时总体内的各个个体被抽到的机会_②_____,就把这种抽样方法叫做简单随机抽样.

(2). 最常用的简单随机抽样方法有两种___③__法和_④_________法. (3). 适用于 ⑤ 的情况. 2.系统抽样

(1).定义:将总体分成 ⑥ 的若干部分,然后按照预先制定的规则,从每一部分中抽取

一个个体,得到所需要的样本,这样的抽样方法称为系统抽样 . (2).系统抽样步骤:假设要从容量为N 的总体中抽取容量为n 的样本. a. 先将总体的N 个个体⑧ .有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;(编号的位数要一样) b. 确定⑨ ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =N n

c. 在第1段用_⑩_________确定第一个个体编号l (l ≤k );

d. 按照一定的规则抽取样本.通常是将l ? 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ) 依次进行下去,直到获取整个样本. (3).系统抽样适用于? 的情况. 3.分层抽样

(1).定义:当总体由? 组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占? 进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.

(2).分层抽样适用于总体由差别明显的几部分组成的情况. 二.样本估计总体有关概念和知识点

1.通常我们对总体作出的估计一般分成两种.一种是用样本的①__________估计总体的分布.另一种是用样本的② 估计总体的数字特征. 2.频率分布直方图画法

(1).求极差(最大值-最小值=极差). (2).决定组距与组数.

(3).确定分点,将数据分组.

5.茎叶图以数据的高位为茎,放中间,低位为叶放两边,它的优点是: (1)保留了原始数据,没有损失样本信息.

(2)数据可以随时记录、添加或修改. (n x x +

+-(n x x +

+-若数据x 1,x 2,…,x n 的平均数为x ,方差为s 2

,则: ①x 1+b ,x 2+b ,…,x n +b 的平均数是x +b ,方差是s 2

; ②ax 1,ax 2,…,ax n 的平均数是a x ,方差是22

a s ;

③ax 1+b ,ax 2+b ,…,ax n +b 的平均数是a x +b ,方差是 22

a s .

三 、正态分布有关概念及知识点 1.正态曲线定义

定义:像总体密度曲线那样,具有① 的特征的函数近似表示为

,),(+∞-∞∈x , 其中实数μ和σ)0(>σ为参数,它的图象

称为正态分布密度曲线,简称② . 2.正态曲线的特点.

(1)曲线在x 轴的_③____,与x 轴不相交. (2)曲线关于直线x =_④_ 对称.

(3)曲线在X=μ处达到峰值1

σ2π

(4)曲线与x 轴间的面积为⑤ .

(5)当X <μ时,曲线上升(增函数);当X >μ时,曲线下降(减函数).并且当曲 线向左、右两边无限延伸时,以X 轴为渐近线,向它无限靠近.

(6)当σ一定时,曲线的位置由μ确定,曲线随着X=μ的变化而沿x 轴平移. (7)μ一定时,曲线的形状由σ确定

σ越大,曲线越⑥ ,总体分布越分散; σ越小,曲线越⑦ .总体分布越集中.

3.正态分布定义及表示

(1)定义:对于任何实数a b <,随机变量X 满足?

=≤

a

dx x b X a P )()(,σμ?,则称随机

变量 X 服从正态分布.记作⑧ ,其中参数μ是总体的⑨ , 参数 σ是总体的⑩ . 4. 3σ原则

(1)定义:如果2

~(,)X N μσ,通常认为随机变量 X 的取值落在区间(),μσμσ-+内

称之为3σ原则 (2)三个特殊区件概率

=+≤<-)(σμσμX P ? ;

=+≤<-)22(σμσμX P ? ; =+≤<-)33(σμσμX P ? .

教材细梳理答案

一:①不放回;②相同;③抽签法;④随机数表法;⑤总体个数较少 ⑥均衡;⑦系统抽样;⑧编号;⑨分段间隔k;⑩简单随机抽样;?加上间隔k;?总体中的个体数较多;?瘦高;?比例 二:①频率分布;②数字特征;③

频率

组距

;④面积;⑤1;⑥中点;⑦组距;⑧最多; ⑨中间;⑩12....n

x x n

+++;?中点;?面积;?面积;?中点横坐标;

三:①两头低、中间高、左右对称;②正态曲线;③上方;④μ;⑤1;⑥矮胖;⑦瘦高; ⑧2

~(,)X N μσ;⑨期望;⑩标准差;?0.6826;?0.9544;?0.9974;

考点精解析—-方法 问题一:随机抽样问题

例1.[2014·湖南卷] 对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )

A .p 1=p 2<p 3

B .p 2=p 3<p 1

C .p 1=p 3<p 2

D .p 1=p 2=p 3 点拨与解析: 随机抽样中,每个个体被抽到的机会是均等的.

解:不管是简单随机抽样、系统抽样还是分层抽样,它们都是等概率抽样,每个个体被抽中的概率均为n N

.所以选D.

例2.[2014·天津卷] 某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.

点拨与解析:由于总体各部分差别比较明显,所以采取分层抽样即按比例抽取. 解:由分层抽样的方法可得,从一年级本科生中抽取学生人数为300×4

4+5+5+6

=60.

例3..已知某商场新进3 000袋奶粉,为检查某维生素是否达标,现采用系统抽样的方法从中抽取150袋检查,若第1组抽出的号码是11,则第61组抽出的号码为__________. 点拨与解析:系统抽样是抽多少个个体,把总体均分成多少组,每组抽取一个,间隔相等

解:∵3 000150

=20,∴需把3 000袋奶粉按0,1,2,3,…,2 999编号,然后分成150组,每

组20个号码.∴第61组抽出的号码为11+(61-1)×20=1 211. 答案:1 211 思维方法小结:

1、三种抽样方法中,每个个体被抽到的概率是相同的.

2.简单随机抽样是系统抽样和分层抽样的基础,是一种等可能的抽样,由定义应抓住以下特点:①它要求总体个数较少;②它是从总体中逐个抽取的;③它是一种不放回抽样. 3.系统抽样又称等距抽样,号码序列一确定,样本即确定了,第一组的抽取的个体必须是随机抽取的,分段间隔必须为整数,当分段间隔不是整数,应先从整体中随机剔除几个个体.

4、分层抽样又称按比例抽取.按照每层在总体中占有的比例抽取个体数.

5.抽样方法经常交叉使用,比如系统抽样中的第一均衡部分,可采用简单随机抽样.分层抽样中,若每层中个体数量仍很大时,则可辅之以系统抽样.进行分层抽样时,每层抽样应采用简单随机抽样或系统抽样的方法进行抽样. 问题2:频率分布直方图的计算问题

例4.[2014·山东卷] 为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.下图11.6-1 是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )

图11.6-1

A. 6

B. 8

C. 12

D. 18

点拨与解析:所有小长方形的面积之和为1.在各组之间,小长方形面积比=高比=频率比=频

数比

解: 因为第一组与第二组一共有20人,并且根据图像知第一组与第二组的人数比是0.24∶0.16=3∶2,所以第一组有20×3

5=12.又因为第一组与第三组的人数比是

0.24∶0.36=2∶3 ,所以第三组一共有12÷2

3=18.因为第三组中没有疗效的有6人,所以

第三组中有疗效的人数是18-6=12.

思维方法小结:有关频率分布直方图计算问题处理方法. 处理有关频率分布直方图计算问题,关键掌握正确理解图表中各个量的意义. 主要掌握以下几点.

(1). =每组频数

频率样本容量

,表示各组数据在总体中所占的比例 .

(2).每个个小长方形的面积等于样本数据落在对应组的频率. (3).所有小长方形的面积之和为1.

(4).在各组之间,小长方形面积比=高比=频率比=频数比

问题3:样本的数字特征估计总体的特征

例5.[2014·陕西卷] 设样本数据1,2,…,10的均值和方差分别为1和4,若i =i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( ) A .1+a ,4 B .1+a ,4+a C .1,4 D .1,4+a

点拨与解析:利用方差和平均数的推论 解:由题意可知

x 1+x 2+x 3+…+x 10

10

=1,

故y -=(x 1+x 2+x 3+…+x 10)+10a 10=1+a .数据x 1,x 2,…,x 10同时增加一个定值,方差

不变.故选A.

例6.甲、乙两位同学在高三的5次月考中数学成绩统计如茎叶图11.6-2所示,若甲、乙两人的平均成绩分别是x 甲,x 乙,则下列叙述正确的是 ( )

A .x 甲>x 乙;乙比甲成绩稳定

B .x 甲>x 乙;甲比乙成绩稳定

C .x 甲<x 乙;乙比甲成绩稳定

D .x 甲<x 乙;甲比乙成绩稳定

图11.6-2

点拨与解析: 直接利用平均数方差公式 或者观察茎叶图茎的大小比较平均数,叶的分散、集中情况,比较方差

点拨1:利用 由12....n x x x n

+++=, 和222

2

12()()()n x x x x x x s n -+-++-=

别计算甲、乙的的平均数和方差

解:由题意可知,x 甲=15×(72+77+78+86+92)=81,x 乙=1

5×(78+88+88+91+90)=

87.又由方差公式可得s 2甲=15

×[(81-72)2+(81-77)2+(81-78)2+(81-86)2+(81-92)2

]

=50.4,

s 2乙=15

×[(87-78)2+(87-88)2+(87-88)2+(87-91)2+(87-90)2]=21.6,因为s 2乙<s 2

甲,

故乙的成绩波动较小,乙的成绩比甲稳定.故选C.

点拨2: 通过茎叶图的数据分布、集中、分散情况来估计

解:从茎叶图上可以看出,甲数据的大部分茎比较小,数据比较分散,而乙数据的茎大部分比较大,并且数据比较集中,所以,甲的平均成绩小于乙的平均数, 并且乙比甲成绩稳定, 故选C.

例7.从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图11.6-3. 由于一些数据丢失,试利用频率分布直方图求:

图11.6-3

(1)这50名学生成绩的众数与中位数; (2)这50名学生的平均成绩.

点拨与解析:利用频率分布直方图中,众数、中位数、平均数的计算方法

解:(1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小矩形框的中间值的横坐标即为所求,所以众数应为75.

在频率分布直方图中,中位数的左右两边频数应相等,即频率也相等,从而小矩形的面积和相等.因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求.

∵0.004×10+0.006×10+0.02×10=0.3, ∴前三个小矩形面积的和为0.3.

而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5, ∴中位数应位于第四个小矩形内,

设其底边为x ,高为0.03,∴令0.03x =0.2,得x ≈6.7, 故中位数应为70+6.7=76.7.

(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可.

∴平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.024×10)+95×(0.016×10)=76.2.

综上,(1)众数是75,中位数约为76.7;(2)平均成绩为76

思维方法小结:解决样本的数字特征估计总体的特征的问题常用以下方法 1.利用平均数和方差的推论

(1)12....n x x x n

+++= 222

2

12()()()n x x x x x x s n -+-++-=

(2)若数据x 1,x 2,…,x n 的平均数为x ,方差为s 2

,则:

①x 1+b ,x 2+b ,…,x n +b 的平均数是x +b ,方差是s 2

; ②ax 1,ax 2,…,ax n 的平均数是a x ,方差是22

a s ;

③ax 1+b ,ax 2+b ,…,ax n +b 的平均数是a x +b ,方差是 22

a s .

2.利用茎叶图的茎大大小比较平均数,利用数据分散、集中比较方差.

3.利用用频率分布直方图估计众数、中位数、平均数. (1)众数:取最高小长方形底边中点的横坐标作为众数. (2)中位数:在频率分布直方图中,把频率分布直方图划分左右两个面积相等的分界线与x 轴交点的横坐标称为中位数.

(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 考点精解析——方法

问题1: 正态分布下的概率计算及3σ原则实际应用

例8.(2010山东卷理 )已知随机变量ξ服从正态分布N (0, 2σ),若P (ξ>2)=0.023。则P (-2≤ξ≤2)=

(A )0.477 (B )0.628 (C) 0.954 (D) 0.977 点拨与解析:利用正态曲线关于 x=0对称,且和x 轴围成的面积为1 解:因为随机变量ξ服从正态分布2

N(0,)σ,所以正态曲线关于直线x=0对称, 又P(>2)=0.023ξ,所以P(<-2)=0.023ξ,所以P(-22)=ξ≤≤1-P(>2)-P(<-2)=ξξ= =1-20.023=?0.954,故选C.

例9.某年级的一次信息技术测验成绩近似服从正态分布N (70,102),如果规定低于60分的学生为不及格学生.

(1)成绩不及格的人数占多少?

(2)成绩在80~90之间的学生占多少?

点拨与解析:根据题意求出μ,σ的值,然后利用图象对称性和3σ原则求解

解:(1)设学生的得分情况为随机变量X ,则X ~N (70,102

),其中μ=70,σ=10. 在60到80之间的学生占的比为P (70-10

∴ 不及格的学生所占的比为1

2

×(1-0.682 6)=0.158 7=15.87%.

思维方法小结:正态分布下的概率计算及3σ原则的实际应用

(1)充分利用正态曲线关于x=μ对称性和正态曲线和X 轴围成的面积为1的性质.

(2)熟记公式 P (X >a )= 1-P (X μ)= P (X <μ)=0.5,把在随机变X 在某个区间概率问题转化成面积问题来计算. (3)利用3σ原则的特殊区间的概率,来解决解决实际问题

P (μ-σ<X ≤μ+σ)=0.6826; P (μ-2σ<X ≤μ+2σ)=0.9544; P (μ-3σ<X ≤μ+3σ)=0.9974. 当堂做练习—-巩固 1.(2013陕西)某单位有840名职工, 现采用系统抽样方法, 抽取42人做问卷调查, 将840

人按1, 2, , 840随机编号, 则抽取的42人中, 编号落入区间[481, 720]的人数为

A .11

B .12

C .13

D .14

2.(2013湖南 )某学校有男、女学生各500名.为了解男女学生在学习兴趣与业余爱好方

面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法

是 A .抽签法 B .随机数法 C .系统抽样法 D .分层抽样法

3.(2013年福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分为6

组:[40,50), [50,60), [60,70), [70,80), [80,90), [90,100)加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为 A .588 B .480 C .450 D .120

4.(2012陕西)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计

数据用茎叶图表示(如图所示),设甲乙两组数据的平均数分别为x 甲,x 乙,中位数分别为

m 甲,m 乙,则

( )

A . x x <甲乙,m 甲>m 乙

B .x x <甲乙,m 甲

C .x x >甲乙,m 甲>m 乙

D .x x >甲乙,m 甲

5.(2013:

运动员

第1次

第2次

第3次 第4次

第5次

甲 87 91 90 89 93 乙

89

90

91

88

92

则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.

6.设随机变量ξ服从正态分布N (2,9),若P (ξ>c +1)=P (ξ

当堂练习--巩固答案: 1.B ; 2.D ; 3. B ; 4.B ; 5.2; 6.2; 学已至此,请完成基础训练11.6

11.6课后基础训练

一、选择题:(每题5分,共10个小题,共计50分,在每小题给出的四个选项中,只有一项是符合题目要求的,请把正确答案的代号填在题后的括号内) 1.现要完成下列3项抽样调查:

①从10盒酸奶中抽取3盒进行食品卫生检查.【来源:全,品…中&高*考*网】

②科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束

后,为了听取意见,需要请32名听众进行座谈. ③东方中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.较为合理的抽样方法是( )

A .①简单随机抽样,②系统抽样,③分层抽样

B .①简单随机抽样,②分层抽样,③系统抽样

C .①系统抽样,②简单随机抽样,③分层抽样

D .①分层抽样,②系统抽样,③简单随机抽样

2.为了调查某产品的销售情况,销售部门从下属的92家销售连锁店中抽取30家了解情况,若用系统抽样法,则抽样间隔和随机剔除的个体数分别为

A . 3,2 B. 2,3 C. 2,30 D. 30,2

4.(2014广东)已知某地区中小学生人数和近视情况分别如图1-1和图1-2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )

图1-1 图1-2 A .200,20 B .100,20 C .200,10 D .100,1

5.正态曲线下、横轴上,从均数到∞+的面积为( )。

A .95%

B .50%

C .97.5%

D .不能确定

6.一组数据的方差是s 2

,将这组数据中的每一个数都乘以3,所得的一组新数据的方差是( )

A.s 2

3

B .s 2

C .3s 2

D .9s 2

7.在一次英语考试中,考试的成绩服从正态分布)36,100(,那么考试成绩在区间(]112,88内的概率是( ) A .0.6826 B .0.3174 C .0.9544 D .0.9974

8.(2013·辽宁卷)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )

A .45

B .50

C .55

D .60

9、下面是甲、乙两班10名学生的数学成绩的茎叶图若甲、乙小组的平均成绩分别是x 甲, x 乙,则下列结论正确的是 ( )

A.x 甲>x 乙,甲比乙成绩稳定 B .x 甲>x 乙,乙比甲成绩稳定 C .x 甲

8.如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别

是( )

A .12.5 12.5

B .12.5 13

C .13 12.5

D .13 13

二、填空题:请把答案填在题中横线上(共4个小题,每题5分,共计20分) 11.(2012江苏)某学校高一、高二、高三年级的学生人数之比为334::,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取____

名学生.

12.一个容量为n 的样本,分成若干组,已知甲组的频数和频率分别为36和1

4

,则容量n =

______,且频率为1

6

的乙组的频数是_______.

13.已知随机变量X 服从正态分布N(3,1),且P(2 ≤X ≤4)=0.6826,则P (X>4)= . 14.某同学5次三级跳远成绩(单位:米)分别为x ,y,10,11,9,已知这五次成绩的平均数

为10,方差为2,则|x -y |的值为______. 三、解答题:(每题10分,共30分)解答应写出文字说明、证明过程或演算步骤.

15.某中学团委组织了“我对祖国知多少”的知识竞赛,从参加考试的学生中抽出60名学生,将其成绩(均为整数)分成六组[40,50),[50,60),…,[90,100],其部分频率分布

直方图如图所示.观察图形,回答下列问题.

(1)求成绩在[70,80)的频率,并补全这个频率分布直方图;

(2)估计这次考试的及格率(60分及以上为及格)和平均分;

(3)从成绩在[40,50)和[90,100]的学生中选两人,求他们在同一分数段的概率.16.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午800~1000

间各自的点击量,得如图所示的茎叶图,根据茎叶图回答下列问题.

(1)甲、乙两个网站点击量的极差分别是多少?

(2)甲网站点击量在[10,40]间的频率是多少?

(3)甲、乙两网站哪个更受欢迎?并说明理由.

17.某厂生产的圆柱形零件的外直径X(单位:cm)服从正态分布N(4,0.52),质检人员从该厂生产的1000件零件中随机抽查一件,测得它的外直径为5.7 cm,试问该厂生产的这批零件是否合格?

课后基础练习参考答案

一、选择题:ADDAB DCBDB

二、填空题:11.15; 12.144;24; 13.0.1587; 14.4; 三、解答题:

15.解:(1)因为各组的频率和等于1,故成绩在[70,80)的频率是1-(0.025+0.015×2+

0.01+0.005)×10=0.3.频率分布直方图如图所示:

(2)依题意,60分及以上的分数在[60,70),[70,80),[80,90),[90,100]这四个组,其频

率和为(0.01+0.03+0.025+0.005)×10=0.75. 所以估计这次考试的及格率是75%.

利用组中值估算学生成绩的平均分,则有

45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.所以估计这次考试的平均分是71分.

(3)成绩在[40,50)的人数是60×0.1=6,成绩在[90,100]的人数是60×0.05=3,所以从成

绩在[40,50)与[90,100]的学生中选两人,他们在同一分数段的概率是P =15+336=1

2

.

16.解:(1)甲网站的极差为:73-8=65,乙网站的极差为:71-5=66.

(2)414=2

7

≈0.286. (3)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎

17解:由于X 服从正态分布N (4,0.52

),由正态分布的性质可知,正态总体在区间(4-3×0.5,+3×0.5)即(2.5,5.5)之外取值的概率只有0.0026,而5.7?(2.5,5.5),说明在一次试验中,出现了几乎不可能发生的小概率事件,据此可认为该批零件是不合格的

统计量及其抽样分布练习题

第六章 统计量及其抽样分布 练习题 一、填空题(共10题,每题2分,共计20分) 1.简单随机抽样样本均值X 的方差取决于_________和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的_________倍。 2. 设1217,,,X X X 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=,则a =____________。 3.若(5)X t ,则2X 服从_______分布。 4.已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。 5.中心极限定理是说:如果总体存在有限的方差,那么,随着_________的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于_____________。 6. 总体分布已知时,样本均值的分布为_________抽样分布;总体分布未知,大样本情况下,样本均值的分布为_________抽样分布。 7. 简单随机样本的性质满足_________和_________。 8.若(2,4)X N ,查分布表,计算概率(X 3)P ≥=_________。若(X )0.9115P a ≤=,计算a =_________。 9. 若12~(0,2),~(0,2),X N X N 1X 与2X 独立,则2212X X +()/2服从______分布。 10. 若~(16,4)X N ,则5X 服从___________分布。 二、选择题(共10题,每题1分,共计10分)

1.中心极限定理可保证在大量观察下 ( ) A . 样本平均数趋近于总体平均数的趋势 B . 样本方差趋近于总体方差的趋势 C . 样本平均数分布趋近于正态分布的趋势 D. 样本比例趋近于总体比例的趋势 2.设随机变量()(1)X t n n >,则21/Y X =服从 ( ) 。 A. 正态分布 B.卡方分布 C. t 分布 D. F 分布 3.某品牌袋装糖果重量的标准是(500±5)克。为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。下列说法中错误的是( ) A. 样本容量为10 B .抽样误差为2 C. 样本平均每袋重量是统计量 D. 498是估计值 4.设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从( ) A. (100/,25)N n B. N C. (100,25/)N n D. (100,N 5、设2(0,1),(5),X N Y χ且X 与Y 独立,则随机变量_________服从自由度为5的t 分布。 ( ) A. /X Y B. 5/Y X C. /X /

用样本估计总体

用样本估计总体一、基础知识 1.频率分布直方图 (1)纵轴表示频率 组距 ,即小长方形的高= 频率 组距 ; (2)小长方形的面积=组距×频率 组距 =频率; (3)各个小方形的面积总和等于1 . 2.频率分布表的画法 第一步:求极差,决定组数和组距,组距=极差组数 ; 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. 3.茎叶图 茎叶图是统计中用来表示数据的一种图, 茎是指中间的一列数,叶就是从茎的旁 边生长出来的数. 4.中位数、众数、平均数的定义 (1)中位数 将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. (2)众数 一组数据中出现次数最多的数据叫做这组数据的众数. (3)平均数 一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,…,x n的 平均数x=1 n(x1+x2+…+x n).

5.样本的数字特征 如果有n个数据x1,x2,…,x n,那么这n个数的 (1)平均数x=1 n(x1+x2+…+x n). (2)标准差s=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2]. (3)方差s2=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2]. 二、常用结论 1.频率分布直方图中的常见结论 (1)众数的估计值为最高矩形的中点对应的横坐标. (2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. (3)中位数的估计值的左边和右边的小矩形的面积和是相等的. 2.平均数、方差的公式推广 (1)若数据x1,x2,…,x n的平均数为x,则mx1+a,mx2+a,mx3+a,…,mx n+a的平均数是m x+a. (2)若数据x1,x2,…,x n的方差为s2,则数据ax1+b,ax2+b,…,ax n+b 的方差为a2s2. 考点一茎叶图 [典例](优质试题·山东高考)如图所示的茎叶图记录了甲、 乙两组各5名工人某日的产量数据(单位:件).若这两组数据 的中位数相等,且平均值也相等,则x和y的值分别为() A.3,5B.5,5 C.3,7 D.5,7 [解析]由两组数据的中位数相等可得65=60+y,解得y=5,又它们的平

用样本估计总体教案

2.2.1用样本的频率分布估计总体分布 一、教学目标分析 1.知识与技能目标 (1)通过实例体会分布的意义和作用。 (2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图。 (3)通过实例体会频率分布直方图的特征,能准确地做出总体估计。 2、过程与方法目标: 通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。 3、情感态度与价值观目标: 通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。 二、教学的重点和难点 重点:会列频率分布表,画频率分布直方图。 难点:能通过样本的频率分布估计总体的分布。 三、教法与学法分析 1、教法:遵循观察、探究、发现、总结式的教学模式。重点以引导学生为主,让他们能积极、主动的进行探索,获取知识。由于内容较繁琐,所以要借助多媒体辅助教学。 2、学法:根据本节知识的特点,由于学生已具备一定的基础知识,可采取研究性学习的学习方法。 四、教学过程 (一)情境引入 1.随机抽样有哪几种基本的抽样方法? 简单随机抽样、系统抽样、分层抽样. 2.随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即 用样本估计总体,是我们需要进一步学习的内容. 3.高二某班有50名学生,在数学必修②结业考试后随机抽取10名,其考试成绩如下: 82,75,61,93,62,55,70,68,85,78. 如果要求我们根据上述抽样数据,估计该班对数学模块②的总体学习水平,就需要有相应的数学方法作为理论指导,本节课我们将学习用样本的频率分布估计总体分布. (二)新课讲解 知识探究(一):频率分布表 【问题】我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费. 通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t): 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2

用样本估计总体(含答案).doc

25.2用样本估计总体 一. 选择题 1. 要了解一批灯泡的使用寿命,从中抽取60只灯泡进行试验,在这个问题中,样本是( ) A. 这一批灯泡 B. 抽取的60只灯泡 C. 这一批灯泡的使用寿命 D. 抽取的这60只灯泡的使用寿命 2. 如果一组数据x 1,x 2,x 3,x 4,x 5,的平均数是x ,那么另一组数据x 1+1,x 2+2,x 3+3,x 4+4,x 5+5的平均数是 ( ) A.x . B. 2x + C.3x +. D.15x + 3. 为了考查某地区初中毕业生的数学毕业会考情况,从中抽查了200名考生的数学成绩,在这个问题中,下面说法错误的是( ) A. 总体是被抽查的200名考生 B. 个体是每一个考生的数学成绩 C.样本是200名考生的数学成绩 D. 样本容量是200 4. 某学校生物兴趣小组11人到校外采集植物标本,其中2人每人采集到6件,4人每人采集到3件,5人每人采集到4件,则这个兴趣小组平均每人采集到的标本是( ) A. 3件 B. 4件 C. 5件 D. 6件 二. 填空题: 1. 样本1,0,2,1,3,5,的平均数是________. 2.某地举行了一次数学竞赛,为了估计平均成绩,在抽取的部分试卷中,有1人得10分,3人得9分,8人得8分,12人得7分,9人得6分,7人得5分,则样本容量是___,样本平均数是_________. 3.某班共有学生50人,平均身高为168cm,其中30名男生平均身高为170cm,则20名女生的平均身高为___________. 三. 解答题: 1.大连是一个严重缺水的城市,为鼓励市民珍惜每一滴水,某居民委员会表彰了100个节约用水模范户,5月份这100户节约用水情况如下表所示,求5月份这100户居民的平均节约用水量. 2.某甲鱼养殖专业户共养甲鱼200只,为了与客户签订购销合同,对自已所养甲鱼的总重量进行估计,随意捞了5只,称得重量分别为1.5, 1.4, 1.6, 2, 1.8,(单位:千克). (1)根据样本平均数估计甲鱼的总重量约是多少千克? (2)如果甲鱼的市场价为每千克150元,那么该专业户卖出全部甲鱼的收入约为多少元?

统计学第5-6章 正态分布、 统计量及其抽样分布知识分享

统计学第5-6章正态分布、统计量及其 抽样分布

第5-6章统计量及其抽样分布 5.1正态分布 5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。 概率密度曲线图 例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等某一条件下产品的质量 如果随机变量X的概率密度为 2 2 () 2 1 (), 2 x f x e x μ σ πσ -- =-∞<<∞ 则称X服从正态分布。 记做 2 (,) X Nμσ : ,读作:随机变量X服从均值为 μ ,方差为2 σ的正态分布 其中, μ -∞<<∞ ,是随机变量X的均值,0 σ>是是随机变量X 的标准差

5.1.2正态密度函数f(x)的一些特点: ()0 f x≥, 即整个概率密度曲线都在x轴的上方。 曲线 () f x相对于xμ =对称,并在xμ = 处达到最大值, 1 () 2 fμ πσ = 。 1 μ< 2 μ< 3 μ 曲线的陡缓程度由 σ 决定: σ 越大,曲线越平缓;σ越小,曲线越陡峭当 x 趋于无穷时,曲线以 x轴为其渐近线。 标准正态分布

当 0,1 μσ == 时, 2 2 1 () 2 x f x e π - = , x -∞<<∞ 称 (0,1) N 为标准正态分布。 标准正态分布的概率密度函数: ()x ? 标准正态分布的分布函数: ()x Φ 任何一个正态分布都可以通过线性变换转化为标准正态分布 设 2 (,) X Nμσ : ,则 (0,1) X Z N μ σ - =: 变量 2 11 (,) X Nμσ :与变量2 22 (,) Y Nμσ :相互独立,则有 22 1212 +(+,+) X Y Nμμσσ : 5.1.3 正态分布表:可以查的正态分布的概率值 ()1() x x Φ-=-Φ

抽样分布习题()

抽样分布习题 1.抽样分布是指( C ) A 一个样本各观测值的分布 B 总体中各观测值的分布 C 样本统计量的分布 D 样本数量的分布 2.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的均值为( A )。 A μ B x C 2σ D n 2 σ 3.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的方差为( D )。 A μ B x C 2σ D n 2 σ 4.从一个均值μ=10,标准差σ=0.6的总体中随机选取容量为n=36的样本。假定该总体并不是很偏的,则样本均值x 小于 9.9的近似概率为( A )。 A 0.1587 B 0.1268 C 0.2735 D 0.6324 5.假设总体服从均匀分布,从此总体中抽取容量为36的样本,则样本均值的抽样分布( B ) A 服从非正态分布 B 近似正态分布 C 服从均匀分布 D 服从2χ分布 6.从服从正态分布的无限总体中分别抽取容量为4,16,36的样

本,当样本容量增大时,样本均值的标准差( C )A 保持不变 B 增加 C 减小D 无法确定 7. 总体均值为50,标准差为8,从此总体中随机抽取容量为64的样本,则样本均值的抽样分布的均值和标准误差分布为( B )。 A 50,8 B 50,1 C 50,4 D 8,8 8.某大学的一家快餐店记录了过去5年每天的营业额,每天营业额的均值为2500元,标准差为400元。由于在某些节日的营业额偏高,所以每日营业额的分布是右偏的,假设从这5年中随机抽取100天,并计算这100天的平均营业额,则样本均值的抽样分布是( B )。 A 正态分布,均值为250元,标准差为40元 B 正态分布,均值为2500元,标准差为40元 C 右偏分布,均值为2500元,标准差为400元 D 正态分布,均值为2500元,标准差为400元 9. 某班学生的年龄分布是右偏的,均值为22,标准差为4.45,如果采取重复抽样的方法从该班抽取容量为100的样本,则样本均值的抽样分布是( A ) A 正态分布,均值为22,标准差为0.445 B 分布形状未知,均值为22,标准差为4.45

用样本估计总体分布

用样本的频率分布估计总体分布(第1课时) 教学目标: 1.通过实例体会分布的意义和作用,通过对现实生活的探究,感知应用数学知识解决问题的方法. 2.通过表示样本数据的过程,学会列频率分布表,画频率分布直方图,理解数形结合的数学思想. 3.通过对样本分析和总体估计的过程,感受数学在实际生活中的作用,认识数学知识源于生活并指导生活的事实. 教学重点: 会列频率分布表,画频率分布直方图,了解样本频率分布与总体分布之间的关系 教学难点: 掌握频率分布直方图的正确画法,体会分布的意义与作用 教学方法:引导——探究教学法 教学过程: 一、创设情境,呈现问题 问题情境:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,武汉市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费. 如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢? 二、操作讨论,构建新知 <知识探究1 改良频数分布表→频率分布表> 问题1:如果标准太低,会影响居民的日常生活;如果标准太高,则不利于节水.那么你认为,为了较合理地确定出这个标准,需要了解哪些相关信息,做哪些工作? 【学生活动1】探究讨论,得到结论: ①为了制定一个较为合理的标准a,需要知道每个家庭的用水量 ②如何获得家庭用水量的有关信息?对家庭进行调查,采用抽样调查的方式 ③抽样时,样本容量定为多少比较合适?武汉市1000万人口,抽样10000比较合适 课堂上为了处理数据的方便,我们理想化地抽取100个数据的样本,比如: 通过抽样调查,获得100户居民的月均用水量如下表(单位:t) 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 问题2:从表中随意记录下的数据中很难直接看出规律,因此需要对统计数据进行整理分析. 回顾你看到全班的期末考试成绩单后是怎样分析的?

抽样分布习题与答案

第 4 章抽样分布自测题选择题 1.抽样分布是指() A. 一个样本各观测值的分布C. 样本统计量的分布 B. 总体中各观测值的分布D. 样本数量的分布 2.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的均值为() 2 A. B. x C.2 D. n 3.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的方差为() 2 A. B.x C.2 D. n 4.从均值为,方差为2 n 的样本,则()的任意一个总体中抽取大小为 A.当 n 充分大时,样本均值x 的分布近似服从正态分布 B.只有当 n<30 时,样本均值x的分布近似服从正态分布 C.样本均值 x 的分布与n无关 D. 无论 n 多大,样本均值x 的分布都是非正态分布 5.假设总体服从均匀分布,从该总体中抽取容量为 36 的样本,则样本均值的抽样分布() A. 服从非正态分布 B. 近似正态分布 C. 服从均匀分布 D. 服从 2 分布 6. 从服从正态分布的无限总体中分别抽取容量为4,16,36的样本,则当样本容量增大时,样 本均值的标准差() A. 保持不变 B. 增加 C.减小 D.无法确定 7. 某大学的一家快餐店记录了过去 5 年每天的营业额,每天营业额的均值为2500 元,标准差为 400 元。由于在某些节日的营业额偏高,所以每日营业额的分布是右偏的,假设从这5年中随机抽取100 天,并计算这100 天的平均营业额,则样本均值的抽样分布是() A. 正态分布,均值为250 元,标准差为40 元 B. 正态分布,均值为2500 元,标准差为40 元 C.右偏,均值为2500 元,标准差为400 元 D. 正态分布,均值为2500 元,标准差为400 元 8. 在一个饭店门口等待出租车的时间是左偏的,均值为12 分钟,标准差为 3 分钟。如果从饭店门口随机抽取 81 名顾客并记录他们等待出租车的时间,则样本均值的抽样分布是() A. 正态分布,均值为12 分钟,标准差为0.33 分钟 B. 正态分布,均值为12 分钟,标准差为 3 分钟 C. 左偏分布,均值为12 分钟,标准差为 3 分钟

用样本估计总体练习题含答案

用样本估计总体 一. 选择题 1. 要了解一批灯泡的使用寿命,从中抽取60只灯泡进行试验,在这个问题中,样本是( ) A. 这一批灯泡 B. 抽取的60只灯泡 C. 这一批灯泡的使用寿命 D. 抽取的这60只灯泡的使用寿命 2. 如果一组数据x 1,x 2,x 3,x 4,x 5,的平均数是x ,那么另一组数据x 1+1,x 2+2,x 3+3,x 4+4,x 5+5的平均数是 ( ) A.x . B. 2x + C.3x +. D.15x + 3. 为了考查某地区初中毕业生的数学毕业会考情况,从中抽查了200名考生的数学成绩,在这个问题中,下面说法错误的是( ) A. 总体是被抽查的200名考生 B. 个体是每一个考生的数学成绩 C.样本是200名考生的数学成绩 D. 样本容量是200 4. 某学校生物兴趣小组11人到校外采集植物标本,其中2人每人采集到6件,4人每人采集到3件,5人每人采集到4件,则这个兴趣小组平均每人采集到的标本是( ) A. 3件 B. 4件 C. 5件 D. 6件 二. 填空题: 1. 样本1,0,2,1,3,5,的平均数是________. 2.某地举行了一次数学竞赛,为了估计平均成绩,在抽取的部分试卷中,有1人得10分,3人得9分,8人得8分,12人得7分,9人得6分,7人得5分,则样本容量是___,样本平均数是_________. 3.某班共有学生50人,平均身高为168cm,其中30名男生平均身高为170cm,则20名女生的平均身高为___________. 三. 解答题: 1.大连是一个严重缺水的城市,为鼓励市民珍惜每一滴水,某居民委员会表彰了100个节约用水模范户,5月份这100户节约用水情况如下表所示,求5月份这100户居民的平均节约用水量. 2.某甲鱼养殖专业户共养甲鱼200只,为了与客户签订购销合同,对自已所养甲鱼的总重量进行估计,随意捞了5只,称得重量分别为, , , 2, ,(单位:千克). (1)根据样本平均数估计甲鱼的总重量约是多少千克 (2)如果甲鱼的市场价为每千克150元,那么该专业户卖出全部甲鱼的收入约为多少元

用样本估计总体知识讲解

用样本估计总体 【学习目标】 1.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图. 2.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计. 3.正确理解样本数据标准差的意义和作用,学会计算数据的标准差. 4.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释. 5.会用样本的基本数字特征估计总体的基本数字特征. 【要点梳理】 要点一、频率分布的概念 频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为: 1.计算一组数据中最大值与最小值的差,即求极差 2.决定组距与组数 3.将数据分组 4.列频率分布表 5.画频率分布直方图 要点诠释: 频率分布直方图的特征: 1.从频率分布直方图可以清楚的看出数据分布的总体趋势. 2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了. 要点二、频率分布折线图、总体密度曲线 1.频率分布折线图的定义: 连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. 2.总体密度曲线的定义: 在样本频率分布直方图中,样本容量越大,所分组数越多,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 要点诠释: 总体密度曲线能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,能够精确的反映一个总体在各个区域内取值的规律. 要点三、茎叶图 当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图. 要点诠释: 茎叶图的特征: (1)用茎叶图表示数据有两个优点:一是在统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示. (2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰. 要点四、众数、中位数与平均数 1.众数 一组数据中出现次数最多的数据叫做众数.如果变量是分类的,用众数是很有必要的.例如班委会要作出

二项分布与正态分布

第七章假设检验 第一节二项分布 二项分布的数学形式·二项分布的性质 第二节统计检验的基本步骤 建立假设·求抽样分布·选择显著性水平和否定域·计算检验统计量·判定第三节正态分布 正态分布的数学形式·标准正态分布·正态分布下的面积·二项分布的正态近似法 第四节中心极限定理 抽样分布·总体参数与统计量·样本均值的抽样分布·中心极限定理 第五节总体均值和成数的单样本检验 σ已知,对总体均值的检验·学生t分布(小样本总体均值的检验)·关于总体成数的检验 一、填空 1.不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分布就趋于()分布。 2.统计检验时,被我们事先选定的可以犯第一类错误的概率,叫做检验的( ),它决定了否定域的大小。 3.假设检验中若其他条件不变,显著性水平的取值越小,接受原假设的可能性越(),原假设为真而被拒绝的概率越()。 4.二项分布的正态近似法,即以将B(x;n,p)视为()查表进行计算。 5.已知连续型随机变量X~N(0,1),若概率P{X ≥λ}=0.10,则常数λ=()。 6.已知连续型随机变量X~N(2,9),函数值 9772 .0 )2( = Φ ,则概率 }8 {< X P= ()。 二、单项选择 1.关于学生t分布,下面哪种说法不正确()。 A 要求随机样本 B 适用于任何形式的总体分布 C 可用于小样本 D 可用样本标准差S代替总体标准差σ 2.二项分布的数学期望为()。 A n(1-n)p B np(1- p) C np D n(1- p)。 3.处于正态分布概率密度函数与横轴之间、并且大于均值部分的面积为()。 A 大于0.5 B -0.5 C 1 D 0.5。

用样本估计总体

《§6.2用样本估计总体》学案 一、学习要求: 1、掌握数据整理及其相关图表的制作方法 2、会求样本的平均值和标准差 3、能通过样本的分布和特征值来估计总体的分布和特征值 4、通过具体的实际问题,感受用样本估计总体分布规律的思想 二、学习重点、难点: 重点:数据整理及其相关图表的制作;样本特征值的计算;对总体分布和特征值的估计。 难点:频数频率分布图表和累计频率分布折线图的作用和分析;如何用样本的分布和特征值来估计总体。 三、学时安排:共4学时 第一学时:学习频率分布表,感受如何用样本频率分布表去估计总体分布,亲自体验制作频数频率分布表的过程。 第二学时:学习频率分布直方图,强化制作频率分布直方图的可操作性。 第三学时:学习平均数、方差和标准差的计算,熟悉并会用计算公式。 第四学时:建立用样本的分布估计总体的特征性质的思想,并小结本节内容四、学习过程: 第一学时 (一)课前尝试 1、学法指导: (1)回顾初中已经学过的频数分布表 (2)自学课本上P.8~10介绍的频数频率分布表。 2、尝试练习: 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量 为100的身高样本,数据如下(单位:cm),试作出该样本频率分布表。 168 165 171 167 170 165 170 152 175 174 165 170 168 169 171 166 164 155 164 158 170 155 166 158 155 160 160 164 156 162

160 170 168 164 174 171 165 179 163 172 180 174 173 159 163 172 167 160 164 169 151 168 158 168 176 155 165 165 169 162 177 158 175 165 169 151 163 166 163 167 178 165 158 170 169 159 155 163 153 155 167 163 164 158 168 167 161 162 167 168 161 165 174 156 167 166 162 161 164 166 (二)课堂探究: 1、探究问题:频数频率分布表能较好地反映总体分布情况,在实际中应用很广,因此,如何来制作频数频率分布表呢? 2、知识链接:对总体分布的估计 (1)频数频率分布表 (2)频数频率分布表的制作 3、拓展练习:课本上P.9例1 一般地,编制频率分布表的步骤如下: (1)求全距,决定组数和组距,组距组数 全距 ; (2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; (3)登记频数,计算频率,列出频率分布表。 4、当堂训练: 下面是某职业学校学生随机抽样的40名学生在一个月内的零花钱数据(单

03 第三节 正态总体的抽样分布

第三节 正态总体的抽样分布 分布图示 ★ 抽样分布 ★ 单正态总体的抽样分布 ★ 例 1 ★ 例 2 ★ 例 3 ★ 双正态总体的抽样分布 ★ 例 4 ★ 例 5 ★ 内容小结 ★ 课堂练习 ★ 习题12-3 内容要点 一、抽样分布 有时, 总体分布的类型虽然已知, 但其中含有未知参数,此时需对总体的未知参数或对总体的重要数字特征(如数学期望、分差等) 进行统计推断, 此类问题称为参数统计推断.在参数统计推断问题中, 常需利用总体的样本构造出合适的统计量, 并使其服从或渐近地服从已知的总体分布. 统计学中泛称统计量分布为抽样分布. 二、单正态总体的抽样分布 设总体X 的均值μ,方差为2σ,n X X X ,,,21 是取自X 的一个样本,X 与2S 分别为该样本的样本均值与样本方差, 则有 ,)(,)(2σμ==X D X E )(2S E .2 σ= 定理1 设总体),,(~2σμN X n X X X ,,,21 是取自X 的一个样本, X 与2S 分别为该样本的样本均值与样本方差, 则有 (1) )/,(~2n N X σμ; (2) ).1,0(~/N n X U σμ-= 定理2 设总体),,(~2σμN X n X X X ,,,21 是取自X 的一个样本, X 与2S 分别为该样本的样本均值与样本方差, 则有 (1) 2χ=);1(~)(1 1 212222--=-∑=n X X S n n i i χσσ (2) X 与2S 相互独立. 定理3 设总体),,(~2σμN X n X X X ,,,21 是取自X 的一个 样本, X 与2S 分别为该样本的样本均值与样本方差, 则有 (1) )(~)(121222n X n i i χμσχ∑=-= (2) ).1(~/--=n t n S X T μ 三、双正态总体的抽样分布 定理 4 设),(~211σμN X 与),(~222σμN Y 是两个相互独立的正态总体, 又设 1 ,,,21n X X X 是取自总体X 的样本, X 与21S 分别为该样本的样本均值与样本方差. 2 ,,,21n Y Y Y 是取自总体Y 的样本, Y 与22S 分别为此样本的样本均值与样本方差. 再记2w S 是21S 与22 S 的加权平均, 即

用样本估计总体 训练-答案

1.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是( ) A .0.05 B .0.25 C .0.5 D .0.7 解析:选D.由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为14 20 =0.7. 2.(2014·高考广东卷)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( ) A .200,20 B .100,20 C .200,10 D .100,10 解析:选A.该地区中小学生总人数为3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20,故选A. 3. 某同学进入高三后,4次月考的数学成绩的茎叶图如图,则该同学数学成绩的方差是( ) A .125 B .5 5 C .45 D .3 5 解析:选C.由茎叶图知平均值为114+126+128+1324=125,∴s 2=1 4[(125-114)2+(125-126)2+(125-128)2+(125 -132)2]=45. 4.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a ,中位数为b ,众数为c ,则有( ) A .a >b >c B .b >c >a C .c >a >b D .c >b >a 解析:选D.把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a =110× (10+12+14+14+15+15+16+17+17+17)=14.7,中位数b =15+15 2 =15,众数c =17,则a

用样本估计总体

用样本估计总体 1.作频率分布直方图的步骤 (1)求极差(即一组数据中最大值与最小值的差). (2)决定组距与组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图. 2.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. (2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.

3.茎叶图 统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数. 4.标准差和方差 (1)标准差是样本数据到平均数的一种平均距离. (2)标准差: s=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2]. (3)方差:s2=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2](x n是样本数据,n是样本容 量,x是样本平均数). 知识拓展 1.频率分布直方图的特点 (1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率 组距 ,频率=组距 ×频率组距 . (2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比. (3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. 2.平均数、方差的公式推广 (1)若数据x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mx n +a的平均数是m x+a. (2)数据x1,x2,…,x n的方差为s2. ①数据x1+a,x2+a,…,x n+a的方差也为s2; ②数据ax1,ax2,…,ax n的方差为a2s2.

抽样分布和样本分布

抽样分布和样本分布 导读:我根据大家的需要整理了一份关于《抽样分布和样本分布》的内容,具体内容:你们知道各是什么吗?以下是有我为大家整理的,希望能帮到你。抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统... 你们知道各是什么吗?以下是有我为大家整理的,希望能帮到你。抽样分布: 从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统计推断的理论基础。 如果从容量为的有限总体抽样,若每次抽取容量为的样本,那么一共可以得到N取n的组合个样本(所有可能的样本个数)。抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。由平均数构成的新总体的分布,称为平均数的抽样分布。随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。 样本分布: 总体是指考察的对象的全体,个体是总体中的每一个考察的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目样本分布是用来估计总体分布的。样本分布有区别于总体分布,它是从总体中按一定的分组标志选出来的部分样本容量。

实际中很多不确定现象都可以用随机变量描述,而应用中的一个十分重要的问题是找到随机变量的分布或其数字特征。例如:某进出口贸易公司进口了10万台微型计算器,按产品技术规定,使用寿命小于4000小时即为次品,且次品率大于1% 就不接受这批产品。如何得知这批产品的次品率呢?是否要测量每一台计算器呢?显然,这是不现实的,解决这个问题的好办法就是随机抽样,然后根据抽样检验得到的次品率来估计整批产品的次品率。也就是从10万台产品中按随机原则,抽取一部分(假如100件)产品组成一个样本,由样本(100件产品)次品率推断整批产品的次品率。 这里,我们把被观察对象的全体(本例中的10万台计算器)称作总体,把从总体中随机抽取的(被抽中的100台计算器)小群体称作样本,而样本中所包含的个体单位数目称为样本容量(100个)。 对于这批计算器,我们关心的是它的使用寿命(低于4000小时的比例有多少)的分布,设X表示"任一台计算器的使用寿命",它是一个随机变量,我们把随机抽中的100件产品看作是100个随机变量X1,X2......,X100,每一个计算器的使用寿命都是一个随机变量,一旦测试完毕,测试的结果就是100个观测值x1,x2,......x100, 统计抽样的任务就是根据测试结果x1,x2,......x100来估计总体X的分布情况。 我们作如下概括:设X是一个随机变量,X1,X2......,Xn是一组相互独立与X具有相同分布的随机变量,称X为总体,X1,X2......,Xn为来自总体的简单随机样本,简称样本,n为样本容量,称样本观察值为样本值,由于按随机原则取样,在试验之前,人们无法知道试验的结果,

11.2用样本估计总体练习题.docx

§11.2用样本估计总体 一、选择题 1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是() A.总体容量越大,估计越精确 B .总体容量越小,估计越精确 C.样本容量越大,估计越精确 D .样本容量越小,估计越精确 2.频率分布直方图中,小长方形的面积等于() A.组距B.频率 C .组数D.频数 3.一个容量为 100 的样本,其数据的分组与各组的频数如下表 组别(0,10](10,20](20,30](30,40](40,50](50,60](60,70] 频数1213241516137则样本数据落在(10,40) 上的频率为() A. 0.13 B . 0.39 C . 0.52 D . 0.64 4.一个容量为 35 的样本数据 , 分组后 , 组距与频数如下: [5,10),5个;[10,15),12 个;[15,20),7个;[20,25), 5 个; [25,30),4个; [30,35),2个.则样本在区间[20,+∞ ) 上的频率为() A. 20%B. 69%C. 31%D. 27% 5.某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重 ( 单位:克) 数据绘制的频率分布直方图, 其中产品净重的范围是 [96,106], 样本数据分组为 [96,98),[98,100),[100,102), [102,104), [104,106],已知样本中产品净重小于100 克的个数是 36, 则样本中净重 大于或等于 98克并且小于 104克的产品的个数是() A. 90B. 75C.60D.45 6. 对某校名学生的体重(单位:kg )进行统计,得到如图所示的频率分布直方图,则学生体重在kg 以上的人数为 () A.B. C.D. 7.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值 为 1,则样本方差为 () . 6 B.6 C.2D.2 A. 5 5 8.为了了解某地区10 000 名高三男生的身体发育情况,抽查了该地 区 100 名年龄为 17~18岁的高三男生体重(kg) ,得到频率分布直方 图如图.根据图示,请你估计该地区高三男生中体重在[56.5,64.5]的学生人数是 () A.40B.400 C.4 000D.4 400

正态总体下的四大分布

《概率论与数理统计》第六章样本及抽样分布 (2)正态总体下的四大分布:正态分布 设n x x x ,,,21 为来自正态总体),(2 σ μN 的一个样本,则样本函数 ). 1,0(~/N n x u def σμ -例:设总体ξ~2 12(1,2 ),,,n N ξξξ 且是取自ξ的样本,则( D ) A) 1(0,1) 2 N ξ-B) 1(0,1) 4N ξ-C) ( ) 1(0,1) 2 N ξ-D ) (0,1) N ξt 分布 设n x x x ,,,21 为来自正态总体),(2 σ μN 的一个样本,则样本函数), 1(~/--n t n s x t def μ其中t(n-1)表示自由度为n-1的t 分布。 分布 2χ设n x x x ,,,21 为来自正态总体),(2 σ μN 的一个样本,则样本函数 ), 1(~)1(22 2 --n S n w def χσ其中)1(2 -n χ 表示自由度为n-1的2χ 分布

例:已知F 0.1(7,20)=2.04,则F 0.9(20,7)=_______0.4902_____. 例.对于给定的正数α,10<<α ,设αu ,)(2 n α χ,)(n t α,),(21n n F α分别是)1,0(N ,)(2n χ,)(n t ,),(21n n F 分布的下α 分位数,则下面结论中不正确... 的是(B ) (A)α α --=1u u (B)) () (2 2 1n n ααχχ-=-(C)) ()(1n t n t αα--=(D)) ,(1 ) ,(12211n n F αα= -2、设X 、Y 相互独立,且都服从标准正态分布,则Z = 2 Y X 服从______t(1)_____分布(同时要写出 分 布的参数). 3.设ξ和η相互独立且都服从N(0,4),而41,ξξ 和41,ηη 分别是来自总体ξ和η的样本,则统计量2 4 2 141......ηηξξ++++= U 服从的分布为 ) 4(t 。

习题六 样本及抽样分布.

习题六样本及抽样分布 一、填空题 1.设来自总体的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =; 2.在总体中随机地抽取一个容量为 36 的样本,则均值落在4与6之间的概率 = 0.9332 ; 3.设某厂生产的灯泡的使用寿命 (单位:小时,抽取一容量为9的样本,得到 ,则; 4.设为总体的一个样本,则 0.025 ; 5.设为总体的一个样本,且服从分布,这里, ,则1/3 ; 6.设随机变量相互独立,均服从分布且与分别是来自总体的简单随机样本,则统计量服从参数为 9 的 t 分布。 7.设是取自正态总体的简单随机样本且 ,则 0.05 , 0.01 时,统计量服从分布,其自由度为 2 ;

8.设总体 X 服从正态分布,而是来自总体的简单随机样 本,则随机变量 服从 F 分布,参数为 10,5 ; 9.设随机变量则 F(n,1 ; 10.设随机变量且,A为常数,则 0.7 二、选择题 1.设是来自总体的简单随机样本,是样本均值, 记 则服从自由度的分布的随机变量是( A ); A. B. C. D. 2.设是经验分布函数,基于来自总体的样本,而是总体的分布函数,则下列命题错误的为,对于每个给定的( B ) A.是分布函数 B.依概率收敛于 C.是一个统计量 D.其数学期望是

3.设总体服从0-1分布,是来自总体的样本,是样本均值,则下列各选项中的量不是统计量的是( B ) A. B. C. D. 4.设是正态总体的一个样本,其中已知而未知,则下列各选项中的量不是统计量的是( C )。 A. B. C. D. 5.设和分别来自两个正态总体和的样本,且相互独立,分别为两个样本的样本方差,则服从的统计量是( B ) A. B. C. D. 6.设是正态总体的一个样本,和分别为样本均值和样本方差,则下面结论不成立的有( D ) A.相互独立; B.与相互独立; C.与相互独立D.与相互独立。

相关文档
最新文档