第46讲 抽样方法、用样本估计总体及正态分布

第46讲 抽样方法、用样本估计总体及正态分布
第46讲 抽样方法、用样本估计总体及正态分布

第46讲抽样方法、用样本估计总体及正态分布

【课程要求】

1.理解随机抽样的必要性和重要性.

2.会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法;搞清三种抽样的联系与区别.

3.了解分布的意义与作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.

4.能从样本数据中提取基本的数字特征(如平均数、标准差).

5.会用样本的频率分布估计总体分布,会用样本的基本数字特征,理解用样本估计总体的思想.

6.会用随机抽样的基本方法和样本估计总体的思想解决一些简单实际问题.

7.利用实际问题的直方图,了解正态分布曲线的特点及曲线所表示的意义.

对应学生用书p127

【基础检测】

概念辨析

1.判断下列结论是否正确(请在括号中打“√”或“×”)

(1)简单随机抽样是一种不放回抽样.()

(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.()

(3)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()

(4)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.()

(5)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.()

(6)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.()

(7)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.()

(8)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.()

(9)正态分布中的参数μ和σ完全确定了正态分布,参数μ是正态分布的均值,σ是正态分布的标准差.()

(10)一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用结果之和,它就服从或近似服从正态分布.()

[答案] (1)√(2)×(3)√(4)×(5)√(6)×

(7)√(8)×(9)√(10)√

教材改编

2.[必修3p100A组T1]在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是()

A.总体

B.个体

C.样本的容量

D.从总体中抽取的一个样本

[解析] 由题目条件知,5000名居民的阅读时间的全体是总体;其中1名居民的阅读时间是个体;从5000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.

[答案] A

3.[必修3p 100A 组T 2(1)]一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( )

A .4

B .8

C .12

D .16

[解析] 设频数为n ,则n

32

=0.25,

∴n =32×1

4

=8.

[答案] B

4.[必修3p 81A 组T 1]若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )

A .91.5和91.5

B .91.5和92

C .91和91.5

D .92和92

[解析] ∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数是

91+92

2=91.5,

平均数x -=87+89+90+91+92+93+94+968

=91.5.

[答案] A

5.[必修3p 71T 1]如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有______人.

[解析] 0.5×0.5×100=25. [答案] 25 6.[选修2-3p 75B 组T 2]已知随机变量X 服从正态分布N(3,1),且P(X>2c -1)=P(X

[解析] ∵X ~N(3,1),∴正态曲线关于x =3对称, 且P(X>2c -1)=P(X

∴2c -1+c +3=3×2,∴c =4

3

.

[答案] 4

3

易 错 提 醒

7.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,

得分(十分制)如图所示,假设得分的中位数为m ,众数为n ,平均数为x -,则m ,n ,x -

的大

小关系为________.(用“<”连接)

[解析] 由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m =5.5;又5出现次数最多,故n =5;

x -=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030

≈5.97. 故n

. [答案] n

8.设随机变量ξ服从正态分布N(μ,σ2),函数f(x)=x 2+4x +ξ没有零点的概率是1

2

则μ等于( )

A .1

B .2

C .4

D .不能确定 [解析] 当函数f(x)=x 2+4x +ξ没有零点时,Δ=16-4ξ<0,即ξ>4,根据正态曲线的对

称性,当函数f(x)=x 2+4x +ξ没有零点的概率是1

2

时,μ=4.

[答案] C

【知识要点】 1.简单随机抽样

(1)定义:设一个总体含有N 个个体,从中__逐个不放回地__抽取n 个个体作为样本(n ≤N),如果每次抽取时总体内的各个个体被抽到的机会都__相等__,就把这种抽样方法叫做简单随机抽样.

(2)最常用的简单随机抽样的方法:__抽签法__和__随机数法__. 2.系统抽样的步骤

假设要从容量为N 的总体中抽取容量为n 的样本. (1)编号:先将总体的N 个个体__编号__.

(2)分段:确定__分段间隔k__,对编号进行__分段__,当N

n

(n 是样本容量)是整数时,

取k =N n

.

(3)确定首个个体:在第1段用__简单随机抽样__确定第一个个体编号l(l ≤k).

(4)获取样本:按照一定规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号__l +k__,再加k 得到第3个个体编号__l +2k__,依次进行下去,抽取样本l +(n -1)k ,直到获取整个样本.

3.分层抽样

(1)定义:在抽样时,将总体分成__互不交叉__的层,然后按照__一定的比例__从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.

(2)分层抽样的应用范围:当总体是由__差异明显的几个部分组成__时,往往选用分层抽样.

4.分层抽样的步骤

(1)分层:将总体按某种特征分成若干部分.

(2)确定比例:计算各层的个体数与总体的个体数的比. (3)确定各层应抽取的样本容量.

(4)在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),综合每层抽样,组成样本.

5.用样本的数字特征估计总体的数字特征 (1)众数、中位数

在一组数据中出现次数__最多__的数据叫做这组数据的众数; 将一组数据按照从大到小(或从小到大)排列,处在__中间位置__上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数.

(2)平均数与方差

如果这n 个数据是x 1,x 2,…,x n ,那么__x -=1n ∑n

i =1x i __,叫做这n 个数据的平均数;

如果这n 个数据是x 1,x 2,…,x n ,那么__s 2=1n ∑n

i =1

__(x i -x -)2__,叫做这n 个数据

的方差;同时s =1n ∑n

i =1

(x i -x -)2,叫做这n 个数据的标准差.

6.频率分布直方图

(1)通常我们对总体作出的估计一般分成两种:一种是用__样本的频率分布估计总体的分布__;另一种是用__样本的数字特征(如平均数、标准差等)估计总体数字特征__.

(2)作频率分布直方图的步骤

①求极差(即一组数据中最大值与最小值的差). ②决定__组距__与__组数__. ③将数据分组. ④列频率分布表. ⑤画频率分布直方图.

(3)在频率分布直方图中,纵轴表示__频率

组距

__,数据落在各个小组内的频率用__各小长

方形面积__表示.各小长方形的面积总和等于1.

7.频率分布折线图和总体密度曲线

(1)频率分布折线图:连接频率分布直方图中各小长方形上端的__中点__,就得到频率分布折线图.

(2)总体密度曲线:随着样本容量的增加__组距__减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.

8.茎叶图的优点

(1)统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到. (2)茎叶图中的数据可以随时记录,随时添加,方便记录与表示. 9.正态分布

(1)函数φ

μ,σ(x)=2,x ∈R 的图象称为正态分布密度曲线,简称正

态曲线.

对于任何实数a <b ,随机变量X 满足P (a <X ≤b )≈__??a

b φμ,σ(x )d x __,则称X 的分布为

正态分布,正态分布完全由参数__μ和σ__确定.因此正态分布常记作__N(μ,σ2)__,如果X 服从正态分布,则记为__X ~N(μ,σ2)__.

(2)正态分布的特点:①曲线__位于x 轴上方与x 轴不相交__;②曲线关于直线__x =μ__

对称;③曲线在x =μ时

;④曲线与x 轴之间的面积为1;⑤当σ一定时,

曲线的位置由μ确定,曲线随着μ的变化而沿x 轴平移;⑥当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”,表示总体的分布越__分散__;σ越小,曲线越“高瘦”,表示总体的分布越__集中__.

(3)δ原则

①x ∈(μ-δ,μ+δ),P(x)=0.6826; ②x ∈(μ-2δ,μ+2δ),P(x)=0.9544; ③x ∈(μ-3δ,μ+3δ),P(x)=0.9974.

对应学生用书p 128

抽样方法及应用

1 (1)在100个零件中,有一级品20个,二级品30个,三级品50个,从中

抽取20个作为样本:

①采用简单随机抽样法,将零件编号为00,01,02,…,99,抽出20个;

②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个; ③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.

若用这三种抽样方式抽样,每个零件被抽到的概率分别是p 1,p 2,p 3,则p 1,p 2,p 3的值分别是________.

[解析] 由抽样方法的性质知,抽样过程中每个个体被抽到的概率都相等,这个比例只与样本容量和总体有关,即不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是15

. [答案] p 1=p 2=p 3=1

5

(2)某学校高二年级为了表彰第一次月考成绩优异者,需要5件不同的奖品,这些奖品要从由1-200编号的200件不同奖品中随机抽取确定,用系统抽样的方法确定其中一件奖品编号为6,则其他四件奖品编号为__________.

[解析] 根据系统抽样可知,样本容量为5,所以分5组,分组间隔为k =200

5=40,再

根据系统抽样编号为l ,l +k ,l +2k ,…,l +(n -1)k 可知,若一件编号为6,则其余四件编号依次为:46,86,126,166.

[答案] 46,86,126,166

[小结]分层抽样、系统抽样的基础知识的课程要求是“了解”和“会”,因此复习时重点在基础知识的了解与简单应用.

1.利用简单随机抽样,从n 个个体中抽取一个容量为10的样本.若第二次抽取时,余

下的每个个体被抽到的概率为1

3

,则在整个抽样过程中,每个个体被抽到的概率为( )

A .14

B .13

C .514

D .1027

[解析] 由题意知9n -1=13,得n =28,所以整个抽样过程中每个个体被抽到的概率为10

28=

5

14

,故选C . [答案] C

2.某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )

A .11

B .12

C .13

D .14

[解析] 由840

42=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为

720-48020=240

20

=12.

[答案] B

3.某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n 的样本,其中甲种产品有18件,则样本容量n 等于( )

A .54

B .90

C .45

D .126

[解析] 依题意得3

3+5+7

×n =18,解得n =90,即样本容量为90.

[答案] B

频率分布直方图及应用

2 某网络营销部门随机抽查了某市200名网友在2019年11月11日的网购金

(1)试确定x ,y ,p ,q 的值,并补全频率分布直方图(如图);

(2)该营销部门为了了解该市网友的购物体验,从这200名网友中,用分层抽样的方法从网购金额在(1,2]和(4,5]的两个群体中确定5人进行问卷调查,若需从这5人中随机选取2人继续访谈,则此2人来自不同群体的概率是多少?

[解析] (1)根据题意有?

???

?16+24+x +y +16+14=200,16+24+x y +16+14=32,

解得?????x =80,

y =50.

∴p =0.4,q =0.25.

补全频率分布直方图如图所示,

(2)根据题意,网购金额在(1,2]内的人数为

2424+16

×5=3(人),记为a ,b ,c.

网购金额在(4,5]内的人数为16

24+16

×5=2(人),记为A ,B.

则从这5人中随机选取2人的选法有:(a ,b),(a ,c),(a ,A),(a ,B),(b ,c),(b ,A),(b ,B),(c ,A),(c ,B),(A ,B)共10种.

记2人来自不同群体的事件为M ,则M 中含有(a ,A),(a ,B),(b ,A),(b ,B),(c ,A),(c ,B)共6种.

∴P(M)=610=3

5

.

[小结]1.绘制频率分布直方图时的2个注意点

(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确; (2)频率分布直方图的纵坐标是频率

组距

,而不是频率.

2.由频率分布直方图进行相关计算时,需掌握的2个关系式 (1)频率组距

×组距=频率; (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数.

4.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )

A .56

B .60

C .120

D .140 [解析] 自习时间不少于22.5小时为后三组,其频率和为(0.16+0.08+0.04)×2.5=0.7,

故人数为200×0.7=140人.

[答案] D

茎叶图及应用

3 “日行一万步,健康你一生”的养生观念已经深入人心,由于研究性学习

的需要,某大学生收集了手机“微信运动”团队中特定甲、乙两个班级n 名成员一天行走的步数,然后采用分层抽样的方法按照[20,30),[30,40),[40,50),[50,60)分层抽取了20名成员的步数,并绘制了如下尚不完整的茎叶图(单位:千步);已知甲、乙两班行走步数的平均值都是44千步.

(1)求x ,y 的值;

(2)若估计该团队中一天行走步数少于40千步的人数比处于[40,50)千步的人数少12人,求n 的值.

[解析] (1)因为甲、乙两班行走步数的平均值都为44,

所以x -

甲=110×(26+32+42+40+x +45+46+48+50+52+53)=44,解得x =6.

所以x -

乙=110×(26+34+30+y +41+42+46+50+52+57+58)=44,解得y =4.

(2)该团队中一天行走步数少于40千步的频率为2+320=14,处于[40,50)千步的频率为

8

20=2

5

, 则估计该团队中一天行走步数少于40千步的人数比处于[40,50)千步的人数的频率之差为25-14=320.

又因为该团队中一天行走步数少于40千步的人数比处于[40,50)千步的人数少12人,

所以n ×3

20

=12,解得n =80.

5.某校开展“爱我母校,爱我家乡”摄影比赛,七位评委为甲,乙两名选手的作品打出的分数的茎叶图如图所示(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲,乙两名选手得分的平均数分别为a 1,a 2,则一定有( )

A .a 1>a 2

B .a 2>a 1

C .a 1=a 2

D .a 1,a 2的大小与m 的值有关 [解析] 由茎叶图知,

a 1=80+1+5+5+4+5

5=84,

a 2=80+4+4+6+4+7

5

=85,故选B .

[答案] B

样本的数字特征

4 甲、乙两名同学8次数学测验成绩如茎叶图所示,x -1,x -

2分别表示甲、

乙两名同学8次数学测验成绩的平均数,s 1,s 2分别表示甲、乙两名同学8次数学测验成绩的标准差,则有( )

A .x -1>x -2,s 1

B .x -1=x -

2,s 1

2,s 1>s 2

[解析] 由茎叶图可知,甲的成绩分别为:78,79,84,85,85,86,91,92. 乙的成绩分别为:77,78,83,85,85,87,92,93.

∴x -1=1

8(78+79+84+85+85+86+91+92)=85,

s 21=18[(78-85)2+(79-85)2+(84-85)2+0+0+(86-85)2+(91-85)2+(92-85)2]=1728; x -2=1

8(77+78+83+85+85+87+92+93)=85,

s 22=18[(77-85)2+(78-85)2+(83-85)2+0+0+(87-85)2+(92-85)2+(93-85)2]=2348, ∴x -1=x -

2,s 1

[小结]利用频率分布直方图估计样本的数字特征的方法

(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值.

(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和. (3)众数:最高的矩形的中点的横坐标.

6.甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图:

(1)分别求出两人得分的平均数与方差;

(2)根据图和上面算得的结果,对两人的训练成绩作出评价. [解析] (1)由图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分. x -甲=10+13+12+14+165

=13;

x -乙=13+14+12+12+145

=13,

s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4; s 2乙=15

[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2

]=0.8. (2)由s 2甲>s 2乙

,可知乙的成绩较稳定.

从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.

正态分布及应用

5 (1)设随机变量ξ服从标准正态分布N(0,1),已知P(ξ≤-1.96)=0.025,

则P(|ξ|<1.96)等于( )

A .0.025

B .0.950

C .0.050

D .0.975

[解析] 本题考查变量服从标准正态分布的概率计算.由题意P(|ξ|<1.96)=P(-1.96<ξ<1.96)=1-2P(ξ≤-1.96)=1-2×0.025=0.950.

[答案] B

(2)已知服从正态分布N(μ,σ2)的随机变量在区间(μ-σ,μ+σ),(μ-2σ,μ+2σ)和(μ-3σ,μ+3σ)内取值的概率分别为68.3%,95.4%和99.7%.某校为高一年级1000名新生每人定制一套校服,经统计,学生的身高(单位:cm )服从正态分布(165,52),则适合身高在155~175 cm 范围内的校服大约要定制( )

A .683套

B .954套

C .972套

D .997套

[解析] ∵P(155

(3)在如图所示的正方形中随机投掷10000个点,则落入阴影部分(曲线C 为正态分布N(0,1)的密度曲线)的点的个数的估计值为( )

附:若X ~N(μ,σ2),则P(μ-σ

[解析] 利用阴影部分的面积所占正方形的比例,估计落入阴影部分的点的个数. 由P(-1

阴影部分的点的个数为10000×0.3413

1×1

=3413.

[答案] C

[小结]正态分布的概率计算关键是利用数形结合思想和对称性转化.

7.某食品公司研发生产一种新的零售食品,从产品中抽取100件作为样本,测量这些产品的一项质量指标值,由测量结果得到如下频率分布直方图:

(1)求直方图中a 的值;

(2)根据频率分布直方图估计样本数据的众数、中位数各是多少(结果保留整数); (3)由频率分布直方图可以认为,这种产品的质量指标值Z 服从正态分布N(200,12.22),试计算数据落在(187.8,212.2)上的概率.

(参考数据:若Z ~N(μ,σ2),则P(μ-σ

[解析] (1)由已知得(0.002+0.009+0.022+a +0.024+0.008+0.002)×10=1, 解得a =0.033.

(2)众数=195+205

2

=200;

由前三组频率之和0.02+0.09+0.22=0.33<0.50, 前四组频率之和为0.33+0.33=0.66>0.50, 故中位数位于第四组[195,205)内, 中位数估计为195+0.50-0.33

0.033

≈200.

(3)因为Z ~N(200,12.22),从而P(187.8

对应学生用书p 131

1.(2017·全国卷Ⅲ理)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.

根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加

C .各年的月接待游客量高峰期大致在7,8月

D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平衡 [解析] 根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都是减少,所以A 错误.

[答案] A

2.(2017·全国卷Ⅰ理)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm ).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).

(1)假设生产状态正常,记X 表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X ≥1)及X 的数学期望;

(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.

(i )试说明上述监控生产过程方法的合理性;

(ii )下面是检验员在一天内抽取的16个零件的尺寸; 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95

经计算得x -=116∑16i =1x i =9.97,s =116∑16i =1 (x i -x -)2=116(∑16i =1

x 2i -16x -2

)≈0.212,其中x i 为抽取的第i 个零件的尺寸,i =1,2, (16)

用样本平均数x -作为μ的估计值μ^,用样本标准差s 作为σ的估计值σ^

,利用估计值判断

是否需对当天的生产过程进行检查?剔除(μ^-3σ^,μ^+3σ^

)之外的数据,用剩下的数据估计μ和σ(精确到0.01).

附:若随机变量Z 服从正态分布N(μ,σ2),则P(μ-3σ

[解析] (1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.9974,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.0026,分析可知X ~B(16,0.0026).因此P(X ≥1)=1-P(X =0)=1-0.997416≈0.0408.

X 的数学期望为EX =16×0.0026=0.0416.

(2)(i )如果生产状态正确,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.0026,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.0408,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的. (ii )由x -=9.97,s ≈0.212,得μ的估计值为μ^=9.97,σ的估计值为σ^

=0.212,由样本数

据可以看出有一个零件的尺寸在(μ^-3σ^,μ^+3σ^

)之外,因此需对当天的生产过程进行检查.

剔除(μ^-3σ^,μ^+3σ^

)之外的数据9.22,剩下数据的平均数为 1

15

(16×9.97-9.22)=10.02, 因此μ的估计值为10.02.

∑16

i =1

x 2i =16×0.2122+16×9.972≈1591.134. 剔除(μ^-3σ^,μ^+3σ^

)之外的数据9.22,剩下数据的样本方差为 1

15

(1591.134-9.222-15×10.022)≈0.008, 因此σ的估计值为0.008≈0.09.

统计量及其抽样分布练习题

第六章 统计量及其抽样分布 练习题 一、填空题(共10题,每题2分,共计20分) 1.简单随机抽样样本均值X 的方差取决于_________和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的_________倍。 2. 设1217,,,X X X 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=,则a =____________。 3.若(5)X t ,则2X 服从_______分布。 4.已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。 5.中心极限定理是说:如果总体存在有限的方差,那么,随着_________的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于_____________。 6. 总体分布已知时,样本均值的分布为_________抽样分布;总体分布未知,大样本情况下,样本均值的分布为_________抽样分布。 7. 简单随机样本的性质满足_________和_________。 8.若(2,4)X N ,查分布表,计算概率(X 3)P ≥=_________。若(X )0.9115P a ≤=,计算a =_________。 9. 若12~(0,2),~(0,2),X N X N 1X 与2X 独立,则2212X X +()/2服从______分布。 10. 若~(16,4)X N ,则5X 服从___________分布。 二、选择题(共10题,每题1分,共计10分)

1.中心极限定理可保证在大量观察下 ( ) A . 样本平均数趋近于总体平均数的趋势 B . 样本方差趋近于总体方差的趋势 C . 样本平均数分布趋近于正态分布的趋势 D. 样本比例趋近于总体比例的趋势 2.设随机变量()(1)X t n n >,则21/Y X =服从 ( ) 。 A. 正态分布 B.卡方分布 C. t 分布 D. F 分布 3.某品牌袋装糖果重量的标准是(500±5)克。为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。下列说法中错误的是( ) A. 样本容量为10 B .抽样误差为2 C. 样本平均每袋重量是统计量 D. 498是估计值 4.设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从( ) A. (100/,25)N n B. N C. (100,25/)N n D. (100,N 5、设2(0,1),(5),X N Y χ且X 与Y 独立,则随机变量_________服从自由度为5的t 分布。 ( ) A. /X Y B. 5/Y X C. /X /

样本及抽样分布知识讲解

第六章 样本及抽样分布 【内容提要】 一、简单随机样本与统计量 1. 总体 用来表征某一随机试验的数量指标X ,其概率分布称为总体的分布。 2. 简单随机样本 在相同条件下,对总体X 进行n 次独立的重复观察,将所得结果12,,...,n X X X 称为从总体X 中抽取的容量为n 的简单随机样本,试验结束后,可得一组数值12,,...,n x x x ,称其为 12,,...,n X X X 的观察值。 注:若12,,...,n X X X 为总体X 的简单随机样本,则12,,...,n X X X 相互独立,且与总体X 同分布。 3. 统计量 设12,,...,n X X X 为总体X 的简单随机样本,12(,,...,)n T g X X X =为样本12,,...,n X X X 的实值函数,且不含任何未知参数,则称12(,,...,)n T g X X X =为一个统计量,将样本值12,,...,n x x x 代入后算出的函数值12(,,...,)n t g x x x =称为该统计量的值。 注:设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,则常用的统计量有: 4. 经验分布函数 设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,将样本值 按由小到大的顺序重新编号12,1r x x x r n ***<

样本及抽样分布

第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 §6.1 随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量: X=所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

统计学第5-6章 正态分布、 统计量及其抽样分布知识分享

统计学第5-6章正态分布、统计量及其 抽样分布

第5-6章统计量及其抽样分布 5.1正态分布 5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。 概率密度曲线图 例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等某一条件下产品的质量 如果随机变量X的概率密度为 2 2 () 2 1 (), 2 x f x e x μ σ πσ -- =-∞<<∞ 则称X服从正态分布。 记做 2 (,) X Nμσ : ,读作:随机变量X服从均值为 μ ,方差为2 σ的正态分布 其中, μ -∞<<∞ ,是随机变量X的均值,0 σ>是是随机变量X 的标准差

5.1.2正态密度函数f(x)的一些特点: ()0 f x≥, 即整个概率密度曲线都在x轴的上方。 曲线 () f x相对于xμ =对称,并在xμ = 处达到最大值, 1 () 2 fμ πσ = 。 1 μ< 2 μ< 3 μ 曲线的陡缓程度由 σ 决定: σ 越大,曲线越平缓;σ越小,曲线越陡峭当 x 趋于无穷时,曲线以 x轴为其渐近线。 标准正态分布

当 0,1 μσ == 时, 2 2 1 () 2 x f x e π - = , x -∞<<∞ 称 (0,1) N 为标准正态分布。 标准正态分布的概率密度函数: ()x ? 标准正态分布的分布函数: ()x Φ 任何一个正态分布都可以通过线性变换转化为标准正态分布 设 2 (,) X Nμσ : ,则 (0,1) X Z N μ σ - =: 变量 2 11 (,) X Nμσ :与变量2 22 (,) Y Nμσ :相互独立,则有 22 1212 +(+,+) X Y Nμμσσ : 5.1.3 正态分布表:可以查的正态分布的概率值 ()1() x x Φ-=-Φ

抽样分布习题()

抽样分布习题 1.抽样分布是指( C ) A 一个样本各观测值的分布 B 总体中各观测值的分布 C 样本统计量的分布 D 样本数量的分布 2.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的均值为( A )。 A μ B x C 2σ D n 2 σ 3.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的方差为( D )。 A μ B x C 2σ D n 2 σ 4.从一个均值μ=10,标准差σ=0.6的总体中随机选取容量为n=36的样本。假定该总体并不是很偏的,则样本均值x 小于 9.9的近似概率为( A )。 A 0.1587 B 0.1268 C 0.2735 D 0.6324 5.假设总体服从均匀分布,从此总体中抽取容量为36的样本,则样本均值的抽样分布( B ) A 服从非正态分布 B 近似正态分布 C 服从均匀分布 D 服从2χ分布 6.从服从正态分布的无限总体中分别抽取容量为4,16,36的样

本,当样本容量增大时,样本均值的标准差( C )A 保持不变 B 增加 C 减小D 无法确定 7. 总体均值为50,标准差为8,从此总体中随机抽取容量为64的样本,则样本均值的抽样分布的均值和标准误差分布为( B )。 A 50,8 B 50,1 C 50,4 D 8,8 8.某大学的一家快餐店记录了过去5年每天的营业额,每天营业额的均值为2500元,标准差为400元。由于在某些节日的营业额偏高,所以每日营业额的分布是右偏的,假设从这5年中随机抽取100天,并计算这100天的平均营业额,则样本均值的抽样分布是( B )。 A 正态分布,均值为250元,标准差为40元 B 正态分布,均值为2500元,标准差为40元 C 右偏分布,均值为2500元,标准差为400元 D 正态分布,均值为2500元,标准差为400元 9. 某班学生的年龄分布是右偏的,均值为22,标准差为4.45,如果采取重复抽样的方法从该班抽取容量为100的样本,则样本均值的抽样分布是( A ) A 正态分布,均值为22,标准差为0.445 B 分布形状未知,均值为22,标准差为4.45

习题六 样本及抽样分布.

习题六样本及抽样分布 一、填空题 1.设来自总体的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =; 2.在总体中随机地抽取一个容量为 36 的样本,则均值落在4与6之间的概率 = 0.9332 ; 3.设某厂生产的灯泡的使用寿命 (单位:小时,抽取一容量为9的样本,得到 ,则; 4.设为总体的一个样本,则 0.025 ; 5.设为总体的一个样本,且服从分布,这里, ,则1/3 ; 6.设随机变量相互独立,均服从分布且与分别是来自总体的简单随机样本,则统计量服从参数为 9 的 t 分布。 7.设是取自正态总体的简单随机样本且 ,则 0.05 , 0.01 时,统计量服从分布,其自由度为 2 ;

8.设总体 X 服从正态分布,而是来自总体的简单随机样 本,则随机变量 服从 F 分布,参数为 10,5 ; 9.设随机变量则 F(n,1 ; 10.设随机变量且,A为常数,则 0.7 二、选择题 1.设是来自总体的简单随机样本,是样本均值, 记 则服从自由度的分布的随机变量是( A ); A. B. C. D. 2.设是经验分布函数,基于来自总体的样本,而是总体的分布函数,则下列命题错误的为,对于每个给定的( B ) A.是分布函数 B.依概率收敛于 C.是一个统计量 D.其数学期望是

3.设总体服从0-1分布,是来自总体的样本,是样本均值,则下列各选项中的量不是统计量的是( B ) A. B. C. D. 4.设是正态总体的一个样本,其中已知而未知,则下列各选项中的量不是统计量的是( C )。 A. B. C. D. 5.设和分别来自两个正态总体和的样本,且相互独立,分别为两个样本的样本方差,则服从的统计量是( B ) A. B. C. D. 6.设是正态总体的一个样本,和分别为样本均值和样本方差,则下面结论不成立的有( D ) A.相互独立; B.与相互独立; C.与相互独立D.与相互独立。

抽样分布习题与答案

第 4 章抽样分布自测题选择题 1.抽样分布是指() A. 一个样本各观测值的分布C. 样本统计量的分布 B. 总体中各观测值的分布D. 样本数量的分布 2.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的均值为() 2 A. B. x C.2 D. n 3.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的方差为() 2 A. B.x C.2 D. n 4.从均值为,方差为2 n 的样本,则()的任意一个总体中抽取大小为 A.当 n 充分大时,样本均值x 的分布近似服从正态分布 B.只有当 n<30 时,样本均值x的分布近似服从正态分布 C.样本均值 x 的分布与n无关 D. 无论 n 多大,样本均值x 的分布都是非正态分布 5.假设总体服从均匀分布,从该总体中抽取容量为 36 的样本,则样本均值的抽样分布() A. 服从非正态分布 B. 近似正态分布 C. 服从均匀分布 D. 服从 2 分布 6. 从服从正态分布的无限总体中分别抽取容量为4,16,36的样本,则当样本容量增大时,样 本均值的标准差() A. 保持不变 B. 增加 C.减小 D.无法确定 7. 某大学的一家快餐店记录了过去 5 年每天的营业额,每天营业额的均值为2500 元,标准差为 400 元。由于在某些节日的营业额偏高,所以每日营业额的分布是右偏的,假设从这5年中随机抽取100 天,并计算这100 天的平均营业额,则样本均值的抽样分布是() A. 正态分布,均值为250 元,标准差为40 元 B. 正态分布,均值为2500 元,标准差为40 元 C.右偏,均值为2500 元,标准差为400 元 D. 正态分布,均值为2500 元,标准差为400 元 8. 在一个饭店门口等待出租车的时间是左偏的,均值为12 分钟,标准差为 3 分钟。如果从饭店门口随机抽取 81 名顾客并记录他们等待出租车的时间,则样本均值的抽样分布是() A. 正态分布,均值为12 分钟,标准差为0.33 分钟 B. 正态分布,均值为12 分钟,标准差为 3 分钟 C. 左偏分布,均值为12 分钟,标准差为 3 分钟

(完整版)样本及抽样分布.doc

第六章样本及抽样分布 【基本要求】 1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布—— 2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】 4 学时 【授课内容】 §6.0前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一 门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性; 而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的 一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来 选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理 统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 § 6.1随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是 个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每 个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几 项数量指标 X ( 可以是向量 ) 和该数量指标X在总体的分布情况。在上述例子中 X 是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X 的这样或那样的数值,因而这个数量指标X 是一个随机变量(或向量),而 X 的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标 X 可能取值的全体组成的集合等同起来。 定义 1:把研究对象的全体(通常为数量指标X 可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X 的分布的研究,所谓总体的分布也就是数量指 标 X 的分布,因此, X 的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体 X 。根据总体中所包括个体的总数,将总体分为:有限总体 和无限总体。 例 1:考察一块试验田中小麦穗的重量: X =所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

二项分布与正态分布

第七章假设检验 第一节二项分布 二项分布的数学形式·二项分布的性质 第二节统计检验的基本步骤 建立假设·求抽样分布·选择显著性水平和否定域·计算检验统计量·判定第三节正态分布 正态分布的数学形式·标准正态分布·正态分布下的面积·二项分布的正态近似法 第四节中心极限定理 抽样分布·总体参数与统计量·样本均值的抽样分布·中心极限定理 第五节总体均值和成数的单样本检验 σ已知,对总体均值的检验·学生t分布(小样本总体均值的检验)·关于总体成数的检验 一、填空 1.不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分布就趋于()分布。 2.统计检验时,被我们事先选定的可以犯第一类错误的概率,叫做检验的( ),它决定了否定域的大小。 3.假设检验中若其他条件不变,显著性水平的取值越小,接受原假设的可能性越(),原假设为真而被拒绝的概率越()。 4.二项分布的正态近似法,即以将B(x;n,p)视为()查表进行计算。 5.已知连续型随机变量X~N(0,1),若概率P{X ≥λ}=0.10,则常数λ=()。 6.已知连续型随机变量X~N(2,9),函数值 9772 .0 )2( = Φ ,则概率 }8 {< X P= ()。 二、单项选择 1.关于学生t分布,下面哪种说法不正确()。 A 要求随机样本 B 适用于任何形式的总体分布 C 可用于小样本 D 可用样本标准差S代替总体标准差σ 2.二项分布的数学期望为()。 A n(1-n)p B np(1- p) C np D n(1- p)。 3.处于正态分布概率密度函数与横轴之间、并且大于均值部分的面积为()。 A 大于0.5 B -0.5 C 1 D 0.5。

03 第三节 正态总体的抽样分布

第三节 正态总体的抽样分布 分布图示 ★ 抽样分布 ★ 单正态总体的抽样分布 ★ 例 1 ★ 例 2 ★ 例 3 ★ 双正态总体的抽样分布 ★ 例 4 ★ 例 5 ★ 内容小结 ★ 课堂练习 ★ 习题12-3 内容要点 一、抽样分布 有时, 总体分布的类型虽然已知, 但其中含有未知参数,此时需对总体的未知参数或对总体的重要数字特征(如数学期望、分差等) 进行统计推断, 此类问题称为参数统计推断.在参数统计推断问题中, 常需利用总体的样本构造出合适的统计量, 并使其服从或渐近地服从已知的总体分布. 统计学中泛称统计量分布为抽样分布. 二、单正态总体的抽样分布 设总体X 的均值μ,方差为2σ,n X X X ,,,21 是取自X 的一个样本,X 与2S 分别为该样本的样本均值与样本方差, 则有 ,)(,)(2σμ==X D X E )(2S E .2 σ= 定理1 设总体),,(~2σμN X n X X X ,,,21 是取自X 的一个样本, X 与2S 分别为该样本的样本均值与样本方差, 则有 (1) )/,(~2n N X σμ; (2) ).1,0(~/N n X U σμ-= 定理2 设总体),,(~2σμN X n X X X ,,,21 是取自X 的一个样本, X 与2S 分别为该样本的样本均值与样本方差, 则有 (1) 2χ=);1(~)(1 1 212222--=-∑=n X X S n n i i χσσ (2) X 与2S 相互独立. 定理3 设总体),,(~2σμN X n X X X ,,,21 是取自X 的一个 样本, X 与2S 分别为该样本的样本均值与样本方差, 则有 (1) )(~)(121222n X n i i χμσχ∑=-= (2) ).1(~/--=n t n S X T μ 三、双正态总体的抽样分布 定理 4 设),(~211σμN X 与),(~222σμN Y 是两个相互独立的正态总体, 又设 1 ,,,21n X X X 是取自总体X 的样本, X 与21S 分别为该样本的样本均值与样本方差. 2 ,,,21n Y Y Y 是取自总体Y 的样本, Y 与22S 分别为此样本的样本均值与样本方差. 再记2w S 是21S 与22 S 的加权平均, 即

抽样分布和样本分布

抽样分布和样本分布 导读:我根据大家的需要整理了一份关于《抽样分布和样本分布》的内容,具体内容:你们知道各是什么吗?以下是有我为大家整理的,希望能帮到你。抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统... 你们知道各是什么吗?以下是有我为大家整理的,希望能帮到你。抽样分布: 从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统计推断的理论基础。 如果从容量为的有限总体抽样,若每次抽取容量为的样本,那么一共可以得到N取n的组合个样本(所有可能的样本个数)。抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。由平均数构成的新总体的分布,称为平均数的抽样分布。随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。 样本分布: 总体是指考察的对象的全体,个体是总体中的每一个考察的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目样本分布是用来估计总体分布的。样本分布有区别于总体分布,它是从总体中按一定的分组标志选出来的部分样本容量。

实际中很多不确定现象都可以用随机变量描述,而应用中的一个十分重要的问题是找到随机变量的分布或其数字特征。例如:某进出口贸易公司进口了10万台微型计算器,按产品技术规定,使用寿命小于4000小时即为次品,且次品率大于1% 就不接受这批产品。如何得知这批产品的次品率呢?是否要测量每一台计算器呢?显然,这是不现实的,解决这个问题的好办法就是随机抽样,然后根据抽样检验得到的次品率来估计整批产品的次品率。也就是从10万台产品中按随机原则,抽取一部分(假如100件)产品组成一个样本,由样本(100件产品)次品率推断整批产品的次品率。 这里,我们把被观察对象的全体(本例中的10万台计算器)称作总体,把从总体中随机抽取的(被抽中的100台计算器)小群体称作样本,而样本中所包含的个体单位数目称为样本容量(100个)。 对于这批计算器,我们关心的是它的使用寿命(低于4000小时的比例有多少)的分布,设X表示"任一台计算器的使用寿命",它是一个随机变量,我们把随机抽中的100件产品看作是100个随机变量X1,X2......,X100,每一个计算器的使用寿命都是一个随机变量,一旦测试完毕,测试的结果就是100个观测值x1,x2,......x100, 统计抽样的任务就是根据测试结果x1,x2,......x100来估计总体X的分布情况。 我们作如下概括:设X是一个随机变量,X1,X2......,Xn是一组相互独立与X具有相同分布的随机变量,称X为总体,X1,X2......,Xn为来自总体的简单随机样本,简称样本,n为样本容量,称样本观察值为样本值,由于按随机原则取样,在试验之前,人们无法知道试验的结果,

样本与抽样分布

第六章样本与抽样分布 §6.1 数理统计的基本概念 一.数理统计研究的对象 例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X表示。 (1)若规定寿命低于1000小时的产品为次品。此问题是求P(X 1000)=F(10000),求F(x)? (2)从平均寿命、使用时数长短差异来看其质量,即求E(x)?、D(x)?。 要解决二个问题

1.试验设计抽样方法。 2.数据处理或统计推断。 方法具有“从局部推断总体”的特点。 二.总体(母体)和个体 1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。 说明: (1)对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他们在整体中的分布。所以总体是个体的数量指标的全体。 (2)为研究方便将总体与一个R.V X

对应(等同)。 a.总体中不同的数量指标的全体, 即是R.V.X的全部取值。 b.R.V X的分布即是总体的分布 情况。 例:一批产品是100个灯泡,经测试其寿命是: 1000小时1100小时 1200小时 20个30个50个 X 1000 1100 1200 P 20/100 30/100

50/100 (设X表示灯泡的寿命)可知R.V.X的分布律, 就是总体寿命的分布,反之亦然。 常称总体X,若R.VX~F(x),有时也用F(x)表示一个总体。 (3)我们对每一个研究对象可能要观测两个或多个数量指标,则可用多维随机向量(X,Y,Z, …)去描述总体。 2.总体的分类 有限总体 无限总体

三.简单随机样本. 1.定义6.1 :从总体中抽得的一部分个体组成的集合称为子样(样本),取得的个体叫样品,样本中样品的个数称为样本容量(也叫样本量)。每个样品的测试值叫观察值。 取得子样的过程叫抽样。 样本的双重含义: (1)随机性: 用(X 1,X 2, ……X n) n维随机向量表 示。 X i表示第i个被抽到的个体,是随机变量。(i=1,2,…n)

正态总体下的四大分布

《概率论与数理统计》第六章样本及抽样分布 (2)正态总体下的四大分布:正态分布 设n x x x ,,,21 为来自正态总体),(2 σ μN 的一个样本,则样本函数 ). 1,0(~/N n x u def σμ -例:设总体ξ~2 12(1,2 ),,,n N ξξξ 且是取自ξ的样本,则( D ) A) 1(0,1) 2 N ξ-B) 1(0,1) 4N ξ-C) ( ) 1(0,1) 2 N ξ-D ) (0,1) N ξt 分布 设n x x x ,,,21 为来自正态总体),(2 σ μN 的一个样本,则样本函数), 1(~/--n t n s x t def μ其中t(n-1)表示自由度为n-1的t 分布。 分布 2χ设n x x x ,,,21 为来自正态总体),(2 σ μN 的一个样本,则样本函数 ), 1(~)1(22 2 --n S n w def χσ其中)1(2 -n χ 表示自由度为n-1的2χ 分布

例:已知F 0.1(7,20)=2.04,则F 0.9(20,7)=_______0.4902_____. 例.对于给定的正数α,10<<α ,设αu ,)(2 n α χ,)(n t α,),(21n n F α分别是)1,0(N ,)(2n χ,)(n t ,),(21n n F 分布的下α 分位数,则下面结论中不正确... 的是(B ) (A)α α --=1u u (B)) () (2 2 1n n ααχχ-=-(C)) ()(1n t n t αα--=(D)) ,(1 ) ,(12211n n F αα= -2、设X 、Y 相互独立,且都服从标准正态分布,则Z = 2 Y X 服从______t(1)_____分布(同时要写出 分 布的参数). 3.设ξ和η相互独立且都服从N(0,4),而41,ξξ 和41,ηη 分别是来自总体ξ和η的样本,则统计量2 4 2 141......ηηξξ++++= U 服从的分布为 ) 4(t 。

与正态总体有关的抽样分布定理证明

定理:设12,,,n X X X 是来自正态总体2(,)N μσ的一个随机样本,记 1 n i i X X n == ∑,2 2 1 ()n i i X X S n =-= ∑ 则有如下性质存在: (1)2 ~, X N n σμ?? ?? ? (2) 2 22 ~(1)nS n χσ - (3 ~(1)X t n - 证明: (1) 已知 ..212,, ,~(,)i i d n X X X N μσ 根据正态分布的性质有 212~(,)n X X X N n n μσ++ + 样本均值为 12n X X X X n ++ += 它的抽样分布为 2~(,)X N μσ (2) 对样本12,, ,n X X X 进行正交变换 Z AX = 其中()12,, ,n X X X X '=,()12,,,n Z Z Z Z '=,A 为正交矩阵

00 A n ?? ? ? ? ? ? = ? ? - ? ? ? ? ? 正交变换之后, i Z,1,2,, i n =相互独立,且 2 112 ~ (0,) Z X X Nσ = 2 2123 ~(0,) Z X X X Nσ =+ 2 112 ~(0,) ( n n Z X X X N n n σ- =++- ? 2 12 ~,) n n Z X X X N n σ =++ 即正交变换之后 2 ~(0,) i Z Nσ,1,2,,1 i n =- 2 ~,) n Z Nσ 由 i Z相互独立,且2 ~(0,) i Z Nσ,1,2,,1 i n =-,推导出 ~(0,1) i Z N σ ,1,2,,1 i n =- 标准正态分布的平方和服从2 χ分布,即有 1 2 2 1 2 ~(1) n i i Z n χ σ - =- ∑ 又因为

样本及抽样分布

样本及抽样分布 §6.1 基本概念 一、总体: 在统计学中, 我们把所研究的全部元素组成的集合称作母体或总体, 总体中的每一个元素称为个体。 我们只研究感兴趣的某个或者几个指标(记为X),因此

把这些指标的分布称为总体的分布,记为X~F(x)。 二、样本: 设总体X具有分布函数 F(x),若X 1, X 2 ,…,X n 是具有分布 函数F(x)的相互独立的随机向量,则称其为总体F(或总体X )的简单随机样本, 简称样本, 它们的观察值x 1,x 2 , …, x n 称为样

本观察值, 又称为X 的n 个独立的观察值。 三、统计量: 设X 1, X 2, … , X n 是来自总体X 的一个样本, g (X 1, X 2, … , X n )是一个与总体分布中未知参数无关的样本的连续函数,则称g (X 1,X 2,… ,X n )为统计量。

统计量是样本的函数,它是一个随机变量,如果x 1, x 2, … , x n 是样本观察值, 则g (x 1, x 2, … , x n )是统计量g (X 1, X 2, … , X n )的一个观察值. 四、 常用的统计量:

, ,)(x 11s ,,x 1x 1. n 1 2 i 2n 1 i 称为样本方差均值仍称为样本 它们的观察值为∑∑==--==i i x n n . B ,, 1,2,X A ,1k 2.222 21S S n n B k ≈-====当样本容量很大时时当时当3.k k k k 若总体X 的k 阶矩E(X )存在, 则当n 时, A . P 注: n i i 1 11. X X ; n ==∑样本均值2 n 2 i i 1 12. S (X ); n-1X ==-∑样本方差n k k i 1 13. k A X , k 1, 2, ; n i ===∑样本阶原点矩n k i i 1 14. k B (X ) , k 2, 3, . n k X ==-=∑样本阶中心矩

(完整word版)习题六样本及抽样分布

习题六 样本及抽样分布 一、填空题 1.设来自总体X 的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =22.716; 2.在总体~(5,16)X N 中随机地抽取一个容量为 36 的样本,则均值X 落在4与6之间的概率 = 0.9332 ; 3. 设某厂生产的灯泡的使用寿命2~(1000,)X N σ (单位:小时),抽取一容量为9的样本,得到940,100x s ==,则(940)P X <= ; 4.设127,,...,X X X 为总体2 ~(0,0.5)X N 的一个样本,则7 21 (4)i i P X =>=∑ 0.025 ; 5.设126,,...,X X X 为总体~(0,1)X N 的一个样本,且cY 服从2χ分布,这里, 22123456()()Y X X X X X X =+++++,则c =1/3 ; 6.设随机变量,X Y 相互独立,均服从2(0,3)N 分布且129,,...,X X X 与129,,...,Y Y Y 分 别是来自总体,X Y 的简单随机样本,则统计量U =服从参数为 9 的 t 分布。 7.设1234,,,X X X X 是取自2~(0,2)X N 正态总体的简单随机样本且 22!234(2)(34),Y a X X b X X =-+-,则a = 0.05 ,b = 0.01 时,统计量Y 服从 2χ分布,其自由度为 2 ; 8.设总体 X 服从正态分布2~(0,2)X N ,而1215,,...,X X X 是来自总体的简单随机 样本,则随机变量 22 110 22 1115...2(...) X X Y X X ++=++ 服从 F 分布,参数为 10,5 ; 9.设随机变量21 ~()(1),,X t n n Y X >=则~Y F(n,1) ; 10.设随机变量~(,)X F n n 且()0.3P X A >=,A 为常数,则1 ()P X A > = 0.7 二、选择题 1.设12,,...,n X X X 是来自总体2(,)N μσ的简单随机样本,X 是样本均值, 记22222 21 23111 111(),(),(),11n n n i i i i i i S X X S X X S X n n n μ====-=-=---∑∑∑ 2 241 1(),n i i S X n μ==-∑则服从自由度1n -的t 分布的随机变量是T =( A ); A . B C D 2.设()n F x 是经验分布函数,基于来自总体X 的样本,而()F x 是X 总体的 分布函数,则下列命题错误的为,对于每个给定的,()n x F x ( B ) A .是分布函数 B .依概率收敛于()F x C .是一个统计量 D .其数学期望是()F x

样本及抽样分布讲解学习

样本及抽样分布

第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。

§6.1 随机样本 一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量:

统计学第5-6章 正态分布、 统计量及其抽样分布讲解学习

第5-6章 统计量及其抽样分布 5.1正态分布 5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。 概率密度曲线图 例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等 某一条件下产品的质量 如果随机变量X 的概率密度为 22 ()21 (),2x f x e x μσπσ --=-∞<<∞ 则称X 服从正态分布。 记做 2 (,)X N μσ:,读作:随机变量X 服从均值为μ,方差为2 σ的正态分布 其中, μ-∞<<∞,是随机变量X 的均值,0σ>是是随机变量X 的标准差 5.1.2正态密度函数f(x)的一些特点: ()0f x ≥,即整个概率密度曲线都在x 轴的上方。 曲线 ()f x 相对于x μ=对称,并在 x μ=处达到最大值,

1 () 2 fμ πσ = 。 1 μ< 2 μ< 3 μ 曲线的陡缓程度由 σ 决定:σ越大,曲线越平缓;σ越小,曲线越陡峭当 x 趋于无穷时,曲线以x轴为其渐近线。 标准正态分布 当 0,1 μσ == 时, 2 2 1 () 2 x f x e π - = , x -∞<<∞ 称 (0,1) N 为标准正态分布。

标准正态分布的概率密度函数: ()x ? 标准正态分布的分布函数: ()x Φ 任何一个正态分布都可以通过线性变换转化为标准正态分布 设 2 (,) X Nμσ : ,则 (0,1) X Z N μ σ - =: 变量 2 11 (,) X Nμσ :与变量2 22 (,) Y Nμσ :相互独立,则有 22 1212 +(+,+) X Y Nμμσσ : 5.1.3 正态分布表:可以查的正态分布的概率值()1() x x Φ-=-Φ 例:设 (0,1) X N :,求以下概率 (1) ( 1.5) P X< (2) (2) P X> (3) (13) P X -<≤

样本与抽样分布

样本与抽样分布 §6.1 数理统计的基本概念 一.数理统计研究的对象 例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X表示。(1)若规定寿命低于1000小时的产品为次品。此问题是求P(X 1000)=F(10000),求F(x)? (2)从平均寿命、使用时数长短差异来看其质量,即求E(x)?、D(x)?。 要解决二个问题 1.试验设计抽样方法。 2.数据处理或统计推断。 方法具有“从局部推断总体”的特点。 二.总体(母体)和个体 1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。 说明: (1)对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他 们在整体中的分布。所以总体是个体的数量指标的全体。 (2)为研究方便将总体与一个R.V X对应(等同)。 a.总体中不同的数量指标的全体,即是R.V.X的全部取值。 b.R.V X的分布即是总体的分布情况。 例:一批产品是100个灯泡,经测试其寿命是: 1000小时1100小时1200小时 20个30个50个 X 1000 1100 1200 P 20/100 30/100 50/100 (设X表示灯泡的寿命)可知R.V.X的分布律, 就是总体寿命的分布,反之亦然。 常称总体X,若R.VX~F(x),有时也用F(x)表示一个总体。

(3)我们对每一个研究对象可能要观测两个或多个数量指标,则可用多维随机向量(X,Y,Z, …)去描述总体。 2.总体的分类 有限总体 无限总体 三.简单随机样本. 1.定义6.1 :从总体中抽得的一部分个体组成的集合称为子样(样本),取得的个体叫样品,样本中样品的个数称为样本容量(也叫样本量)。每个样品的测试值叫观察值。 取得子样的过程叫抽样。 样本的双重含义: (1)随机性: 用(X 1,X 2,……X n ) n 维随机向量表示。 X i 表示第i 个被抽到的个体,是随机变量。(i=1,2,…n ) (2)确定性: (x 1,x 2, (x) n )表示n 个实数,即是每个样品X i 观测值x i (i=1,2,…n)。 2.定义6.2: 设总体为X ,若X 1,X 2……X n 相互独立且与X 同分布,则称(X 1,X 2…X n )为来自总体X 的容量为n 的简单随机样本(简称样本)。 3.已知总体的分布写出子样的分布 (1)已知总体X ~F(x ),则样品X i ~F(x i ) i=1,2…n 样本(X 1,X 2…X n )的联合分布为: F( x 1 ,x 2 …x n )=P(X 1≤ x 1 ,X ≤ 2x 2 …X ≤ n x n ) =∏=n i 1 P(X ≤ x i ) =∏=n i 1 F(x i ) 若总体X ~f( x ),样品X i ~f(x i ) i=1,2……n

相关文档
最新文档