第七讲 随机抽样、样本估计总体及正态分布

第七讲   随机抽样、样本估计总体及正态分布
第七讲   随机抽样、样本估计总体及正态分布

第七节随机抽样、样本估计总体

及正态分布

学习目标:理解随机抽样的必要性和重要性;会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法;了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点;理解样本数据标准差的意义和作用,会计算数据标准差;能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题;利用实际问题的直方图,了解正态分布曲线的特点及曲线所表示的意义。

一、例题分析:

例1.1、某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是()

A.分层抽样法,系统抽样法

B.分层抽样法,简单随机抽样法

C.系统抽样法,分层抽样法

D.简单随机抽样法,分层抽样法

2、(09广东)某单位200名职工的年龄分布情况如图2,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号…,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是。若用分层抽样方法,则40岁以下年龄段应抽取人.

小结:三种抽样方法的联系与区别:

从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是 ( ) (A)简单随机抽样法(B)抽签法 (C)随机数表法 (D)

2、(理科做)(09湖南)一个总体分为A,B两层,其个体数之比为

用分层抽样方法从总体中抽取一个容量为10的样本,已知B

层中甲、乙都被抽到的概率为1/28,则总体中的个数数位。

例2.1、(09山东)某工厂对一批产品进行了抽样检测.右图是

根据抽样检测后的产品净重(单位:克)数据绘制的频率分布

直方图,其中产品净重的范围是[96,106],样本数据分组为

[96,98),[98,100),[100,102),[102,104),[104,106],已知样

本中产品净重小于100克的个数是36,则样本中净重大于或等于98

品的个数是( ) A.90 B.75 C. 60 D.45 2、某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们所有

比赛得分的情况用如图2所示的茎叶图表示, 则甲、乙两名运动

员得分的中位数分别为( ) A .19、13 B .13、19 C .20、18 D .18、20

3、(09江苏)某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:则这两组数据的方差中较小的一个为2

s = .小结:1、样本估计总体的方法有两种:①用样本的频率分布估计总体(如频率分布直方图、频率分布折线图、茎叶图)②用样本的数字特征估计总体(如平均数、标准差、方差等); 2、方差和标准差都是刻画数据波动大小的数字特征,一般地,设一组样本数据1x ,2x ,…,

n x ,其平均数为-x =1n

i i X n

=∑,则方差21

2)(1 x x n s n i i -=∑=,标准差

21

)(1-=-=∑x x n s n

i i ;

3、中位数、众数的概念:

4、在频率分布直方图中:①小矩形的面积=组距

组距频率

?

=频率;②众数最高矩形的中点的横

坐标;③中位数的左边与右边的直方图的面积相等,可以由此估计中位数的值 拓展变式:1、设矩形的长为a ,宽为b ,其比满足b ∶a =

618.02

1

5≈-,这种矩形给人以美感,称为黄金矩形。黄金矩形常应用于工艺品设计中。下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620 根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是( ) A. 甲批次的总体平均数与标准值更接近 B. 乙批次的总体平均数与标准值更接近 C. 两个批次总体平均数与标准值接近程度相同 D. 两个批次总体平均数与标准值接近程度不能确定

2、下图是样本容量为200的频率分布直方图。 根据样本的频率分布直方图估计,样本数据落在【6,10】内的频数为 ,数据落在(2,10)内的概率约为 。

3、随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm),获

得身高数据的茎叶图如图7。(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差;(3)现从乙班这10名同学中随机抽取两名身高不低于173cm 的同学,求身高为176cm 的同学被抽中的概率。

例3.(理科做)(08安徽).设两个正态分布2111()(0)N μσσ>,和2

222()(0)N μσσ>,的密度函数图像如图所示。则有( )

A .1212,μμσσ<<

B .1212,μμσσ<>

C .1212,μμσσ><

D .1212,μμσσ>> 小结:

正态曲线的性质:①曲线位于x 轴上方,与x 轴不相交; ②曲线是单峰的,关于直线x =μ 对称;③曲线在x =μ处达到峰值

π

σ21

;④曲线与x 轴之间的面积为1;⑤当σ一定时,曲线随μ质的变化沿x 轴平

移;⑥当μ一定时,曲线形状由σ确定:σ越大,曲线越“矮胖”,表示总体分布越集中;σ越小,曲线越“高瘦”,表示总体分布越分散。

二、体验高考:

1

则样本数据落在上的频率为

A. 0.13

B. 0.39

C. 0.52

D. 0.64 2、(11湖北理5)已知随机变量ξ服从正态分布(

)2

,2σ

N ,且()8.04=<ξP ,则

()=<<20ξP ( ) A. 6.0 B . 4.0 C. 3.0 D. 2.0

3、一汽车厂生产A,B,C 三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):按类型分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A 类轿车10辆 (1)求z 的值.

(2)用分层抽样的方法在C 类轿车中抽取一个容量为5的样本.将该样本看成一个总体,从中任取2辆,求至少有1辆舒适型轿车的概率;

三、巩固提高:

1、对于样本频率分布直方图与总体密度曲线的关系,下列说法正确的是( ) A 、频率分布直方图与总体密度曲线无关 B 、频率分布直方图就是总体密度曲线

C 、样本容量很大的频率分布直方图就是总体密度曲线

D 、如果样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于总体密度曲线

2、某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1:2:1,用

轿车A 轿车B 轿车C 舒适型 100 150 z 标准型 300 450 600

分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980h ,1020h ,1032h ,则抽取的100件产品的使用寿命的平均值为___________h . 3、根据空气质量指数API (为整数)的不同,可将空气质量分级如下表:对某城市一年(365天)的空气质量进行监测,获得的API 数据按照区间]50,0[,]100,50(,]150,100(,]200,150(,]250,200(,]300,250(进行分组,得到频率分布直方图如图5. (1)求直方图中x 的值; (2)计算一年中空气质量分别为良和轻

微污染的天数; (3)求该城市某一周至少有2天的空气质量为良或轻微污染的概率.

4、某良种培育基地正在培育一种小麦新品种A ,将其与原有的一个优良品种B 进行对照 试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:

品种A:357,359,367,368,375,388,392,399,400,405,412,414, 415,421,423,423,427,430,430,434,443,445,445,451,454 品种B :363,371,374,383,385,386,391,392,394,394,395,397

397,400,401,401,403,406,407,410,412,415,416,422,430 (Ⅰ)完成所附的茎叶图

(Ⅱ)用茎叶图处理现有的数据,有什么优点?

(Ⅲ)通过观察茎叶图,对品种A 与B 的亩产量及其稳定性进行比较,写出统计结论。

统计量及其抽样分布练习题

第六章 统计量及其抽样分布 练习题 一、填空题(共10题,每题2分,共计20分) 1.简单随机抽样样本均值X 的方差取决于_________和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的_________倍。 2. 设1217,,,X X X 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=,则a =____________。 3.若(5)X t ,则2X 服从_______分布。 4.已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。 5.中心极限定理是说:如果总体存在有限的方差,那么,随着_________的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于_____________。 6. 总体分布已知时,样本均值的分布为_________抽样分布;总体分布未知,大样本情况下,样本均值的分布为_________抽样分布。 7. 简单随机样本的性质满足_________和_________。 8.若(2,4)X N ,查分布表,计算概率(X 3)P ≥=_________。若(X )0.9115P a ≤=,计算a =_________。 9. 若12~(0,2),~(0,2),X N X N 1X 与2X 独立,则2212X X +()/2服从______分布。 10. 若~(16,4)X N ,则5X 服从___________分布。 二、选择题(共10题,每题1分,共计10分)

1.中心极限定理可保证在大量观察下 ( ) A . 样本平均数趋近于总体平均数的趋势 B . 样本方差趋近于总体方差的趋势 C . 样本平均数分布趋近于正态分布的趋势 D. 样本比例趋近于总体比例的趋势 2.设随机变量()(1)X t n n >,则21/Y X =服从 ( ) 。 A. 正态分布 B.卡方分布 C. t 分布 D. F 分布 3.某品牌袋装糖果重量的标准是(500±5)克。为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。下列说法中错误的是( ) A. 样本容量为10 B .抽样误差为2 C. 样本平均每袋重量是统计量 D. 498是估计值 4.设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从( ) A. (100/,25)N n B. N C. (100,25/)N n D. (100,N 5、设2(0,1),(5),X N Y χ且X 与Y 独立,则随机变量_________服从自由度为5的t 分布。 ( ) A. /X Y B. 5/Y X C. /X /

样本及抽样分布知识讲解

第六章 样本及抽样分布 【内容提要】 一、简单随机样本与统计量 1. 总体 用来表征某一随机试验的数量指标X ,其概率分布称为总体的分布。 2. 简单随机样本 在相同条件下,对总体X 进行n 次独立的重复观察,将所得结果12,,...,n X X X 称为从总体X 中抽取的容量为n 的简单随机样本,试验结束后,可得一组数值12,,...,n x x x ,称其为 12,,...,n X X X 的观察值。 注:若12,,...,n X X X 为总体X 的简单随机样本,则12,,...,n X X X 相互独立,且与总体X 同分布。 3. 统计量 设12,,...,n X X X 为总体X 的简单随机样本,12(,,...,)n T g X X X =为样本12,,...,n X X X 的实值函数,且不含任何未知参数,则称12(,,...,)n T g X X X =为一个统计量,将样本值12,,...,n x x x 代入后算出的函数值12(,,...,)n t g x x x =称为该统计量的值。 注:设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,则常用的统计量有: 4. 经验分布函数 设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,将样本值 按由小到大的顺序重新编号12,1r x x x r n ***<

样本及抽样分布

第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 §6.1 随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量: X=所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

抽样分布习题与答案

第 4 章抽样分布自测题选择题 1.抽样分布是指() A. 一个样本各观测值的分布C. 样本统计量的分布 B. 总体中各观测值的分布D. 样本数量的分布 2.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的均值为() 2 A. B. x C.2 D. n 3.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的方差为() 2 A. B.x C.2 D. n 4.从均值为,方差为2 n 的样本,则()的任意一个总体中抽取大小为 A.当 n 充分大时,样本均值x 的分布近似服从正态分布 B.只有当 n<30 时,样本均值x的分布近似服从正态分布 C.样本均值 x 的分布与n无关 D. 无论 n 多大,样本均值x 的分布都是非正态分布 5.假设总体服从均匀分布,从该总体中抽取容量为 36 的样本,则样本均值的抽样分布() A. 服从非正态分布 B. 近似正态分布 C. 服从均匀分布 D. 服从 2 分布 6. 从服从正态分布的无限总体中分别抽取容量为4,16,36的样本,则当样本容量增大时,样 本均值的标准差() A. 保持不变 B. 增加 C.减小 D.无法确定 7. 某大学的一家快餐店记录了过去 5 年每天的营业额,每天营业额的均值为2500 元,标准差为 400 元。由于在某些节日的营业额偏高,所以每日营业额的分布是右偏的,假设从这5年中随机抽取100 天,并计算这100 天的平均营业额,则样本均值的抽样分布是() A. 正态分布,均值为250 元,标准差为40 元 B. 正态分布,均值为2500 元,标准差为40 元 C.右偏,均值为2500 元,标准差为400 元 D. 正态分布,均值为2500 元,标准差为400 元 8. 在一个饭店门口等待出租车的时间是左偏的,均值为12 分钟,标准差为 3 分钟。如果从饭店门口随机抽取 81 名顾客并记录他们等待出租车的时间,则样本均值的抽样分布是() A. 正态分布,均值为12 分钟,标准差为0.33 分钟 B. 正态分布,均值为12 分钟,标准差为 3 分钟 C. 左偏分布,均值为12 分钟,标准差为 3 分钟

统计学第5-6章 正态分布、 统计量及其抽样分布知识分享

统计学第5-6章正态分布、统计量及其 抽样分布

第5-6章统计量及其抽样分布 5.1正态分布 5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。 概率密度曲线图 例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等某一条件下产品的质量 如果随机变量X的概率密度为 2 2 () 2 1 (), 2 x f x e x μ σ πσ -- =-∞<<∞ 则称X服从正态分布。 记做 2 (,) X Nμσ : ,读作:随机变量X服从均值为 μ ,方差为2 σ的正态分布 其中, μ -∞<<∞ ,是随机变量X的均值,0 σ>是是随机变量X 的标准差

5.1.2正态密度函数f(x)的一些特点: ()0 f x≥, 即整个概率密度曲线都在x轴的上方。 曲线 () f x相对于xμ =对称,并在xμ = 处达到最大值, 1 () 2 fμ πσ = 。 1 μ< 2 μ< 3 μ 曲线的陡缓程度由 σ 决定: σ 越大,曲线越平缓;σ越小,曲线越陡峭当 x 趋于无穷时,曲线以 x轴为其渐近线。 标准正态分布

当 0,1 μσ == 时, 2 2 1 () 2 x f x e π - = , x -∞<<∞ 称 (0,1) N 为标准正态分布。 标准正态分布的概率密度函数: ()x ? 标准正态分布的分布函数: ()x Φ 任何一个正态分布都可以通过线性变换转化为标准正态分布 设 2 (,) X Nμσ : ,则 (0,1) X Z N μ σ - =: 变量 2 11 (,) X Nμσ :与变量2 22 (,) Y Nμσ :相互独立,则有 22 1212 +(+,+) X Y Nμμσσ : 5.1.3 正态分布表:可以查的正态分布的概率值 ()1() x x Φ-=-Φ

抽样分布习题()

抽样分布习题 1.抽样分布是指( C ) A 一个样本各观测值的分布 B 总体中各观测值的分布 C 样本统计量的分布 D 样本数量的分布 2.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的均值为( A )。 A μ B x C 2σ D n 2 σ 3.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的方差为( D )。 A μ B x C 2σ D n 2 σ 4.从一个均值μ=10,标准差σ=0.6的总体中随机选取容量为n=36的样本。假定该总体并不是很偏的,则样本均值x 小于 9.9的近似概率为( A )。 A 0.1587 B 0.1268 C 0.2735 D 0.6324 5.假设总体服从均匀分布,从此总体中抽取容量为36的样本,则样本均值的抽样分布( B ) A 服从非正态分布 B 近似正态分布 C 服从均匀分布 D 服从2χ分布 6.从服从正态分布的无限总体中分别抽取容量为4,16,36的样

本,当样本容量增大时,样本均值的标准差( C )A 保持不变 B 增加 C 减小D 无法确定 7. 总体均值为50,标准差为8,从此总体中随机抽取容量为64的样本,则样本均值的抽样分布的均值和标准误差分布为( B )。 A 50,8 B 50,1 C 50,4 D 8,8 8.某大学的一家快餐店记录了过去5年每天的营业额,每天营业额的均值为2500元,标准差为400元。由于在某些节日的营业额偏高,所以每日营业额的分布是右偏的,假设从这5年中随机抽取100天,并计算这100天的平均营业额,则样本均值的抽样分布是( B )。 A 正态分布,均值为250元,标准差为40元 B 正态分布,均值为2500元,标准差为40元 C 右偏分布,均值为2500元,标准差为400元 D 正态分布,均值为2500元,标准差为400元 9. 某班学生的年龄分布是右偏的,均值为22,标准差为4.45,如果采取重复抽样的方法从该班抽取容量为100的样本,则样本均值的抽样分布是( A ) A 正态分布,均值为22,标准差为0.445 B 分布形状未知,均值为22,标准差为4.45

习题六 样本及抽样分布.

习题六样本及抽样分布 一、填空题 1.设来自总体的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =; 2.在总体中随机地抽取一个容量为 36 的样本,则均值落在4与6之间的概率 = 0.9332 ; 3.设某厂生产的灯泡的使用寿命 (单位:小时,抽取一容量为9的样本,得到 ,则; 4.设为总体的一个样本,则 0.025 ; 5.设为总体的一个样本,且服从分布,这里, ,则1/3 ; 6.设随机变量相互独立,均服从分布且与分别是来自总体的简单随机样本,则统计量服从参数为 9 的 t 分布。 7.设是取自正态总体的简单随机样本且 ,则 0.05 , 0.01 时,统计量服从分布,其自由度为 2 ;

8.设总体 X 服从正态分布,而是来自总体的简单随机样 本,则随机变量 服从 F 分布,参数为 10,5 ; 9.设随机变量则 F(n,1 ; 10.设随机变量且,A为常数,则 0.7 二、选择题 1.设是来自总体的简单随机样本,是样本均值, 记 则服从自由度的分布的随机变量是( A ); A. B. C. D. 2.设是经验分布函数,基于来自总体的样本,而是总体的分布函数,则下列命题错误的为,对于每个给定的( B ) A.是分布函数 B.依概率收敛于 C.是一个统计量 D.其数学期望是

3.设总体服从0-1分布,是来自总体的样本,是样本均值,则下列各选项中的量不是统计量的是( B ) A. B. C. D. 4.设是正态总体的一个样本,其中已知而未知,则下列各选项中的量不是统计量的是( C )。 A. B. C. D. 5.设和分别来自两个正态总体和的样本,且相互独立,分别为两个样本的样本方差,则服从的统计量是( B ) A. B. C. D. 6.设是正态总体的一个样本,和分别为样本均值和样本方差,则下面结论不成立的有( D ) A.相互独立; B.与相互独立; C.与相互独立D.与相互独立。

(完整版)样本及抽样分布.doc

第六章样本及抽样分布 【基本要求】 1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布—— 2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】 4 学时 【授课内容】 §6.0前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一 门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性; 而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的 一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来 选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理 统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 § 6.1随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是 个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每 个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几 项数量指标 X ( 可以是向量 ) 和该数量指标X在总体的分布情况。在上述例子中 X 是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X 的这样或那样的数值,因而这个数量指标X 是一个随机变量(或向量),而 X 的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标 X 可能取值的全体组成的集合等同起来。 定义 1:把研究对象的全体(通常为数量指标X 可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X 的分布的研究,所谓总体的分布也就是数量指 标 X 的分布,因此, X 的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体 X 。根据总体中所包括个体的总数,将总体分为:有限总体 和无限总体。 例 1:考察一块试验田中小麦穗的重量: X =所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

统计学习题答案 第4章 抽样与抽样分布

统计学习题答案第4章抽样与抽样分布

第4章抽样与抽样分布——练习题(全免) 1. 一个具有64 n个观察值的随机样本抽自于均 = 值等于20、标准差等于16的总体。 ⑴给出x的抽样分布(重复抽样)的均值和标 准差 ⑵描述x的抽样分布的形状。你的回答依赖于 样本容量吗? ⑶计算标准正态z统计量对应于5.15 = x的值。 ⑷计算标准正态z统计量对应于23 x的值。 = 解: 已知n=64,为大样本,μ=20,σ=16, ⑴在重复抽样情况下,x的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。 ⑴x<16;⑵x>23;⑶x>25;⑷.x落在16和22之间;⑸x<14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有100 n个观察值的随机样本选自于 = μ、16=σ的总体。试求下列概率的近似值:30 =

解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。 ⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远? ⑶ 为了回答b 你必须要知道μ吗?请解释。 解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。对于每一个样本容量,构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。 解:趋向正态 6. 美国汽车联合会(AAA )是一个拥有90个俱 乐部的非营利联盟,它对其成员提供旅行、

二项分布与正态分布

第七章假设检验 第一节二项分布 二项分布的数学形式·二项分布的性质 第二节统计检验的基本步骤 建立假设·求抽样分布·选择显著性水平和否定域·计算检验统计量·判定第三节正态分布 正态分布的数学形式·标准正态分布·正态分布下的面积·二项分布的正态近似法 第四节中心极限定理 抽样分布·总体参数与统计量·样本均值的抽样分布·中心极限定理 第五节总体均值和成数的单样本检验 σ已知,对总体均值的检验·学生t分布(小样本总体均值的检验)·关于总体成数的检验 一、填空 1.不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分布就趋于()分布。 2.统计检验时,被我们事先选定的可以犯第一类错误的概率,叫做检验的( ),它决定了否定域的大小。 3.假设检验中若其他条件不变,显著性水平的取值越小,接受原假设的可能性越(),原假设为真而被拒绝的概率越()。 4.二项分布的正态近似法,即以将B(x;n,p)视为()查表进行计算。 5.已知连续型随机变量X~N(0,1),若概率P{X ≥λ}=0.10,则常数λ=()。 6.已知连续型随机变量X~N(2,9),函数值 9772 .0 )2( = Φ ,则概率 }8 {< X P= ()。 二、单项选择 1.关于学生t分布,下面哪种说法不正确()。 A 要求随机样本 B 适用于任何形式的总体分布 C 可用于小样本 D 可用样本标准差S代替总体标准差σ 2.二项分布的数学期望为()。 A n(1-n)p B np(1- p) C np D n(1- p)。 3.处于正态分布概率密度函数与横轴之间、并且大于均值部分的面积为()。 A 大于0.5 B -0.5 C 1 D 0.5。

03 第三节 正态总体的抽样分布

第三节 正态总体的抽样分布 分布图示 ★ 抽样分布 ★ 单正态总体的抽样分布 ★ 例 1 ★ 例 2 ★ 例 3 ★ 双正态总体的抽样分布 ★ 例 4 ★ 例 5 ★ 内容小结 ★ 课堂练习 ★ 习题12-3 内容要点 一、抽样分布 有时, 总体分布的类型虽然已知, 但其中含有未知参数,此时需对总体的未知参数或对总体的重要数字特征(如数学期望、分差等) 进行统计推断, 此类问题称为参数统计推断.在参数统计推断问题中, 常需利用总体的样本构造出合适的统计量, 并使其服从或渐近地服从已知的总体分布. 统计学中泛称统计量分布为抽样分布. 二、单正态总体的抽样分布 设总体X 的均值μ,方差为2σ,n X X X ,,,21 是取自X 的一个样本,X 与2S 分别为该样本的样本均值与样本方差, 则有 ,)(,)(2σμ==X D X E )(2S E .2 σ= 定理1 设总体),,(~2σμN X n X X X ,,,21 是取自X 的一个样本, X 与2S 分别为该样本的样本均值与样本方差, 则有 (1) )/,(~2n N X σμ; (2) ).1,0(~/N n X U σμ-= 定理2 设总体),,(~2σμN X n X X X ,,,21 是取自X 的一个样本, X 与2S 分别为该样本的样本均值与样本方差, 则有 (1) 2χ=);1(~)(1 1 212222--=-∑=n X X S n n i i χσσ (2) X 与2S 相互独立. 定理3 设总体),,(~2σμN X n X X X ,,,21 是取自X 的一个 样本, X 与2S 分别为该样本的样本均值与样本方差, 则有 (1) )(~)(121222n X n i i χμσχ∑=-= (2) ).1(~/--=n t n S X T μ 三、双正态总体的抽样分布 定理 4 设),(~211σμN X 与),(~222σμN Y 是两个相互独立的正态总体, 又设 1 ,,,21n X X X 是取自总体X 的样本, X 与21S 分别为该样本的样本均值与样本方差. 2 ,,,21n Y Y Y 是取自总体Y 的样本, Y 与22S 分别为此样本的样本均值与样本方差. 再记2w S 是21S 与22 S 的加权平均, 即

习题六__样本及抽样分布解答

样本及抽样分布 一、填空题 1 ?设来自总体X的一个样本观察值为:2.1, 5.4, 3.2, 9.8, 3.5,则样本均值= 4.8 ,样本方差=2.7161 2; 2. 在总体X ~ N (5,16)中随机地抽取一个容量为36的样本,则均值X落在4 与6之间的概率=0.9332 ; 3. 设某厂生产的灯泡的使用寿命X~N(1000,二2)仲位:小时),抽取一容量为 9 的样本,得到殳=940,s =100 ,则P(X ::: 940) = ___________ ; 7 4. 设X1,X2,?., X7 为总体X ~ N(0,0.52)的一个样本,则Pr X i24^ 0.025 : i=1 5. 设X1,X2,...,X6为总体X ~ N(0,1)的一个样本,且CY服从2分布,这里, Y =(X1 X2 X3)2(X4 X5 X6)2,则C=血_ ; 6?设随机变量X,Y相互独立,均服从N(0,32)分布且X1,X2,...,X9与Y,Y2,...,Y分 别是来自总体X ,Y的简单随机样本,则统计量U= X1... X9服从参数为—9 H2+...+Y2 的_L_分布。 7. 设X11X21X31X4是取自X ~ N(0,22)正态总体的简单随机样本且 ^a(X^2X2)2b(3X^4X4)2,,则a = 0.05 , 0.01 时,统计量Y 服从 2分布,其自由度为一2_; 1 9. 设随机变量X ~t(n)(n 1),Y 2,则Y~ —; X 1 10. 设随机变量X~F(n,n)且P(X∣>A) = 0.3 , A 为常数,则P(XA—)= 0.7 A

8. 设总体X服从正态分布X ~ N(0,22),而X1,X2,...,X15是来自总体的简单随机 X 2十+X2 样本,则随机变量Y X1 2... 利服从F 分布,参数为10,5 ; 2(X11 +...+X15)

样本与抽样分布

第六章样本与抽样分布 §6.1 数理统计的基本概念 一.数理统计研究的对象 例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X表示。 (1)若规定寿命低于1000小时的产品为次品。此问题是求P(X 1000)=F(10000),求F(x)? (2)从平均寿命、使用时数长短差异来看其质量,即求E(x)?、D(x)?。 要解决二个问题

1.试验设计抽样方法。 2.数据处理或统计推断。 方法具有“从局部推断总体”的特点。 二.总体(母体)和个体 1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。 说明: (1)对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他们在整体中的分布。所以总体是个体的数量指标的全体。 (2)为研究方便将总体与一个R.V X

对应(等同)。 a.总体中不同的数量指标的全体, 即是R.V.X的全部取值。 b.R.V X的分布即是总体的分布 情况。 例:一批产品是100个灯泡,经测试其寿命是: 1000小时1100小时 1200小时 20个30个50个 X 1000 1100 1200 P 20/100 30/100

50/100 (设X表示灯泡的寿命)可知R.V.X的分布律, 就是总体寿命的分布,反之亦然。 常称总体X,若R.VX~F(x),有时也用F(x)表示一个总体。 (3)我们对每一个研究对象可能要观测两个或多个数量指标,则可用多维随机向量(X,Y,Z, …)去描述总体。 2.总体的分类 有限总体 无限总体

三.简单随机样本. 1.定义6.1 :从总体中抽得的一部分个体组成的集合称为子样(样本),取得的个体叫样品,样本中样品的个数称为样本容量(也叫样本量)。每个样品的测试值叫观察值。 取得子样的过程叫抽样。 样本的双重含义: (1)随机性: 用(X 1,X 2, ……X n) n维随机向量表 示。 X i表示第i个被抽到的个体,是随机变量。(i=1,2,…n)

第5章 样本及抽样分布课后习题答案(高教出版社,浙江大学)

第5章 样本及抽样分布 1,设总体X 服从均值为1/2的指数分布,4321,,,X X X X 是来自总体的容量为4的样本,求 (1)4321,,,X X X X 的联合概率密度;(2)}2.17.0,15.0{21<<<x ,所以 (1) 联合概率密度为)()()()(),,,(43214321x f x f x f x f x x x x g = )(2432116x x x x e +++-=,(0,,,4321>X X X X ) (2)2 1,X X 的联合概率密度为) (2212x x e +-,所以 ????----== <<<<2 .17 .0221 5 .01215.02 .17 .021222121 2 1224}2.17.0,15.0{dx e dx e dx dx e X X P x x x x ))((4.24.121------=e e e e (3),21)(41)(41==∑=i i X E X E 16 1 2141)(161)(2 41=? ?? ???==∑=i i X D X D ; (4)4 1 )()()(2121==X E X E X X E ,(由独立性) ]4 1)()([21]41[21])5.0[()(])5.0([22 2222221221+-=+-= -=-X E X E X X E X E X E X X E 8 1]412141[21]4121)()([212 222=-??? ??+=+-+=X E X D ; (5)2 2 22 12122212141)()()(])[()(?? ? ??-=-=X E X E X X E X X E X X D 16 3161)4141)(4141(161)]()()][()([222121=-++=- ++=X E X D X E X D 。

正态总体下的四大分布

《概率论与数理统计》第六章样本及抽样分布 (2)正态总体下的四大分布:正态分布 设n x x x ,,,21 为来自正态总体),(2 σ μN 的一个样本,则样本函数 ). 1,0(~/N n x u def σμ -例:设总体ξ~2 12(1,2 ),,,n N ξξξ 且是取自ξ的样本,则( D ) A) 1(0,1) 2 N ξ-B) 1(0,1) 4N ξ-C) ( ) 1(0,1) 2 N ξ-D ) (0,1) N ξt 分布 设n x x x ,,,21 为来自正态总体),(2 σ μN 的一个样本,则样本函数), 1(~/--n t n s x t def μ其中t(n-1)表示自由度为n-1的t 分布。 分布 2χ设n x x x ,,,21 为来自正态总体),(2 σ μN 的一个样本,则样本函数 ), 1(~)1(22 2 --n S n w def χσ其中)1(2 -n χ 表示自由度为n-1的2χ 分布

例:已知F 0.1(7,20)=2.04,则F 0.9(20,7)=_______0.4902_____. 例.对于给定的正数α,10<<α ,设αu ,)(2 n α χ,)(n t α,),(21n n F α分别是)1,0(N ,)(2n χ,)(n t ,),(21n n F 分布的下α 分位数,则下面结论中不正确... 的是(B ) (A)α α --=1u u (B)) () (2 2 1n n ααχχ-=-(C)) ()(1n t n t αα--=(D)) ,(1 ) ,(12211n n F αα= -2、设X 、Y 相互独立,且都服从标准正态分布,则Z = 2 Y X 服从______t(1)_____分布(同时要写出 分 布的参数). 3.设ξ和η相互独立且都服从N(0,4),而41,ξξ 和41,ηη 分别是来自总体ξ和η的样本,则统计量2 4 2 141......ηηξξ++++= U 服从的分布为 ) 4(t 。

贾俊平《统计学》(第5版)课后习题-第6章 统计量及其抽样分布【圣才出品】

第6章 统计量及其抽样分布一、思考题 1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设12n X X X ,, …,是从总体X 中抽取的容量为n 的一个样本,如果由此 样本构造一个函数12()n T X X X ,,…,,不依赖于任何未知参数,则称函数12()n T X X X ,,…,是一个统计量。 (2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。 (3)统计量是样本的一个函数。由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。 2.判断下列样本函数哪些是统计量?哪些不是统计量? 1121021210310410()/10 min() T X X X T X X X T X T X μ μσ =+++==-=-…,,…,()/答:统计量中不能含有未知参数,故1T 、2T 是统计量,3T 、4T 不是统计量。

3.什么是次序统计量? 答:设12n X X X ,, …,是从总体X 中抽取的一个样本,()i X 称为第i 个次序统计量,它是样本 12()n X X X ,,…,满足如下条件的函数:每当样本得到一组观测值12X X ,,…,n X 时,其由小到大的排序 (1)(2)()()i n X X X X ≤≤≤≤≤……中,第i 个值()i X 就作为次序统计量()i X 的观测值,而(1)(2)()n X X X ,,…,称为次序统计量,其中(1)X 和()n X 分别为最小和最大次序统计量。 4.什么是充分统计量? 答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。 5.什么是自由度? 答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。 6.简述2 χ分布、t 分布、F 分布及正态分布之间的关系。答:(1)随机变量X 1,X 2,… X n 相互独立,且都服从标准正态分布,则它们的平方和21 n i i X =∑服从自由度为n 的2 χ分布。(2)随机变量X 服从标准正态分布,Y 服从自由度为n 的2 χ分布,且X 与Y 独立,

与正态总体有关的抽样分布定理证明

定理:设12,,,n X X X 是来自正态总体2(,)N μσ的一个随机样本,记 1 n i i X X n == ∑,2 2 1 ()n i i X X S n =-= ∑ 则有如下性质存在: (1)2 ~, X N n σμ?? ?? ? (2) 2 22 ~(1)nS n χσ - (3 ~(1)X t n - 证明: (1) 已知 ..212,, ,~(,)i i d n X X X N μσ 根据正态分布的性质有 212~(,)n X X X N n n μσ++ + 样本均值为 12n X X X X n ++ += 它的抽样分布为 2~(,)X N μσ (2) 对样本12,, ,n X X X 进行正交变换 Z AX = 其中()12,, ,n X X X X '=,()12,,,n Z Z Z Z '=,A 为正交矩阵

00 A n ?? ? ? ? ? ? = ? ? - ? ? ? ? ? 正交变换之后, i Z,1,2,, i n =相互独立,且 2 112 ~ (0,) Z X X Nσ = 2 2123 ~(0,) Z X X X Nσ =+ 2 112 ~(0,) ( n n Z X X X N n n σ- =++- ? 2 12 ~,) n n Z X X X N n σ =++ 即正交变换之后 2 ~(0,) i Z Nσ,1,2,,1 i n =- 2 ~,) n Z Nσ 由 i Z相互独立,且2 ~(0,) i Z Nσ,1,2,,1 i n =-,推导出 ~(0,1) i Z N σ ,1,2,,1 i n =- 标准正态分布的平方和服从2 χ分布,即有 1 2 2 1 2 ~(1) n i i Z n χ σ - =- ∑ 又因为

(完整word版)习题六样本及抽样分布

习题六 样本及抽样分布 一、填空题 1.设来自总体X 的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =22.716; 2.在总体~(5,16)X N 中随机地抽取一个容量为 36 的样本,则均值X 落在4与6之间的概率 = 0.9332 ; 3. 设某厂生产的灯泡的使用寿命2~(1000,)X N σ (单位:小时),抽取一容量为9的样本,得到940,100x s ==,则(940)P X <= ; 4.设127,,...,X X X 为总体2 ~(0,0.5)X N 的一个样本,则7 21 (4)i i P X =>=∑ 0.025 ; 5.设126,,...,X X X 为总体~(0,1)X N 的一个样本,且cY 服从2χ分布,这里, 22123456()()Y X X X X X X =+++++,则c =1/3 ; 6.设随机变量,X Y 相互独立,均服从2(0,3)N 分布且129,,...,X X X 与129,,...,Y Y Y 分 别是来自总体,X Y 的简单随机样本,则统计量U =服从参数为 9 的 t 分布。 7.设1234,,,X X X X 是取自2~(0,2)X N 正态总体的简单随机样本且 22!234(2)(34),Y a X X b X X =-+-,则a = 0.05 ,b = 0.01 时,统计量Y 服从 2χ分布,其自由度为 2 ; 8.设总体 X 服从正态分布2~(0,2)X N ,而1215,,...,X X X 是来自总体的简单随机 样本,则随机变量 22 110 22 1115...2(...) X X Y X X ++=++ 服从 F 分布,参数为 10,5 ; 9.设随机变量21 ~()(1),,X t n n Y X >=则~Y F(n,1) ; 10.设随机变量~(,)X F n n 且()0.3P X A >=,A 为常数,则1 ()P X A > = 0.7 二、选择题 1.设12,,...,n X X X 是来自总体2(,)N μσ的简单随机样本,X 是样本均值, 记22222 21 23111 111(),(),(),11n n n i i i i i i S X X S X X S X n n n μ====-=-=---∑∑∑ 2 241 1(),n i i S X n μ==-∑则服从自由度1n -的t 分布的随机变量是T =( A ); A . B C D 2.设()n F x 是经验分布函数,基于来自总体X 的样本,而()F x 是X 总体的 分布函数,则下列命题错误的为,对于每个给定的,()n x F x ( B ) A .是分布函数 B .依概率收敛于()F x C .是一个统计量 D .其数学期望是()F x

样本及抽样分布讲解学习

样本及抽样分布

第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。

§6.1 随机样本 一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量:

相关文档
最新文档