第十一讲 第六章 样本和抽样分布(2016)

统计学第七章、第八章课后题包括答案.docx

统计学复习笔记 第七章参数估计 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏 估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总 体的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数, 这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4.解释95%的置信区间的含义是什么 置信区间 95%仅仅描述用来构造该区间上下界的统计量(是随机的 )覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有 95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个 95%置信区间,就以为该区间以的概率覆盖总体参数。 5.简述样本量与置信水平、总体方差、估计误差的关系。 1.估计总体均值时样本量 n 为 ( z22 2) 22 E z n22其中:2 E 2n 2.样本量n与置信水平1-α、总体方差、估计误差E之间的关系为

用样本估计总体分布

用样本的频率分布估计总体分布(第1课时) 教学目标: 1.通过实例体会分布的意义和作用,通过对现实生活的探究,感知应用数学知识解决问题的方法. 2.通过表示样本数据的过程,学会列频率分布表,画频率分布直方图,理解数形结合的数学思想. 3.通过对样本分析和总体估计的过程,感受数学在实际生活中的作用,认识数学知识源于生活并指导生活的事实. 教学重点: 会列频率分布表,画频率分布直方图,了解样本频率分布与总体分布之间的关系 教学难点: 掌握频率分布直方图的正确画法,体会分布的意义与作用 教学方法:引导——探究教学法 教学过程: 一、创设情境,呈现问题 问题情境:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,武汉市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费. 如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢? 二、操作讨论,构建新知 <知识探究1 改良频数分布表→频率分布表> 问题1:如果标准太低,会影响居民的日常生活;如果标准太高,则不利于节水.那么你认为,为了较合理地确定出这个标准,需要了解哪些相关信息,做哪些工作? 【学生活动1】探究讨论,得到结论: ①为了制定一个较为合理的标准a,需要知道每个家庭的用水量 ②如何获得家庭用水量的有关信息?对家庭进行调查,采用抽样调查的方式 ③抽样时,样本容量定为多少比较合适?武汉市1000万人口,抽样10000比较合适 课堂上为了处理数据的方便,我们理想化地抽取100个数据的样本,比如: 通过抽样调查,获得100户居民的月均用水量如下表(单位:t) 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 问题2:从表中随意记录下的数据中很难直接看出规律,因此需要对统计数据进行整理分析. 回顾你看到全班的期末考试成绩单后是怎样分析的?

第六章 样本及抽样分布

第六章样本及抽样分布 【授课对象】理工类本科二年级 【授课时数】4学时 【授课方法】课堂讲授与提问相结合 【基本要求】1、理解总体、个体和样本的概念; 2、了解经验分布函数和直方图的作法,知道格林汶科定理; 3、理解样本均值、样本方差和样本矩的概念并会计算; 4、理解统计量的概念,掌握几种常用统计量的分布及其结论; 5、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布,F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【授课内容及学时分配】 §6.0 前言5分钟前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象的统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 §6.1 随机样本25分钟一、总体与样本

1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究华北工学院男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但在数理统计里,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X (可以是向量)和该数量指标X 在总体的分布情况。在上述例子中X 是表示灯泡的寿命或男大学生的身高和体重。在实验中,抽取了若干个个体就观察到了X 的这样或那样的数值,因而这个数量指标X 是一个随机变量(或向量),而X 的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X 可能取值的全体组成的集合等同起来。我们对总体的研究,就是对相应的随机变量X 的分布的研究,所谓总体的分布也就是数量指标X 的分布,因此,X 的分布函数和数字特征分别称为总体的分布函数和数字特征。 定义1:把研究对象的某项或几项数量指标的值的全体称为总体; 总体中的每个元素称为个体。 根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 Ex 1:考察一块试验田中小麦穗的重量: X =所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 对应的分布: +∞<<= ≤= ≤=? ∞ --- x N dt e x x P x F x t 0),(~21 }{)(22)(2 2σμσ πξσμ总麦穗数的麦穗数重量 Ex 2:考察一位射手的射击情况: X =此射手反复地无限次射下去所有射击结果全体; 每次射击结果都是一个个体(对应于靶上的一点) 个体数量化???=未中射中 01x 1在总体中的比例p 为命中率

统计学复习资料第七章

1 估计量的含义是指()。 A.用来估计总体参数的统计量的名称 B.用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体数值 2 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为()。 A.无偏性 B.有效性 C.一致性 D.充分性 3 根据一个具体的样本求出的总体均值的95%的置信区间()。 A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 4 无偏估计是指()。 A.样本统计量的值恰好等于待估的总体参数 B.所有可能样本估计值的数学期望等于待估总体参数 C.样本估计值围绕待估总体参数使其误差最小 D.样本量扩大到和总体单元相等时与总体参数一致 5 总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以()。 A.样本均值的抽样标准差 B.样本标准差 C.样本方差 D.总体标准差 6 当样本量一定时,置信区间的宽度()。 A.随着置信系数的增大而减小 B.随着置信系数的增大而增大 C.与置信系数的大小无关 D.与置信系数的平方成反比 7 当置信水平一定时,置信区间的宽度()。 A.随着样本量的增大而减小 B.随着样本量的增大而增大 C.与样本量的大小无关 D.与样本量的平方根成正比 8 一个95%的置信区间是指()。 A.总体参数有95%的概率落在这一区间内 B.总体参数有5%的概率未落在这一区间内 C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数 D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数

样本及抽样分布

第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 §6.1 随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量: X=所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

第六章抽样调查练习及答案

第六章抽样调查 一、填空题 1.抽选样本单位时要遵守原则,使样本单位被抽中的机会。 2.常用的总体指标有、、。 3.在抽样估计中,样本指标又称为量,总体指标又称为。 4.全及总体标志变异程度越大,抽样误差就;全及总体标志变异程度越小, 抽样误差。 5.抽样估计的方法有和两种。 6.整群抽样是对被抽中群内的进行的抽样组织方式。 7.误差分为和代表性误差;代表性误差分为________和偏差;偏差是 ____________________________,也称为________________。 8.简单随机抽样的成数抽样平均误差计算公式是:重复抽样条件下:; 不重复抽样条件下:。 9.误差范围△,概率度t和抽样平均误差 之间的关系表达式为。 10.抽样调查的组织形式有:。 二、单项选择题 1.所谓大样本是指样本单位数在( )及以上 A 30个 B 50个 C 80个D100个 2.抽样指标与总体指标之间抽样误差的可能范围是( )

A 抽样平均误差 B 抽样极限误差 C 区间估计范围 D 置信区间 3.抽样平均误差说明抽样指标与总体指标之间的( ) A 实际误差 B 平均误差 C 实际误差的平方 D 允许误差 4.是非标志方差的计算公式( ) A P(1-P) B P(1-P)2 C )1(P P D P 2(1-P) 5.总体平均数和样本平均数之间的关系是( ) A 总体平均数是确定值,样本平均数是随机变量 B 总体平均数是随机变量,样本平均数是确定值 C 两者都是随机变量 D 两者都是确定值 6.对入库的一批产品抽检10件,其中有9件合格,可以( )概率保证合格率不低于80%。 A 95.45% B 99.7396 C 68.27% D 90% 7.在简单随机重复抽样情况下,若要求允许误差为原来的2/3,则样本容量( ) A 扩大为原来的3倍 B 扩大为原来的2/3倍 C 扩大为原来的4/9倍 D 扩大为原来的2.25倍 8.根据抽样调查得知:甲企业一等品产品比重为30%,乙企业一等品比重为50% 一等品产品比重的抽样平均误差为 ( ) A 甲企业大 B 两企业相同 C 乙企业大 D 无法判断 9.是非标志的平均数是( ) A -P)1P( B P(1-P) C p D (1-P)2 10.重复抽样的误差一定( )不重复抽样的误差。

第六章 样本及抽样分布.

第六章样本及抽样分布 §1总体与样本 从理论上讲,对随机变量进行大量的观测,被研究的随机变量的概率特征一定能显现出来,可是实际进行的观测次数只能是有限的,有时甚至是少量的。因此,我们关心的问题就是怎样有效地利用收集到的有限的资料,尽可能地对被研究的随机变量的概率特征作出精确而可靠的结论. 我们把被研究的对象的全体称为总体(或母体),而把组成总体的各个元素称为个体。代表总体的指标是一个随机变量,所以总体就是指某个随机变量可能取的值的全体。 从总体中抽取一个个体,就是对代表总体的随机变量进行一次试验(或观测),得到的一个试验数据(或观测值)。从总体中抽取一部分个体,就是对随机变量进行若干次试验(观测)。 从总体中抽取若干个个体的过程称为抽样。抽样结果得到的一组试验数据(观测值),称为样本(或子样);样本中所含个体的数量称为样本容量。 从总体中抽取样本,一般总是假设满足下述两个条件: (1)随机性为了使样本具有充分的代表性,抽样必须是随机的,应使总体中的每一个个体都有同等的机会被抽取到,通常可以用编号抽签的方法或利用随机数表来实现。 (2)独立性各次抽样必须是相互独立的,即每次抽样的结果既不影响其它各次抽样的结果,也不受其它各次抽样结果的影响。 这种随机的、独立的抽样方法称为简单随机抽样,由此得到的样本称为简单随机样本。 例如,从总体中进行放回抽样,显然是简单随机抽样,得到的样本就是简单随机样本。 从有限总体(即其中只含有有限多个个体的总体)中,进行不放回抽样,虽然不是简单随机抽 样,但是若总体容量很大而样本容量较小(,则可以近似地看作是放回抽样,因而也就可以近似地看作是简单随机抽样,得到的样本可以近似地看作是简单随机样本。 今后,凡是提到抽样与样本,都是指简单随机抽样与简单随机样本。 从总体中抽取容量为n的样本,就是对代表总体的随机变量随机地、独立地进行n次试验(观测),每次试验的结果可以看作是一个随机变量,n次试验的结果就是n个随机变量 。 这些随机变量相互独立,并且与总体服从相同的分布。设得到的样本观测值分别是 ,

@2-第6章 统计量及其抽样分布 练习题

第六章 统计量及其抽样分布 练习题 一、填空题(共10题,每题2分,共计20分) 1.简单随机抽样样本均值X 的方差取决于_________和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的_________倍。 2. 设1217,,,X X X L 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=, 则a =____________。 3.若(5)X t :,则2X 服从_______分布。 4.已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。 5.中心极限定理是说:如果总体存在有限的方差,那么,随着_________的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于_____________。 6. 总体分布已知时,样本均值的分布为_________抽样分布;总体分布未知,大样本情况下,样本均值的分布为_________抽样分布。 7. 简单随机样本的性质满足_________和_________。 8.若(2,4)X N :,查分布表,计算概率(X 3)P ≥=_________。若(X )0.9115P a ≤=,计算a =_________。 9. 若12~(0,2),~(0,2),X N X N 1X 与2X 独立,则2212X X +()/2服从______分布。 10. 若~(16,4)X N ,则5X 服从___________分布。 二、选择题(共10题,每题1分,共计10分) 1.中心极限定理可保证在大量观察下 ( ) A . 样本平均数趋近于总体平均数的趋势 B . 样本方差趋近于总体方差的趋势 C . 样本平均数分布趋近于正态分布的趋势 D. 样本比例趋近于总体比例的趋势

第七章二项分布与正态分布

第七章 假设检验 一、填空 1.不论总体是否服从正态分布,只要样本容量n 足够大,样本平均数的抽样分布就趋于( )分布。 2.统计检验时,被我们事先选定的可以犯第一类 错误的概率,叫做检验的( ),它决定了否定域 的大小。 3.假设检验中若其他条件不变,显著性水平的取 值越小,接受原假设的可能性越( ),原假设 为真而被拒绝的概率越( )。 5.已知连续型随机变量X ~N (0,1),若概率P{X ≥λ}=0.10,则常数λ=( )。 6.已知连续型随机变量X ~N (2,9),函数值 9772.0)2(0=Φ,则概率}8{

C 小概率事件 D 正态分布 的性质 6.在统计检验中,那些不大可能的结果称为 ( )。如果这类结果真的发生了, 我们将否定假设。 A 检验统计量 B 显著性水平 C 零假设 D 否定域 7.对于大样本双侧检验,如果根据显著性水平查正态分 布表得Z α/2=1.96,则当零假设被否定时,犯第一类错误 的概率是( )。 A 20% B 10% C 5% D .1% 9.事件A 在一次试验中发生的概率为4 1,则在3次独立重复试验中,事件A 恰好发生2次的概率为( )。 A 21 B 16 1 C 643 D 649 4. C 6. D 7. C 8. A 9. C 六、计算题 1.根据统计,北京市初婚年龄服从正态分布,其均值 为25岁,标准差为5岁,问25岁到30岁之间结婚的人; 其百分数为多少?

抽样分布和样本分布

抽样分布和样本分布 导读:我根据大家的需要整理了一份关于《抽样分布和样本分布》的内容,具体内容:你们知道各是什么吗?以下是有我为大家整理的,希望能帮到你。抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统... 你们知道各是什么吗?以下是有我为大家整理的,希望能帮到你。抽样分布: 从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统计推断的理论基础。 如果从容量为的有限总体抽样,若每次抽取容量为的样本,那么一共可以得到N取n的组合个样本(所有可能的样本个数)。抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。由平均数构成的新总体的分布,称为平均数的抽样分布。随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。 样本分布: 总体是指考察的对象的全体,个体是总体中的每一个考察的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目样本分布是用来估计总体分布的。样本分布有区别于总体分布,它是从总体中按一定的分组标志选出来的部分样本容量。

实际中很多不确定现象都可以用随机变量描述,而应用中的一个十分重要的问题是找到随机变量的分布或其数字特征。例如:某进出口贸易公司进口了10万台微型计算器,按产品技术规定,使用寿命小于4000小时即为次品,且次品率大于1% 就不接受这批产品。如何得知这批产品的次品率呢?是否要测量每一台计算器呢?显然,这是不现实的,解决这个问题的好办法就是随机抽样,然后根据抽样检验得到的次品率来估计整批产品的次品率。也就是从10万台产品中按随机原则,抽取一部分(假如100件)产品组成一个样本,由样本(100件产品)次品率推断整批产品的次品率。 这里,我们把被观察对象的全体(本例中的10万台计算器)称作总体,把从总体中随机抽取的(被抽中的100台计算器)小群体称作样本,而样本中所包含的个体单位数目称为样本容量(100个)。 对于这批计算器,我们关心的是它的使用寿命(低于4000小时的比例有多少)的分布,设X表示"任一台计算器的使用寿命",它是一个随机变量,我们把随机抽中的100件产品看作是100个随机变量X1,X2......,X100,每一个计算器的使用寿命都是一个随机变量,一旦测试完毕,测试的结果就是100个观测值x1,x2,......x100, 统计抽样的任务就是根据测试结果x1,x2,......x100来估计总体X的分布情况。 我们作如下概括:设X是一个随机变量,X1,X2......,Xn是一组相互独立与X具有相同分布的随机变量,称X为总体,X1,X2......,Xn为来自总体的简单随机样本,简称样本,n为样本容量,称样本观察值为样本值,由于按随机原则取样,在试验之前,人们无法知道试验的结果,

第六章 抽样分布

第六章抽样分布 (一)判断题 1、样本统计量是对样本的一种数量描述。() 2、样本统计量是对样本的一种数量描述。() 3、样本均值的期望值等于总体均值。() 4、样本均值与总体均值之间的差被称为抽样误差。() 5、样本方差的抽样分布服从T 分布。() (二)单项选择题 1、某工厂生产的零件出厂时每200个装一盒,这种零件分为合格与不合格两类,合格率约为99%,设每盒中的不合格数为X,则X通常服从()。 A.正态分布 B.二项分布 C.泊松分布 D.超几何分布 2、总体的均值为100,标准差为20,从总体中抽取一个容量为50的样本,则样本均值的标准差为()。 A.2.83 B.20 C.30 D.5 3、中心极限定理表明,来自于任意分布的样本均值的分布为()。 A.正态分布 B.正态分布 C.只有大样本情况下为正态分布 D.只有小样本情况下为正态分布 4、某班同学某课程考试中的平均得分为70,标准差为3分,从该班学生中随机抽取36名,并计算他们的平均成绩,则平均分超过71分的概率为()。 A.0.1293 B.0.4755 C.0.0228 D.0.3507 5、总体均值为10,标准差为5。从该总体中抽取容量为25的随机样本,则样本均值的抽样分布为()。 A.N(10, 1) B.N(10, 5) C.N(5, 1) D.N(5, 5) 6、某班学生的年龄分布为右偏的,均值为20,标准差为3,如果采取重复抽样的方法从该班抽取容量为100的样本,则样本均值的抽样分布为()。 A.正态分布,均值为20,标准差为0.3 B.分布形状未知,均值为20,标准差为0.3 C.正态分布,均值为20,标准差为3

第七章样本率(或构成比)比较的假设检验

第七章样本率(或构成比)比较的假设检验 第一节样本率与总体率比较的u检验 样本率与总体率(一般为已知的理论值、标准值或经大量观察所得到的稳定值等)比较的目的,是推断该样本所代表的未知总体率π与已知总体率π0是否不同。 u检验的适用条件:当样本含量n足够大,且样本率p和(1-p)均不太小,如np与n(1-p)均大于5时,样本率的分布近似正态分布,此时样本率与总体率差别的假设检验可利用正态分布的原理作u检验。 第二节两个样本率比较的u检验 当两样本含量n1及n2足够大,且两个样本率p1、(1-p1)及p2、(1-p2)均不太小,如n1 p1和n1(1- p1)及n2 p2和n2(1- p2)均大于5时,可根据正态分布原理,进行u检验。 第三节四格表资料的χ2检验(两个样本率比较) 一、两个样本率资料的四格表形式 1、χ2检验的基本思想 χ2值反映了实际频数和理论频数的吻合程度。χ2值越小,说明实际频数与理论频数越吻合,χ2值越大,说明实际频数与理论频数差异越大。如果检验假设成立,则实际频数与理论频数之差一般不会很大,即出现大的χ2值的概率是小的。若在无效假设下,出现了大的χ2值的概率P≤α(检验水准),我们就怀疑假设的成立,因此拒绝它。另外χ2值的大小,还与自由度有关。故考虑χ2值大小的意义时要同时考虑自由度。 若χ2≥χ2α,,(υ), 则P≤α, 拒绝H0,接受H1。 2、四格表χ2检验的的校正公式 (1)当自由度为1的四格表资料,理论数较小时,需做连续性校正。 (2)四格表χ2检验的适用条件 当n>40,且所有T≥5时,用χ2检验的基本公式或四格表专用公式。 当n>40,但有1

第七章 抽样与抽样分布

第七章抽样与抽样分布 一、思考题 1.什么是随机抽样与非随机抽样?二者有何根本区别。 2.什么是重复抽样?什么是不重复抽样? 3.什么是样本可能数目?它主要与哪些因素有关? 4.随机抽样有哪几种不同的组织形式?并简述它们各自的特点。 5.什么是抽样方案的设计?抽样方案的设计应遵循的基本原则是什么? 6.举例说明什么是总体分布、样本分布和抽样分布。 二、练习题 (一)填空题 1.抽样分布是指 __的概率分布。 2.抽样分布的理论基础 __ 和。 3.中心极限定理告诉我们不管总体服从什么分布,只要样本容量足够多,其 __ 的分布总是近似服从正态分布。 4.科学地设计抽样方案必须遵循两个基本原则:即保证实现 __ ;保证实现 __。 5.正态曲线下的总面积等于。 (二)判断题 σ,这两 1.正态分布总体有两个参数,一个是均值(期望值)μ,一个是方差2 个参数确定以后,一个正态分布也就确定了。( ) 2.一般而言,类型抽样的误差比简单随机抽样的误差小。( ) 3.重复抽样的抽样误差一定大于不重复抽样的抽样误差。( ) 4.随机抽样与非随机抽样的根本区别在于是否遵循随机原则。( ) 5.大数定律从理论上揭示了样本与总体之间的内在联系,即随着样本容量n 的增大,样本均值(或样本比例)有接近于总体均值(或总体比例)的趋势。( ) 6.中心极限定理是阐述大量随机变量之和的极限分布是正态分布的一系列定理的总称。( ) 7.总体分布是指总体X的概率分布。( ) 8.样本均值的抽样分布与总体是否正态分布无关。( )

(三)单项选择题 1.从纯理论出发,在直观上最符合随机原则的抽样方式是( )。 A.简单随机抽样 B.类型抽样 C.等距抽样 D.整群抽样 2.整群抽样的随机原则落实在( )。 A.各总体单位被抽中的机会均等 B.各群被抽中的机会均等 C.各群、各总体单位被中的机会均等 C.各群被抽中的机会不等 3.标准正态分布的特征是( )。 A.不对称 B.有的对称,有的不对称 C.关于0=x 对称 D. 关于μ=x 对称 4.t 分布的特征是( )。 A.不对称 B.有的对称,有的不对称 C.关于0=x 对称 D. 关于μ=x 对称 5.n 足够大时,n x σμ -服从( )。 A.正态分布 B.标准正态分布 C.t 分布 D.2χ分布 6.n 足够大时,n s x μ -服从( )。 A.正态分布 B.标准正态分布 C.t 分布 D.2χ分布 7.n 足够大时,n p )1(πππ --服从( )。 A.正态分布 B.标准正态分布 C.t 分布 D.2χ分布 8.n 足够大时,n p p p )1(--π 服从( )。 A.正态分布 B.标准正态分布 C.t 分布 D.2χ分布 (四)多项选择题 1.重复抽样的特点是( ) A.各次抽选相互影响 B.各次抽选互不影响 C.每次抽选时,总体单位数始终不变

用样本的频率分布估计总体分布(高考题)

用样本的频率分布估计总体分布 链接高考 1.(2014山东,7,5分,★★☆)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为 [12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为() A.6 B.8 C.12 D.18 2.(2015湖北,14,5分,★★☆)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示. (1)直方图中的a=________; (2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. 3.(2014江苏,6,5分,★★☆)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图

如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm. 4.(2015湖南,2,5分,★☆☆)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示. 若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是() A.3 B.4 C.5 D.6 5.(2013安徽,17,12分,★★☆)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下: (1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格); (2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为、,估计-的值. 三年模拟

6第六章样本及抽样分布自测题及答案

第六章 自测题 时间:120分钟 一、单项选择题 (每题5分,共25分) 1. 设总体2(,)X N μσ , 其中μ已知,2σ未知, X 1, X 2, …, X n 是来自总体X 的简单随机样 本,则下列表达式中不是统计量的是( ) (A) 11n i i X n =∑ (B) 1min{}i i n X ≤≤ (C) 21 n i i X μσ=-∑() (D) 2 11n i i X n μ=-∑() 2. 设随机变量X 和Y 都服从标准正态分布,则 ( ) (A) X +Y 服从正态分布;(B) X 2+Y 2服从χ2分布; (C) X 2和Y 2都服从χ2分布;(D) X 2/Y 2服从F 分布。 3. 设二维随机变量(X , Y )服从二维正态分布N (μ1, μ2, σ12, σ22, ρ) (ρ≠0),则( ) (A) 2X +Y 服从正态分布;(B) X 2+Y 2服从χ2分布; (C) X -Y 不服从正态分布;(D) X 2/Y 2服从F 分布. 4.设X 1, X 2, …, X 11是来自正态总体2 (0,)X N σ 的简单随机样本,102 211,10i i Y X ==∑,则下 列选项正确的是( ) (A)22(1)X χ ; (B) 22 (10);Y χ (C) 11 (10);X t Y (D) 2112(10,1).X F Y 5. 设总体X 和Y 相互独立且都服从正态分布2(,)N μσ,,X Y 分别是来自总体X 和Y 容量为n 的样本均值, 则当n 固定时, 概率{}P X Y σ->的值随着σ的增大而( ) (A)单调增大; (B) 单调减小; (C)保持不变; (D) 增减不定. 二、填空题 (每题5分,共15分) 1. 设随机变量2110012...,X N X X ~(,),,是取自X 的样本,X 为样本均值, 已知 (0,1),Y aX b N =+ 则a ,b 的值为( ). 2. 设总体X 服从正态分布)2,0(2 N ,而1521,,,X X X 是来自总体的简单随机样本,则随 机变量 ) (22 152112 10 21X X X X Y ++++= 服从( )分布,参数为( ).

用样本分布估计总体分布

用样本分布估计总体分布 用样本分布估计总体分布是从样本分布状况的角度分析总体的规律,涉及的内容有图表和数字特征. 其中图表包括频率分布表及直方图、折线图、散点图、茎叶图. 数字特征包括平均数、中位数、众数、方差、标准差等. 考纲对这部分内容的要求是识图、读图和估计. 本文将通过几个实例分析这类题型的解法. 数据特征 例1 为评估一种农作物的种植效果,选了[n]块地作试验田.这[n]块地的亩产量(单位:kg)分别为[x1],[x2],…,[xn],下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是() A. [x1],[x2],…,[xn]的平均数 B.[x1],[x2],…,[xn]的标准差 C.[x1],[x2],…,[xn]的最大值 D.[x1],[x2],…,[xn]的中位?? 解析刻画评估这种农作物亩产量稳定程度的指标是标准差. 答案 B 点评众数:一组数据出现次数最多的数叫众数,众数

反应一组数据的多数水平. 中位数:一组数据中间的数(起到分水岭的作用),中位数反应一组数据的中间水平. 平均数:反应一组数据的平均水平. 方差:反映和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小),并把它叫作这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度. 频率分布表及频率分布直方图 例2 某手机卖场对市民进行国产手机认可度的调查,随机抽取100名市民,按年龄(单位:岁)进行统计的频数分布表和频率分布直方图如下. 求频率分布表中[x,y]的值,并补全频率分布直方图. 解析由图知,[P(25≤x<30)=0.01×5=0.05], 故[x=100×0.05=5]. [P(30≤x<35)]=1-(0.05+0.35+0.3+0.1)=1-0.8=0.2,故[y]=100×0.2=20. 图中缺失部分:[频率组距=0.25=0.04](画图略). 点评用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法. 频率分布表在数量表示上比较准确,频率分布直方图比较直观. 频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分

6-2 第六章 抽 样(习题解答)

第六章抽样 一、辨析题 1、一般来说,任意抽样技术适用于正式的实际调查。 错误。适用于非正式的探测性调查,或调查前的准备工作。 2、一般说来,总体中各单位之间标志值的变异程度越大,需要抽样的样本数目越多;反之,需要抽样的样本数目越少。 正确 3、分层最佳抽样法指的是等比例分层抽样。 错误。这是非比例分层抽样。 4、一般而言,抽样的样本占总体的比例同抽样误差成反向关系,即抽样比例越大,抽样误差相对越小。 正确 5、抽样误差是随机抽样调查中必然发生的代表性误差,所以平均误差是不可避免的。而且,这种误差一般包括了技术性误差,即调查工作中的误差。 错误。这种误差一般不包括技术性误差即调查工作中的误差。 6、总体单位之间标志变异程度越大,抽样误差越大;反之则越

小。 正确 7、样本单位数目越多,抽样误差越大,反之则越小。 错误。样本单位数目越多,抽样误差越小,反之则大。 8、一般来说,简单随机抽样比分层、分群抽样误差大,不重复抽样比重复抽样误差大。 错误。重复抽样比不重复抽样误差大。 9、点值估计是考虑了抽样误差,直接以样本指标作为总体指标的估计值,作近似的估计。 错误,不考虑抽样误差。 二、名词解释 1、抽样调查 抽样调查也称为抽查,是指从调查总体中抽选出一部分要素作为样本,对样本进行调查,并根据抽样所得的结果推断总体的一种专门性的调查活动。 2、抽样 抽样是指在抽样调查时采用一定的方法,抽选具有代表性的样本,以及各种抽样操作技巧和工作程序等的总称。 3、随机抽样 随机抽样又称为概率抽样或机率抽样,是对总体中每一个体都给予平等的抽取机会的抽样技术。在随机抽样的条件下,每个个体抽中或抽不中完全凭机遇,

习题六 样本及抽样分布

习题六 样本及抽样分布 一、填空题 1.设来自总体X 的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =22.716; 2.在总体~(5,16)X N 中随机地抽取一个容量为 36 的样本,则均值X 落在4与6之间的概率 = 0.9332 ; 3. 设某厂生产的灯泡的使用寿命2~(1000,)X N σ (单位:小时),抽取一容量为9的样本,得到940,100x s ==,则(940)P X <= ; 4.设127,,...,X X X 为总体2 ~(0,0.5)X N 的一个样本,则7 21(4)i i P X =>=∑ 0.025 ; 5.设126,,...,X X X 为总体~(0,1)X N 的一个样本,且cY 服从2χ分布,这里, 22123456()()Y X X X X X X =+++++,则c =1/3 ; 6.设随机变量,X Y 相互独立,均服从2(0,3)N 分布且129,,...,X X X 与129,,...,Y Y Y 分别是来自总体,X Y 的简单随机样本,则统计量U =服从参数为 9 的 t 分布。 7.设1234,,,X X X X 是取自2~(0,2)X N 正态总体的简单随机样本且 22!234(2)(34),Y a X X b X X =-+-,则a = 0.05 ,b = 0.01 时,统计量Y 服从 2χ分布,其自由度为 2 ; 8.设总体 X 服从正态分布2~(0,2)X N ,而1215,,...,X X X 是来自总体的简单随机 样本,则随机变量 22 110 22 1115...2(...) X X Y X X ++=++ 服从 F 分布,参数为 10,5 ; 9.设随机变量2 1 ~()(1),,X t n n Y X >= 则~Y F(n,1) ; 10.设随机变量~(,)X F n n 且()0.3P X A >=,A 为常数,则1 ()P X A > = 0.7

样本与抽样分布

样本与抽样分布 Corporation standardization office #QS8QHH-HHGX8Q8-GNHHJ8

第六章样本与抽样分布 §数理统计的基本概念 一.数理统计研究的对象 例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X 表示。 (1)若规定寿命低于1000小时的产品为次品。此问题是求P(X £1000)=F(10000),求F(x) (2)从平均寿命、使用时数长短差异来看其质量,即求E(x)、D(x)。 要解决二个问题

1.试验设计抽样方法。 2.数据处理或统计推断。 方法具有“从局部推断总体”的特点。 二.总体(母体)和个体 1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。 说明: (1)对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他们在整体中的分布。所以总体是个体的数量指标的全体。

(2)为研究方便将总体与一个 X对应 (等同)。 a.总体中不同的数量指标的全体, 即是的全部取值。 b. X的分布即是总体的分布情 况。 例:一批产品是100个灯泡,经测 试其寿命是: 1000小时 1100小时 1200小时 20个30个 50个 X 1000 1100

1200 P 20/100 30/100 50/100 (设X表示灯泡的寿命)可知的分布 律, 就是总体寿命的分布,反之亦然。 常称总体X,若~F(x),有时也用 F(x)表示一个总体。 (3)我们对每一个研究对象可能要观 测两个或多个数量指标,则可用多 维随机向量(X,Y,Z, …)去描述总 体。 2.总体的分类

相关文档
最新文档