抽样分布及参数估计作业1
第5章--抽样分布与参数估计教案资料

(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
9
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
9,10
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
(9.5)
10
10,1
10,2
10,3
10,4
10,5
10,6
10,7
10,8
10,9
10,10
数是 ,标准差是 ,从这个总体中抽出一 个容量是 n 的样本,则样本平均数 X 也服从 正态分布,其平均数 E( X ) 仍为 ,其标准
差为 。 X 5-19
从正态分布的再生定理可以看出,只要总体 变量服从正态分布,则从中抽取的样本,不管n 是多少,样本平均数都服从正态分布。但是在 客观实际中,总体并非都是正态分布。对于从 非正态分布的总体中抽取的样本平均数的分布 问题,需要由中心极限定理来解决。
第5章--抽样分布与参数估计
第一节 抽样的基本概念与数学原理
一、有关抽样的基本概念 二、大数定理与中心极限定理
5-2
一、有关抽样的基本概念
(一)样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分
单位的集合,这个集合的大小称为样本容量, 一般用n表示,它表明一个样本中所包含的单 位数。
lim
n
1 n
p
n
i 1
X
i
1
(5.5)
5-17
大数定理表明:尽管个别现象受偶然因 素影响,有各自不同的表现。但是,对总体 的大量观察后进行平均,就能使偶然因素的 影响相互抵消,消除由个别偶然因素引起的 极端性影响,从而使总体平均数稳定下来, 反映出事物变化的一般规律。
抽样分布与参数估计

三、t分布曲线下的面积分布规律
自由度为 的t分布曲线
t 分布曲线下 的整个面积为1, t 分布曲线下从a到b 的面积为t值分布 在此范围内的百分 比,即t值落在此 范围内的概率P。
双侧:由于t分布以0为中心对称,即 P(t≤- t, )= P(t≥ t, )= /2 于是有P(- t, ≤t≤ t, )=1-
sx
u X
X
t X =n-1
s X
u分布 t分布
二、t分布图形的特点
• 1. t分布是一簇曲线。 t分布有一个参数, 即自由度 ,与标准差的自由度一致。
• 2. t分布曲线以0为中心,左右对称; 越小, t变量值的离散程度越大,曲线越扁平。
• 3. t分布曲线较标准正态曲线要扁平些(高 峰低些,两尾部翘得高些), 逐渐增大, t分布曲线逐渐的逼近于标准正态曲线,若 =,则t分布曲线和标准正态曲线完全吻 合。
参数估计在统计方法中的地位
统计方法
描述统计
推断统计
点值估计
参数估计
假设检验
区间估计
一、基本概念
➢ 参数估计:用样本统计量来估计总体参数。
点值估计:不计抽样误差,直接用样本均数来 估计μ。
区间估计:根据抽样误差的规律,按一定的概 率估计总体均数的所在范围。统计上习惯用95% 或99%可信区间表示总体均数可能所在范围。
第一节 均数的抽样误差 第二节 t分布 第三节 总体均数可信区间的估计
一、抽样研究:从总体中随机抽取部分 观察单位构成样本,用样本信息去 推断总体特征的研究方法。
统计推断的过程
总体
样
样本统计量
本
例如:样本均
值、比例
二、抽样误差:在抽样研究中,因抽样造 成的样本统计量与样本统计量、样本统计 量与总体参数的差值。
第4章抽样分布与参数估计习题

第四章抽样分布与参数估计思考与练习一、单项选择题1.抽样平均误差与极限误差间的关系是( d )。
a. 抽样平均误差大于极限误差b. 抽样平均误差等于极限误差c. 抽样平均误差小于极限误差d. 抽样平均误差可能大于、等于或小于极限误差2.在其它条件不变的情况下,如果允许误差缩小为原来的二分之一,则样本容量( a )。
a. 扩大为原来的4倍b. 扩大为原来的2倍c. 缩小为原来的二分之一d. 缩小为原来的四分之一3.类型抽样影响抽样平均误差的方差是( b )。
a. 组间方差b. 组内方差c. 总方差d. 允许误差4.当样本单位数充分大时,样本估计量充分地靠近总体指标的可能性趋于1,称为抽样估计的( b )。
a.无偏性b.一致性c.有效性d.充分性二、多项选择题1.影响抽样平均误差的因素有( a b c d )。
a.总体标志变异程度b.样本容量c.抽样方式d.抽样的组织形式e.样本指标值的大小2.抽样估计的抽样平均误差(a c e)。
a.是不可避免要产生的b.是可以通过改进调查方法消除的c.是可以事先计算的d.只有调查结束之后才能计算e.其大小是可以控制的3.确定样本容量时,可用以下方法取得近似的总体方差估计值(a b c )。
a.参考以往调查的经验资料b.以试点调查的样本方差来估计c.在做成数估计时,用成数方差最大值0.25来代替d.假定总体不存在标志变异,方差为零三、计算题1.某市居民家庭人均年收入是服从μ=4 000元,σ=1 200元的正态分布,求该市居民家庭人均年收入:(1)在5 000~7 000元之间的概率;(2)超过8 000元的概率。
解:(1)1200,4000==σμ。
{}()()0.197055935.020325.09876.00062.08333.02}8333.0{1}5.2{2}5.2{1}8333.0{}5.2{}5.28333.0{}70005000{}70005000{=+-+=⎪⎪⎭⎫ ⎝⎛<+<--⎪⎪⎭⎫ ⎝⎛<+<-=<-<=<<=-<=-<-=<<z prob z prob z prob z prob z prob z prob z prob z x prob x prob σμσμσμ (2) {}{}{}00035.0333.32333.311333.31}333.3{}8000{}8000{=⎥⎥⎦⎤⎢⎢⎣⎡<+<--=<-=>=->=-=>z prob z prob z prob z prob z x prob x prob σμσμ2.某小组5个工人的周工资分别为140、160、180、200、220元,现在用重复抽样的方法从中抽出2个工人的工资构成样本。
抽样分布、参数估计和假设检验

抽样分布一、抽样分布的理论及定理 (一) 抽样分布抽样分布是统计推断的基础,它是指从总体中随机抽取容量为n 的若干个样本,对每一样本可计算其k 统计量,而k 个统计量构成的分布即为抽样分布,也称统计量分布或随机变量函数分布。
(二) 中心极限定理中心极限定理是用极限的方法所求的随机变量分布的一系列定理,其内容主要反映在三个方面。
1.如果总体呈正态分布,则从总体中抽取容量为n 的一切可能样本时,其样本均数的分布也呈正态分布;无论总体是否服从正态分布,只要样本容量足够大,样本均数的分布也接近正态分布。
2.从总体中抽取容量为n 的一切可能样本时,所有样本均数的均数(X μ)等于总体均数(μ)即μμ=X3.从总体中抽取容量为n 的一切可能样本时,所有样本均数的标准差(X σ)等于总体标准差除以样本容量的算数平方根,即n X σσ=中心极限定理在统计学中是相当重要的。
因为许多问题都使用正态曲线的方法。
这个定理适于无限总体的抽样,同样也适于有限总体的抽样。
中心极限定理不仅给出了样本均数抽样分布的正态性依据,使得大多数数据分布都能运用正态分布的理论进行分析,而且还给出了推断统计中两个重要参数(即样本均数X μ与样本标准差X σ)的计算方法。
(三)抽样分布中的几个重要概念1.随机样本。
统计学是以概率论为其理论和方法的科学,概率又是研究随机现象的,因此进行统计推断所使用的样本必须为随机样本(random sample )。
所谓随机样本是指按照概率的规律抽取的样本,2.抽样误差。
从总体中抽取容量为n 的k 个样本时,样本统计量与总体参数之间总会存在一定的差距,而这种差距是由于抽样的随机性所引起的样本统计量与总体参数之间的不同,称为抽样误差。
3.标准误。
样本统计量分布的标准差或某统计量在抽样分布上的标准差,符号SE 或Xσ表示。
根据中心极限定理其标准差为n X σσ=正如标准差越小,数据分布越集中,平均数的代表性越好。
统计学 第 6 章 抽样与参数估计

第6章抽样与参数估计第6章抽样与参数估计6.1抽样与抽样分布6.2参数估计的基本方法6.3总体均值的区间估计6.4总体比例的区间估计6.5样本容量的确定学习目标理解抽样方法与抽样分布估计量与估计值的概念点估计与区间估计的区别评价估计量优良性的标准总体均值的区间估计方法总体比例的区间估计方法样本容量的确定方法参数估计在统计方法中的地位统计推断的过程6.1抽样与抽样分布什么是抽样推断概率捕样方法抽样分布抽样方法抽样方法概率抽样(probabilitysampling)也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样(simplerandomsampling)从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的最基本的抽样方法,是其它抽样方法的基础特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其它辅助信息以提高估计的效率分层抽样(stratifiedsampling)将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计系统抽样(systematicsainplmg)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范闱内随机地抽取一个单位作为初始单位,然后按爭先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难整群抽样(clustersampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差抽样分布总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布总体分布(populationdistribution)一个样本中各观察值的分布也称经验分布当样本容屋n逐渐增大时,样本分布逐渐接近总体的分布样本分布(sampledistribution)抽样分布的概念(samplingdistribution)抽样分布是指样本统计屋的分布,即把某种样本统计量看作一个随机变量,这个随机变屋的全部可能值构成的新的总体所形成的分布即为某种统计量的抽样分布.统计量:样本均值,样本比例,样本方差等样本统计量的概率分布是一种理论概率分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据对抽样分布的理解抽样分布:即不是总体分布,也不是样本分布,是根据所有可能样本计算的统计量的全部可能取值形成的分布样本均值的抽样分布容量相同的所有町能样本的样本均值的概率分布一种理论概率分布进行推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布(例题分析)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。
《统计学》第10讲 参数估计(复习+习题)

(二)方差的区间估计
1.总体方差的区间估计
对于来自正态总体的容量为n的简单随机样本,统 计量 n 1s 2 / 2 服从自由度为 n 1 的卡方分布。
n 1 s 2
2
~ 2 n 1
总体方差在1- 置信水平下的置信区间为
2 n 1 s
2
2 2 2 2 s1 s2 s1 s2 , F 2 F1 2
F分布两个自由度
24
(三)总体比率区间估计
1.单样本比率的区间估计
当样本容量充分大时,样本比率p近似服从以总体比
率P为数学期望,以P(1-P)/n为方差的正态分布。
1. 样本比率的数学期望
E (p) P
2. 样本比率的方差
P (1 P ) n
n1 n2
18
( n1 3 0, n 2 3 0 )
大样本,方差已知(两个总体分布没有要求)
1. 两个样本均值之差 x 1 x 2 的抽样分布服从正态
分布,其数学期望为两个总体均值之差
E (x1 x 2 ) 1
2
2. 方差为各自的方差之和
2 x1 x 2
12 22 n1 n2
•
分别从两个独立的随机总体中抽取容量为n1和n2的 独立样本,当两个样本都为大样本时,两个样本比 率之差的抽样分布可用正态分布来近似。 数学期望为
• •
E ( p 1 p 2 ) P1 P 2
方差为各自的方差之和
27
2 p1 p 2
P1 (1 P1 ) P2 (1 P2 ) n1 n2
2
2 2 x n
曾五一《统计学导论》配套题库【章节题库】第五章 抽样分布与参数估计 【圣才出品】

12.样本均值的抽样标准差 x ,( ).
A.随着样本量的增大而变小 B.随着样本量的增大而变大
5 / 30
圣才电子书 十万种考研考证电子书、题库视频学习平台
C.与样本量的大小无关
D.大于总体标准差
【答案】A
【解析】根据样本均值的抽样分布可知,样本均值抽样分布的标准差 x
D.服从 2 分布
【答案】B
【解析】当 n 比较大时,样本均值的抽样分布近似服从正态分布。题中 n 36 30 为
大样本,因此样本均值的抽样分布近似服从正态分布。
5.估计量的含义是指( )。 A.用来估计总体参数的统计量的名称
2 / 30
圣才电子书 十万种考研考证电子书、题库视频学习平台
圣才电子书 十万种考研考证电子书、题库视频学习平台
第五章 抽样分布与参数估计
一、单项选择题 1.抽样分布是指( )。 A.一个样本各观测值的分布 B.总体中各观测值的分布 C.样本统计量的分布 D.样本数量的分布 【答案】C 【解析】统计量是样本的函数,它是一个随机变量。样本统计量的分布称为抽样分布。
2.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布, 其分布的均值为( )。
A.
B. X C. 2
2 D.
n 【答案】A
【解析】根据中心极限定理,设从均值为 ,方差为 2 的任意一个总体中抽取样本量 为 n 的样本,当 n 充分大时,样本均值的抽样分布近似服从均值为 ,方差为 2 n 的正
n
,样本
量越大,样本均值的抽样标准差就越小。
13.在用正态分布进行置信区间估计时,临界值 1.645 所对应的置信水平是( )。 A.85% B.90% C.95% D.99% 【答案】B 【解析】置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在
统计学课后答案(第3版)第6章抽样分布与参数估计习题答案

第六章 抽样分布与参数估计习题答案一、单选1.B ;2.D ;3.D ;4.C ;5.A ;6.B ;7.C ;8.D ;9.A ;10.A 二、多选1.ADE ;2.ACDE ;3.ABCD ;4.ADE ;5.BCE6.ACD ;7.ACDE ;8.ACE ;9.BCE ;10.ABD 三、计算分析题1、解:n=10,小样本,由EXCEL 计算有:11.6498==S x ; (1)方差已知,由10596.14982⨯±=±nz x σα得,(494.9,501.1)(2)方差未知,由1011.62622.2498)1(2⨯±=-±nS n t x α得,(493.63,502.37)2、n=500为大样本,p=80/500=16%,则置信区间为 016.096.1%16500)16.01(16.096.1%16)1(2⨯±=-⨯±=-±n p p z p α=(14.4%,17.6%) 3、nx σσ=,由于大国抽取的样本容量大,则抽样平均误差小。
4、(1)3.10100103===nS x σ(小时);=-=-=100)95.01(95.0)1(n p p p σ 2.18%(2)=⨯±=±3.10211202x z x σα(1099.4,1140.6) ⨯±=±2%952p z p σα2.18%=(90.64,99.36)5、为简化起见,按照重复抽样形式计算 (1)∑∑=ff s Si22=22.292; 472.010072.4===nS x σ(2)93.0691472.096.1100691002±=⨯±=±nSz x α=(690.07,691.93) 6、由于总体标准差已知,则用标准状态分布统计量估计nz x σα2=∆(1)10160170102022=-===∆αασz nz x则58.12=αz ,有%29.94)58.1(=F α=1-94.29%=5.71%,则概率%58.88%71.5%29.941=-=-=α (2)=⇒⨯=⇒⨯=∆n n nz x 2096.142σα97(个)(3)=⇒⨯=⇒⨯=∆n nnz x 2096.122σα385(个)允许误差缩小一半,样本容量则为原来的4倍。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样分布及参数估计作业1
一、某农副产品公司对某种名茶做随机重复抽样,抽检结果如下:
要求:1、计算样本平均数和抽样平均误差;
2、试以0.9973(Z=3)的概率保证程度,估计这批茶叶平均每包重量的置信区间;
3、若按质量规定,这种茶叶每包重量不得低于150克,试以95.45%(Z =2)的概率保证程度,估计这批茶叶每包重量不合格品率的范围。
二、从某学校参加英语等级考试的学生中随机抽取100名,考试成绩分组资料如下:
试以95.45%的可靠程度估计该校学生英语等级考试在75分以上的学生所占比重的范围。
(z=2)。