第六章 抽样理论与参数估计 作业
统计学 第 6 章 抽样与参数估计

第6章抽样与参数估计第6章抽样与参数估计6.1抽样与抽样分布6.2参数估计的基本方法6.3总体均值的区间估计6.4总体比例的区间估计6.5样本容量的确定学习目标理解抽样方法与抽样分布估计量与估计值的概念点估计与区间估计的区别评价估计量优良性的标准总体均值的区间估计方法总体比例的区间估计方法样本容量的确定方法参数估计在统计方法中的地位统计推断的过程6.1抽样与抽样分布什么是抽样推断概率捕样方法抽样分布抽样方法抽样方法概率抽样(probabilitysampling)也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样(simplerandomsampling)从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的最基本的抽样方法,是其它抽样方法的基础特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其它辅助信息以提高估计的效率分层抽样(stratifiedsampling)将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计系统抽样(systematicsainplmg)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范闱内随机地抽取一个单位作为初始单位,然后按爭先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难整群抽样(clustersampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差抽样分布总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布总体分布(populationdistribution)一个样本中各观察值的分布也称经验分布当样本容屋n逐渐增大时,样本分布逐渐接近总体的分布样本分布(sampledistribution)抽样分布的概念(samplingdistribution)抽样分布是指样本统计屋的分布,即把某种样本统计量看作一个随机变量,这个随机变屋的全部可能值构成的新的总体所形成的分布即为某种统计量的抽样分布.统计量:样本均值,样本比例,样本方差等样本统计量的概率分布是一种理论概率分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据对抽样分布的理解抽样分布:即不是总体分布,也不是样本分布,是根据所有可能样本计算的统计量的全部可能取值形成的分布样本均值的抽样分布容量相同的所有町能样本的样本均值的概率分布一种理论概率分布进行推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布(例题分析)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。
参数估计习题及答案

参数估计习题及答案参数估计在统计学中是一个重要的概念,它涉及到根据样本数据来估计总体参数的过程。
下面,我将提供一些参数估计的习题以及相应的答案,以帮助学生更好地理解这一概念。
习题一:假设有一个班级的学生数学成绩,我们从这个班级中随机抽取了10名学生的成绩,得到样本均值 \(\bar{x} = 85\),样本标准差 \(s = 10\)。
请估计总体均值 \(\mu\)。
答案:根据样本均值 \(\bar{x}\) 来估计总体均值 \(\mu\),我们可以使用以下公式:\[ \hat{\mu} = \bar{x} \]因此,\(\hat{\mu} = 85\)。
习题二:在习题一中,如果我们想要估计总体方差 \(\sigma^2\),我们应该如何操作?答案:总体方差 \(\sigma^2\) 通常使用样本方差 \(s^2\) 来估计,样本方差的计算公式为:\[ s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2 \]其中 \(n\) 是样本大小,\(x_i\) 是第 \(i\) 个观测值。
在这个例子中,\(n = 10\),\(\bar{x} = 85\),\(s = 10\)。
因此,我们可以使用以下公式来估计总体方差:\[ \hat{\sigma}^2 = s^2 = \frac{1}{10-1} \times 10^2 = 100 \]习题三:一个工厂生产的产品长度服从正态分布,样本均值为 \(\bar{x} =50\) 厘米,样本标准差为 \(s = 2\) 厘米。
如果我们知道总体均值\(\mu\) 为 \(50\) 厘米,我们如何估计总体标准差 \(\sigma\)?答案:根据已知的样本均值 \(\bar{x}\) 和样本标准差 \(s\),我们可以使用以下公式来估计总体标准差 \(\sigma\):\[ \hat{\sigma} = s \]因此,\(\hat{\sigma} = 2\) 厘米。
统计学第六章抽样与参数估计

统计学第六章抽样与参数估计《统计学》第六章抽样与参数估计1、某市劳动和社会保障局想调查下岗职工中女性所占的比重,随机抽取300个下岗职工,发现其中195个为女性职工。
试以95.45%的概率保证程度,估计该市下岗职工中女性比重的区间范围。
解:已知n=300,概率保证程度95.45%,Z 0.0455/2 =2P=300195=65% 区间范围P n )1(2p p -Z ±α=0.65300)65.01(65.02-±=0.65±0.055 该市下岗职工中女性比重的区间范围为59.5%~70.5之间2、某灯管厂生产10万只日光灯管,现采用简单随机重复抽样方式抽取1‰灯管进行质量检验,测试结果如下表所示:耐用时间(小时)灯管数(只)800以下 10 800-900 15 900-1000 35 1000-1100 25 1100以上 15 合计100根据上述资料:(1)试计算抽样总体灯管的平均耐用时间(2)在99.73%的概率保证程度下,估计10万只灯管平均耐用时间的区间范围。
(3)按质量规定,凡耐用时间不及800小时的灯管为不合格品,试计算抽样总体灯管的合格率,并按95%的概率保证程度下,估计10万只灯管的合格率区间范围。
(4)若上述条件不变,只是抽样极限误差可放宽到40小时,在99.73%的概率保证程度下,作下一次抽样调查,需抽多少只灯管检验?解:耐用时间(小时)灯管数(只)f组中值x xf f x x 2)(-800以下 10 750 7500 484000 800-900 15 850 12750 216000 900-1000 35 950 33250 14000 1000-1100 25 1050 26250 160000 1100以上15115017250486000合计 100 - 97000 1360000(1)平均耐热时间x =∑∑f xf =10097000=970(小时)(2)S2=∑∑-ffx x 2)( =1001360000=13600 x σ=n s 2=10013600=11.66 x ?=3×11.66=34.98 x x ?±=970±34.98在99.73%的概率保证程度下,该灯管平均耐用时间在935.02~1004.98小时之间(3)p=10015253515+++=0.9p σ=03.0100)9.01(9.0)1(≡-≡-n p pp ?=1.96×0.03=0.0588 p ±p ?=0.9±0.0588在95%的概率保证程度下,该灯管的合格率在84.12%~95.88%之间(4)n=x2222Z s α=2240136003?=76.5≈77(只)。
第六章抽样与参数估计

第六章抽样与参数估计1、某地区粮食播种面积共5000亩,按不重复抽样方法随机抽取了100亩进行实测。
调查结果,平均亩产为450公斤,亩产量的标准差为52公斤。
试以95%的置信度估计该地区粮食平均亩产量的区间。
2、某地对上年栽种一批树苗共3000株进行了抽样调查,随机抽查的200株树苗中有170株成活。
试以95.45%的概率估计该批树苗的成活率的置信区间和成活总数的置信区间。
3、某公司有职工3000人,现从中随机抽取60人调查其工资收入情况,得到有关资料如下:(2)试以0.9545的置信度估计月收入在1000元及以上工人所占比重。
4、对一批产品按不重复抽样方法抽选200件,其中废品8件。
又知道抽样总体是成品总量的1/20,当概率为95.45%时,可否认为这一批成品的废品率低于5%?5、某企业从长期实践得知,其产品直径X是一随机变量,服从方差为0.05的正态分布。
从某日产品中随机抽取6个,测得其直径分别为14.8,15.3,15.1,15,14.7,15.1(单位:厘米)。
在0.95的置信度下,试求该产品直径的均值的置信区间。
6、某厂对一批产品的质量进行抽样检验,采用重复抽样抽取样品200只,样本优质品率为85%,试计算当把握程度为95%时优质品率的区间范围。
7、检验某食品厂本月生产的10000袋产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。
要求在95.45%的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?8、某企业对一批产品进行质量检验,这批产品的总数为5000件,过去几次同类调查所得的产品合格率为93%、95%和96%,为了使合格率的允许误差不超过3%,在99.73%的概率下应抽查多少件产品?9、某广告公司为了估计某地区收看某个新电视节目的居民人数所占比重,设计了一个抽样方案。
如果该公司希望有95%的信心使所估计的比重只有2个百分点的误差,问样本量定为多少人较为合适?10、某地区对居民用于某类消费品的年支出数额进行了一次抽样调查。
统计学第六章 抽样法

第六章 抽样法
序号
1 2 3 4
5 6 7 8
9 10 11 12
13 14 15 16 合计
样本变量x
40、40 40、50 40、70 40、80
50、40 50、50 50、70 50、80
70、40 70、50 70、70 70、80
80、40 80、50 80、70 80、80
-
x
x E(x)
总体
研究如何利用 样本数据来 推断总体特 征。
内容包括:参 数估计和假 设检验。
目的:对总体
特征作出推
样 本
断。
这是推断统计学研 究的问题
5
第六章 抽样法
描述统计与推断统计的关系
反映客观 现象的数
据
概率论
(包括分布理论、大 数定律和中心极限定
理等)
样本数
描述统计
推断统计
据
总体数 据
(统计数据的搜集 、整理、显示和分
13
第六章 抽样法
第二节 有关抽样的基本概念(2)
(二)抽样总体
也称子样,样本或样本总体,它是从全 及总体中随机抽取出来的,代表全及总体的 那部分单位的集合体。抽样总体的单位数称 为样本容量,用n表示,对于N来说,n是很 小的。
总体
样 本
14
第六章 抽样法
第二节 有关抽样的基本概念(3)
• 二 全及指标和抽样指标p.249 (一) 全及指标
研究总体中 的品质标志
总体成数 P N1
N
总体成数标准差 P
P1 P
17
第六章 抽样法
第二节 有关抽样的基本概念(5)
(二)抽样指标
抽样指标是由样本总体各单位标志值 或标志特征计算的综合指标,也称统计量。 与全及指标相对应有:样本平均数,样本 标准差;样本成数,样本成数的标准差。
第6章 抽样与参数估计

第6章 抽样与参数估计练习题参考答案一、单项选择题1.B2.C3.D4.D5.A6.B7.D8.C9.C 10.B 11.C 12.B 13.A 14.C 15.D 16.A 二、多项选择题1.ACDE2.ABD3.ACE4.ABCE5.ACDE6.AB7.ADE8.ABD9.(将题中的“可靠性”改为“精确性”)BC 10.ABC 11.BD 12.ABCDE 13.AC 14.ACD 15.BDE 三、判断题1.×2.√3.×4.×5.√6.√7.×8.√9.× 10.√ 11.√ 12.√ 四、计算分析题 1.解:重复抽样: 1414.0002222(克)===nXσσ不重复抽样: 199.0110000100100001002122(克)===--⨯--⋅N n N nXσσ2.解:①已假定总体标准差为σ=15元,则样本均值的抽样标准误差为1429.24915===n X σσ②已知置信水平1-α=95%, Z α/2=1.96, 允许误差2.41429.296.12/2/≈⨯=⋅=⋅=∆XXZ nZ σσαα③已知样本均值为()元120=X,置信水平1-α=95%,Z α/2=1.96,总体均值的置信区间为2.41202/±=⋅±nZ Xσα如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。
3.解:①该校学生考试的平均成绩:6.76100766015151==⋅=∑∑==k k k k kf X f X()43.1199129441151251≈=⋅--=∑∑==k k kk k f XXf S143.110043.11=≈=nXσσ由 α-1=95.45% 查表 Z α/2=2, 2754.21377.122/=⨯==∆XXZ σαXX X X∆+≤≤∆-μ2754.26.762754.26.76+≤≤-μ在95.45%的置信水平下,该校学生考试的平均成绩区间范围是:88.7832.74≤≤X②该校学生成绩在80分以上的学生所占比重: %481004821===n n p04996.0100)48.01(48.0)1(=-⨯=-=np p pσ09992.004996.022/=⨯==∆ppZ σα全校80分以上的学生所占的比重范围为:下限=pp ∆-=0.48-0.09992=0.3801上限=pp ∆+=0.48+0.9992=0.5799所以在95.45%概率保证程度下,该校学生成绩在80分以上的比重范围在38.01%—57.99%之间。
第六章《抽样估计》作业解答

第六章《抽样估计》作业解答一、解:(1)x =f xf ∑∑=10015030=150.3(克) =2δff x x ∑∑2)(-=0.76 u x =)1(2N n n -σ = 99.010076.0⨯ = 0.087; 由于F(t)=0.9973, t=3 ∴ △x =t ×u x =3×0.087=0.26 平均每包重量的置信区间为:x ±△x即:150.3±0.26 → (74.44,78.76)所以该批产品以99.73%的概率,达到了重量规格的要求。
(2)p =10070=70%; u p =)1()1(N n n p p -- = )01.01(1003.07.0-⨯=4.6% △p =t ×u p =3×4.6%=13. 8% ∴该批产品包装合格率的置信区间为:p ±△p即:70%±13.8% → (56. 2%,83. 8%)该批产品以99.73%的概率保证合格率在56. 2%~83. 8%之间。
二、解:(1)x =f xf ∑∑=76.6(分) =2δff x x ∑∑2)(-=129.44; u x =)1(2N n n -σ = 9.010044.129⨯ = 1.079; △x =t ×u x =2×1.079=2.16 置信区间为:(74.44,78.76)(2)p =10048=48%; u p =)1()1(Nn n p p -- = 4.7% △p =t ×u p =2×4.7%=9.48% 置信区间为:(38.52%,57.48%)三、解:已知 n=500,p =500175=35%; F(t)=0.9500, t=1.96 u p =n p p )1(- = 500)35.01(35.0-=2.13% △p =t ×u p =1.96×2.13%=4.1748% ∴ 置信区间为:p ±△p即:35%±4.1748% → (30.83%,39.17%)我们有95%的把握程度说,喜欢该节目的观众在30.83%~39.17%之间。
统计学第六章参数估计和假设检验习题

统计学第六章参数估计和假设检验习题第六章参数估计和假设检验一、填空题1、总体参数估计是指2、称为置信水平,表示为3、落在总体均值两个抽样标准差范围内的概率为4、影响样本的单位数目的因素有5、是研究者想收集证据予以反对的假设。
答案:1、就是以样本统计量来估计总体参数,总体参数是常数,而统计量是随机变量。
2、将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例,(1 -3、0.95454、总体变量的变异程度σ、允许的误差范围△、抽样的可靠程度1-α5、纯随机抽样、等距抽样(机械抽样)、类型抽样(分层抽样)和整群抽样二、单项选择题1、估计量的含义是指(A)A.用来估计总体参数的统计量的名称B.用来估计总体参数的统计量的具体数值C.总体参数的名称D.总体参数的具体数值2、一个95%的置信区间是指( C )A.总体参数有95%的概率落在这一区间内B.总体参数有5%的概率未落在这一区间内C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数3、抽取一个容量为100的随机样本,其均值为x =81,标准着s=12。
总体均值μ的99%的置信区间为( C )81±1.9781±2.3581±3.1081±3.524.成数与成数方差的关系是(C )A.成数的数值越接近0,成数的方差越大B.成数的数值越接近0.3,成数的方差越大C.成数的数值越接近0.5,成数的方差越大D.成数的数值越接近l ,成数的方差越大5.纯随机重复抽样的条件下,若其他条件不变,要使抽样平均误差缩小为原来的1/3,则样本单位数必须( B )A.增大到原来的3倍B.增大到原来的9倍C.增大到原来的6倍D.也是原来的1/36、对于非正态总体,使用统计量x z =估计总体均值的条件是(D ) A .小样本B .总体方差已知C .总体方差未知D .大样本7、在假设检验中,原假设和备选假设( C )A. 都有可能成立B. 都有可能不成立C. 只有一个成立而且必有一个成立D. 原假设一定成立,备选假设不一定成立8.一种零件的标准长度5cm ,要检验某天生产的零件是否符合标准要求,建立的原假设和备选假设就为( A )A .0:5H μ=,1:5H μ≠B .0:5H μ≠,1:5H μ>C .0:5H μ≤,1:5H μ>D .0:5H μ≥,1:5H μ<9、若检验的假设为00:H μμ≥,10:H μμ<,则拒绝域为( B )A .z z α>B .z z α<-C ./2z z α<-或/2z z α<-D .z z α>或z z α<-10。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样分布
(sampling distribution)
1. 样本统计量的概率分布
2. 是一种理论概率分布 3. 随机变量是 样本统计量
– 样本均值, 样本比例,样本方差等
4. 结果来自容量相同的所有可能样本 5. 提供了样本统计量长远我们稳定的信息,是进 行推断的理论基础,也是抽样推断科学性的重 要依据
2
1.5 2.0 2.5 3.0 1
3
2.0 2.5 3.0 3.5 1.0 1.5 2
4
2.5 3.0 3.5 4.0 2.0 3 2.5 4 3
0.1 0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
样本均值的抽样分布
均值X的取值 均值X的个数
3.0
3.5 2
4.0 1
取值的概率P(X ) 1/16 2/16 3/16 4/16 3/16 2/16 1/16
2
1,2 2,2 3,2 4,2
3
1,3 2,3 3,3 4,3
4
1,4 2,4 3,4 4,4
样本均值的抽样分布
(例题分析)(重复抽样)
计算出各样本的均值如下表。给出样本均值的抽样分布
16个样本的均值(x)
0.3 0.2 P (X )
第一个 观察值
1 2 3 4
第二个观察值
1
1.0 1.5 2.0 2.5
Z 2 n d 1.9613 2 162 .3 163 2
2
第二节 样本分布
• • • • • 一、什么是样本分布 二、正态分布及渐近正态分布 三、t分布 四、 分布 2 F分布 五、
一、样本分布/抽样分布
• 样本分布指样本统计量的分布,它是统计 推论的重要依据。 • 在谈及样本统计量的分布时,首先要保证 各个样本是独立的,各个样本都服从同样 的分布。要保证这一点,取样方法应该用 随机抽样的方法。
=10
n=4 x 5 n =16 x 2.5
= 50
X
x 50
X
总体分布
抽样分布
中心极限定理
(central limit theorem)
中心极限定理:设从均值为,方差为 2的一个任意总 体中抽取容量为 n的样本,当n充分大时,样本均值的抽 样分布近似服从均值为μ、方差为σ2/n的正态分布
样本均值的抽样分布
(例题分析)(重复抽样)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1、x2=2、x3=3 、x4=4 。 总体的均值、方差及分布如下 总体分布
.3
均值和方差
x
i 1
N
i
.2 .1 0
1 2 3 4
N
N i 1
2.5
2
N差 252 n差 n 120 42 N 720
Байду номын сангаас
⑵.最佳配置法
最佳配置法不仅考虑各层的人数比例,而 且考虑到了各层的标准差。当各层内的 标准差已知,应该在标准差大的层内多 分配而在标准差小的层内少分配抽样数 量。 最佳配置法可以使得到的样本具有较好的 异质性。
在各层内应抽取个体数计算
• 两阶段随机抽样(two-stages
random sampling)的一般过程是:
先将总体分成M个部分;
• 第一阶段从这M个部分中随机抽取m 个部分作为第一阶段样本;
• 第二阶段是分别从这m个部分中抽取
一定数量(ni)的个体构成第二阶段 样本。
5.整群抽样
• 整群随机抽样是先将 总体各单位按一定的
三.抽样设计的意义及原则
1.抽样设计的意义
⑴.使研究节省人力及费用;
⑵.使研究节省时间,提高时效性; ⑶.保证研究结果的准确性。
2.抽样设计的原则
• 抽样设计的要求是样本对研究总体有良 好的代表性,即样本的构成与总体保持 一致。为了保证这一点,抽样时必须遵 循随机化 (randomization)的基本原 则。 • 所谓随机化原则,是指在抽样时,样本 中的每一个体都是按照随机的原理被抽 取的,总体中每一个体被抽到的可能性 是相等的。
然后依固定的间隔取样。
• 等距抽样可以保证样本的成分与总体
一致,但随机性不如单纯随机抽样法。
应用中可将两种方法结合使用。
3.分层随机抽样
• 分层随机取样简称分层抽样 (stratified sampling 或
hierarchical sampling),是进行
大规模研究时常常使用的抽样方 法。
• 分层抽样的方法:先将总体按照一定标准 分为若干类型(统计上称为层),再根据 各层对象的数量在总体数量中所占的比例, 确定从每一种类型(层)中抽取样本的数 量,然后按随机原则和所确定的各层取样 的数量,从各层中取样。 • 做好分层随机取样的关键:分类的标准要 科学,要符合实际情况。各层内的差别要 小,而层与层之间的差异则越大越好。
标准分成许多群(小
组),然后按随机原 则从这些群中抽取若
干群作为样本。
• 整群随机取样法的优点是样本比较集 中,适宜于某些特定的研究,尤其是 在教育实验中常用此法。此外,在规 模较大的调查研究中,整群随机取样 易于组织,可节省人力、物力和时间。 • 整群随机抽样法的缺点是样本分布不 均匀,代表性较差。
• 简单随机抽样法的局限是:当样本 规模小时,样本的代表性较差。
简单随机取样有两种基本方式:
• 抽签法(drawing lots) • 随机数字表法(random number table)
2.等距抽样
• 等距抽样(interval sampling)也称为 机械抽样或系统抽样。实施时,先把 总体中的所有个体按一定顺序编号,
由 t
2
X S n
有
t S 2 n d
2
(22.5)
当样本容量n 未确定时,t 值无法确定, 因此一般采用尝试法。
• 例:拟估计某市高校四级英语考试 成绩的总体平均分数。以往考试成
绩的标准差为13,这次的估计最大
允许误差为2分,可信度为95%,问 应抽取多大的样本?
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
X
抽样分布与总体分布的关系
总体分布
正态分布
大样本
非正态分布
小样本
正态分布
正态分布 抽样分布
非正态分布
问题
• 样本平均数的分布是怎么得到的? • 样本平均数分布的平均数与方差和母总体的平均数 与方差有何关系?在不同情况下一样吗? • 什么叫自由度? • 样本平均数的分布与t分布的关系? 2 分布是什么分布?特点?应用于? •
(例题分析)(不重复抽样)
计算出各样本的均值如下表。给出样本均值的抽样分布
16个样本的均值(x) 第一 个 观察 值 1 2 1.5 第二个观察值 1 2 1.5 3 2.0 2.5 1.5 3.5 2 4 2.5 3.0 3.5 2.0 2 2.5 4
0.3 0.2 0.1 0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 X P (X )
X
= 2.5
σ2 =1.25
1.25 4 2 5 2 4 1 12
2 X
X 2.5
样本均值的抽样分布 与中心极限定理
当总体服从正态分布 N~(μ,σ2) 时,来自该总体的 所有容量为 n 的样本的均值 X也服从正态分布, X 的数学期望为μ,方差为σ2/n。即X~N(μ,σ2/n)
四 .样本容量的确定
• 1.确定样本容量的意义
• 在应用中应根据研究所要求的精确度及 经费情况确定样本容量。如果样本容量 过小,会影响样本对总体的代表性,增 大抽样误差而降低研究推论的精确性; 样本容量过大,虽然减小了抽样误差, 但可能增大过失误差,并且增加不必要 的人力物力资源的浪费。
• 样本容量与抽样误差并不 是直线关系。 • 确定容量的基本原则是: 在尽量节省人力、经费和 时间的条件下,确保用样 本推断总体达到预定的可 行度及准确性。
(22.3)
• 分层随机取样法的优点是代表性和
推论的精确性较好。它适用于总体 单位数量较多,并且内部差异较大
的研究对象。
• 分层随机取样法的局限性是要求对 总体各单位的情况有较多的了解, 否则就难以作出科学的分类。
4.两阶段随机抽样
• 当总体容量很大时,直接以总体中 的所有个体为对象,从中进行抽样, 在实际调查或研究中存在很大困难。 • 采用分阶段的抽样方法,可以缩小 实际抽样的范围,使实际抽样工作 能够按研究设计的要求顺利进行。
抽样分布
(sampling distribution)
总 体
样 本
计算样本统计 量 例如:样本均 值、比例、方 差
样本统计量的抽样分布
1、样本平均数的分布 2、样本方差的抽样分布
样本均值的抽样分布
1. 容量相同的所有可能样本的样本均值的概 率分布
2. 一种理论概率分布 3. 进行推断总体总体均值的理论基础
第六章 抽样理论与参数估计
第一节 抽样的基本概念
• • • • 一、概念回顾 二、抽样方法 三、抽样设计的意义及原则 四、样本容量的计算
统计推断的可靠性与下列因素有关 1.数据的质量 2.运用统计方 法及数据处理的准 确性 3.样本对总体 的代表性
在收集数据的 过程中控制 选择恰当的方法
通过抽样 设计控制
样本对总体的代表性,既涉及到抽样方法, 又涉及到样本的容量。
一、概念回顾
• 总体、个体、样本 • 参数、统计量
二.几种重要的随机抽样方法