第五章 抽样分布与推断

合集下载

第5章--抽样分布与参数估计教案资料

第5章--抽样分布与参数估计教案资料

(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
9
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
9,10
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
(9.5)
10
10,1
10,2
10,3
10,4
10,5
10,6
10,7
10,8
10,9
10,10
数是 ,标准差是 ,从这个总体中抽出一 个容量是 n 的样本,则样本平均数 X 也服从 正态分布,其平均数 E( X ) 仍为 ,其标准
差为 。 X 5-19
从正态分布的再生定理可以看出,只要总体 变量服从正态分布,则从中抽取的样本,不管n 是多少,样本平均数都服从正态分布。但是在 客观实际中,总体并非都是正态分布。对于从 非正态分布的总体中抽取的样本平均数的分布 问题,需要由中心极限定理来解决。
第5章--抽样分布与参数估计
第一节 抽样的基本概念与数学原理
一、有关抽样的基本概念 二、大数定理与中心极限定理
5-2
一、有关抽样的基本概念
(一)样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分
单位的集合,这个集合的大小称为样本容量, 一般用n表示,它表明一个样本中所包含的单 位数。
lim
n
1 n
p
n
i 1
X
i
1
(5.5)
5-17
大数定理表明:尽管个别现象受偶然因 素影响,有各自不同的表现。但是,对总体 的大量观察后进行平均,就能使偶然因素的 影响相互抵消,消除由个别偶然因素引起的 极端性影响,从而使总体平均数稳定下来, 反映出事物变化的一般规律。

社会统计学 第五章 正态分布

社会统计学 第五章 正态分布
在相同条件下进行N次实验 或观察,随机事件A出现的次 数为n,频次n与实验次数N 的比值n/N,称作N次实验或 观察中事件A的频率,即这一 事件出现的概率。 频率是试验值,而概率是个 理论值,其值是唯一的。
n P ( A) N
(2)古典概率类型
在古典概率类型问题中,所有可能的试验结果是有 限的,即试验的基本事件数是有限的,并且,所有 这些基本事件都是等可能的。 若事件组 A1, A2 , A3 ,, An 满足下面三个条件,则称该事 件为等可能完备事件组。
(1)二项试验
一个二项实验是一个满足如下条件的实验:
实验由确定的试验数所组成; 每个试验只有两个可能的结果,通常称为”成功” 和”失败”; 任一试验的结果独立于任何其他试验结果; 在各次实验中,”成功”的概率和”失败”的概率 都是固定的常数,并且他们的和等于1。
(2)二项实验的概率
1 5 p , q 1 p , n 20, m 7. 6 6
因此,20次中恰好出现7次6点的概率为:
P
7 20
1 7 5 20 -7 C ( ) ( ) 6 6
7 20
二项实验的概率
如果单次试验中,事件成功与失败的概 1 率相等,即 p q 2 则上述二项实验 的概率公式可简化为:
C
m n
Pnm m!
例7:
一条航线上共有十个航空站,请问这条航 线上共有多少种不同的飞机票? 有四栋大楼将分配给四个单位使用,分配 原则是每个单位只允许分配一栋,请问共 有多少种分配方案?
例8:
抛掷一枚骰子20次,则恰好出现7次“6 点”的概率. 解:这是一个二项实验,依题意,此时
例2:某年级共有学生100名,其中来自广东 省的有25名,来自广西省的有10名,问任抽 一名,来自两广的概率是多少?

抽样分布及总体平均数的推断

抽样分布及总体平均数的推断
量服从呈t分布。
于是需用t分布来估计该校三年级学生阅读
能力总体平均数95%和99%的置信区间。
由原始数据计算出样本统计量为
X 29.917
S 3.926
当P=0.95时, t11 2.201 0.05
因此,该校三年级学生阅读能力2 得分95%的置信区间为:
X t11 0.05
S n 1
检验的思路是:假定研究样本是从平均数为μ 的总体随机抽取的,而目标总体的平均数 为μ0,检验μ与μ0之间是否存在差异。如果 差异显著,可以认为研究样本的总体不是 平均数为μ0的总体,也就是说,研究样本 不是来自平均数为μ0的总体。
二、总体平均数显著性检验的步骤
一个完整的假设检验过程,一般经过四个 主要步骤:
2.平均数区间估计的计算
①总体正态,σ已知(不管样本容量大小),
或总体非正态,σ已知,大样本
平均数离差的的抽样分布呈正态,平均数的 置信区间为:
X
Z
2
n
X
Z
2
n
(9.1)
例题1:某小学10岁全体女童身 高历年来标准差为6.25厘米, 现从该校随机抽27名10岁女童, 测得平均身高为134.2厘米,试 估计该校10岁全体女童平均身 高的95%和99%置信区间。
⑴.提出假设 ⑵.选择检验统计量并计算统计量的值 ⑶.确定显著性水平 ⑷.做出统计结论
⑴.提出假设
即根据研究假设提出相应的统计检验的假设。
双侧检验的假设形式为: H0:μ=μ0, H1:μ≠μ0 单侧检验的假设形式为: H0:μ≥μ0,H1:μ<μ0 (左侧检验) 或者 H0:μ≤μ0,H1:μ>μ0 (右侧检验)
在确定检验形式时,凡是检验是否与假设 的总体一致的假设检验,α被分散在概率 分布曲线的两端,因此称为双侧检验。

第五章 统计推断(1)

第五章 统计推断(1)
2检验是根据s判断抽出该样本的总体 其标准差是否等于
某一给定值。
检验程序:
(a) 确定假设H 0和H A: H 0:= 0;H A 有三种可能的形式: ( 1 ) 0 (2) 0 (若已知不可能小于 0 ) (3) 0 (若已知不可能大于 0 )
(b)计算检验的统计量:
1. 单个样本平均数检验
在实际研究中,常常要 检验一个样本平均数 x与已知的总体 平均数0是否有显著差异,即检 验该样本是否来自某一 已知 的总体。
已知的总体平均数一般 为一些公认的理论数值 。如畜禽正常 的生理指标、怀孕期、 生产性能指标等,都可 以样本平均数 与之比较,检验差异显 著性。
1.1 在σ已知的情况下,单个平均数的显著性 检验-u检验 检验程序:
• 两类错误之间的关系如何?
二者的区别是I型错误只有在否定H0的情况下发生,而 II型错误只有在接受H0时才会发生。 二者的联系是,在样本容量相同的情况下,I型错误减 小,II型错误就会增大;反之II型错误减小,I型错误就 会增大。比如,将显著性水平α从0.05提高到0.01,就 更容易接受H0,因此犯I型错误的概率就减小,但相应 地增加了犯II型错误的概率。
第一节 假设检验的基本步骤及原理
1. 假设检验的基本步骤
我们通过一个例子来介绍假设检验的基本步骤:
例一,已知某品种玉米 单穗重X ~ N (300,9.52 ),即单穗重 总体平均数0 300g,标准差 9.5 g。在种植过程中喷洒 了某种药剂的植株中随 机抽取9个果穗,测得平均单穗 重 x 308g,试问这种药剂对该品 种玉米的平均单穗重 有无真实影响?
• (一)提出假设
首先对样本所在的总体 作一假设。假设喷洒了 药剂的玉米单穗重 总体平均数与原来的玉米单穗重总 体平均数0之间没有真实差异, 即=0。也就是说表面差异( x 0)是由抽样误差造成的 。

抽样与抽样分布(试题及答案)

抽样与抽样分布(试题及答案)

第五章抽样与抽样分布一、单项选择题(以下每小题各有四项备选答案,其中只有一项是正确的。

)1.抽样推断的主要目的是( )。

A.用统计量来推算总体参数B.对调查单位作深入研究C.计算和控制抽样误差D.广泛运用数学方法[答案] A[解析] 抽样调查是指从总体中按随机原则抽取部分单位作为样本,进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法,因此,抽样推断的主要目的是用已知的统计量来推算未知的总体参数。

2.抽样调查中,无法消除的误差是( )。

A.抽样误差B.责任心误差C.登记误差D.系统性误差[答案] A[解析] 抽样误差是指在遵循了随机原则的条件下,不包括登记误差和系统性误差在内的,用样本指标代表总体指标而产生的不可避免的误差。

3.在其他条件相同的情况下,重复抽样的抽样平均误差和不重复抽样相比,( )。

A.前者一定小于后者B.前者一定大于后者C.两者相等D.前者可能大于,也可能小于后者[答案] B[解析] 以抽样平均数的抽样平均误差为例进行说明:在重复抽样条件下,抽样平均数的平均误差的计算公式:;在不重复抽样条件下,抽样平均数的平均误差的计算公式:。

因为,故。

4.拟分别对甲、乙两个地区大学毕业生在试用期的工薪收入进行抽样调查。

据估计甲地区大学毕业生试用期月工薪的方差要比乙区高出一倍。

在样本量和抽样方法相同的情况下,甲区的抽样误差要比乙区高( )。

A.41.4% B.42.4% C.46.8% D.48.8%[答案] A[解析] 假设乙地区的大学毕业生试用期月工薪的方差为σ2,甲地区的大学毕业生试用期月工薪的方差为2σ2,则:,那么,在样本量和抽样方法相同的,情况下,甲区的抽样误差要比乙区高=41.4%。

5.对某天生产的2000件电子元件的耐用时间进行全面检测,又抽取5%进行抽样复测,资料如表5-1所示。

表5-1耐用时间(小时) 全面检测(支) 抽样复测(支)3000以下3000~4000 4000~5000 50600990230505000以上总计36020018100规定耐用时间在3000小时以下为不合格品,则该电子元件合格率的抽样平均误差为( )。

统计学 第五章

统计学      第五章

第五章 抽样推断抽样推断定义:是一种非全面调查,是按随机原则,从总体中抽取一部分单位进行调查,并以其结果对总体某一数量特征作出估计和推断的一种统计方法。

(一) 总体和样本在抽样推断中面临两个不同的总体,即全及总体和样本总体,全及总体也叫母体,简称总体。

全及总体的单位数用N 表示全及总体⎪⎩⎪⎨⎧⎩⎨⎧属性总体有限总体无限总体变量总体样本总体又叫抽样总体、子样,简称样本,样本总体的单位数称样本容量,用n 表示。

(二) 参数和统计量参数亦称全及指标,由于全及总体是唯一确定的,故根据全及总体计算的参数也是个定值 对于属性总体,可以有如下参数,全及总体成数p ,全及总体标准差)(2p p σσ方差 属性总体标准差:()p p p-=1σ统计量即样本指标设样本总体有n 个变量:n x x x x ,...,,,321 则:样本平均数 nx x ∑=(三) 样本容量与样本个数样本容量是指一个样本所包含的单位数,用n 来表示,一般地,样本单位数达到或超过30个的样本称为大样本,而在30个以下称为小样本。

社会经济统计的抽样推断多属于大样本,而科学实验的抽样观察则多取小样本。

样本个数又称样本可能数目,是指从全及总体中可能抽取的样本的个数。

一个总体可能抽取多少样本,与样本容量大小有关,也与抽样的方法有关。

在样本容量确定之后,样本的可能数目便完全取决于抽样方法。

抽样误差是抽样调查自身所固有的,不可避免的误差,虽然不能消除这种误差,但有办法进行计算,并能对其加以控制。

抽样平均误差越大,表示样本的代表性越低;抽样平均误差越小,表示样本的代表性越高。

在重复简单随机抽样时,样本平均数的抽样分布有数学期望值E(a)=a(a代表全及总体平均数,即X)X⇔。

样本平均数的平均数=总体平均数抽样平均误差=抽样标准误差=样本平均数的标准差(它反映抽样平均数与总体平均数的平均误差程度)例题:某班组4个工人的月工资(N=4)分别是:1400元,1500元,1600元,1700元,现用重复简单随机抽样的方法从全及总体中抽选出容量大小为2的样本(n=2),求抽样平均误差?解:全及总体平均工资)(15501700160015001400元=+++=X全及总体标准差()4500002=-=∑NX Xσ抽样平均误差x μ=nnσσ=2=)(0569.792*450000元=例题:某班组4个工人的月工资(N=4)分别是:1400元,1500元,1600元,1700元,现用不重复简单随机抽样的方法从全部总体中抽选容量大小为2的样本(n=2),求抽样平均误差?解:全及总体平均工资)(155041700160015001400元=+++==∑NXX全及总体标准差()4500002=-=∑NX Xσx μ=⎪⎭⎫ ⎝⎛--∙12N n N n σ=)(55.6414244*250000元=--∙例题:某电子元件厂,生产某型号晶体管,按正常生产试验,产品中属于一级品的占70%,现在从10000件晶体管中,抽取100件进行抽查检验,求一级品率的抽样平均误差? 解:已知:P=0.7 , P(1-P)=0.21在重复抽样的情况下,抽样平均误差为:()np p p -=1μ=%58.410021.0=在不重复抽样的情况下,抽样平均误差为:()⎪⎭⎫⎝⎛-∙-=N n n p p p 11μ=%56.410000*********.0=⎪⎭⎫ ⎝⎛-∙参数估计()()⎪⎪⎩⎪⎪⎨⎧→-==+≤≤是概率度是置信度,极限误差)样本指标总体指标极限误差—(样本指标区间估计:求不高的情况准确程度与可靠程度要点估计:适用于推断的t t F t F P α1例题:已知某车间某产品的合格率在某个置信度下的估计区间是(85%,95%),还已知样本容量为100,求置信度?解:显然p p ∆-=85%,p p ∆+=95%,即p=90%,p ∆=5%p ∆=μ⋅t μpt ∆=⇒=()()67.1100%901%90%51=-∙=-∆np p p ()t F =0.9052即置信度为90.51% ★求置信度,只需要求出t影响抽样数目的因素⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧∆样本单位不重置抽样可以少抽些单位,抽样需要多抽一些样本、在同等条件下,重置单位,则反之值越大,则多抽些样本、概率度则反之单位,的值大可以少抽些样本)、允许误差(极限误差越多,则反之值越大,必要抽样数目、总体标准差4321t x σ例题:某城市组织职工家庭生活抽样调查,职工家庭平均每户每月收入的标准差为11.50元,要求把握程度为95.45%,允许误差为1元,问需抽选多少户? 解:()t F =0.95452=⇒t , 元元,150.11=∆=x σxt n 222∆=σ=()户529150.1142=∙。

第五章 抽样法

第五章 抽样法

抽样的作用

抽样调查能够解决全面调查无法或难以解决的问
题。

抽样调查可以补充和订正全面调查的结果。
抽样调查方法可以用于生产过程中产品质量的检
查和控制。 抽样调查方法可以用于对总体的某种假设进行检 验,以判断这种假设的真伪,决定行动的取舍。

抽样中的几个基本术语
总体(Population):调查研究的事物或现象的全体 个体(Item unit):组成总体的每个元素
一、抽样的概念、特点、作用 二、抽样中的基本术语 (一)总体和样本 (二)参数和统计量 (三)样本容量和样本个数 (四)重复抽样和不重复抽样 (五)概率抽样与非概率抽样 (六)抽样框 三、抽样误差
抽样的概念 特点
(一)概念 抽样调查是按照随机原则从全部研究对象中抽取 一部分单位进行观察,并依据获得的数据对全部研 究对象的数量特征做出具有一定可靠性的估计和判 断.达到对现象总体认识的一种方法. (二)特点 它是按照随机原则从总体中抽取样本。 它是由部分推算整体的一种方法。 它是运用概率估计的方法。 抽样误差可事先计算并加以控制。
抽样中的几个基本术语
X
i 1 N
总体均值
X
i
N

X F
i 1 K i
K
i
F
i 1
i
标准差

X
N i 1
i
X
2
N

X
K i 1
i K
X Fi
i
2
F
i 1
抽样中的几个基本术语
总体方差
2
( X i X )2
i 1
N
N

( X i X ) 2 Fi

《统计学原理》第5章:抽样推断

《统计学原理》第5章:抽样推断

σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数, θ为样本统计量,则 θ的优良标 准为: 1若 E(θ ) =θ ,则称 θ为 θ 的无偏估计量(无偏性)
更有效的估计量(有效性) 2若σθ1 < σθ2,则称θ1为比θ2
3若 越大σθ 越小,则称 θ 为θ 的一致估计量(一 致性)
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样 类型抽样 整群抽样 等距抽样 多阶段抽样 多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示. 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
抽样推断的一般问题
抽样推断的特点 按随机原则抽取样本 运用概率论的理论和方法,用样本指标来推断 总体指标。 推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用 无法或 很难进行全面调查而又需要了解 其全面情况时 某些可以采用全面调查的社会经济现象, 也可采用抽样推断。 可用于生产过程的质量控制 进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计分布
概率统计分布抽样统计分布
离散性连续性
单变量
多变量
0-1分布
二项分布B(n,p)
泊松分布P()

超几何分布
()
,
,
H k n N
大样本
小样本
样本均值分布
样本成数分布
样本方差分布
样本均值之差分布
样本成数之差分布
样本方差纸币分布正态分布)2
N u,σ

平均分布G(a,b)
指数分布()

开方分布()
2
x n
统计分布
概率分布抽样分布
离散性连续性单变量多变量
概率分布
离散性连续性
0-1分布二项分布B (n,p )大样本小样本
泊松分布P (λ)超几何分布H (k ,N ,n )正态分布N
平均分布G (a ,b )
指数分布
开方分布
T 分布t (n )
F 分布F (n ,m )
()
2
,μσ()
2X n 概率分布
z
z z z
z z
抽样分布
单变量多变量
样本均值分布样本成数分布样本方差分布样本均值之差分布样本成数之差分布样本方差之比分布
z z
()
z

z z
124.86126.443.26/25 3.26/253.26/25 3.26/25X −≤
z
z
10
z
z
101 10
N N N X
×+×
==∑
z z z
z z
z (
0.030.050.0750.05
p
−−
≤≤
z z
z z
z
z
22
12
,
X X N
σσ
μμ

−−+


z
都近似的服从正态分布,其成数之差也服从正z
z
z
1122
+
11112222
+
⎜⎟⎜
z
11
z z
z z z
z z z z
z z
z z z z
z z n
2
(1)
n n N σ

z z z z
z
在其他条件相同的情况下,重复抽样和不重复抽样仅差一个修正均误差小于重复抽样的平均误差的
z
(1)
p p n
−(1)(1)p p n
n N
−−(1)n N
−1n
n −1n N

z
z
2
n
σ
2
(1)n n N
σ
−(1)
p p n
−(1)(1)p p n
n N
−−
z z z
z z z
z
是参数的一个估计量,z ˆn θθ−
z z z z z
z z z z z z。

相关文档
最新文档