I 基本概念与抽样分布1-8#
第5章--抽样分布与参数估计教案资料

(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
9
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
9,10
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
(9.5)
10
10,1
10,2
10,3
10,4
10,5
10,6
10,7
10,8
10,9
10,10
数是 ,标准差是 ,从这个总体中抽出一 个容量是 n 的样本,则样本平均数 X 也服从 正态分布,其平均数 E( X ) 仍为 ,其标准
差为 。 X 5-19
从正态分布的再生定理可以看出,只要总体 变量服从正态分布,则从中抽取的样本,不管n 是多少,样本平均数都服从正态分布。但是在 客观实际中,总体并非都是正态分布。对于从 非正态分布的总体中抽取的样本平均数的分布 问题,需要由中心极限定理来解决。
第5章--抽样分布与参数估计
第一节 抽样的基本概念与数学原理
一、有关抽样的基本概念 二、大数定理与中心极限定理
5-2
一、有关抽样的基本概念
(一)样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分
单位的集合,这个集合的大小称为样本容量, 一般用n表示,它表明一个样本中所包含的单 位数。
lim
n
1 n
p
n
i 1
X
i
1
(5.5)
5-17
大数定理表明:尽管个别现象受偶然因 素影响,有各自不同的表现。但是,对总体 的大量观察后进行平均,就能使偶然因素的 影响相互抵消,消除由个别偶然因素引起的 极端性影响,从而使总体平均数稳定下来, 反映出事物变化的一般规律。
教育统计学_第七、八章 抽样分布及总体平均数的推断

20 1
20 1
P(57.14 68.86) 0.99
答:该地区这一年高考数学平均分95%和99%的 置 信 区 间 分 别 为 58.72 至 67.28 分 之 间 和 57.14 至 68.86分之间。
3.大样本的情况:
当样本容量比较大,自由度在逐渐增大,这时的t分布 已经非常接近正态分布。这时可把t分布转成标准正态 分布来作处理。然后再作区间估计。
n
n
P( X 1.96 X 1.96 ) 0.95
n
n
要在一定可靠度上求出总体参数的置信区间的 上下限,需要以下条件:
1.要知道与所要估计的参数相对应的样本统计量的 值,以及样本统计量的理论分布;
2.要求出该种统计量的标准误;
3.要确定在多大的可靠度上对总体参数作估计,再 通过查某种理论概率分布表,找出与某种可靠度相 对应的该分布横轴上记分的临界值,才能计算出总 体参数的置信区间上下限。
三、 σ未知条件下总体平均数的区间估计
1.σ未知条件下总体平均数区间估计的基本原理 (1)当总体σ未知,总体呈正态分布,大样本或小
样本时
(2)或当总体σ未知,总体虽不呈正态分布,大样 本容量较大(n>30)时,样本平均数可以转换成t 值。
总体平均数95%置信区间为:
P(t X t ) 0.95
E(X )
第一节 抽样分布
2、容量为n的平均数在抽样分布上的标准差,等 于总体标准差除以n的方根。
X
n
第一节 抽样分布
3、从正态总体中,随机抽取的容量为n的一切可能 样本平均数的分布也呈正态分布。
4、虽然总体不呈正态分布,如果样本容量较大, 反映总体μ和σ的样本平均数的抽样分布,也接近于 正态分布。
统计学 第三章抽样与抽样分布

=10
= 50 X
总体分布
n= 4
x 5
n =16
x 2.5
x 50
X
抽样分布
从非正态总体中抽样
结论:
从非正态中体中抽样,所形成 的抽样分布最终也是趋近于正态分 布的。只是样本容量需要更大些。
总结:中心极限定理
设从均值为,方差为 2的一个任意总体中抽 取容量为n的样本,当n充分大时(超过30),样本 均值的抽样分布近似服从均值为μ、方差为σ2/n的
总体
样本
参数
统计量
总体与样本的指标表示法
总体参数
样本统计量
(Parameter) (Sample Statistic)
容量 平均数 比例 方差 标准差
N
n
X
x
p
2
s2
s
小练习
某药品制造商感兴趣的是用该公司开发的某 种新药能控制高血压人群血压的比例。进行了一 项包含5000个高血压病人个体的研究。他发现用 这种药后80%的个体,他们的高血压能够被控制。 假定这5000个个体在高血压人群中具有代表性的 话,回答下列问题: 1、总体是什么? 2、样本是什么? 3、识别所关心的参数 4、识别此统计量并给出它的值 5、我们知道这个参数的值么?
正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
X
总体分布
正态分布
非正态分布
大样本 小样本 大样本 小样本
正态分布
正态分布
非正态分布
三 中心极限定理的应用
中心极限定理(Central Limit theorem) 不论总体服从何种分布,从中抽取
统计学第9章抽样与抽样估计

整理ppt
1
第1节 抽样与抽样分布
一、有关抽样的基本概念
总体(Population) 研究对象的全体称为总体
样本(子样)(Sample) 从总体中抽取一部分个体进行试验或观察,这种从总体
中抽取个体的行为称为抽样。而从总体中抽样所得的一部分 个体叫样本 总体参数(Population parameter)
整理ppt
10
抽样平均误差和抽样极限误差
抽样平均误差:所有可能的样本指标与总体指标间的平均 差异程度。
x (xm X)2, p (p m P )2
整理ppt
11
抽样极限误差
样本指标与总体指标之间允许的误差范围叫抽样极限误 差。也称抽样允许误差。
它是样本指标可允许变动的上限或下限与总体指标 之差的绝对值。
X
X 2.5
X2
1.250.625 2
整理ppt
18
大数定律及中心极限定理
不重复抽样:
(1)总体是正态分布,样本必然是正态分布 (2)样本平均数的平均数等于总体平均数 (3)样本平均数的方差等于总体方差除以样本
容量n
x2
2
n
Nn N1
(4)n越大,样本平均数越趋近于正态分布
整理ppt
19
抽样平均误差 (1)均值 重复抽样:
整理ppt
22
例、从某校1000名学生中简单随机抽取50名学生,称得平均体重为50千克, 若已知总体标准差为10千克,计算重复抽样及不重复抽样下抽样平均误 差。
解:重复抽样条件下,
V ( x ) 2 10 2 2 n 50
x
n
2 1.41
不重复抽样条件下,
统计学抽样与抽样分布

3. 需要包含所有低阶段抽样单位的抽样框;同时由于
实行了再抽样,使调查单位在更广泛的范围内展开
4. 在大规模的抽样调查中,经常被采用的方法
概率抽样(小结)
非概率抽样
n也叫非随机抽样,是指从研究目的出发,根据调查者的 经验或判断,从总体中有意识地抽取若干单位构成样本。
n重点调查、典型调查、配额抽样(是按照一定标准或一 定条件分配样本单位数量,然后由调查者在规定的数额内 主观地抽取样本)、方便抽样(指调查者按其方便任意选 取样本。如商场柜台售货员拿着厂家的调查表对顾客的调 查)等就属于非随机抽样。
样本分量:其中每一个Xi是一个随机变量,称为样本 分量。
样本观察值:一次抽样中所观察到的样本数据x1、x2、 x3称为样本观察值。 对于某一既定的总体,由于抽样的方式方法不同,样 本容量也可大可小,因而,样本是不确定的、而是可5
一、 几个概念
(二)样本总体与样本指标
样本指标(统计量)。在抽样估计中,用来反 映样本总体数量特征的指标称为样本指标,也 称为样本统计量或估计量,是根据样本资料计 算的、用以估计或推断相应总体指标的综合指 标。
3
总体和参数(续)
通常所要估计的总体指标有
X
NX
一、 几个概念
(二)样本总体与样本指标
样本总体。简称样本(Sample),它是按照随机原则, 从总体中抽取的部分总体单位的集合体 。
样本容量:样本中所包含的个体的数量,一般用n表示。 在实际工作中,人们通常把n≥30的样本称为大样本, 而把n<30的样本称为小样本。
(二)抽样平均误差(抽样标准误)
抽样平均误差是反映抽样误差一般水平的指标(因为 抽样误差是一个随机变量,它的数值随着可能抽取的 样本不同而或大或小,为了总的衡量样本代表性的高 低,就需要计算抽样误差的一般水平)。通常用样本 估计量的标准差来反映所有可能样本估计值与其中心 值的平均离散程度。
第四篇抽样和分布1(药学)PPT课件

24
4、整群抽样 先将总体分成若干互不重叠部分(称为群),再 从各群中随机抽取某群或几群作为样本。 例:调查某年级学生上网情况
可把每班作为一群,从中随机抽取一班或几班作 为样本。
该法适用于大规模调查,易于组织,节省人 力物力,但误差较大,适于群体差异较小的调 查对象。
8
实例 研究某地区12岁儿童生长发育情 况,总体和个体应为什么? 显然,总体为该地区的全体儿童
个体为每一个儿童。
当然,衡量儿童生长发育情况要通过诸如身高、 体重等数量指标进行,所以对总体的研究实际上 是对该地区的全体儿童的这些指标值概率分布进 行研究。
9
根据研究指标的多少,总体分为 一维总体-研究一项描述指标,常用随机变量X表示; 多维总体-研究多项描述指标,常用随机向量表示,
14
一般地,对有限总体,应采用有放回抽样,对 无限总体(或数量较多),可采用无放回抽样 (近似看作有放回),否则违背独立性。
简单随机抽样具体实施的方法: 抽签法
随机数法
15
三、统计量(Statistic )
样本是对总体的代表和反映,抽样的目的是利用样本值对 总体进行统计推断。
而对总体进行统计推断,常根据需要的不同,利用样本构 造一些包含所需要的多种信息的量,就是关于样本 X1 ,X2 ,…,Xn的一些函数,这些函数统称为统计量。
3
例如,在几何学中要证明“等腰三角形底角相等”, 只须从“等腰”这个前提出发,运用几何公理,一步一 步推出这个结论.这是演绎推理。
而一个习惯于统计思想的人,可能这样推理: 做很多大小形状不一的等腰三角形,实地测量 其底角,看差距如何,根据所得资料看看可否作 出“底角相等”的结论. 这样做就是归纳式的方法.
《统计学》第9章 抽样与抽样分布

二、抽样中的基本概念
⚫ 样本比例(成数)
p = n1 ,q = n0 = 1− p
n
n
⚫ 样本是非标志的标准差
(n = n0 + n1)
sp =
n p (1− p) =
n −1
n pq n −1
⚫ 样本是非标志的方差
s
2 p
=
n n −1
p(1 −
p)
=
n n −1
pq
第一节 抽样和抽样方法
三、抽样方法
三、抽样方法
⚫ 多阶段抽样
⚫ 在实践中总体所包括的单位数很多,分布很广,通过一次 抽样就选出有代表性的样本是很困难的。此时可将整个抽 样过程分为几个阶段,然后逐阶段进行抽样,最终得到所 需要的有代表性的样本。
第一节 抽样和抽样方法
三、抽样方法
⚫ 多阶段抽样
⚫ 阶段数不宜过多,一般采用两个、三个阶段,至多四个阶 段为宜,否则,手续繁琐,效果也不一定好。
第一节 抽样和抽样方法
二、抽样中的基本概念
⚫ 总体参数
⚫ 总体参数是根据总体各单位的标志值或特征计算的、反 映总体某一属性的综合指标。
⚫ 总体参数是唯一的、确定的常数,但一般情况下又是未 知的。
⚫ 常用的总体参数有 ⚫ 总体均值 ⚫ 总体标准差、总体方差 ⚫ 总体比例(成数)
第一节 抽样和抽样方法
⚫ 样本标准差
s =
1 n −1
n i =1
(xi
−
x )2,或s
=
1
m
m
(xi − x )2 fi
fi −1 i=1
i =1
⚫ 样本方差
( ) ( ) s2 = 1 n n −1 i=1
8-抽样分布

样本方差的抽样分布
1. 在重复选取容量为n的样本时,由样本方差的所有 可能取值形成的相对频数分布 2. 对于来自正态总体的简单随机样本,则比值
(n 1) s 2
的抽样分布服从自由度为 (n -1) 的2分布,即
2
(n 1) s 2 ~ (n 1) 2
2
2分布(图示)
不同容量样本的抽样分布
统计量
抽样分布
抽样分布 ( sampling distribution) 抽样误差
抽样分布
一、抽样分布的概念 二、样本均值抽样分布的形式 三、样本均值抽样分布的特征
三种不同性质的分布
总体分布
样本分布
抽样分布
总体分布(population distribution)
1. 2. 3.
M为样本数目
比较及结论:1. 样本均值的均值(数学期望) 等于总 体均值。 2. 样本均值的方差等于总体方差的1/n。
总体分布
.3 P(x)
抽样分布
.3 .2 .1 0 1 2 3 4
.2 .1 0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
= 2.5
σ2 =1.25
x 2.5 2 x 0.625
2.
3.
称F为服从自由度n1和n2的F分布,记为
U n1 F V n2
F ~ F (n1 , n2 )
例: (X1,X2,…,X5)为取自正态总体X~(0,σ2)的样本,
2 3( X 12 X 2 ) 求统计量 2 2( X 32 X 4 X 52 )
的分布
Xi
解
X i ~ N (0, 2 )
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用数理统计概述不确定性数学:1 . 概率论、数理统计),,(P F Ω 2 . 模糊数学 )}(,{x x ϕM 3 . 灰色数学 ],[b a H 4 . 未确知数学 )}(],,{[x F b a对于上述各个数学分支,各自有相应的运算法则和适用范围。
(一) 概率论:1.),,(P F Ω: E 是一个随机试验,Ω 为E 的全体基本事件的集合 F 由Ω的一些子集为元素 所构成的集合人们通过对某事件A 的频率)(A f 的研究,发现了概率 )(A P 和性质及运算 2.讨论的一般方法: 随机变量 → 分布 → 数学期望、方差等(宏观指标) ① 对于一维 : )(ωξξ= )(i i x ωξ= ∑<=<=x x i i p x P x F }{)(ξ, i i p x P ==}{ξ ;⎰∞-=<=xdt t p x P x F )(}{)(ξ, 0)(≥x p .⎰∑∞+∞-∞==dx x xp p x E i i i )(1或ξ; 2)(ξξξE E D -=② 对于n 维 : 随机变量),,,(21n ξξξ → 实数),,,(21n x x x},{})({),,(2211121n n ni i i n x x x P x p x x x F <<<=<==ξξξωξω ;(二) 数理统计:1.基础:统计量⎪⎩⎪⎨⎧=∑=数据分区间处理经验型,如:公式型,n i in 11ξξ 及其分布 ⎩⎨⎧经验分布(直方图)分布如:统计分布2χ2. 样本的处理:① 参数估计; ② 假设检验(参数假设检验<本科>、非参数假设检验<分布拟合 与 两总体相等性检验>);③ 回归分析; ④ 方差分析 与 正交试验设计.数理统计的基本概念与抽样分布(复习)一. 基本概念:1. 总体ξ( 被研究对象的全体 );2. 样本 (n ξξξ,,,21 ) → 观测值(样本值 或 样本点) (n x x x ,,,21 ) 定理:→)()(~x p x F 或ξ∏∏==ni i n i i n x p x F 1121)()(~),,,(或ξξξ3.统计量 针对要解决的问题而构造的相应的样本的函数 ),,,(21n T T ξξξ = 注:统计量不含任何未知参数, ∑==ni in11ξξ如:等212*)(11ξξ--=∑=ni in S,它是公式性质的量.二.经验分布函数与直方图:目的:用观测值(数据)去估计和推断总体ξ的分布)()(x p x F 或 即:用数据 → 样本分布)(x F n ≈)(x F ; 直方图)(x p n ≈)(x p1.经验分布函数: ① 定义 若n x x x ,,,21 →ξ记 )(x n ν 为 n x x x ,,,21 中<x 的个数,则称)(x n ν为 经验频数 ; 并称+∞<<∞-=x nx x F n n )()(ν 为总体ξ的 经验分布函数(样本分布函数).② 操作 将)()2()1(21,,,,,,n n x x x x x x → 则⎪⎪⎩⎪⎪⎨⎧>-=≤<≤==+)()1()()1(11,,2,10)()(n k k n n x x n k x x x n k x x n x x F ν易知:1})()({lim =<-∞→εx F x F P n n ; )())((x F x F E n =;1}0)()(lim{==-+∞<<∞-∞→x F x F SupP n x n (格利汶科 Гливенко)2.直方图: 总体ξ的分布称为理论分布,即:)()(x p x F 或这里是用样本(数据)构造经验分布)(x p n ≈)(x p 其中)(x p n 的图象称为直方图① 离散型:设总体ξ的分布列 i i p x P ==}{ξ 未知,若n ξξξξ,,,21 →令 )(x i ν 表示该抽样中事件}{i x =ξ出现的次数, 则用n i p nx ii ,,2,1)( =≈ν 事实上,)(∞→−→−n p niPi ν② 连续型:设总体ξ的分布密度)(x p 未知,若n ξξξξ,,,21 →设 ),[],[)()1(b a n ⊂ξξ, 将 ),[),[1+−−→−i i m a a b a 个分 令 i ν 为样本落在),[1+i i a a 中的个数,则⎰+=<≤−→−+1)(}{1i ia a i i Pidx x p a a P nξν ≈ma b a P i -=}{ξ所以 ≈=}{i a P ξn m m i ab m ni<-=-⋅;1,,2,1 ν故③ 作图实例: (P.65 例1考察钢的含硅量ξ的)(x p n , 以此说明直方图的作法)1+i i处理方法 :找 95.0,64.0)()1(==n x x ;确定 )955.0,635.0[),[=b a ;确定小区间个数 16=m 以得 组距02.0=-ma b ; 计算 i ν ;画出以 ),[1+i i a a 为底边,高为的各个矩形 .有p.67 直方图p注: 区间个数m 的大小应根据数据个数n 的大小而定; 当n 、m (m <n ) 都充分大( 即:缩小组距 ) 时,)(x p n 的上边缘将以光滑的曲线)(x p 为极限.)(x p ≈三.常用统计分布: 1.分布2χ:① 若n N ξξξξ,,,)1,0(~21 →,则 统计量 )(~2122n ni iχξχ∑==② 若n N ξξξσμξ,,,),(~212 →,则 )(~)(12222n n i χμξσχ∑-=③ 分布2χ的密度曲线为: ④ 分布2χ的实用性结论⑴ 若 22221,,,m χχχ 独立,且),,2,1()(~22m k n k k =χχ则)(~1212∑∑==mk k mk kn χχ称为分布2χ的可加性⑵ 若)(~22n χχ则)()1,0(22∞→−→−-n N nnLχ⑶ 若)(~22n χχ则)()1,0(1222∞→−→−--n N n Lχ 或 )()1,12(22∞→-−→−n n N Lχ证明思路:}122{)(2x n P x F n <--=∆χ}2{}2)12({222n x nn P n x P εχχ+<-=-+<=其中 0lim =∞→n n ε 所以 )(21lim )(lim 22x dt ex F tx n n n nΦ==-+∞-∞→∞→⎰επ2.t 分布:① 若ξ、η独立,且)1,0(~N ξ,)(~2n χη则 统计量 )(~n t nt ηξ=② 若),(~2σμξN ,)(~22n χση,ξ、η独立,则 )(~n t nt ημξ-=xp③ t 分布的密度曲线为: ④ 结论 :设 )(~n t t ,记 密度为)()(x p n t则 ∞→n lim )()(x p n t )(2122+∞<<-∞=-x exπ一般 )30(2)(>≈n ex p t π3.F 分布:① 若ξ、η独立,且)(~2m χξ,~2χηm ξ推论:若),(~n m F F ,则 ,(~1n F F② F 分布的密度曲线为:4.分位数(分位点): αx αλ ① 分位数的概念:(i )下侧分位点 αx 使 αξαα==<)(}{x F x P (ii )上侧分位点αλ 使αλξα=≥}{P 显然αλξα-=<1}{P ② 几种分布的常用分位数说明:(本教材利用下侧分位点作为分位数,有)(i ) 标准正态分布 )1,0(~N U , α的分位数记为αu ,即:ααα=Φ=<)(}{u u U P (查正态表)或 αααα=≥⇒-=>-}{1}{21uU P u U P(ii )2χ分布:)(~22n χχα的分位数记为 )(2n αχ,即:αχχα=<)}({22n P (查2χ表) 或 αχχχχαα=≥<-}{2212222及P注:当n >45 时,使用 22)12(21)(-+≈n u n ααχ(iii )t 分布: )(~n t t α的分位数记为 )(n t α,αα=<)}({n t t P (查t 表)注:当n >45 时,使用 ααu n t ≈)(x或 αααα=≥⇒-=>-)}({1)}({21n tt P n t t P(iv )F 分布:),(~n m F F α的分位数记为 ),(n m F α,即:αα=<)},({n m F F P (查F 表) 或 ααα=≥<-}{212FF F F P 及注: ),(1),(1m n F n m F αα=-四.抽样分布的常用结论:1.,),(~1),(~122∑==nk knN nN σμξξσμξ,则)1,0(~N nσμξ-且2. 1,,,),(~21211n N ξξξσμξ →设2,,,),(~21222nN ηηησμη →独立与且}{}{21k k ηξ)1,0(~)()(222121212221N n n σσμμηξσσ+---为已知,则,若21212222111)()(n n S w+---==μμηξσσσ则未知,若)2(~21-+n n t 2)1()1(2212*222*1121222211-+-+-=-++=n n S n S n n n S n S n S w 其中∑=--=11212*1)(11n k kn Sξξ ∑=--=21222*2)(11n k kn Sηη3. ),,(~2σμξN )1(~1---=-*n t n S nSμξμξ则4. ),1,0(~N ξ 独立;或与则)(22*S S ξ ;且)1(~)()1(222*2--=-=∑n Sn nSi χξξ),,(~2σμξN 独立;或与则)(22*S S ξ;且)1(~)(1)1(22222*22--=-=∑n Sn nSiχξξσσσ5. 1,,,),(~21211n N ξξξσμξ →设2,,,),(~21222n N ηηησμη → 则)1,1(~2121222*22211--⋅*n n F S n S n σσ注:对于非正态总体的抽样分布,一般不易求出.但在大样本抽样的情况下,样本均值ξ有如下的近似分布: 设总体ξ,ξD 存在,n ξξξξ,,,21 → 则ξ近似服从 ),(2⎪⎪⎭⎫⎝⎛n D E N ξξ 五.顺序统计量与样本极差: 1.顺序统计量的概念:设n ξξξξ,,,21 →n x x x ,,,21 →排序 )()2()1(,,,n x x x , 则 ),,,(21)(n k k x x x f x =称),,,(21)(n k k f ξξξξ = 为 顺序统计量 (它不含未知参数)称)(k ξ为样本的第k 个顺序统计量, k nk ξξ≤≤=1)1(min 为样本的最小顺序统计量knk n ξξ≤≤=1)(max 为样本的最大顺序统计量.2. 样本极差的概念:设n ξξξξ,,,21 →)()2()1(,,,n ξξξ →称 ji nj i n n R ξξξξ-=-=≤≤,1)1()(m a x 为 样本极差注:关于样本极差的分布,若 ),1,0(~N ξ 那么,样本极差的分布函数、分位数、nER 、nDR在较详细的数理统计用表中,都有已编制的数值表可查.。