第六章样本及抽样分布

合集下载

概率论与数理统计(06)第6章 统计量及其抽样分布

概率论与数理统计(06)第6章  统计量及其抽样分布
一个任意分 布的总体
σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋 于正态分布 的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章 样本与统计量
6.1引言 6.1引言
数理统计学: 运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,研究如何合理地获得数据资料, 建立有效的数学方法,根据所获得的数据资料,对 所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ,则
2
χ2分布
2. 3.
z=
X −µ
Y=z

统计学第6章统计量及其抽样分布

统计学第6章统计量及其抽样分布

整理ppt
16
2. T统计量
设X1,X2,…,Xn是来自正态总体N~ (μ,σ2 )
n
的一个样本,
X
1 n
n i 1
Xi
(Xi X )2 s 2 i1
n 1
则 T(X) ~t(n1)
S/ n
称为T统计量,它服从自由度为(n-1)的t分布。
整理ppt
17
F分布
定义:设随机变量Y与Z相互独立,且Y和Z分别服 从自由度为m和n的c2分布,随机变量X有如下表达式:
整理ppt
8
中心极限定理
设从均值为,方差为2的一个任意总 体中抽取容量为n的样本,当n充分大时, 样本均值的抽样分布近似服从均值为μ、 方差为σ2/n的正态分布。
当样本容量足够大时
(n≥30),样本均值的抽样
分布逐渐趋于正态分布
整理ppt
9
标准误差
标准误差:样本统计量与总体参数之间的平均差异
1. 所有可能的样本均值的标准差,测度所有样本 均值的离散程度
因此,估计这100名患者治愈成功的比 例在85%至95%的概率为90.5%
整理ppt
22
6.5 两个样本平均值之差的分布

X
1
是独立地抽自总体
X1 ~N(1,12)
的一个容量
为n1的样本的均值。 X 2 是独立地抽自总体
X2 ~N(2,22)的一个容量为n2的样本的均值,则有
E (X 1X 2)E (X 1) E (X 2)12
2. 样本均值的标准误差小于总体标准差
3. 计算公式为
x
n
整理ppt
10
【例】设从一个均值μ=8、标准差σ=0.7的总 体中随机抽取容量为n=49的样本。要求:

六样本及抽样分布

六样本及抽样分布

ex ,
解 总体 X 的概率密度为
f (x)
0,
x 0, x 0,
因为 X1, X2 , , Xn 相互独立, 且与 X 有相同的分布,
所以 ( X1, X2 , , Xn )的概率密度为
fn( x1, x2, , xn )
n
f
( xi
)
ne
n
i 1
xi
,
i 1
0,
xi 0, 其他.
请注意 : 设X1, X2 , Xn是来自总体X的一个样本 , x1, x2 ,
xn是一个样本的观察值 ,则g( x1, x2 , xn )也是统 计量g(X1, X2 , Xn )的观察值.
例 设 X1, X2 , X3是来自总体N ( , 2 )的一个 样本, 其中 为已知, 2 为未知, 判断下列各式哪
例5 设总体 X 服从两点分布B(1, p), 其中0 p 1, ( X1, X 2 , , X n )是来自总体的样本, 求样本 ( X1, X 2 , , Xn )的分布律. 解 总体 X 的分布律为
P{ X i} pi (1 p)1i (i 0, 1)
因为 X1, X2 , , Xn相互独立, 且与 X 有相同的分布, 所以 ( X1, X2 , , Xn )的分布律为
如实例3中, 总体就是数集 {15, 16, 17, 18, 19, 20}. 总体分布为
年龄 15 16 17 18 19 20 比率 9 21 132 1207 588 43
2000 2000 2000 2000 2000 2000
二、随机样本的定义
1. 样本的定义
设 X 是具有分布函数F 的随机变量, 若 X1, X2 , , Xn 是具有同一分布函数F、相互独立的 随机变量, 则称 X1, X2 , , Xn 为从分布函数F (或总体 F、或总体 X ) 得到的容量为n 的简单 随机样本, 简称样本.

社会研究方法 第6章

社会研究方法 第6章

整群抽样
不同子群
子群抽取
整群抽样
优点:简便易行,节省费用 扩大抽样应用范围
缺点: 样本分布不广, 代表性相对较差
适用对象: 总体的不同子群之间差别不大, 而每个子群内部差异较大
五、多段抽样
按抽样元素的隶属、层级关系把抽样过程分为 几个阶段进行:先从总体中随机抽取几个大群, 然后再从这几个大群内随机抽取几个小群,这 样一级级抽下去直到抽到最基本的元素为止。
第六章 抽样
第一节 抽样的意义与作用 第二节 概率抽样的原理与程序 第三节 概率抽样方法 第四节 户内抽样与PPS抽样 第五节 非概率抽样方法 第六节 样本规模与抽样误差
第一节 抽样意义与作用
一、抽样的概念
(1)总体(population):构成它的所有元素的 集合,用“ N ”表示。
(2)元素(element):构成总体的最基本单位。
出总体内在结构的变量作为分层变量。 c:以那些已有明显层次区分的变量作为分层变量 (2)分层的比例 a:按比例分层抽样 b:不按比例分层抽样
按比例分层抽样
分层
学生
1200
女生1000 (5/6)
男生200 (1/6)
抽 样(120人)
100人 5/6
样 本 20人 1/6 120
按各种类型或层次中单位数目同总体单位数目间 的比例来抽取子样本的方法。可以确保得到一个 与总体结构完全一样的样本。
样本规模的计算
简单随机抽样中样本规模的计算 置信水平对应的临界值

推论总体均值

n
t2
e2
பைடு நூலகம்
2
总体的标准差 允许的抽样误差
推论总体成数:
t 2 p(1 p)

概率论 第六章 样本及抽样分布

概率论 第六章 样本及抽样分布
函数Fn(x)为 Fn(x)=S(x)/n , -∞<x< +∞。
一般,设 x1,x2, …,xn 是总体F的一个容 量为n的样本值,先将x1,x2, …,xn 按自小到 大的次序排列,并重新编号,设为
x(1) ≤x(2) ≤…≤x(n) 则经验分布函数Fn(x)的观察值为
0,
若x x(1) ,
性质:
(1) limf (t)
1
e ; t2 2
n
2
(2)当n 45时 取t (n) Z .
(三)设X~2(n1), Y~ 2(n2), 且X 与Y相互独立,则随机变量
F X/ n1 Y / n2
则称F服从第一自由度为n1,第二自由 度为n2的F分布,记作
F~F(n1 ,n2)
F分布的分布密度为
2 2
E( X 2 ) D( X ) (E( X ))2
2 2
n
E(S 2 )
E[ 1 n 1
n i 1
(Xi
X
)2 ]
E[
1
n
(
n 1 i1
X
2 i
2
n X )]
1
n
E(
n 1 i1
X
2 i
nX
2
)
1 [E( n 1
n i 1
X
2 i
)
E(n X
2
)]
1[ n 1
n i 1
考察某厂生产的电容器
的使用寿命。在这个试验 中什么是总体,什么是个 体。
解 个体是每一个电容器 的使用寿命;总体X是各个 电容器的使用寿命的集合。
2. 样本
为推断总体分布及各种特征,按一定规 则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样 本中所包含的个体数称为样本容量.

统计学第六章抽样和抽样分布

统计学第六章抽样和抽样分布

2021/3/4
统计学第六章抽样和抽样分布
4
一、总体与样本
▪ 把握两个问题: ▪ 1、总体和总体参数; ▪ 2、样本和样本统计量。
2021/3/4
统计学第六章抽样和抽样分布
5
1、总体与总体参数
(1)总体:指根据研究目的确定的所 要研究的同类事物的全体,是所要说 明其数量特征的研究对象。按所研究 标志性质不同,分为变量总体和属性 总体,分别研究总体的数量特征和品 质特征。 构成总体的个别事物(基本单元 )就是总体单位,也称个体。总体单 位的总数称为总体容量,记作N。
缺点:受主观影响易产生倾向性误差; 不能计算、控制误差,无法说明调查结果 的可靠程度。
抽样一般都是指概率抽样。
2021/3/4
统计学第六章抽样和抽样分布
15
2、重复抽样和非重复抽样
(1)重复抽样:又称重置抽样,是指从总体 中抽出一个样本单位,记录其标志值后,又将 其放回总体中继续参加下一轮单位的抽取。特 点是:第一,n个单位的样本是由n次试验的结 果构成的。第二,每次试验是独立的,即其试 验的结果与前次、后次的结果无关。第三,每 次试验是在相同条件下进行的,每个单位在多 次试验中选中的机会(概率)是相同的。在重复 试验中,样本可能的个数是 N n ,N为总体单位 数,n为样本容量。
2021/3/4
统计学第六章抽样和抽样分布
16
2、重复抽样和非重复抽样
(2)非重复抽样:又称为不重置抽样,即每次从
总体抽取一个单位,登记后不放回原总体,不参加下
一轮抽样。下一次继续从总体中余下的单位抽取样本
。特点是:第一,n个单位的样本由 n 次试验结果构成
统计学第六章抽样和抽样分 布
第六章 抽样与抽样分布

概率论6-1,2,3

概率论6-1,2,3

例如,考察某工厂10月份生产的灯泡的寿命所组 例如,考察某工厂 月份生产的灯泡的寿命所组 成的总体。 成的总体。灯泡寿命落在各个时间区间内有一定的 百分比,如灯泡寿命落在1000小时 小时~1300小时的占灯 百分比,如灯泡寿命落在 小时 小时的占灯 泡总数的85%,落在1300小时 %,落在 小时~1800小时的占灯泡总 泡总数的 %,落在 小时 小时的占灯泡总 数的5%, %,…。 即灯泡寿命的取值有一定的分布。 数的 %, 。 即灯泡寿命的取值有一定的分布。
就取位于 [ 是整数, x([ np ]+1) , 不是整数, 当np不是整数, x 综上, 综上, p = 1 [ x( np ) + x( np+1) ], 当np是整数 . 2
0 当 特别, 特别, p = 0.5时,.5分位数 x0 .5也记为Q2或
数据集的箱线图是由箱子和直线组成的图形, 数据集的箱线图是由箱子和直线组成的图形, 它是基于以下五个数的图形概括: 它是基于以下五个数的图形概括: 最小值 Min, 第一四分位数 Q1,中位数M,第三四分位数 Q3和 中位数 最大值 Max. 作法如下: 作法如下: (1) 画一水平数轴, 在轴上标上 Min,Q1, M, 画一水平数轴, Q3,Max. 在数轴上方画一个上、 下侧平行于数 在数轴上方画一个上、 Q 箱子的左右两侧分别位 于 Q1, 3 的上方. 轴的矩形箱子, 轴的矩形箱子, 在 M点的上方画一条垂直线 段 .线段位于箱子内部. ( 2)自箱子左侧引一条水平 线至 Min; 在同一水平 高度自箱子右侧引一条水平线直至最大值. 高度自箱子右侧引一条水平线直至最大值. 如图所示. 如图所示.
1.总体与个体 总体与个体
§1 随机样本
总体 试验的全部可能的观察值称为总体. 试验的全部可能的观察值称为总体. 个体 总体中的每个可能观察值称为个体. 总体中的每个可能观察值称为个体.

概率论与数理统计-第六章

概率论与数理统计-第六章
大街上随机抽取200人,进行调查。记录了
这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi

i 1, 2,
,n
,n
于是 (

) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

X 1 X 2 ~ 2 ( n1 n2 )
②若 X ~ 2 (n), 则 E(X)=n, D(X)=2n.
(2) t 分布
变量
2 (n), 且X与Y相互独立,则称 定义: 设X~N(0,1) , Y~
T X Y n
所服从的分布为自由度为 n的 t 分布. 记为T~t(n).
具有自由度为n的t分布的随机变量T的数学期望和方差为:
服从自由度为n1及 n2 的F分布,n1称为第一自由度,n2 称为第二自由度,记作 F~F(n1,n2) .
由定义可见,
1 Y n2 ~ F (n2 , n1 ) F X n1
若X~F(n1,n2), X的概率密度为
X的数学期望为: E ( X )
n2 n2 2
若n2>2
即它的数学期望并不依赖于第一自由度n1. 例1 已知T~t(n),证:T2~F(1,n)
总体的每次抽样结果称为一个个体。
2.样本
要获取有关总体的信息,需对总体进行抽样。一般我们作简单随机抽样, 即①每个个体被抽取的机会均等,②每次抽取后不改变总体的分布。
直观描述:对总体作n次“简单随机抽样”,得到n个个体:(X1,X2,…,Xn),称 为总体的一个样本容量为n的样本。其中Xi为第i次抽样的结果,为随机变量。
E(T)=0; D(T)=n / (n-2) , 对n >2 t分布的密度函数关于x=0对称,且
Lim f ( x; n) 0
x
当n充分大时, t 分布近似N (0,1)分布. 但对于较小的n, t分布与N (0,1)分布相差 很大 (t分布尾部较高).
(3) F分布
2 2 定义: 设 X ~ (n1 ), Y ~ (n2 ), X与Y相互独立,则称统 计量 X n1 F Y n2
X1,X2,…,Xn来自同一总体,且相互独立.可得样本的 精确描述:若X1,X2,…,Xn相互独立 ,且具有相同分布函数F(x),则称(X1,X2,…,Xn) 为来自总体F(x)的一个样本容量为n的样本(可看作n维随机变量),它们的观察值 x1,x2,…,xn称为样本值。
§2. 抽样分布 1. 统计量 由样本值去推断总体情况,需要对样本值进行“加工”
1 n 样本k阶中心矩 Bk ( X i X ) k 它反映了总体k 阶中心矩E{(X-EX)k} n i 1 的信息
k=1,2,…
3.抽样分布(统计量的分布)
一.来自正态总体的几个常用的抽样分布
(1) 2 分布
定义: 设 X 1, X 2 ,, X n 相互独立, 都服从正态分布N(0,1), 则称随机变量: 2 X 12 X 2 2 X n 2 所服从的分布为自由度为 n 的 2分布.
(3)
2 2 S1 1 F 2 2 ~ F ( n1 1,n2 1 ) S2 2
(1) U X Y ( 1 2 ) n1 n2
2 1 2 2
~ N ( 0 ,1 )
(2)当1= 2时
T X Y ( 1 2 ) ( n1 1 )S ( n2 1 )S n1 n2 2
2 1 2 2
1 ቤተ መጻሕፍቲ ባይዱ n1 n2
~ t( n1 n2 2 )
,这就要构造一些样本的函数,它把样本中所含的(某一 方面)的信息集中起来. 这种不含任何未知参数的样本的函数称为统计量.
定义:设X1,X2,…,Xn是来自总体X的一个样本,g(X1,X2,…,Xn) 是n维随机变量函数,若g中不含任何未知参数,则称 g(X1,X2,…,Xn)为统计量.设x1,x2,…,xn为X1,X2,…,Xn的观察值, 则称g(x1,x2,…,xn)为g(X1,X2,…,Xn)的观察值. 统计量是一个随机变量,统计量的分布称为抽样分布.
2 ~ 2 (n) 记为
2 所以,设 X 1, X 2 ,, X n为来自正态总体 N ( , ) 的样本,则
1 n 2 ( X i )2 ~ 2 ( n ) i 1
2
2 分布的性质
①可加性: 2 2 设 X 1 ~ (n1 ), X 2 ~ (n2 ), 且X1,X2相互独立,则
第六章 样本及抽样分布
第1章至第5章属于概率论范畴; 第6章至第8章属于数理统计范畴。 概率论、数理统计都是研究随机现象的统计规律性的数 学分支,但两者研究角度不同。 概率论:从已知数学模型出发,研究随机现象的性质、 特点、规律;如已知X~N(a,d2),P{X∈(b,c)}. 数理统计: 观察随机变量得到数据,由此选择、检验数 学模型,并对所考察的问题作出推断或预测。 数理统计的任务就是研究怎样有效地收集、整理、分析 所获得的有限的资料,对所研究的随机现象的一般概率 特征如分布函数、概率密度(或分布律)、数学期望、 方差等尽可能地作出精确而可靠的统计推断.
n
不是统计量
几个常见统计量
样本均值
1 n X Xi n i 1
2
它反映了总体均值EX的信息
1 n S ( X i X )2 样本方差 n 1 i 1
它反映了总体方差DX的信息
样本k阶原点矩
1 n k Ak X i 它反映了总体k阶原点矩E(Xk)的信息 n i 1
例1 设X1,X2,…,Xn是来自总体X的一个样本,X~N(,2), 且 已知, 2 未知,问下列样本函数哪个是统计量?
1 n X Xi n i 1
1 n S ( X i X )2 n 1 i 1
2
是统计量
1 2 2
( X i )2
i 1
§1 随机样本 1.总体与个体
直观描述:具有一定共同属性的研究对象的全体称为总体
有限总体
无限总体 总体中每个成员称为个体. 由于研究总体往往只关心其中的某项数量指标,而该数量指标是一个
随机变量,因而,得到统计学中的 精确描述:具有确定分布函数F(x)的随机变量X称为总体(总体X,或总体F(x));
X和S 2 分别为样本均值和样本方差, 则有
(1) 1 n 2 X Xi ~ N ( , ) n i 1 n X U ~ N ( 0 ,1 ) n
(2)
(6)
X S n
~ t( n 1 )
( n 1 )S 2 1 n (4) 2 ( X i X )2 ~ 2 ( n 1 ) 2 i 1
证:
X T Y /n
X~N(0,1), Y ~ (n)
2
X 2 /1 T Y /n
2
X 2 ~ 2 (1)
Y ~ 2 (n)
∴T2~F(1,n)
二.分位数 (1)设X的分布函数为F(x), 0<p<1,若数up使P{X≤up}=p, 则称up为F(x)的p分位数(点).
p
4.抽样分布定理 定理 1 设X1,X2,…,Xn是取自正态总体 N ( , 2 ) 的样本,
(5) X 和S 2 相互独立
定理2 X ~ N( 1 , ),Y ~ N( 2 , 2 ),且X与Y独立,
2 1
2
X1,X2,…, X n1 是取自X的样本, Y1,Y2,…, Yn2 是 取自Y的样本,
2 X和Y 分别是这两个样本的 样本均值, S12和S2 分别是这两
个样本的样本方差,则有
相关文档
最新文档