统计量及其分布
统计量及其分布

样本均值的抽样分布 (例题分析)
【例】设一个总体含有4 个个体,分别为X1=1、X2=2、 X3=3 、X4=4 。总体的均值、方差及分布如下。
总体均值和方差
总体的频数分布
X
i 1
N
i
N
N
2.5
2
2 ( X ) i i 1
0.02 0 2 1 0.1
21 Φ0.2
0.8414
(4) 样本 k 阶(原点)矩
1 n k Ak X i , k 1, 2, ; n i 1
1 n k 其观察值 k x i , k 1, 2, . n i 1
n n 1 2 1 2 2 E( S ) E X i nX (Xi X ) E n 1 i 1 n 1 i 1
2
1 n 2 2 E ( X i ) nE ( X ) n 1 i 1 2 1 n 2 2 2 ( ) n 2 n 1 i 1 n
n
k 1
n
2
2
n
,
定理 设总体X的期望E(X) = ,方差D(X) = 2,X1, X2,…,Xn为总体X的样本, X,S2分别为样本均值 和样本方差,则
E( X ) E( X )
D( X ) 2 D( X ) n n
E( S 2 ) D( X ) 2
思考:在分组样本场合,样本均值如何计算? 二者结果相同吗?
x1 f1 x n f n 其中 x n
《概率论与数理统计》统计量及其分布

但数理统计以概率论为基础,更着重于根据试验得
到的数据来对研究对象的客观规律作出种种合理的估
计和判断.
4
第5章
统计量及其分布
数
描述统计学
理
对随机现象进行观测、试验, 以取得有代表
统
性的观测值.
计
的
推断统计学
分
对已取得的观测值进行整理、分析, 作出推
类
断、决策,从而找出所研究的对象的规律性.
O
5
n 10
10
15
20
x
32
01
抽样分布
2. t 分布
2
X
~
N
(0,1)
,
Y
~
x
(n),且X与Y 独立,则
设随机变量
X
T
Y /n
服从自由度为n的t分布,记为t(n).
性质 密度f(t)是偶函数,且t分布的极限分布是标准正
态分布.
33
01
抽样分布
t分布的密度函数
n 1
n 1
那么如何来利用样本呢?
列表?
画图?
统计量!
样本来自于总体,含有总体性质的信息,但较为分
散. 为了进行统计推断,需要把分散的信息进行整理,
针对不同的研究目的,构造不同的样本函数,这种函
数在统计学中称为统计量.
18
本讲内容
01
总体与个体
02
样本
03
统计量
03
统计量
3.统计量
统计量——不含有未知参数的样本函数
f ( x)
n1
n2
x
第6章-统计量及其抽样分布

对应于每个数值的相对出现频数排成另一列, 由此,全部可能的样本统计量值形成了一个概 率分布,这个分布就是我们想要得到的抽样分 布。
样本均值的抽样分布 与中心极限定理
当总体服从正态分布N(μ,σ2)时,来自该总体的所有 容量为n的样本的均值x也服从正态分布,x 的数
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
所有样本均值的均值和1.0 1.5 4.0 16
2.5 m
n
(xi mx )2
s
2 x
i 1
M
M为样本数目
(1.0 2.5)2
(4.0 2.5)2
s2
0.625
16
n
1. 样本均值的均值(数学期望)等于总体均值 2. 样本均值的方差等于总体方差的1/n
从检查一部分得知全体。
复习 抽样方法
抽样方式
概率抽样
非概率抽样
简单随机抽样 整群抽样
多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
判断抽样 滚雪球抽样
6.2.1 抽样分布 (sampling distribution)
1. 样本统计量的概率分布,是一种理论分布
在重复选取容量为n的样本时,由该统计量的所有可 能取值形成的相对频数分布
2. 随机变量是 样本统计量
样本均值, 样本比例,样本方差等
3. 结果来自容量相同的所有可能样本
4. 提供了样本统计量长远而稳定的信息,是进行推 断的理论基础,也是抽样推断科学性的重要依据
抽样分布的形成过程 (sampling
distribution)
统计量及其分布

思考题
设 X1, X2 , … , Xn 是取自正态总体 N (, 2 ),
的一个样本,求 E( XS 2 ) ?
定理 2 设 X1, X2 , … , Xn 是取自正态总体 N (, 2 )
的样本,X 和S 分别为样本均值和样本均方差,则有
1) X ~ N(0, 1); / n
2) X ~ t(n 1).
nx 2 ];
③ s
1 n 1
n i 1
( xi
x )2
;
④
ak
1 n
n i 1
xik ,
k 1, 2
;
⑤ bk
1 n
n
(xi x )k ,
i 1
k
1, 2
.
例1 设总体X 的期望为 E(X ) , 方差为 D(X ) 2 其样本为 X1, X2, , Xn , 求E(X ), D(X ), E(S 2) .
为t分布的上 分位点。
t1 (n) t (n)
若 0.5,直接查表;若 0.5, t (n) t1 (n).
当 n 45 , t (n) z .
(3) F-分布
设随机变量X与Y相互独立,且 X ~ 2 (n1), Y ~ 2 (n2 ),
则随机变量
F
X Y
/ n1 / n2
所服从的分布是自由度为 (n1, n2 )
~
F (2,
2)
作 业 17
P137: 4 P147: 4
1.6664.
解:因为
(n 1)
2
S
2
~ 2(n 1)
15S 2
2
~ 2(15)
P
S
2 2
1.6664
统计量及其分布教案

统计量及其分布教案教案标题:统计量及其分布教案一、教学目标:1. 理解统计量的概念并能正确区分常用的统计量。
2. 了解和掌握统计量的计算方法与应用。
3. 掌握统计量的分布特征及其在统计推断中的应用。
二、教学内容:1. 统计量的概念:a. 定义和目的:统计量用于对样本数据进行总结和描述,并从中推断总体特征。
b. 常用统计量的举例:均值、中位数、众数、方差等。
2. 统计量的计算方法:a. 样本均值的计算方法及应用。
b. 样本方差的计算方法及应用。
c. 样本标准差的计算方法及应用。
3. 统计量的分布特征:a. 正态分布的性质和应用。
b. t 分布的概念和特点。
c. 卡方分布的定义和用途。
4. 统计量在统计推断中的应用:a. 点估计和区间估计的概念和方法。
b. 假设检验的基本思想和步骤。
c. 统计量在假设检验中的作用和应用。
三、教学步骤:1. 导入部分:a. 引入统计量的概念及其在实际生活中的应用背景。
b. 师生互动讨论,学生提出对于统计量的初步理解和疑问。
2. 理论讲解:a. 通过例子和图表展示统计量的不同计算方法和应用。
b. 解答学生提出的问题,确保学生对统计量的概念和计算方法有清晰的理解。
3. 练习与实践:a. 基于实际数据,让学生进行统计量的计算和分析。
b. 学生小组合作讨论并展示各自的计算结果及分析。
c. 教师针对学生的计算过程和结果给予指导和评价。
4. 拓展和应用:a. 引导学生思考统计量在各个学科领域的应用情况。
b. 鼓励学生进行小研究,探索在实际问题中如何选择合适的统计量进行分析。
四、教学评价:1. 学生练习和实践的成果,包括计算的准确性和分析的合理性。
2. 学生对于统计量概念和计算方法的理解程度。
3. 学生对于统计量在实际问题中应用的思考和创造力。
五、教学资源:1. PowerPoint 或其他展示工具。
2. 统计软件或计算器。
3. 实际问题的数据材料。
六、教学延伸:1. 统计量的更高级应用:如方差分析、回归分析等。
统计学6

6 - 33
经济、管理类 基础课程
统计学
三、样本方差的分布
6 - 34
经济、管理类 基础课程
统计学
(一)样本方差的分布
设总体服从正态分布N 设总体服从正态分布N ~ (µ,σ2 ), X1,X2,… ,Xn为来自该正态总体的样本,则样本方差 为来自该正态总体的样本, s2 的分布为
(n −1)s
2
2. 3.
,则
Z=
X −µ
令 Y = Z 2 ,则 Y 服从自由度为1的χ2分布,即 服从自由度为1 分布,
σ
~ N(0,1)
Y ~ χ (1)
2
4.
当总体 X ~ N(µ,σ 2 ) ,从中抽取容量为n的样本,则 从中抽取容量为n的样本,
样 本 6 - 10
经济、管理类 基础课程
(三)抽样分布
(sampling distribution) distribution)
统计学
1. 样本统计量的概率分布 2. 是一种理论概率分布 3. 随机变量是 样本统计量
样本均值, 样本均值, 样本比例,样本方差等
4. 结果来自容量相同的所有可能样本 结果来自容量相同的所有可能样本 5. 提供了样本统计量长远我们稳定的信息,是进 行推断的理论基础,也是抽样推断科学性的重 要依据
总体分布、样本分布、抽样分布
三、渐进分布和近似分布
6-3
经济、管理类 基础课程
统计学
一、统计量
(一)统计量的概念 • 是样本的特征值 • 设X1 , X2 ,…, Xn是从总体中抽取的容量 为n的一个样本,如果由此样本构造一 个函数T 个函数T( X1 , X2 ,…, Xn ),不依赖于 任何未知参数,则称函数T 任何未知参数,则称函数T( X1 , X2 ,…, Xn )是一个统计量。
统计学第二章-统计量及其分布-重点难点归纳及答案解析

统计量及其分布习题知识点精析与应用一、填空题(将正确答案的序号填在括号内,共5小题,每小题2分,共10分)1、简单随机抽样样本均值X 的方差取决于 和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的 倍。
2、设1217,,,X X X 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=,则a =____________。
(注:20.99(17)33.4χ=, 20.995(17)35.7χ=, 20.99(16)32.0χ=, 20.995(16)34.2χ=)3、若(5)X t ,则2X 服从_______分布。
4、已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。
5、中心极限定理是说:如果总体存在有限的方差,那么,随着 的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于 。
,二、选择题(将正确答案的序号填在括号内,共5小题,每小题2分,共10分)1、中心极限定理可保证在大量观察下A 样本平均数趋近于总体平均数的趋势B 样本方差趋近于总体方差的趋势C 样本平均数分布趋近于正态分布的趋势D 样本比例趋近于总体比例的趋势2、设随机变量()(1)X t n n >,则21/Y X =服从21/Y X = 。
A 正态分布B 卡方分布C t 分布D F 分布3、根据抽样测定100名4岁男孩身体发育情况的资料,平均身高为95cm ,,标准差为0.4cm 。
至少以 的概率可确信4岁男孩平均身高在93.8cm 到96.2cm 之间。
A 68.27%B 90%C 95.45%D 99.73%4、某品牌袋装糖果重量的标准是(500±5)克。
为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。
下列说法中错误的是( )A 、样本容量为10B 、抽样误差为2C 、样本平均每袋重量是统计量D 、498是估计值5、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从A (100/,25)N nB NC (100,25/)N nD (100,N 三、判断题1、所有可能样本平均数的方差等于总体方差。
(概率论与数理统计 茆诗松) 第5章 统计量及其分布(5.4)

当随机变量 2 2(n) 时,对给定 (01), 称满足 P(2 12(n)) 的 12(n) 是自由度为 n1的卡方分布的 1 分位数. 分位数 12(n) 可以从附表3 中查到。
P{ X
2 1
(n)} ,
该密度函 数的图像 是一只取 非负值的 偏态分布
E 2 n, Var( 2 ) 2n
习题5.4:
Q4
5.4.2 F 分布
定义5.4.2 设X1 2(m), X2 2(n), X1与X2独立, 则称 F =(X1/m)/(X2/n) 的分布是自由度为 m 与 n 的 F分布,记为F F(m, n),其中m 称为分子自 由度,n 称为分母自由度。
t ( n)
t
(n)
当随机变量t t(n) 时,称满足 P(t t1(n)) =1 的 t1(n) 是自由度为 n 的 t 分布的1分位数. 分位数 t1(n) 可以从附表4中查到。 譬如 n=10,=0.05,那么从附表4上查得
t10.05(10) = t0.95(10)=1.812 . 由于 t 分布的密度函数关于0 对称, 故其分位数 间有如下关系
~ t (m n 2)
1 4 5 7 9 14 16
• n2时,t 分布的方差存在,且为n/(n2);
• 当自由度较大 (如n30) 时, t 分布可以用正态分布 N(0,1)近似。
当随机变量t t(n) 时,称满足 P(t t1(n)) =1 的 t1(n) 是自由度为 n 的 t 分布的1分位数.
注:
t (n) t1 (n)
在推论5.4.1的记号下,设 12 =22 = 2 ,
2 2 ( x x ) ( y y ) i i i 1 i 1 m n
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x1, x2, … , xn
tribution
~
X
用简单随机抽样方法得到的样本称为简单随机样本, 也简称样本。
于是,样本 x1, x2, …, xn 可以看成是独立同分 布( iid ) 的随机变量,其共同分布即为总体分布。 设总体X具有分布函数F(x), x1, x2, …, xn 为取 自该总体的容量为n的样本,则样本联合分布 函数为
实际中总体中的个体数大多是有限的。当 个体数充分大时,将有限总体看作无限总体是 一种合理的抽象。 本书以无限总体作为主要研究对象。
1.2 样本
样品、样本、样本量:
随机抽样:按照随机的方式 ,从总体X中抽取部分个体, 进行观测或测试的过程。简称抽样。
样本:从总体X中抽取n个个体,则它们的
指标值x1, x2 , ……,xn, 称为总体的一个样本 样本容量:样本所含个体的个数——n
100只元件的寿命数据
寿命范围 (192 216] (216 240] (240 264] (264 288] (288 312] (312 336] (336 360] (360 184] 元件数 6 3 3 5 5 3 5 1 寿命范围 (384 408] (408 432] (432 456] (456 480] (480 504] (504 528] (528 552] >552 元件数 4 4 1 2 2 3 1 13
F ( x1 , ..., x n )
F ( x ).
i i 1
n
总体分为有限总体与无限总体
实际中总体中的个体数大多是有限的。当个体 数充分大时,将有限总体看作无限总体是一种 合理的抽象。 对无限总体,随机性与独立性容易实现,困难 在于排除有意或无意的人为干扰。 对有限总体,只要总体所含个体数很大,特别 是与样本量相比很大,则独立性也可基本得到 满足。
简单起见,无论是样本还是其观测值,样本一般 均用 x1, x2,… xn 表示,应能从上下文中加以区别。
例1.3 啤酒厂生产的瓶装啤酒规定净含量为640 克。由于随机性,事实上不可能使得所有的啤酒 净含量均为640克。现从某厂生产的啤酒中随机 抽取10瓶测定其净含量,得到如下结果:
641, 635, 640, 637, 642, 638, 645, 643, 639, 640
表1.2中的样本观测值没有具体的数值, 只有一个范围,这样的样本称为分组样本。
样本的要求:简单随机样本
要使得推断可靠,对样本就有要求,使样本能很 好地代表总体。通常有如下两个要求: 随机性: 总体中每一个个体都有同等机会 被选入样本 -- xi 与总体X有相同的分布。 独立性: 样本中每一样品的取值不影响其 它样品的取值 -- x1, x2, …, xn 相互独立。
样品:样本中的个体
样本具有两重性 • 一方面,由于样本是从总体中随机抽取的,抽 取前无法预知它们的数值,因此,样本是随机 变量,用大写字母 X1, X2, …, Xn 表示;
• 另一方面,样本在抽取以后经观测就有确定的 观测值,因此,样本又是一组数值。此时用小 写字母 x1, x2, …, xn 表示是恰当的。
布情况时,济南市的全体男大学生组成了总体, 济南市的每个男大学生都是个体。
但是在数理统计中,由于我们关心的不是 每个个体的所有具体特性,而仅仅是它的某一 项或某几项的数量指标X(可以是向量)和该数 量指标在总体中的分布情况。
上述例子中X是表示灯泡的寿命或男大学生的身高 和体重,就此数量指标而言,每个个体所取值是不同的。 在试验中抽取了若干个个体,就观察到了X的这样或那 样的数值,因而这个数量指标X就是一个随机变量(或 向量)。而X的分布就完全描述了总体中我们所关心的
那个数量指标的分布情况。由于我们关心的正是这个 数量指标,因此我们以后就把总体和数量指标X 可能 取值的的全体组成的集合等同起来。 所谓总体的分布也就是指数量指标X 的分布。 以后说从“总体中抽样”与“从某分布中抽样”是同一个 意思。
总体的三层含义:
• 研究对象的全体; • 数据; • 分布
例1.1 考察某厂的产品质量,以0记合格品,以1记 不合格品,则 总体 = {该厂生产的全部合格品与不合格品} = {由0或1组成的一堆数} 若以 p 表示这堆数中1的比例(不合格品率),则该 总体可由一个二点分布表示:
X P
0 1p
1 p
比如:两个生产同类产品的工厂的产品的总体分布:
X p X p 0 0.983 0 0.915 1 0.017 1 0.085
可见:第一个工厂的产品质量优于第二个工厂 但是:在实际中,分布中的不合格品率是未知的, 所以也面临对其进行估计的问题. 例1.2
我们对每一个研究对象可能要观测两个 甚至更多个指标,此时可用多维随机向量及 其联合分布来描述总体,这种总体称为多维 总体。 一维和二维总体是基本的。本书主要研究 一维总体,某些地方也会涉及二维总体。 总体分为有限总体与无限总体
例1.5 设有一批产品共N个,需要进行抽样检 验以了解其不合格品率p。现从中采取不放回 抽样抽出2个产品,这时,第二次抽到不合格 品的概率依赖于第一次抽到的是否是不合格 品,如果第一次抽到不合格品,则 P(x2 = 1 | x1 = 1) = (Np1)/(N1) 而若第一次抽到的是合格品,则第二次抽到不合 格品的概率为 P(x2 = 1 | x1 = 0) = (Np)(N1)
这是一个容量为10的样本的观测值, 对应的总体为该厂生产的瓶装啤酒的净含量。 这样的样本称为完全样本。
例1.4 考察某厂生产的某种电子元件的 寿命,选了100只进行寿命试验,得到 如下数据:
表1.2
寿命范围 ( 0 24] (24 48] (48 72] (72 96] (96 120] (120 144] (144 168] (168 192] 元件数 4 8 6 5 3 4 5 4
统计量及其分布
§1 总体与样本 §2 样本数据的整理与显示
§3 统计量及其分布
§4 三大抽样分布
§5 充分统计量
§1
总体:
总体与样本
• 研究对象的全体;
个体:而把组成总体的每个元素称为个体。
例1 在研究某批灯泡的寿命时,该批灯泡的全 体就组成了总体,而其中每个灯泡就是个体。 例2 在研究济南市男大学生的身高和体重的分