概率统计6.1、6.2(总体、样本与统计量)
合集下载
概率论与数理统计(06)第6章 统计量及其抽样分布

一个任意分 布的总体
σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋 于正态分布 的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章 样本与统计量
6.1引言 6.1引言
数理统计学: 运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,研究如何合理地获得数据资料, 建立有效的数学方法,根据所获得的数据资料,对 所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ,则
2
χ2分布
2. 3.
z=
X −µ
Y=z
σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋 于正态分布 的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章 样本与统计量
6.1引言 6.1引言
数理统计学: 运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,研究如何合理地获得数据资料, 建立有效的数学方法,根据所获得的数据资料,对 所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ,则
2
χ2分布
2. 3.
z=
X −µ
Y=z
概率与数理统计第六章

t
x
y
W {T t (n 1)}
2021/3/11
t
x 16
6.2.1 单个正态总体均值的假设检验
例6.2 正常人的脉搏平均每分钟72次,某医生测得10例四乙基铅 中毒患者的脉搏数(次/分)如下:54,67,68,78,70,66, 67,70,65,69.已知人的脉搏次数服从正态分布.试问四乙基铅
在取6份水样,测定该有害物质含量,得如下数据: 0.530‰,0.542‰,0.510‰,0.495‰,0.515‰,0.530‰
能否据此抽样结果说明有害物质含量超过了规定? 0.05
练习2 一公司声称某种类型的电池的平均使用寿命至少为21.5小 时,有一实验室检验了该公司制造的6套电池,得到如下的寿命数 据(单位:小时):19 18 22 20 16 25 设电池寿命服202从1/3/正11 态分布,试问这种类型的电池寿命是否低于该18 公
即提出假设: H0 : p 0.02 若 H0 正确,则取到次品为小概率事件.
2021/3/11
在一次试验中, 小概率事件是 几乎不可能发 生的.
小概率原理
2
6.1 假设检验的基本概念
2. 两类错误
犯了“弃真”错误 第一类错误
犯了“纳伪”错误 第二类错误
P(拒绝H0 | H0为真)
P(接受H0 | H0为假)
注意:我们总把含 有“等号”的情形 放在原假设.
在原假设 H0 为真的前提下,确定统计量
U
X 0
~
N (0,1)
n
2021/3/11
因为X
~
N
,
2
n
,
所以
X
~
N (0,1)
【2024版】概率论与数理统计(数理统计的基本概念)

X
2 n
)
D(
X
2 1
)
D(
X
2 2
)
D(
X
2 n
)
nD (
X
2 i
)
n{ E (
X
4 i
)
[E(
X
2 i
)]2
}
n
x4
1
2
e
x2 2
dx
12
n3
1
2n
23
若 2 ~ 2(n) 分布函数为F ( x)
,0 1 若F ( x) P{ 2 x}
则其解称为 2 分布 的 分位数(临界值)
0.15 00.1.155
000.1..11
N(0,1)
n=10 n=10 nn==33
n增大
000.0..00555
nnn===111
000
-5--55
-4--44
-3-3
-2-2
-1-1
00
11
22
33
444
555
t 分布的密度曲线关于y轴对称 随着n的增大, t 分布的密度曲线越陡
n 时,t 分布趋于标准正态分布N (0,1)
后,还要对数据进行加工和提炼,将样本的有关 信息,利用数学的工具进行加工.
引入统计量的概念
12
定义 设( X1, X 2 ,, X n )为来自总体X的一个样本,
若n元函数f ( X1, X 2 ,, X n )不含任何未知参数,
则
称f
(
X
1
,
X
2
,,
X
n
)为X
1
,
X
2
数理统计基本概念

n1 Γ( ) 2 n 1 x 2 fT ( x ) (1 ) 2 , n n n Γ ( ) 2
P{6.262 χ 2 24.996}
2 2
P{χ 6.262} P{χ 24.996}
0.975 0.05 0.925
注意 应注意分布表的定义与查法!
#
数理统计基本概念
3.自由度为 n的 t 分布 作笔名发表文章.
T~t(n)
又称学生氏分布--第一个研究者以Student
( X 1 , X 2 , , X n ) ~ ( 2 ) e
n 2 2
i 1
( xi )2 2 2
n
数理统计基本概念
四、统计量 定义6.1.2 设X1 , X2 , ·, Xn是总体X的样本, · · T为n元实值函数,若样本的函数 T=T(X1 , X2 , ·, Xn) · · 是随机变量且不含未知参数,称 T为统计量. 对相应的样本值( x1 , x2 , … , xn ) ,称 t =T( x1 , x2 , … , xn )
理
统
计
的
引
入
数理统计基本概念
某厂生产的一批产品中次品率为 p 。从中 抽取10件产品装箱。 概
1)没有次品的概率 2)平均有几件次品
率
3)为以 0.95的概率保证箱中 有10件正品,箱中至少要装多 少件产品。
数
理
统
计
的
引
入
数理统计基本概念
所有这些问题的关键是 p 是已知的! 如何获取 p ? 这就是数理统计的任务了!
定的α(0<α<1),数uα满足
P{ X u } ,
(C ) u1 ;
P{6.262 χ 2 24.996}
2 2
P{χ 6.262} P{χ 24.996}
0.975 0.05 0.925
注意 应注意分布表的定义与查法!
#
数理统计基本概念
3.自由度为 n的 t 分布 作笔名发表文章.
T~t(n)
又称学生氏分布--第一个研究者以Student
( X 1 , X 2 , , X n ) ~ ( 2 ) e
n 2 2
i 1
( xi )2 2 2
n
数理统计基本概念
四、统计量 定义6.1.2 设X1 , X2 , ·, Xn是总体X的样本, · · T为n元实值函数,若样本的函数 T=T(X1 , X2 , ·, Xn) · · 是随机变量且不含未知参数,称 T为统计量. 对相应的样本值( x1 , x2 , … , xn ) ,称 t =T( x1 , x2 , … , xn )
理
统
计
的
引
入
数理统计基本概念
某厂生产的一批产品中次品率为 p 。从中 抽取10件产品装箱。 概
1)没有次品的概率 2)平均有几件次品
率
3)为以 0.95的概率保证箱中 有10件正品,箱中至少要装多 少件产品。
数
理
统
计
的
引
入
数理统计基本概念
所有这些问题的关键是 p 是已知的! 如何获取 p ? 这就是数理统计的任务了!
定的α(0<α<1),数uα满足
P{ X u } ,
(C ) u1 ;
数理统计基本知识

2 (5), Y
E( 2 ) n, D( 2 ) 2n.
P{ (n)}
2 2
2 2 ( n ) 的点 为分布 (n) 的上分位点.
( n)
2
f ( y)dy
19
•当n充分大(>45)时,有
2
1 ( z 2n 1 ) 2 2
i 1
n
X i 2 等均
1 ( X 1 X 2 ) 等都不是统计 2 Xi i 1 2 量,因为它们含有未知参数 ,
为统计量,而
1
n
2
从统计量的定义可知,统计量是不含任何未知参数的
随机变量.
10
几个常用的统计量 设X1, X2 ,…, Xn是来自总体X
的一个样本, (x1,x2,…,xn)是其观察值.
§6.2
抽样分布
一、统计量 样本是进行统计推断的依据.但在应
用时,往往不是直接使用是样本本身,而是针对不同 的问题构造样本的适当函数,利用这些样本的函数进 行统计推断. 定义1 设X1, X2 ,…, Xn是来自总体 X 的一个样本, g(X1, X2 ,…, Xn)是X1, X2 ,…, Xn函数,若g 中不含任 何未知参数,则称g(X1, X2 ,…, Xn)是一个统计量. [注] (1) 统计量是一个随机变量;
n 11
0
18
y
2 分布的可加性 设 12 ~ 2 (n1 ), 2 ~ 2 (n2 ) 2 2 2 2 2 且 1 与 2相互独立,则有 1 2 ~ ( n1 n2 )
分布的数学期望和方差
例: X
U ( 0, 4), 则 E ( X Y ) _____ D( X Y ) _____ . 分布的分位点 对于给定正数 (0<<1), 称满足
第六章 统计量及其抽样分布

样本均值的抽样分布
样本均值的抽样分布
1. 容量相同的所有可能样本的样本均值的概率分 布
2. 一种理论概率分布 3. 进行推断总体总体均值的理论基础
样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1、x2=2、x3=3 、x4=4 。 总体的均值、方差及分布如下
第 一
16个样本的均值(x)
个
第二个观察值
观 察值1 2
3
4
11
1.
20.
52. 0.
5
21
2.
25.
03. 5.
0
23
2.
30.
53. 0.
5
24
3.
35.
04. 5.
0
.3 P (X ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
第六章 统计量及其抽样分布
抽样理论依据: 1、大数定律 (1)独立同分布大数定律:证明当N足够大时,平均数据有稳定性,为用样本平 均数估计总体平均数提供了理论依据。 (2)贝努力大数定律:证明当n足够大时,频率具有稳定性,为用频率代替概率 提供了理论依据 2、中心极限定律 (1)独立同分布中心极限定律:设从均值为u、方差为s2(有限)的任意一个总体 中抽取样本量为n的样本,但n充分大时,样本均值X的抽样分布近似服从均值为u, 方差为s2/n的正态分布。 (2)德莫佛-拉普拉斯中心极限定律:证明属性总体的样本数和样本方差,在n足 够大时,同样趋于正态分布。
(central limit theorem)
概率论与数理统计(叶慈南 刘锡平 科学出版社)第6章 数理统计的基本概念教程

3.样本k阶(原点)矩 Ak = 样本k阶中心矩
Bk =
1 n k ∑ X i 反映总体k阶矩E(Xk)的信息 n i =1 P E ( X k ) = k , k = 1, 2, L →
反映总体k
9
1 n P → ∑ ( X i X )k E {[ X E ( X )]k } = mk n i =1 k=1,2,…
1o
X ~ N ( ,
σ2 ) n
即
X ~ N (0,1) σ/ n
2o 3o
(n 1) S 2 ~ χ 2 ( n 1) σ2 X 与 S 2 相互独立 4o X ~ t ( n 1) S/ n
23
24
4
1o
X ~ N ( , X=
σ2 ) n
即
X ~ N ( 0, 1) σ/ n
4o
正态总体的抽样分布定理
例 设 X1,…,X10 是取自N(0,0.32)的样本,求
P{∑ X i > 1.44}
2 i =1 10
定理一,二,三
2 2 设 X 1 ,..., X n 是来总体 N ( , σ ) 的样本, X , S 分别为样
本均值和样本方差,则
例 设 X 1 , X 2 , L , X 15 是来自总体 N (0,1)的一个简单随 2 2 X 12 + X 2 + L + X 10 机样本, Y= 则 服从 分布. 2 2 2 2( X 11 + X 12 + L + X 15 )
4
个体:组成总体的元素(如:某一个灯泡的寿命)
每个可能的观察值
有限总体 无限总体 如:考察某大学大一2000名男生的身高 如:考察某大学大一2000名男生的身高 如:测量一湖泊任一地点的深度
概率论与数理统计A第6章

几个常见统计量
样本平均值
样本方差
它反映了总体 方差的信息
X
1 n
n i1
Xi
它反映了 总体均值 的信息
S2n11in1(Xi X)2
n1 1i n1Xi2nX2
样本标准差 S n1 1i n1(Xi X)2
样本k阶原点矩
Ak
1 n
n i1
Xik
k=1,2,…
样本k阶中心矩
Mk
1 n n i1
(1)
(n1)S2
2
~2(n1)
(2) X与S2独立 .
n取不同值时 (n 1)S 2
2
的分布
推论1 (样本均值的分布)
设X1,X2,…,Xn是取自正态总体 N(,2)
的样本, X和S2 分别为样本均值和样本方差,
则有
X ~t(n1)
Sn
证由定 1、 2理 t,分布的定义可得
X~N(0,1), n
X ~ N(,2) n
即 X~N(0,1) n
X ~ N(,2) X ~ N(0,1) n n
请注意 : 在已知总体,2时, 可用本定理计算样 本均值X.
n取不同值时样本
均值 X 的分布
定理 5 (样本方差的分布)
设X1,X2,…,Xn是来自正态总体 N(,2)的样本,
X和S2分别为样本均值和样本方差, 则有
的 点 t ( n ) 为 t ( n ) 分 布 的 上 分 位 数 。 如 图 所 示 .
t ( n )
t分布的上分位点的性质: t1(n)t(n)
t分 布 的 左 侧 分 位 点 t(n)可 查 表 求 得 , 例 t0.975(15)6.262.
当n45时,对于常 的 用值 的,可用正态近
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x1 x2...xn
学生可参看教材
同类型例题P139140 例4-7
2、统计量 定义2 设 X1, X 2,... X n 是来自总体X的一个样本,g(X1, X 2,... X n )是 X1, X 2,... X n的函
数,若g中不含任何未知参数,则称 g(X1, X 2,... X n )是一个统计量(Statistic). 设 x1, x2 ,... xn是 X1, X 2,... X n 相应于样本的样本值,则称 g(x1, x2 ,... xn )是 g( X1, X 2,... X n ) 的观察值. 注:统计量必需满足的两个条件:
4、常用统计量:
样本平均值
:X
1 n
n i 1
Xi;
样本方差
S2
1 n 1
n
(Xi
i1
X )2
1 n n 1 i1
X
i
2
n
X
2
;
样本标准差
S
S2
1 n 1
n i 1
(Xi
X
)2
;
样本k阶(原点)矩
Ak
1 n
n i 1
Xik
,
i
};
(3)Xn 2 p;
(4)(Xn X1)2
解:由统计量的定义可知(3)中含有未知参数P,所以(1)、
(2)、(4)是统计量 ,而(3)不是统计量。 教材类似例题
3、常用的统计量
P141 例1
设X1,X2,…,Xn是来自总体X的一个样本,x1, x2,..., xn ,是
这一样本的观察值.
由于是独立重复测量,X1,X2,…,Xn是简单随机样本。总体的分布即X的分
布与(X1,X2,…,Xn分布相同)。由,所以X可认为服从正态分布N(μ,σ2)(X1等于物件重量μ)加上称
量误差,即X的概率密度为 f (x)
1
e
(
x) 2 2
2
,求样本的概率密度.
k 1,2,... ;
样本k阶中心矩
Bk
1 n
n i 1
(Xi
X )k ,k
1,2,....
x)2
1n (
n 1 i2
xi2
2
n x );
s
1 n 1
n i 1
( xi
x)2
;
ak
1 n
n i 1
xik , k
1,2,...,
n,...;
bk
1 n
i
n 1
(
xi
x)2, k
1,2,..., n,...
例4:某单位收集到20名青年人某月的娱乐支出费用数据:
(2) s2 1 [(79 99.4)2 (84 99.4)2 . . . (125 99.4)2 ] 20 1
133.9368
s 133 .9368 11.5731
二、能力反馈部分
(考察学生对样本、统计量的相关知识掌握)
1、为估计一物件的重量μ,用一架天平重复测量n次,得样本X1,X2,…,Xn,
三、小结
1、总体与样本的定义. 2、统计量: 设 X1, X 2,... X n 是来自总体 X 的一个样本,g(X1, X 2,... X n ) 是 X1, X 2 ,... X n 的函数,若g中不含任何未知参数,则称g(X1, X 2,... X n )是一个统计量. 3、统计量必需满足的两个条件: (1)它是 X1, X 2,... X n 的函数; (2)它不含未知参数.
2
2、设总体
X服从正态分布
N (, 2 ),其中
已知,
未知,X
1
,
X
2
,
X
是取自总体
3
的一个样本,则非统计量是( ).
A、
1 3 (X1
X2
X3)
B、 X1 X 2 2
C、max( X1, X 2 , X3)
D、 1
2
( X12
X
2 2
X
2 3
)
3、下面给出了50个学生概率论课程的一次考试成绩,试求样本均值和样本方差, 样本标准差。
0 ,
其它
例2: 考虑电话交换台一小时内的呼唤次数X。求来自这一总体的简单随机样
本 X1, X 2,... X n 的样本分布
解:由概率论知识知X服从泊松分布P(λ),其概率函数
PX (x) P{X
x} x e ( 0) x!
(其中是非负整数{0,1,2,…,k,…}中的一个)。从而,简单随机
(1)它是 X1, X 2,... X的n 函数;(2)它不含未知参数.
例3: 设总体 X ~ B(1, p), p{X 1} p, p{X 0} 1 p, 其中p>0为未知参
数,X1, X2,..., X为n 来自总体X的一个样本,指出下列函数哪些是统计
量
(1)X1
X
;
2
(2)max{X 1in
n
样本k阶(原点)矩
Ak
1 n
n i 1
Xik
,
k 1,2,... ,
A1 X ;
样本k阶中心矩
Bk
1 n
n
( X i X )k , k 1,2,..., n,...;
i 1
观察值分别为
x
1 n
n i 1
xi ;
s2
1 n 1
n i2
( xi
解:因为X的概率密度为 f (x) 2e2x,x 0 ,所以联合概率密度为
g(x1, x2 , x3, x4 ) f (x1) f (x2 ) f (x3 ) f (x4 )
16e 2( x x x x ) 1 2 3 4
,x , x , x , x 0 1234
当总体X是连续型随机变量时,f(x)是它的概率密度,则(X1, X 2,..., X n ) 的联合
n
概率密度为 f (x1, x2,... xn ) f (xi ) i 1
例1:设总体X服从均值为1/2的指数分布,X1, X 2 , X 3, X 4 是来自总体的容量 为4的样本,求 X1, X 2 , X 3, X 4 的联合概率密度.
定义:
样本平均值
X
1
n
n i 1
Xi;
样本方差
S 2
n
1
1
i
n 1
(
X
i
X )2
n
1
[ 1i
n 1
X
2 i
n
X
2
];
样本标准差 S
S2
1 n 1
n i 1
(Xi
X
)2
;
注:结论: E(X ) E(X );D(X ) D(X ) ; E(S 2 ) D(X ).
n
F (x1, x2 ,... xn ) P{X1 x1, X 2 x2 ,..., X1 x1} F (xi ) i 1
当总体X是离散型随机变量时,pi p{X xi}是它的分布律,X1, X 2,..., X n 的联合
n
分布律为 p( X1 x1, X 2 x2,..., X n xn ) pi i 1
样本 X1, X 2,... X n 的样本分布为
P(x1, x2,...xn ) PX (x1)PX (x2)...PX (xn ) P{X x1}P{X x2}...P{X xn}
n
x1 x2 ...xn
e n
xi i1
en .
x1 x2...xn
定义1:设 X为总体,X1, X2,..., Xn为样本,如果每个样本 Xi (i 1,2,..., n与) 总体的 分布相同,即同分布;且 X1,..., X n 之间相互独立;则称 X1,..., X n 为简单随机 样本.
设总体 X 的分布函数为 F(x) P{X x}则的联合分布函数为
第六章 统计量和抽样分布 §6.1总体与样本 §6.2统计量
一、授课部分
(一)新课导入
例 某灯泡厂,一个季度内生产了一大批灯泡,出厂前要对这批灯泡的质量, 比如它的寿命,做比较全面的分析。
(二)新课讲解
1、总体 —— 我们所关心的某个数量指标的全体,记作:X 2、样本 —— 总体中的个体,记作:X1, X2,..., Xn 3、样本值——样本取到的值,记作:x1, x2,..., xn 4、样本容量——样本的个数,记作:n
79 84 84 88 92 93 94 97 98 99
100 101 101 102 102 108 110 113 118 125
求(1)该月这20名青年的平均娱乐支出
(2)该月这20名青年的娱乐支出的样本方差与样本标准差
解:(1)
x
1
(79 84 .
.
.125) 99.4,
20