数理统计的基本概念

合集下载

数理统计

数理统计
数理统计
四、数理统计的基本概念 五、参数估计
四、数理统计的基本概念
1. 总体和样本 总体:研究对象的某项数量指标的值的全体。 个体:总体中的每个元素为个体。 容量:总体中所包含的个体的个数。 按此分为有限总体和无限总体。 例如:某工厂生产的灯泡的寿命是一个总体,每 一个灯泡的寿命是一个个体;某学校男生的身高 的全体一个总体,每个男生的身高是一个个体。


1 ˆ 解得: n
2
x
i 1 n
n
i
x
1 ˆ n

i 1
( X i X )2
(3)估计量的评选标准
1) ˆ ˆ 无偏性:若 ( X 1 , , X n )的数学期望存在, ˆ ˆ 且E . 则称是的无偏估计量。
2)
ˆ ˆ ˆ ˆ 有效性:若1 1 ( X 1 , , X n ), 2 2 ( X 1 , , X n ) ˆ ˆ 都是的无偏估计量;若D( ) D( ).
ˆ 所以 A1 X ,
ˆ A2
2 2 A1
1 n

i 1
n
X i2
1 X n
2

i 1
n
( X i X )2
(2) 极大似然估计法
(1).若总体X属离散型,其分布律 { X x} p( x; ), P 的形式为已知, 为待估参数,是可能取值的范围。
解:X的概率密度为: 1 1 2 f ( x; , ) exp{ (x )2} 2 2 2
似然函数为:
L( , )
2
2 2 2 i 1 n n 1 ln L ln(2 ) ln( ) 2 2 2 2

数理统计

数理统计

第六章 数理统计的基本概念本章必须掌握基本概念:总体,统计量。

特别要掌握常见统计量的分布。

统计量是样本的函数,统计量的选择和运用在本章统计推断中占据核心地位。

参数估计在考试中占有极其重要的地位,必须重视。

一、 考研知识结构网络图二、相应知识点精讲数理统计的基本概念 随机样本 总体总体与个体 总体分布函数样本平均值 n个相互独立且与总体同分布的随机变量 两重性样本 统计量常用统计量样本值 总体与随机变量 简单随机样本三大分布样本值样本方差样本标准差 样本k 阶原点矩 样本k 阶中心矩2分布(定义与性质)t 分布(定义与性质)F分布(定义与性质)正态总体下统计量两个正态总体统计量的分布单个正态总体统计量的分布统计量的分布及数字特征1.总体:研究对象的某项数量指标的值的全体称为总体。

总体用X 表示,是一个随机变量。

2.样本:从总体X 中随机抽取n 个个体n X X X ,,,21 ,称为总体X 的一个容量为n 的样本。

(1)样本中的每一个个体n X X X ,,,21 都是随机变量。

(2)简单随机样本(简称样本)n X X X ,,,21 与总体X 同分布且相互独立。

(3)样本一旦抽取,它们都是具体的数值,称为样本值,记为12,,,n x x x 。

3.设n 元函数g (n X X X ,,,21 )是连续函数,n X X X ,,,21 是来自总体的一个样本。

如果g (n X X X ,,,21 )中不含任何未知参数,则称之为总体X 的一个统计量。

4.若统计量是用于总体的某个参数进行估计,则称为估计量。

5.常用统计量: (1)样本均值:∑==ni i X nX 11(2)样本方差:∑=--=ni iX X n S 122)(11(3)样本标准差:212)(11∑=--==ni iX X n SS(4)样本k 阶原点矩:∑==ni ki k X nA 111.设总体X 服从正态分布),(2σμN ,n X X X ,,,21 为来自X 的一个样本,则样本均值∑==ni i X nX 11服从正态分布),(~),,(22nN X nN σμσμ即。

数理统计基本概念

数理统计基本概念
n1 Γ( ) 2 n 1 x 2 fT ( x ) (1 ) 2 , n n n Γ ( ) 2
P{6.262 χ 2 24.996}
2 2
P{χ 6.262} P{χ 24.996}
0.975 0.05 0.925
注意 应注意分布表的定义与查法!
#
数理统计基本概念
3.自由度为 n的 t 分布 作笔名发表文章.
T~t(n)
又称学生氏分布--第一个研究者以Student
( X 1 , X 2 , , X n ) ~ ( 2 ) e
n 2 2
i 1
( xi )2 2 2
n
数理统计基本概念
四、统计量 定义6.1.2 设X1 , X2 , ·, Xn是总体X的样本, · · T为n元实值函数,若样本的函数 T=T(X1 , X2 , ·, Xn) · · 是随机变量且不含未知参数,称 T为统计量. 对相应的样本值( x1 , x2 , … , xn ) ,称 t =T( x1 , x2 , … , xn )






数理统计基本概念
某厂生产的一批产品中次品率为 p 。从中 抽取10件产品装箱。 概
1)没有次品的概率 2)平均有几件次品

3)为以 0.95的概率保证箱中 有10件正品,箱中至少要装多 少件产品。







数理统计基本概念
所有这些问题的关键是 p 是已知的! 如何获取 p ? 这就是数理统计的任务了!
定的α(0<α<1),数uα满足
P{ X u } ,
(C ) u1 ;

数理统计的基本概念

数理统计的基本概念
(n 2) n n

n 1 2
, x .
t 分布的概率密度图形
图形关于 x 0 对称, lim f ( x; n) 0 , 且 x 当 n 充分大时,f (x; n) 趋近于标准正态 分布的概率密度。
定理 4: X 1, 2, , n 是抽自正态总体 设 X X
若总体 X 是离散型的,其分布律为:
则样本的联合分布为
§6.2 抽样分布
6.2.1 统计量的概念 由样本推断总体的某些情况时,需要对样本进行“ 加工”,构造出若干个样本的已知 (确定)的函数, 其作用是把样本中所含的某一方面的信息集中起来 。 这种不含任何未知参数的样本的函数称为统计量。 它是完全由样本所决定的量。 定义2:设 X 1 , X 2 , , X n 是来自总体X的样本, g( X 1 , X 2 , , X n ) 是样本 X 1 , X 2 , , X n 的函数,如果 g( X 1 , X 2 , , X n ) 中不包含任何未知参数,则称它 是一个统计量。
1 (0.82)
1 0.7939 0.2061
X ~ N (0, 22 ), X1 , X 2 , X3 , X 4 为其样本,求a,b 例2:总体
(2). (n 1)S / ~ (n 1)
2
X (1). X ~ N ( , / n), 或 ~ N (0,) ; 1 / n 2 2 2
2
X (3). X 与 S 相互独立; (4). ~ t(n 1). S/ n
定理5:设X1, X2, …, Xm 与Y1, Y2, …, Yn分别来自总体 2 两样本独立, X ~ N ( 1 , 12 )和Y ~ N ( 2 , 2 )的样本, 2 S12 / S2 则有 F 2 ~ F ( m 1, n 1). 2 1 / 2 定理6*:设X1, X2, …, Xm 与Y1, Y2, …, Yn分别来自

数理统计的基本概念

数理统计的基本概念
首页 上页 返回 下页 结束
第6章
§6.1-6.2
第10页
设(X1,X2,…,Xn)为来自总体X的简单随机样本 1 n 1.样本均值: X X i 常用于估计总体分布的均值,或 检验有关总体分布均值的假设。 n i 1
n 1 2 S2 ( X X ) 2.样本方差: i n 1 i 1
首页 上页 返回 下页 结束
第6章
§6.1-6.2 §6.1 样本及抽样分布
第3页
数理统计的核心问题是由样本推断总体,即统计推断
6.1.1 总体、个体与样本
1. 总体:研究对象的全体称为总体(母体),用X表示, 它是一个随机变量. 总体分为有限总体和无限总体. 个体:组成总体的每个研究对象称为个体.
i 1 i 1
i
ki !
e
首页
上页
返回
下页
结束

第6章
§6.1-6.2
第8页
3 加工某零件时,每一件需要的时间服从均值为1 / 的 指数分布,今以加工时间为零件的数量指标,任取n件 零件构成一个容量为n的样本,求样本分布.
解:零件的加工时间为总体X,则X ~ E ( ), 其概率 e x x0 密度为 f ( x) x0 0 于是样本( X 1 , X 2 , X n )的密度为 f ( x1 , x2 , xn )
样本容量为5
首页 上页 返回 下页 结束
第6章
§6.1-6.2
第5页
样本是随机变量. 抽到哪5辆是随机的
容量为n的样本可以看作n维随机变量(X1, X2, …, Xn). 一旦取定一组样本,得到的是n个具体的数 (x1,x2,…,xn),称为样本的一次观察值,简称样本值 .

数理统计的基本概念

数理统计的基本概念

样本k阶原点矩 样本 阶原点矩 样本k阶中心矩 样本 阶中心矩
河南理工大学精品课程
1 Ak = n 1 Bk = n
∑ ∑
n
n
i =1
X ik ( k = 1, 2 , L )
i =1
( X i − X ) k ( k = 1, 2 , L )
概率论与数理统计
说明 (修正 样本方差还可表示为 修正)样本方差还可表示为 修正
n 1 S2 = [ ∑ X i2 − n X 2 ] n − 1 i =1
1 n 推导】 【推导】 S 2 = ( X i − X )2 ∑ n − 1 i =1 = = = =
河南理工大学精品课程
1 n ( X i2 − 2 X i X + X 2 ) ∑ n − 1 i =1 n n n 1 [ ∑ X i2 − 2 X ∑ X i + ∑ X 2 ] n − 1 i =1 i =1 i =1 n 1 [ ∑ X i2 − 2 n X 2 + n X 2 ] n − 1 i =1 n 1 [ ∑ X i2 −n X 2 ] n − 1 i =1
河南理工大学精品课程 概率论与数理统计
做法
从总体中随机地抽取若干个体(灯泡、 从总体中随机地抽取若干个体(灯泡、工大男
生),测试其所需数据(寿命、身高),最后对所得数据通过 ),测试其所需数据 寿命、身高), 测试其所需数据( ),最后对所得数据通过 整理加工和分析来推断总体(这批灯泡寿命、 整理加工和分析来推断总体(这批灯泡寿命、工大男生身 高)的分布情况,从而了解整体情况. 的分布情况,从而了解整体情况. 一般,我们所研究的总体的某项数量指标X 一般,我们所研究的总体的某项数量指标X是一个随 机变量,其取值在客观上有一定的分布.因此, 机变量,其取值在客观上有一定的分布.因此,对总体的研 究,就是对相应的随机变量X的研究。 就是对相应的随机变量X的研究。 今后,我们称X 今后,我们称X的分布函数和数字特征分别为总体的 分布函数和数字特征, 分布函数和数字特征,并不再区分总体与相应的随机变量 X.对总体的称呼 总体,总体X 总体F X.对总体的称呼:总体,总体X与总体F. 对总体的称呼:

数理统计基本概念

数理统计基本概念
2 ( n1 1) S12 ( n2 1) S2 n1 n2 2
1 1 n1 n2
~ t ( n1 n2 2)
定理 5 (两总体样本方差比的分布)
且X与Y独立, 设X ~ N ( 1, ), Y ~ N ( 2 , ), X1, X2,…, X n1是取自X的样本, Y1,Y2,…, Yn2 是
样本是联系二者的桥梁 总体分布决定了样本取值的概率规律, 也就是样本取到样本值的规律,因而可以由 样本值去推断总体.
二、统计量和抽样分布 1. 统计量 由样本值去推断总体情况,需要对样本 值进行“加工”,这就要构造一些样本的 函数,它把样本中所含的(某一方面)的 信息集中起来.
这种不含任何未知参数的样本的函数 称为统计量. 它是完全由样本决定的量.
2. 独立性: X1,X2,…,Xn是相互独立的随机 变量.
由简单随机抽样得到的样本称为简单 随机样本,它可以用与总体独立同分布的 n个相互独立的随机变量X1,X2,…,Xn表示.
若总体的分布函数为F(x),则其简单随机 样本的联合分布函数为 F(x1) F(x2) … F(xn) 简单随机样本是应用中最常见的情 形,今后,当说到“X1,X2,…,Xn是取自某 总体的样本”时,若不特别说明,就指简 单随机样本.
数理统计的基本概 念
一、总体和样本
1.总体
一个统计问题总有它明确的研究对象.
研究对象的全体称为总体(母体), 总体中每个成员称为个体.
总体

研究某批灯泡的质量
然而在统计研究中,人们关心总体仅仅 是关心其每个个体的一项(或几项)数量指标 和该数量指标在总体中的分布情况. 这时, 每个个体具有的数量指标的全体就是总体.
统计中,总体这个概念 的要旨是:总体就是一个 概率分布.

数理统计的基本概念

数理统计的基本概念

证明:设F~F(n1,n2),则
P{F F1 (n1 , n2 )} 1
1 1 P{ } 1 F F1 (n1 , n2 ) 1 1 P{ } F F1 (n1 , n2 )
得证!
1 P{ F (n2 , n1 )} F
5.1.4 统计量及抽样分布
2. F分布的分位点 对于:0<<1,
若存在F(n1, n2)>0,
满足
P{FF(n1, n2)}=, 则
称F(n1, n2)为 F(n1, n2)的 上侧分位点;
F (n1 , n2 )
注:
1 F1 (n1 , n2 ) F (n2 , n1 )
1 ~ F ( n2 , n1 ) F
列出其频数频率分布表。
组序 分组区间 组中值 1 (147,157] 152 2 (157,167] 162 3 (167,177] 172 4 (177,187] 182 5 (187,197] 192 合计
频数 4 8 5 2 1 20
频率 累计频率(%) 0.20 20 0.40 60 0.25 85 0.10 95 0.05 100 1
1、设X 1 , X 2 ,
, X n (n 2)为来自总体N (0,1)的简单随机样本, (n 1) X 12
2 X i i 2 n
X 为样本均值,S 2为样本方差,则统计量

从 __________ 分布。 (05—06二)
2、设 X 1 , X 2 , X 3是来自正态分布 N (0, 2 )总 体的简单随机样本,则 统计量 2 服从 ________ 分布。(05—06三) X1 X X
3.总体、样本、样本观察值的关系 总体
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 Fn x X 1 , n
则称这个函数为随机变量(或总体)X 的经验分布函数.
相应地称函数
1 Fn x x1 , n
, xn中小于或等于 x 的个数,
x
为经验分布函数的观测值. 例11 有这样一组样本观测值(5,3,7,5,4), 试写出经验分布
xi n , xn , p p 1 p i 1 n
xi 1,2,
, i 1,2,
,n
§1.3

经验分布函数
X1 , X 2 ,
, X n 是取自总体 X 的一个样本, x1, , xn
, X n中小于或等于 x 的个数,
x
是样本观测值, 定义函数
任意的 0 , 有
X1 , X 2 ,
, X n 是取自总体 X 的一个样本,
lim P Fn x F x 0
n


x
证明主要步骤:
⑴对任意实数 x , , 设
1, Yi 0,
X i x, X i x.
则样本 X1 , X 2 ,
, X n 的联合密度函数为:
,Xn
X ~ f x, θ ,
, xn
f * x1, x2 ,
, xn , θ ˆ f X1 , X 2
x1, x2 ,
f xn , θ
f X1 ( x1 ) f X 2 ( x2 )
f X n ( xn )
f x1 , θ f x2 , θ
f xi , θ
i 1
n
X ~ R 0, θ , X 1, X 2 , , X n 为取自该总体 的一个样本, 求样本 X 1 , X 2 , , X n 的联合密度函数.
例7 设总体 解 因总体
X ~ R 0, θ , 因此相应的密度函数为
分布中的某些量, 例如总体 观测值称为样本观测值.
X 的均值、方差、中位数等.
这些抽取的个体便称为取自总体的一个样本, 这些个体的
在试验前, 样本的观测值是不确定的, 为了体现随机性, 在 数理统计中把样本记作 X1 , X 2 ,
, X n . 事实上是一个 n 维
随机变量. 通过试验或观测得到的数值称为样本观测值, 记作
e

, xn , f xi , P X i xi
i 1
n
n
n
i 1
n
x
1
x1 !
e

x
xn !
e
n

xi
i 1
x1 ! x2 !
,
xn !
, n.
xi 0,1,2,
i 1,2,
设总体 X 为连续型随机变量, 密度函数为
一个样本, 试写出样本 X1 , X 2 ,
, X n 的联合概率函数.
n
, X n 是来自该总体的

f
*
x1, x2 ,
n
, xn , p f xi , p
i 1 xi n i 1
P X i xi p
i 1
1 p
1 xi
数理统计主要研究如何以有效的方法收集、整理与
分析带有随机性影响的数据, 从而对所考察的问题作
出推断和预测, 为采取某种决策提供依据和建议.
本章要点
一、直方图 二、总体与样本 三、经验分布函数 四、统计量 五、三大常用分布 六、抽样分布
§1.1
一、直方图的做法: 例1.1
直方图
直方图近似描绘了连续型随机变量的概率密度函数.
简单随机样本
从总体中抽取样本的方法有很多种, 主要并且常用的就是 所谓的简单随机抽样方法, 即有放回重复独立的抽取, 这样 得到的样本便称之为简单随机样本. 由抽样方式即可知, 简单随机样本具有以下两个特点: 1. 独立性: 随机变量 X1 , X 2 ,
, X n 是相互独立;
2. 代表性: 每个个体 X i 的分布都和总体分布相同;
P X n xn
f X1 x1 , θ f X 2 x2 , θ
f x1 , θ f x2 , θ
f X n xn , θ
f xn , θ
f xi , θ
i 1
n
例5 设总体 X ~ B 1, p , X1 , X 2 ,
例8 设总体


X ~ N , 2 , 相应的密度函数为
1 f x, , e 2π
2
2 x
2 2
,
x ,
因此, 联合密度函数为
f
*
x , x ,
1 2
1 , xn , , e i 1 2 π
2 n
2 xi
2 2




n
e
i 1
xi
2 2
n
2

n 2 2

e
i 1
2 x i
n
2 2
xi , i 1,2,
, n.
例9
设 X1 , X 2 ,
, X n 是取自总体 X 的一个样本, X
x1 , x2 ,
, xn . 是一组数据或者说是 n 维空间的一个点.
称 n 为样本大小, 或样本容量.
在实际工作中, 我们通常把看到的一堆数据称为样本. 但是
严格来讲: 样本不是数据而是一组随机变量.
数据是抽样完成以后得到的一次观测值, 而数理统计就是 在样本抽样前就某个问题制定“方针政策”.

X i ~ f xi , θ , i 1,2,
, n.
故经常有这样的叙述: 设 X1 , X 2 ,
, X n 是取自总体 X
X 1 , , X n 相互独立并且都服从 概率密度函数或概率函数为 f x, θ 的分布.
的一个样本, 这句话就表示
问题: 如何求样本的联合概率密度函数或概率函数?
0 x θ,
其余.
1 , f x, θ θ 0, 因此, 联合密度函数为
f
*
x1, x2 ,
1 n, , xn , θ θ 0,
0 xi θ, i 1, 2,
其余.
n,
X ~ N , 2 , X1 , X 2 , , X n 为取自该 总体的一个样本, 求 X 1 , X 2 , , X n 的联合密度函数.
函数的观测值.
解⑴
由定义
(5,3,7,5,4)
1 F5 x x1 , 5
0, 1 , 5 2 , 5 4 5 , 1,
, x5中小于或等于 x 的个数
x 3, 3 x 4, 4 x 5, 5 x 7, x 7.
的密度函数为
2x 2 , 0 x θ, f x, θ θ 其余. 0, 试写出 X1 , X 2 , , X n 的联合密度函数.
解 联合密度函数为
f
*
x1, x2 ,
2n x1 x2 xn , 0 xi θ, i 1, 2, 2n , xn , θ θ 其余. 0,

和方差

2
这两个参数是未知的.
2
诚然, 我们可以逐个测量身高来求得 和
. 但是人太多,
逐个测量很不经济, 而且有一些随机试验是破坏性试验, 如测 试灯泡的寿命, 这种情形下, 逐个检查是不现实的.
所以我们希望从客观存在的总体中按一定原则选取一些个
体、即抽样, 通过对这些个体作观察或测试来推断关于总体
p
xi
i 1
n
1 p
n
xi ,
i 1
n
xi 0,1, i 1,2,
, n.
X ~ P , X1 , X 2 , , X n 为取自该总体的 的一个样本, 求样本 X 1 , X 2 , , X n 的联合概率函数.
例6 设总体

f * x1 , x2 ,
第一章 数理统计的基本概念

以 X 表示某地区人员的身高, 设 X ~ N
2 , ,
其中 表示平均身高,
2 表示身高的离散程度.
问: 如何设计车门的高度才能满足至少99%的乘客需求?

设车门高为 x 米, 则
P X x 0.99,
即:
x
x 0.99.

u0.99 2.326 x 2.326
所以必须已知 和 的值才能算出 x !
例 小儿麻痹症是20世纪五十年代的一种流行病, 对于一种
疫苗的有效性检验, 收集了20万儿童并随机分成两组: 实验
组和对照组. 而试验结果是对照组中有138个儿童受到感染, 而实验组中则有56个受到感染. 试根据这组数据判断疫苗的 有效性. 统计假设检验的结果表明138与56的差异是高度显著的, 因此该疫苗统计有效.
X ~ N ,
2
2

, 写出总体分布 f
2 x
x, , .
2
1 f x, , e ˆ fX x 2π
2 2
, x .
样本
在数理统计中, 总体分布往往是未知的, 有时虽然总体分布 的类型已知, 但分布中含有未知参数, 如引例中虽然知道人群 中每个成员的身高是服从正态分布的, 但是均值
相关文档
最新文档