武汉大学数理统计ppt 2数理统计基本概念
合集下载
数理统计的基本知识.ppt

设 x1, x2,…, xn 是相应于样本 X1, X2, …,Xn 的样本值,则称 g(x1,x2,…, xn) 是统计量T = g(X1,X2,…,Xn)的观察值.
二、样本矩
下面给出几个常用的统计量.设(X1,X2,…,Xn)是来自总体 X 的一个样
本,(x1,x2,…,xn)是样本观察值,定义:
频数
2 0 0 2 2 8 13 23 24 21 14 6 2 2 0 1
组中值
0.645 0.665 0.685 0.705 0.725 0.745 0.765 0.785 0.805 0.825 0.845 0.865 0.885 0.905 0.925 0.945
直方图中第 i 个小矩形面积 yiΔt=fi (i=1,2,…,k),k 个小矩形的面积之 和为1.
由于样本观察值的 n 个数值 x1,x2,…,xn是从总体X 中独立抽取的,它 们落入区间 (ti-1,ti] 的频率 fi 近似等于随机变量 X 在该区间内取值的概率,即
fi≈P{ti-1<X≤ti}=pi,i=1,2,…,k,
一、样本分布函数
样本能够反映总体X的信息,总体X的分布函 数F(x)是否能由样本来“表示”?回答是肯定的, 我们用下面介绍的样本函数来近似表示总体X的 分布函数.
定义 设x(1),x(2),…,x(n)是总体X的顺序统计量的一组观察值,对于任 意的实数x,定义函数
0, x x(1) ;
Fn
(
x)
i n
,
x(i) x x(i1) ,
1, x x(n) .
i 1, 2,, n 1;
称 Fn(x) 为 总 体 X 的 样 本 分 布 函 数 (或 经 验 分 布 函 数).
高等数学(第2版)课件:数理统计的基本概念

的观察值.
2.几个常用的统计量
设 X1, X2,, Xn 是来自总体的一个样本 ,
(1) 样本均值
X
1 n
n i 1
Xi;
(2) 样本方差
S2
1 n1
n i 1
(Xi
X
)2
(3) 样本标准差
S
S2
1 n1
n i 1
Xi
X
2
;
2.几个常用的统计量
设 X1, X2,, Xn 是来自总体的一个样本 ,
具有上述特征的样本抽样方法称为简单随机抽样.
二、样本分布函数
定义. 设 x1, x2 , , xn 是总体 X 的一个容量为n的样本值,
将 x1, x2 , , xn 按从小到大的顺序排序: x(1) x(2) x(n) ,令
0
Fn
(
x)
k n
, x x(1) , x(k ) x x(k1)
通常把所研究对象的全体称为总体,把组成总体的 各个元素称为个体.
2.样本
从总体 X 中抽取 n个个体 X1, X2 , , Xn ,这n个个体 称为来自总体 X 的样本容量为n的样本.对样本进行一次 观察或测试,就得到 n个数据 x1, x2 , , xn , 称它们为 样本观察值.
样本特征:
1)代表性 X1, X2 , , Xn 与总体 X 有相同的分布; 2)独立性 X1, X2 , , Xn 是相互独立地随机变量.
1 , x x(n)
称Fn( x)为样本分布函数或经验分布函数.
例. 设总体有三个样本值1,1,2,则经验分布函数
0,
F3( x)
2, 3
1,
x 1, 1 x2 x 2.
2.几个常用的统计量
设 X1, X2,, Xn 是来自总体的一个样本 ,
(1) 样本均值
X
1 n
n i 1
Xi;
(2) 样本方差
S2
1 n1
n i 1
(Xi
X
)2
(3) 样本标准差
S
S2
1 n1
n i 1
Xi
X
2
;
2.几个常用的统计量
设 X1, X2,, Xn 是来自总体的一个样本 ,
具有上述特征的样本抽样方法称为简单随机抽样.
二、样本分布函数
定义. 设 x1, x2 , , xn 是总体 X 的一个容量为n的样本值,
将 x1, x2 , , xn 按从小到大的顺序排序: x(1) x(2) x(n) ,令
0
Fn
(
x)
k n
, x x(1) , x(k ) x x(k1)
通常把所研究对象的全体称为总体,把组成总体的 各个元素称为个体.
2.样本
从总体 X 中抽取 n个个体 X1, X2 , , Xn ,这n个个体 称为来自总体 X 的样本容量为n的样本.对样本进行一次 观察或测试,就得到 n个数据 x1, x2 , , xn , 称它们为 样本观察值.
样本特征:
1)代表性 X1, X2 , , Xn 与总体 X 有相同的分布; 2)独立性 X1, X2 , , Xn 是相互独立地随机变量.
1 , x x(n)
称Fn( x)为样本分布函数或经验分布函数.
例. 设总体有三个样本值1,1,2,则经验分布函数
0,
F3( x)
2, 3
1,
x 1, 1 x2 x 2.
数理统计的基本概念PPT精品文档40页

则样本的联合分布为
n
n
P { X 1 x 1 ,X 2 x 2 , ,X n x n } P { X i x i} p i.
i 1
i 1
§6.2 抽样分布
6.2.1 统计量的概念
由样本推断总体的某些情况时,需要对样本进行“ 加工”,构造出若干个样本的已知 (确定)的函数, 其作用是把样本中所含的某一方面的信息集中起来 。这种不含任何未知参数的样本的函数称为统计量。 它是完全由样本所决定的量。
统计量的分布称为抽样分布,下面介绍来自正 态总体的几个重要统计量的分布,称为统计学的三 大分布: 2 分布,t分布和F分布.
6.2.2 χ 2 分布
定义4: 设 X1, X2, …, Xn 是来自总体 N(0, 1), 的样本,则称统计量
与总体X具有相同的概率分布,则称随机变量 X1,X2, ,Xn为来自总体X的容量为n的简单随机 样本,简称样本.
它们的 x1,x观 2, ,x 察 n称值 为,样 又本 称值 为 X的 n个独立 . 的观察值
注意:样本的二重性。
6.1.2 样本的分布 样本 X1,X2,…,Xn 可以被看作n维随机向量,自
定义2:设 X1,X2, ,Xn是来自总体X的样本, g(X 1,X 2, ,X n)是样本 X1,X2, ,Xn的函数,如果 g(X 1,X 2, ,X n)中不包含任何未知参数,则称它
是一个统计量。
定义3:几个常用的统计量
样本均值
X
1 n
n i1
Xi
反映总体 均值的信息
样本方差 S2n11in1(Xi X)2n11(in1 Xi2nX2)
200 20 00 20 00 20 00 20 00 20 000
数理统计的基本概念课件

离散程度
通过方差、标准差等指标 来描述数据的离散程度, 反映数据的变化程度。
数据的中位数、均值和众数
中位数
将数据按照大小顺序排列,处于 中间位置的数值即为中位数。中 位数可以反映数据的集中趋势和
离散程度。
均值
将所有数据相加后除以数据个数 ,得到的数值即为均值。均值可 以反映数据的集中趋势和离散程
度。
拟合优度
决定于所选择的非线性函数形式,常 用的有R²和SSPE(残差平方和)。
显著性检验
一般采用基于参数的假设检验和似然 比检验。
THANKS FOR WATCHING
感谢您的观看
05
假设检验
假设检验的基本思想
统计假设
假设检验的核心是对提出的问题(即假设)进行统计推断,先假设所要考察的 总体参数按某种规律或分布(即统计模型)分布,然后根据样本信息对原假设 进行检验。
假设检验的基本步骤
首先提出假设,然后收集样本数据,接着根据样本数据对原假设进行检验,最 后根据检验结果做出结论。
多元线性回归分析
• β0: 截距 • β1, β2, ...: 斜率
• ε: 误差项
多元线性回归分析
拟合优度
R²,表示模型解释因变量的方差的比例 。
VS
显著性检验
整体显著性检验(F检验)和单个变量的 显著性检验(t检验)。
非线性回归分析
定义
非线性回归分析是研究非线性关系的 统计方法。
模型
Y = f(X) (其中 f 是非线性函数)
• β0: 截距
一元线性回归分析
01
• β1: 斜率
02
• ε: 误差项
03
04
拟合优度:R²,表示模型解 释因变量的方差的比例。
《数理统计》课件

季节性分析
要点一
总结词
季节性分析是时间序列分析的重要环节,通过季节性分析 可以了解时间序列数据中存在的季节性波动。
要点二
详细描述
季节性分析的方法包括季节性分解、季节性自相关图、季 节性指数等。这些方法可以帮助我们识别时间序列数据中 的季节性模式,并基于这些模式进行预测和建模。
THANKS FOR WATCHING
参数与统计量
参数是描述总体特性的指标, 统计量是描述样本特性的指标 。
概率与随机变量
概率用于描述随机事件发生的 可能性,随机变量是表示随机 现象的变量。
估计与检验
估计是用样本数据推断总体参 数的过程,检验是利用样本数
据对假设进行判断的过程。
CHAPTER 02
描述性统计
数据的收集与整理
数据来源
描述数据的来源,如调查、观察、实 验等。
非线性回归分析
总结词
非线性回归分析是数理统计中用于研究非线 性关系的分析方法。
详细描述
非线性回归分析不依赖于最小二乘法原理, 而是通过其他优化方法来拟合非线性模型。 非线性回归分析适用于因变量和自变量之间 存在非线性关系的情况。常见的非线性回归 模型包括多项式回归、指数回归、对数回归 等。非线性回归分析广泛应用于各个领域,
如正态分布、指数分 布等。
随机事件的概率计算
条件概率
在某个事件发生的条件下,另一个事件发生 的概率。
互斥事件的概率计算
两个互斥事件同时发生的概率等于各自发生 概率的和。
独立事件的概率计算
两个独立事件同时发生的概率等于各自发生 概率的乘积。
全概率公式
一个复杂事件的概率可以分解为若干个互斥 事件的概率之和。
单因素方差分析
数理统计的基本概念幻灯片PPT

数理统计的基本概念幻灯片PPT
本PPT课件仅供大家学习使用 请学习完及时删除处理 谢谢!
数理统计学 是一门以数据为基础的科学, 可以定义为
收集数据, 分析数据和由数据得出结论的一组概念、
原则和方法。
例如:若规定灯泡寿命低于1000小时者为次品,如何确定 次品率?由于灯泡寿命试验是破坏性试验,不可能把整批 灯泡逐一检测,只能抽取一部分灯泡作为样本进行检验, 以样本的信息来推断总体的信息,这是数理统计学研究的 问题之一。
答 : 只 有 (4)不 是 统 计 量 。
2分布
定 义 : 设 随 机 变 量 X1,X2, Xn相 互 独 立 , Xi N0,1 i1,2, ,n
n
则 称n2 Xi2
1
i1
服 从 自 由 度 为 n的 2分 布 , 记 为 22n
自 由 度 指1式 右 端 包 含 的 独 立 变 量 的 个 数
n211
112 2 2
n n112n2 2 1
nx220
1
0 0
x0
其中B a,b x 其中Ba,b01x11xb1dxaabb1 1 1x b 0
f x
n2 ,n120 n2 25
n2 10
0
1
2
x
F 分 布 的 密 度 函 数
对 于 给 定 的 ,0 1 ,称 满 足 条 件 F n 1 ,n 2 fx ;n 1 ,n 2 d x 的 点 F n 1 ,n 2 为 F n 1 ,n 2 分 布 的 上 分 位 数 。 F n 1 ,n 2 的 值 可 查 F 分 布 表
2 . 设 Y 1 2 n 1 , Y 2 2 n 2 , 且 Y 1 , Y 2 相 互 独 立 , 则 有 Y 1 Y 2 2 n 1 n 2
本PPT课件仅供大家学习使用 请学习完及时删除处理 谢谢!
数理统计学 是一门以数据为基础的科学, 可以定义为
收集数据, 分析数据和由数据得出结论的一组概念、
原则和方法。
例如:若规定灯泡寿命低于1000小时者为次品,如何确定 次品率?由于灯泡寿命试验是破坏性试验,不可能把整批 灯泡逐一检测,只能抽取一部分灯泡作为样本进行检验, 以样本的信息来推断总体的信息,这是数理统计学研究的 问题之一。
答 : 只 有 (4)不 是 统 计 量 。
2分布
定 义 : 设 随 机 变 量 X1,X2, Xn相 互 独 立 , Xi N0,1 i1,2, ,n
n
则 称n2 Xi2
1
i1
服 从 自 由 度 为 n的 2分 布 , 记 为 22n
自 由 度 指1式 右 端 包 含 的 独 立 变 量 的 个 数
n211
112 2 2
n n112n2 2 1
nx220
1
0 0
x0
其中B a,b x 其中Ba,b01x11xb1dxaabb1 1 1x b 0
f x
n2 ,n120 n2 25
n2 10
0
1
2
x
F 分 布 的 密 度 函 数
对 于 给 定 的 ,0 1 ,称 满 足 条 件 F n 1 ,n 2 fx ;n 1 ,n 2 d x 的 点 F n 1 ,n 2 为 F n 1 ,n 2 分 布 的 上 分 位 数 。 F n 1 ,n 2 的 值 可 查 F 分 布 表
2 . 设 Y 1 2 n 1 , Y 2 2 n 2 , 且 Y 1 , Y 2 相 互 独 立 , 则 有 Y 1 Y 2 2 n 1 n 2
概率论与数理统计PPT课件(共8章)第六章 数理统计的基本概念

代表性
每个样本Xi(i=1,2,…,n)与 总体X具有相同的分布
独立性
各个样本X1,X2,…,Xn的取 值互不影响,即X1,X2,…,Xn是 相互独立的随机变量.
6.1.3 样本的联合分布
若 X1 ,X2 , ,Xn 为总体 X 的一个样本, X 的分布函数为 F(x) ,则 X1 ,X2 , ,Xn
n
n
xi
n xi
p i1 (1 p) i1 ,
概
率
论
与
数 理
6.2
统
计
统计量与抽样分布
6.2.1 统计量
定义 6.2 不含任何未知参数的样本 X1 ,X2 , ,Xn 的连续函数 g(X1 ,X2 , ,Xn )
称为统计量.
下面列出一些常用的统计量.
(1)样本均值
X
1 n
n i1
Xi
(2)样本方差
概
率
论
与
数
理 统 计
数理统计的基本概念
第六章
概
率
论
与
数
理 统
壹 总体与样本
计
贰 统计量与抽样分布
目录
概
率
论
与
数 理
6.1
统
计
总体与样本
总体与个体
6.1.1 总体
在数理统计中,通常把研究对象的全体称为总体,把构 成总体的每个研究对象称为个体.
总体分布
为了便于数学上的处理,我们将总体定义为随机变量, 记作.随机变量的分布称为总体分布.
N
(1
,12
)
与
N
(2
,
2 2
)
的样本,且这两个样本相互独立.设
数理统计的基本概念PPT模板

3 次序统计量和样本分布函数
例 4 设总体服从泊松分布,容量为 10 的样本观测值如下: 2,1,4,3,5,6,4,8,4,3.
试构造样本的分布函数 F10 (x) .
解 将样本的观测值由小到大排列为1 2 3 3 4 4 4 5 6 8 ,所以样本的频 率分布如表 5-1 所示.
设 X1 ,X2 , ,Xn 是总体 X 的样本,则可定义以下统计量.
(1)样本均值为
X
1 n
n i 1
Xi
,
(5-1)
它的观测值记为
x
1 n
n i 1
xi
.
数理统计的基础知识
数理统计的基本概念
1.2 参数与统计量
(2)样本方差为
S2 1 n n 1 i1
Xi X
2
1 n 1
n i 1
数理统计的基本概念
1.2 参数与统计量
由于样本具有二重性,统计量作为样本的函数也具有二重性,即 对一次具体的观察或试验,它们都是具体的数值,但当脱离具体的某 次观察或试验,样本是随机变量,因此统计量也是随机变量.
统计量是用来对总体分布参数进行估计或检验的,它包含了样本 中有关参数的信息,在数理统计中,根据不同的目的构造了许多不同 的统计量.
设 样 本 X1 ,X2 , ,Xn 的 次 序 统 计 量 为
X (1) X (2)
X(n) ,对应的样本观测值为
x(1) x(2)
x(n) ,令
0 ,x x(1) ,
1 n
,x(1)
x x(2) ,
Fn
(x)
k
n
,x(k )
x x(k 1) ,
1,x x(n) .
(5-6)
例 4 设总体服从泊松分布,容量为 10 的样本观测值如下: 2,1,4,3,5,6,4,8,4,3.
试构造样本的分布函数 F10 (x) .
解 将样本的观测值由小到大排列为1 2 3 3 4 4 4 5 6 8 ,所以样本的频 率分布如表 5-1 所示.
设 X1 ,X2 , ,Xn 是总体 X 的样本,则可定义以下统计量.
(1)样本均值为
X
1 n
n i 1
Xi
,
(5-1)
它的观测值记为
x
1 n
n i 1
xi
.
数理统计的基础知识
数理统计的基本概念
1.2 参数与统计量
(2)样本方差为
S2 1 n n 1 i1
Xi X
2
1 n 1
n i 1
数理统计的基本概念
1.2 参数与统计量
由于样本具有二重性,统计量作为样本的函数也具有二重性,即 对一次具体的观察或试验,它们都是具体的数值,但当脱离具体的某 次观察或试验,样本是随机变量,因此统计量也是随机变量.
统计量是用来对总体分布参数进行估计或检验的,它包含了样本 中有关参数的信息,在数理统计中,根据不同的目的构造了许多不同 的统计量.
设 样 本 X1 ,X2 , ,Xn 的 次 序 统 计 量 为
X (1) X (2)
X(n) ,对应的样本观测值为
x(1) x(2)
x(n) ,令
0 ,x x(1) ,
1 n
,x(1)
x x(2) ,
Fn
(x)
k
n
,x(k )
x x(k 1) ,
1,x x(n) .
(5-6)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正态分布, 2分布, t 分布, F 分布
(1) 标准正态分布 X ~ N 0, 1
X的上α (0< α<1)分位点 z
P X z P X z 1 z 1
(2) 2 分 布
设
X
1,
X
2 ,
,
X
相互独立,都服从正态
n
分布N (0,1), 则称随机变量:
2 X 12 X 22 X n2
设 ( x1, x2 , , xn ) 为样本 ( X 1 , X 2 , , X n ) 的一个
实现,且 x1 x2 xn.
当 ( X 1 , X 2 , , X n ) 取值为 ( x1, x2 , , xn ) 时,
定义随机变量 X(k) xk, k 1,2,, n.则称统计量
( X (1) , X (2) , , X (n) ) 为顺序统计量.
样本中所包含的个体数目称为样本容量.
从国产轿车中抽5辆进行耗油量试验。 样本容量为5。
由于抽样的目的是为了对总体进行统计推断,
为了使抽取的样本能很好地反映总体,必须考虑抽样 方法.
统计中,采用的抽样方法是随机抽样法, 即子样中每个个体是从总体中随意地取出来的。
(1) 重复(返回)抽样 X 1 , X 2 , , X n
n
n 1
D
X
D
X
n
DX
例2 设
体 的 阶矩 (1) (2) 证
是来自总体
的一样本,总 存在,证明
独立且与 独立且与
同分布 同分布
由辛钦大数定律,知
体 的 阶矩
是来自总体 的一样本,总
对k元连续函数
三. 抽样分布
统计量既然是依赖于样本的,而后者又是随机 变量,故统计量也是随机变量,因而就有一定 的分布,这个分布叫做统计量的“抽样分布” . 常用的有
给出了在n次独立重复试验中,事件 出现的频率,具有分布函数的一切性质。如: 非降,右连续;
由频数分布知
---n次独立重复试验中,事件 发生的频率。
由伯努利大数定律,
格列汶科进一步证明了:当n→∞时,Fˆn(x)以
概率1关于x一致收敛于F(x),即
P{lim n
sup
x
|
Fˆn
(
x
)
F
(
x
)
统计是从手中已有的资料--样本值,
去推断总体的情况--总体分布F(x)的性质.
样本是联系二者的桥梁
4. 样本的分布
1)样本的频数分布
将n个样本值
按从小到大排列,把相同
的数合并,并指出其频数(样本中各数出现的次数)
x
频数
频率
1)样本的经验分布函数
样本值 样本值小于或等于x的个数, ---样本的经验分布函数
-------推断统计学,如:参数估计、假设检验等。
例如 某厂生产一型号的合金材料,用随机的方法选取
100个样品进行强度测试,于是面临下列几个问题:
1、估计这批合金材料的强度均值是多少? (参数的点估计问题) 2、强度均值在什么范围内? (参数的区间估计问题) 3、若规定强度均值不小于某个定值为合格,那么这 批材料是否合格? (参数的假设检验问题) 4、这批合金的强度是否服从正态分布? (分布检验问题) 5、若这批材料是由两种不同工艺生产的,那么不同 的工艺对合金强度有否影响?若有影响,那一种工艺 生产的强度较好? (方差分析问题)
6、若这批合金 由几种原料用不同的比例合成,那么 如何表达这批合金的强度与原料比例之间的关系?
(回归分析问题) 7.若这批材料是由k个厂家、k种不同工艺和k种固定 的原料比例生产的,各个厂家、各种工艺和各种原料 比例生产的合金强度有什么不同,怎么找出最好的厂 家、工艺和原料比例组合最好?(试验设计问题)
对无限总体而言做无返回抽取,并不改变总体的成分 X 1, X 2 , , X n 独立且同分布于总体
最常用的一种抽样方法叫作 “简单随机抽样”。 它要求抽取的样本满足下面两点: (1) 代表性(随机性):从总体中抽取样本的每一个 分量Xk 是随机的, 每一个个体被抽到的可能性相同。 (2) 独立同分布性
|
0}
1
这就是著名的格列汶科定理.
定理告诉我们,当样本容量n足够大时,对所有
的生x的, 概F(ˆ率xn )与为F1(.x)之差的绝对值都很小,这件事发
这就是我们可以由样本推断总体的基本理论依据.
二 统计量
1. 统计量 定义1 设 X 1 , X 2 , , X n 是来自总体X的一个样本,
g ( X 1 , X 2 , , X n ) 为一实值连续函数,其不包含任何 未知参数,则称 g ( X 1 , X 2 , , X n ) 为一个统计量。 g ( x1 , x2 , , xn ) 为 g ( X 1 , X 2 , , X n ) 的观测值。
很大.
3 、 t 分布的分位点 对于给定的正数
e ,
(
x )2 2 2
2
x
样本的联合概率密度为
n
f * ( x1 , , xn ) f ( xi )
i1
1
2
n
e
1 2
2
n
xi 2
i1
3. 总体、样本、样本值的关系 事实上我们抽样后得到的资料都是具体的、确定的值. 如我们从某班学生中抽取10人测量身高,得到10个数, 它们是样本取到的值而不是样本. 我们只能观察到随机变量取的值,而见不到随机变量. 总体分布决定了样本取值的概率规律,也就是样本 取到样本值的规律,因而可以由样本值去推断总体.
E
X
2 i
1,
DX
2 i
E
X
4 i
(
E
X
2 i
)
2
3
1
2,
i 1,2, n
n
n
所以 E 2 E (
X
2 i
)
EX
2 i
n.
i 1
i 1
n
n
D 2 D(
X
2 i
)
DX
2 i
2n.
i 1
i 1
(4) 应用中心极限定理可得,若 X ~ 2 (n )
则当n充分大时,
X n 2n (标准化)
其中
X (1)
min{X
1k n
k
},
X (n)
max{X
1k n
k
}
称
Dn X (n) X (1) 为极差.
样本的经验分布函数
常见统计量的性质
(1) E ( X ) E ( X )
E ( X )
E(1 n
n i1
Xi)
1n E(
n i1
Xi)
E(X ) E(X )
D(X )
(2) D(X )
注:g ( X 1 , X 2 , , X n ) 是随机变量的函数仍为随机变量。 g ( x1 , x2 , , xn ) 便是一个数。
注:统计量是随机变量。
例1
为来自总体的样本
未知, 已知,判断下列函数哪些是统计量。
2. 几个常见的统计量
X 1 , , X n是来自总体X的一个样本,
样本均值
所服从的分布为自由度为 n的 t 分布.
记为 t ~ t(n). t分 布 又 称 为 学 生 氏 分 布 .t(n)分 布 的
概率密度函数为:
f (x)
[(n 1)
2] (1
x
2
)
n 1 2
(n 2) n
n
x
2. 性质 (1)具有自由度为 n 的 t 分布的随机变量 T 的
数学期望和方差为:
第二章 数理统计的基本概念
数理统计
数理统计可以分为两大类: 一类是如何科学地安排试验,以获取有效的随机数据。
-------描述统计学如:试验设计、抽样方法。 另一类是研究如何分析所获得的随机数据, 对所研究 的问题进行科学的、合理的估计和推断,尽可能地为 采取一定的决策提供依据,作出精确而可靠的结论.
N ( , 2 ), 则
2
1
2
n
(Xi
i1
)2
~
2(n)
(2) 设 X 1 ~ 2 ( n1 ), X 2 ~ 2 ( n 2 ), 且 X1,X2 相
互独立,则
X 1 X 2 ~ 2 (n1 n2 )
这个性质叫 2分布的可加性.
(3) E 2 n, D 2 2n
证 : E X i 0 , D X i 1, X i ~ N ( 0,1)
独立的随机变量 X 1 , X 2 , , X n 表示.
若总体X的分布函数为F x , 则其简单随机样本的
联合分布函数为
n
F
*
(
n
x1
,
x2
,
,
x
)
n
=
F
x1
F
x2
F
xn
F xk
k 1
若总体X的分布密度函数为f x, 则其简单随机样本的
n
联合密度函数为 f * (x1,, xn ) f (xi )
X 1 , X 2 , , X n 是相互独立的随机变量.
其中每一个分量Xk与所考察的总体有相同的分布. k 1,2, , n.
简单随机样本是应用中最常见的情形,今后当说到 “X1,X2,…,Xn是取自某总体的样本”时, 若不特别说明,就指简单随机样本.
简单随机样本可以用与总体独立同分布的n个相互
所服从的分布为自由度为n的 2分布.
记为 2 ~ 2 ( n )
2分布的密度函数为
f ( x;n)
(1) 标准正态分布 X ~ N 0, 1
X的上α (0< α<1)分位点 z
P X z P X z 1 z 1
(2) 2 分 布
设
X
1,
X
2 ,
,
X
相互独立,都服从正态
n
分布N (0,1), 则称随机变量:
2 X 12 X 22 X n2
设 ( x1, x2 , , xn ) 为样本 ( X 1 , X 2 , , X n ) 的一个
实现,且 x1 x2 xn.
当 ( X 1 , X 2 , , X n ) 取值为 ( x1, x2 , , xn ) 时,
定义随机变量 X(k) xk, k 1,2,, n.则称统计量
( X (1) , X (2) , , X (n) ) 为顺序统计量.
样本中所包含的个体数目称为样本容量.
从国产轿车中抽5辆进行耗油量试验。 样本容量为5。
由于抽样的目的是为了对总体进行统计推断,
为了使抽取的样本能很好地反映总体,必须考虑抽样 方法.
统计中,采用的抽样方法是随机抽样法, 即子样中每个个体是从总体中随意地取出来的。
(1) 重复(返回)抽样 X 1 , X 2 , , X n
n
n 1
D
X
D
X
n
DX
例2 设
体 的 阶矩 (1) (2) 证
是来自总体
的一样本,总 存在,证明
独立且与 独立且与
同分布 同分布
由辛钦大数定律,知
体 的 阶矩
是来自总体 的一样本,总
对k元连续函数
三. 抽样分布
统计量既然是依赖于样本的,而后者又是随机 变量,故统计量也是随机变量,因而就有一定 的分布,这个分布叫做统计量的“抽样分布” . 常用的有
给出了在n次独立重复试验中,事件 出现的频率,具有分布函数的一切性质。如: 非降,右连续;
由频数分布知
---n次独立重复试验中,事件 发生的频率。
由伯努利大数定律,
格列汶科进一步证明了:当n→∞时,Fˆn(x)以
概率1关于x一致收敛于F(x),即
P{lim n
sup
x
|
Fˆn
(
x
)
F
(
x
)
统计是从手中已有的资料--样本值,
去推断总体的情况--总体分布F(x)的性质.
样本是联系二者的桥梁
4. 样本的分布
1)样本的频数分布
将n个样本值
按从小到大排列,把相同
的数合并,并指出其频数(样本中各数出现的次数)
x
频数
频率
1)样本的经验分布函数
样本值 样本值小于或等于x的个数, ---样本的经验分布函数
-------推断统计学,如:参数估计、假设检验等。
例如 某厂生产一型号的合金材料,用随机的方法选取
100个样品进行强度测试,于是面临下列几个问题:
1、估计这批合金材料的强度均值是多少? (参数的点估计问题) 2、强度均值在什么范围内? (参数的区间估计问题) 3、若规定强度均值不小于某个定值为合格,那么这 批材料是否合格? (参数的假设检验问题) 4、这批合金的强度是否服从正态分布? (分布检验问题) 5、若这批材料是由两种不同工艺生产的,那么不同 的工艺对合金强度有否影响?若有影响,那一种工艺 生产的强度较好? (方差分析问题)
6、若这批合金 由几种原料用不同的比例合成,那么 如何表达这批合金的强度与原料比例之间的关系?
(回归分析问题) 7.若这批材料是由k个厂家、k种不同工艺和k种固定 的原料比例生产的,各个厂家、各种工艺和各种原料 比例生产的合金强度有什么不同,怎么找出最好的厂 家、工艺和原料比例组合最好?(试验设计问题)
对无限总体而言做无返回抽取,并不改变总体的成分 X 1, X 2 , , X n 独立且同分布于总体
最常用的一种抽样方法叫作 “简单随机抽样”。 它要求抽取的样本满足下面两点: (1) 代表性(随机性):从总体中抽取样本的每一个 分量Xk 是随机的, 每一个个体被抽到的可能性相同。 (2) 独立同分布性
|
0}
1
这就是著名的格列汶科定理.
定理告诉我们,当样本容量n足够大时,对所有
的生x的, 概F(ˆ率xn )与为F1(.x)之差的绝对值都很小,这件事发
这就是我们可以由样本推断总体的基本理论依据.
二 统计量
1. 统计量 定义1 设 X 1 , X 2 , , X n 是来自总体X的一个样本,
g ( X 1 , X 2 , , X n ) 为一实值连续函数,其不包含任何 未知参数,则称 g ( X 1 , X 2 , , X n ) 为一个统计量。 g ( x1 , x2 , , xn ) 为 g ( X 1 , X 2 , , X n ) 的观测值。
很大.
3 、 t 分布的分位点 对于给定的正数
e ,
(
x )2 2 2
2
x
样本的联合概率密度为
n
f * ( x1 , , xn ) f ( xi )
i1
1
2
n
e
1 2
2
n
xi 2
i1
3. 总体、样本、样本值的关系 事实上我们抽样后得到的资料都是具体的、确定的值. 如我们从某班学生中抽取10人测量身高,得到10个数, 它们是样本取到的值而不是样本. 我们只能观察到随机变量取的值,而见不到随机变量. 总体分布决定了样本取值的概率规律,也就是样本 取到样本值的规律,因而可以由样本值去推断总体.
E
X
2 i
1,
DX
2 i
E
X
4 i
(
E
X
2 i
)
2
3
1
2,
i 1,2, n
n
n
所以 E 2 E (
X
2 i
)
EX
2 i
n.
i 1
i 1
n
n
D 2 D(
X
2 i
)
DX
2 i
2n.
i 1
i 1
(4) 应用中心极限定理可得,若 X ~ 2 (n )
则当n充分大时,
X n 2n (标准化)
其中
X (1)
min{X
1k n
k
},
X (n)
max{X
1k n
k
}
称
Dn X (n) X (1) 为极差.
样本的经验分布函数
常见统计量的性质
(1) E ( X ) E ( X )
E ( X )
E(1 n
n i1
Xi)
1n E(
n i1
Xi)
E(X ) E(X )
D(X )
(2) D(X )
注:g ( X 1 , X 2 , , X n ) 是随机变量的函数仍为随机变量。 g ( x1 , x2 , , xn ) 便是一个数。
注:统计量是随机变量。
例1
为来自总体的样本
未知, 已知,判断下列函数哪些是统计量。
2. 几个常见的统计量
X 1 , , X n是来自总体X的一个样本,
样本均值
所服从的分布为自由度为 n的 t 分布.
记为 t ~ t(n). t分 布 又 称 为 学 生 氏 分 布 .t(n)分 布 的
概率密度函数为:
f (x)
[(n 1)
2] (1
x
2
)
n 1 2
(n 2) n
n
x
2. 性质 (1)具有自由度为 n 的 t 分布的随机变量 T 的
数学期望和方差为:
第二章 数理统计的基本概念
数理统计
数理统计可以分为两大类: 一类是如何科学地安排试验,以获取有效的随机数据。
-------描述统计学如:试验设计、抽样方法。 另一类是研究如何分析所获得的随机数据, 对所研究 的问题进行科学的、合理的估计和推断,尽可能地为 采取一定的决策提供依据,作出精确而可靠的结论.
N ( , 2 ), 则
2
1
2
n
(Xi
i1
)2
~
2(n)
(2) 设 X 1 ~ 2 ( n1 ), X 2 ~ 2 ( n 2 ), 且 X1,X2 相
互独立,则
X 1 X 2 ~ 2 (n1 n2 )
这个性质叫 2分布的可加性.
(3) E 2 n, D 2 2n
证 : E X i 0 , D X i 1, X i ~ N ( 0,1)
独立的随机变量 X 1 , X 2 , , X n 表示.
若总体X的分布函数为F x , 则其简单随机样本的
联合分布函数为
n
F
*
(
n
x1
,
x2
,
,
x
)
n
=
F
x1
F
x2
F
xn
F xk
k 1
若总体X的分布密度函数为f x, 则其简单随机样本的
n
联合密度函数为 f * (x1,, xn ) f (xi )
X 1 , X 2 , , X n 是相互独立的随机变量.
其中每一个分量Xk与所考察的总体有相同的分布. k 1,2, , n.
简单随机样本是应用中最常见的情形,今后当说到 “X1,X2,…,Xn是取自某总体的样本”时, 若不特别说明,就指简单随机样本.
简单随机样本可以用与总体独立同分布的n个相互
所服从的分布为自由度为n的 2分布.
记为 2 ~ 2 ( n )
2分布的密度函数为
f ( x;n)