概率论与数理统计第六章(最新版)

合集下载

概率论与数理统计(06)第6章 统计量及其抽样分布

概率论与数理统计(06)第6章  统计量及其抽样分布
一个任意分 布的总体
σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋 于正态分布 的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章 样本与统计量
6.1引言 6.1引言
数理统计学: 运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,研究如何合理地获得数据资料, 建立有效的数学方法,根据所获得的数据资料,对 所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ,则
2
χ2分布
2. 3.
z=
X −µ
Y=z

概率论与数理统计第6章(公共数学版)

概率论与数理统计第6章(公共数学版)

Xi
1 n (X1
X2
Xn)
S 2
1 n
n i 1
(Xi
X )2
显然
S 2
1 n
n
[
X
2 i
i 1
2Xi
X
(X )2]
1n [
n i1
X
2 i
2X
n i 1
Xi
n( X )2 ]
1 n
n i 1
X
2 i
2X
X
(X )2
S 2
1 n
n i 1
X
2 i
(X )2
16
样本均方差
样本标准差
4
Yi 2
i 1
4
Yi
2
i1 4
4
Yi
2
4
i1 2
32
T 4( X 2) 4 Yi 2 i 1
X 2
4
Yi
2
i1 4
X 2
~ t(4),
4
Yi
2
4
i1 2
即 T 服从自由度为 4 的 t 分布: T ~ t(4). 由 P{| T | t0 } 0.01.
t0 t0.995 (4) 4.6041.
设( X1, X2,, Xn )为来自总体X的一个样本
则( X1, X2,, Xn )为一个随机向量 X为一个随机变量 X1, X2,, Xn相互独立,且具有和总体X同样的分布
样本的同分布性和相互独立性
11
三、统计量 对所研究的对象收集了有关样本的数据
后,还要对数据进行加工和提炼,将样本的有关 信息,利用数学的工具进行加工.
S
S2

概率论与数理统计第六章

概率论与数理统计第六章

概率论与数理统计第六章一、估计及其性质“估计”在中文里既可以作名词,也可以作动词。

用英文的话,可以表示成不同的单词:estimate:所谓的“估计”(动词)就是根据样本预测总体分布中的未知参数。

例如,已知总体服从正态分布[公式] ,但总体均值[公式] 未知,我们通过某个函数“估计”总体均值,[公式] 。

estimator:“估计量”(名词)[公式] 实际上是一个统计量,它是通过一个不含未知参数的样本函数计算出来的结果。

一般使用[公式] 表示总体的参数,[公式] 表示参数的估计量。

estimation:“估计法”(名词)表示寻找函数[公式] 的过程,可以理解为一种估计方法。

例如:Maximum Likelihood Estimation,最大似然估计法。

随着样本不同,同一估计法得到的结果可能是不一样的,因此“估计量”也是一个随机变量。

对于同一个参数,有不同的估计方法,而且看起来都是合理的。

如何比较它们的优劣呢?(1)均方误差MSE Mean Square Error评价一个估计量的好坏,很自然地会想到:衡量“估计量”与“真实值”之间的距离,距离越小表示估计量的性能越好。

也就是所谓的“均方误差”函数:[公式] 也就是距离平方的期望值,如果将其进一步展开:[公式]注意:[公式] 和[公式] 均为数值,[公式] 表示参数的真实值,[公式] 表示估计量的数学期望。

由此看见,均方误差由两部分组成:一是估计量的方差(Variances),即[公式] ;二是估计量的系统偏差(Bias)的平方,即[公式] 。

从“马同学”处借来此图,它可以帮助理解“方差”与“偏差”:备注:靶心表示“真实值”,红叉表示“估计值”“方差”衡量估计值的分散程度,“偏差”衡量估计值的期望与真实值的距离。

左上图:估计值落在靶心四周,此时“方差”较大但“偏差”较小;右上图:估计值落在靶心邻近,此时“方差”、“偏差”均较小;左下图:估计值离靶心较远,呈分散状,此时“方差”、“偏差”均较大;右下图:估计值离靶心较远,落点集中,此时“偏差”较大但“方差”较小。

【精品】概率论与数理统计PPT课件第六章 描述性统计

【精品】概率论与数理统计PPT课件第六章 描述性统计
但它们是并列的两个学科,并无 从属关系 .
5
• 数理统计
收集数据、整理数据、分析数据并对数 据分析结果做出解释
• 应用领域
➢精算 ➢金融 ➢生物 ➢工程技术 ➢质量控制 ➢可靠性…
6
第六章 描述性统计
统计学的做法分为两种: 描述性统计 推断性统计
7
§6.1 总体和参数
A. 总体、个体和均值 所要调查的对象全体叫做总体(population), 总体中每个成员叫做个体。 总体一般用随机变量作为数学模型。 总体参数是描述总体特性的指标,简称参数。
和样本方差
1 n
x n i1 xi
s2 1 n n 1 i1
2
xi x
s= s2 称为样本标准差。
12
§6.2 抽样调查方法
A. 抽样调查的可行性和必要性 抽样的可行性:汤的例子 样本的随机性(代表性) 适当的样本量。 样本量不必随总体增大而增大。
13
为了从样本推断总体的情况,样本的代表性是最关键 的问题。 调查全部总体不现实或不必要,如: 寿命试验。 抽样调查因为工作量较小所以有时比普查可以更准确
2
到了十九世纪末二十世纪初,随 着近代数学和概率论的发展,才真正 诞生了数理统计学这门学科
3
数理统计研究的任务 对随机现象进行试验或观测,以
有效的方式收集、 整理和分析带有 随机性的数据,以便对所考察的问 题作出推断和预测,直至为采取一 定的决策和行动提供依据和建议.
4
概率论是数理统计的基础,而 数理统计是概率论的重要应用.
从总体 X 中等可能地随机抽取,不论是有放回还是 无放回,得到的 X1, X2, …, Xn看成随机变量,都可以
证明 EX 。

概率论与数理统计课程电子版教材

概率论与数理统计课程电子版教材

第六章 数理统计的基本概念第一节 基本概念1、概念网络图正态总体下的四大分布统计量样本函数样本个体总体数理统计的基本概念→⎪⎪⎪⎭⎪⎪⎪⎬⎫⎪⎪⎪⎩⎪⎪⎪⎨⎧ 2、重要公式和结论例6.1:从正态总体)6,4.3(2N 中抽取容量为n 的样本,如果要求其样本均值位于区间(1.4, 5.4)内的概率不小于0.95,问样本容量n 至少应取多大?第二节 重点考核点统计量的分布第三节 常见题型1、统计量的性质例6.2:设),,,(721X X X 取自总体)5.0,0(~2N X ,则=⎪⎭⎫⎝⎛>∑=7124i i X P。

例6.3:设总体X 服从正态分布),(21σμN ,总体Y 服从正态分布),(22σμN ,1,,21n X X X 和 2,,21n Y Y Y 分别是来自总体X 和Y 的简单随机样本, 则=⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡-+-+-∑∑==2)()(21212121n n Y Y X X E n j j n i i .2、统计量的分布例6.4:设),,,(21n X X X 是来自正态总体),(2σμN 的简单随机样本,X 是样本均值,记,)(111221∑=--=ni i X X n S,)(11222∑=-=ni i X X n S,)(111223∑=--=ni i X n S μ,)(11224∑=-=ni i X n S μ则服从自由度为n-1的t 分布的随机变量是 (A ).1/1--=n S X t μ(B ).1/2--=n S X t μ(C )./3nS X t μ-=(D )./4nS X t μ-=[ ]例6.5:设总体X ~N (0,12),从总体中取一个容量为6的样本),,,(621X X X ,设26542321)()(X X X X X X Y +++++=,试确定常数C ,使随机变量CY 服从2χ分布。

第四节 历年真题数学一:1(98,4分) 从正态总体)6,4.3(2N 中抽取容量为n 的样本,如果要求其样本均值位于区间(1.4, 5.4)内的概率不小于0.95,问样本容量n 至少应取多大? [附表]:dt eZ t Z2221)(-∞-⎰=Φπ990.0975.0950.0900.0)(33.296.1645.128.1Z Z Φ2(01,7分) 设总体)0)(,(~2>σσμN X ,从该总体中抽取简单随机样本)2(,,,221≥n X X X n ,其样本的均值∑==ni i X n X 21,21求统计量∑=+-+=ni i n i X X X Y 12)2(的数学期望E (Y )。

概率论与数理统计-第六章

概率论与数理统计-第六章
大街上随机抽取200人,进行调查。记录了
这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi

i 1, 2,
,n
,n
于是 (

) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2

《概率论与数理统计》第六章

《概率论与数理统计》第六章
所以,X是一个随机变量!
既然总体是随机变量X,自然就有其概率分布。
我们把X的分布称为总体分布。
总体的特性是由总体分布来刻画的。因此,常 把总体和总体分布视为同义语。
第六章 样本及抽样分布 ‹#›
例2
在例1中,假定物体真实长度为(未知)。一般 说来,测量值X就是总体,取 附近值的概率要大一 些,而离 越远的值被取到的概率就越小。
k=1,2,…
第六章 样本及抽样分布 ‹#›
它反映了总体k 阶矩的信息
样本k阶中心矩
Bk
1 n
n i 1
(Xi
X )k
它反映了总体k 阶 中心矩的信息
第六章 样本及抽样分布 ‹#›
统计量的观察值
1 n
x n i1 xi;
s2
1 n 1
n i1
(xi
x )2
s
1 n 1
n i1
(xi
x
)2
第六章 样本及抽样分布 ‹#›
实际上,我们真正关心的并不一定是总体或个
体本身,而真正关心的是总体或个体的某项数量指 标。
如:某电子产品的使用寿命,某天的最高气温, 加工出来的某零件的长度等数量指标。因此,有时也
将总体理解为那些研究对象的某项数量指标的全
体。
第六章 样本及抽样分布 ‹#›
为评价某种产品质量的好坏,通常的做法是: 从全部产品中随机(任意)地抽取一些样品进行观测(检
样本X1,X2,…,Xn 既被看成数值,又被看成随机变量, 这就是所谓的样本的二重性。
随机样本
例 4 (例2续) 在前面测量物体长度的例子中,如果我们 在完全相同的条件下,独立地测量了n 次,把这 n 次测 量结果,即样本记为
X1,X2,…,Xn .

[学习]概率论与数理统计课件第6章

[学习]概率论与数理统计课件第6章
为样本,构造一个统计量 (X1, X2, , Xn ) 来估计 参数,则称 (X1, X2, , Xn ) 为参数的估计量。
将样本观测值 x1, x2 , , xn 代入 (X1, X2, , Xn ) , 得到的值 (x1, x2, , xn ) 称为参数的估计值。
点估计(point estimation) :如果构造一个统计量
设总体的分布中含有一个参数,对给定的,如果 由样本(X1,X2,…,Xn)确定两个统计量
1( X1,X2,…,Xn ), 2( X1,X2,…,Xn ), 使得P{1 << 2}=1- ,则称随机区间( 1 , 2 )为 参数的置信度(或置信水平)为1- 的置信区间。
1——置信下限 2——置信上限
几点说明
或 Uk (1,2,
,m )
1 n
n i 1
(Xi
X )k
(k 1, 2,
, m)
得m个方程构成方程组,解得的 1,2, ,m 即为参数 1,2 , ,m的矩估计量,代入样本观测值,即得参数
的矩估计值。
例2 设某总体X的数学期望为EX=,方差DX=2,X1, X2,…,Xn为样本,试求和2的矩估计量。
X
1 n
n i 1
Xi
2
1 n
n i 1
(Xi
X )2
S
2 n
估计值为
x
1 n
n i 1
xi
2
1 n
n i 1
( xi
x )2
例3 设X1,X2,…,Xn为总体X的样本,试求下列总体 分布参数的矩估计量。
(1) X ~ N , 2 (2)X ~ B N, p(N已知)(3)X ~ P()
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
数理统计学是一门应用性很强的学科. 它是研究 怎样以有效的方式收集、 整理和分析带有随机性的 数据,以便对所考察的问题作出推断和预测,甚至 为采取一定的决策和行动提供依据和建议。 由于大量随机现象必然呈现它规 律性,只要对随机现象进行足够多次 观察,被研究的规律性一定能清楚地 呈现出来. 客观上, 只允许我们对随机现象 进行次数不多的观察试验 ,我们只
研究对象的所构成的一个集合全体称为总体, 是一维随机变量(或多维随机变量), 记为X. 总体中每个成员称为个体, 总体中所包含的个体的个数称为总体的容量.
总体

研究某批灯泡的质量
有限总体 总体 无限总体
5
在数理统计研究中,人们往往研究有关对象的 某一项(或几项)数量指标和为此,对这一指标进行 随机试验,观察试验结果全部观察值,从而考察该 数量指标的分布情况.这时,每个具有的数量指标的 全体就是总体.每个数量指标就是个体.
1 n 2 2 X i - nX n - 1 i 1
它反映了 总体均值 的信息
它反映了总体 方差的信息
样本标准差
1 n 2 S ( Xi - X ) n - 1 i 1
21
样本k阶原点矩
1 k Ak X i k=1,2,… n i 1
样本k阶中心矩
n
12
最常用的一种抽样叫作“简单随机抽样”,其特点: 1. 代表性: X1,X2,…,Xn中每一个与所考察的总体有 相同的分布. 2. 独立性: X1,X2,…,Xn是相互独立的随机变量. 3.同分布: 样本与总体服从同一分布.
13
定义:
设X是具有分布函数F的随机变量,若X1 , X 2 , , Xn 是具有同一分布函数F的、相互独立的随机 变量,则称X1 , X 2 ,, Xn为从分布函数F(或总体 F、或总体X)得到的容量n为的简单随机样本, 简称样本,它们的观察值x1 , x 2 ,, xn 称为样本值, 又称为X的n个独立的观察值.
8
例如:研究某批灯泡的寿命时,关心的数 量指标就是寿命,那么,此总体就可以用随 机变量X表示,或用其分布函数F(x)表示.
总体
寿命X可用一概 率分布来刻划
F(x)
某批 灯泡的寿命
鉴于此,常用随机变量的记号 或用其分布函数表示总体. 如 说总体X或总体F(x) .
9
类似地,在研究某地区中学生的营养状 况时,若关心的数量指标是身高和体重,我 们用X和Y分别表示身高和体重,那么此总体 就可用二维随机变量(X,Y)或其联合分布函数 F(x,y)来表示.
某批 灯泡的寿命
国产轿车每公里 的耗油量
该批灯泡寿命的ห้องสมุดไป่ตู้ 体就是总体
国产轿车每公里耗油量 的全体就是总体
6
由于每个个体的出现是随机的,所以相 应的数量指标的出现也带有随机性. 从而可 以把这种数量指标看作一个随机变量,因此 随机变量的分布就是该数量指标在总体中的 分布. 这样,总体就可以用一个随机变量 及其分布来描述.
能获得局部观察资料.
3
数理统计是以概率论为理论基础, 根据抽 样信息, 对研究对象(总体)作出合理的估计 和判断的学科.
数理统计的步骤: (1) 收集、整理数据资料; (2) 对所得数据资料进行分析、研究; (3) 对所研究对象的性质、特点作出估计 或判断.
4
一、总体和样本 1.总体
一个统计问题总有它明确的研究对象.
n4
n 10
n 20
30
分布的性质
2
1. 设 X 1 , X 2 ,, X n相互独立, 都服从正态分布
min( X 1 , X 2 , , X n ) ; X1 + + X n - ; n
X1+ Xn ; 2 + X n )2 ( X1

2
;
( X 1 + + X n ) - n . . n
20
几个常见统计量 样本平均值 样本方差
1 n X Xi n i 1 1 n 2 2 S ( Xi - X ) n - 1 i 1
请注意 : 设X1 , X 2 , X n 是来自总体X的一个样本 , x1 , x2 ,
xn 是一个样本的观察值, 则g ( x1 , x2 , xn )也是统 计量g ( X1 , X 2 , X n )的观察值.
注:统计量是随机变量。它不含任何 未知参数.
19
例 1 设 X1 , X n为来自总体 X ~ N ( , 2 ) 的一个样本, 问下列随机变量中那些是统计量 其中 未知, 2 已知,
1 (2) 已知 (1)就是 , 2 分布由定义X i2 ~ 2 (1), . 2 n 1 n 2 2 2 即X i ~ , 2 .再由可加性知 X i ~ , 2 . 2 2 i 1
2
29
n1
2 - 分布的密度函数 ( y) 曲线图 f
F3 ( x)的观察值为
0, 2 F3 ( x) , 3 1,
若x 1 若1 x 2 若x 2
25
一般,设x1 , x2 , , xn是总体的一个容量为n的样本 值.将它们按大小次序排列如下:x(1) x(2) x( n ) 则经验分布函数Fn ( x)的观察值为
统计中,总体这个概念 的要旨是:总体就是一个 概率分布.
10
2. 样本
总体分布一般是未知,或只知道是包含未知 参数的分布,为推断总体分布及各种特征,按一 定规则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息 ,这一抽取过程称为 “抽 样”,所抽取的部分个体称为样本. 样本中所包 含的个体数目称为样本容量. 从国产轿车中抽5辆 进行耗油量试验 样本容量为5 抽到哪5辆是随机的
有X 1 , X 2 ,, X n 独立且与X k同分布, E ( X ik ) k
k k k
k 1,2,, n 再由辛钦大数定律可得上述结论 .
再由依概率收敛性质知,可将上述性质推广为 g ( A1 , A2 ,, Ak ) g (1 , 2 ,, k )
p
3. s
1 n ( xi - x )2 n - 1 i 1
样本标准差 样本k阶矩 样本k阶中心矩
23
1 n k 4. ak xi , k 1,2 n i 1
1 n 5. bk ( xi - x )k , k 1,2 n i 1
请注意 :
若总体X的k阶矩E ( X k ) k 存在,则当n 时, 1 n k p Ak X i k k 1,2,. n i 1 事实上 由X 1 , X 2 ,, X n 独立且与X 同分布,
0, k Fn ( x) , n 1,
若x x(1) 若x( k ) x x( k +1) , 若x x( n ) (k 1,2,, n - 1)
26

统计三大抽样分布
2
1、
分布

2
分布是由正态分布派生出来的一种分布.
定义: 设 X 1 , X 2 ,, X n 相互独立, 都服从正态分布 N(0,1), 则称随机变量:
11
对总体X在相同的条件下,进行n次重复、独立 观察,其结果依次记为X 1,X 2, ,X n .
这样得到的随机变量X 1 , X 2 , X n 是来自总体X 的一个简单随机样本,与总体随机变量具有相同的 分布. n称为这个样本的容量.
一旦取定一组样本X1,… ,Xn ,得到n个具体的数 (x1,x2,…,xn),称为样本的一次观察值,简称样本值 .
由简单随机抽样得到的样本称为简单随机样本, 它可以用与总体独立同分布的n个相互独立的随机
变量X1,X2,…,Xn表示.
14
若总体的分布函数为F(x)、概率密度函数为 f(x),则其简单随机样本的联合分布函数为
F * ( x , x2 ,, xn ) =F(x1) F(x2) … F(xn)
其简单随机样本的联合概率密度函数为
它反映了总体k 阶矩的信息
1 k Bk ( X i - X ) n i 1
n
它反映了总体k 阶 中心矩的信息
22
它们的观察值分别为:
1.
1 n x xi n i 1
样本均值
n 1 n 1 2 2. s 2 ( xi - x )2 [ xi - nx 2 ] 样本方差 n - 1 i 1 n - 1 i 1
第一二节 随机样本与抽样分布
教学内容 1 总体和样本 2 统计量与经验分布函数 3 统计三大抽样分布 4 几个重要的抽样分布定理 教学重点 统计量,几个重要的抽样分布定理
1
概率论与数理统计是研究和揭示随机现
象统计规律性的一门学科,是重要的一个数 学分支。概率论是研究随机现象发生可能性 的大小的一门学科,而数理统计则是研究大 量随机现象数量规律的一门学科。它们之间 联系密切但也有根本差别,数理统计的方法 在自然科学、工程技术研究及社会科学领域 中应用极其广泛。
分布的密度函数为
( x ) e t dt, x 0
-t x -1 0

来定义.
1 x -1e- x / f x ( x) ( ) 0
记为
x 0, 其他,
0, 0
28
X ~ ( , )
注: (1)若随机变量X,Y相互独立且服从分布,即 X ~ ( , ), Y ~ ( , ),则X + Y ~ ( + , );
其中g为连续函数 . 这就是矩估计法的理论 根据.
24
2. 经验分布函数 设X 1 , X 2 ,, X n 是总体F的一个样本,用s( x ) x
相关文档
最新文档