数理统计的基本概念

合集下载

数理统计

数理统计
数理统计
四、数理统计的基本概念 五、参数估计
四、数理统计的基本概念
1. 总体和样本 总体:研究对象的某项数量指标的值的全体。 个体:总体中的每个元素为个体。 容量:总体中所包含的个体的个数。 按此分为有限总体和无限总体。 例如:某工厂生产的灯泡的寿命是一个总体,每 一个灯泡的寿命是一个个体;某学校男生的身高 的全体一个总体,每个男生的身高是一个个体。


1 ˆ 解得: n
2
x
i 1 n
n
i
x
1 ˆ n

i 1
( X i X )2
(3)估计量的评选标准
1) ˆ ˆ 无偏性:若 ( X 1 , , X n )的数学期望存在, ˆ ˆ 且E . 则称是的无偏估计量。
2)
ˆ ˆ ˆ ˆ 有效性:若1 1 ( X 1 , , X n ), 2 2 ( X 1 , , X n ) ˆ ˆ 都是的无偏估计量;若D( ) D( ).
ˆ 所以 A1 X ,
ˆ A2
2 2 A1
1 n

i 1
n
X i2
1 X n
2

i 1
n
( X i X )2
(2) 极大似然估计法
(1).若总体X属离散型,其分布律 { X x} p( x; ), P 的形式为已知, 为待估参数,是可能取值的范围。
解:X的概率密度为: 1 1 2 f ( x; , ) exp{ (x )2} 2 2 2
似然函数为:
L( , )
2
2 2 2 i 1 n n 1 ln L ln(2 ) ln( ) 2 2 2 2

数理统计基本概念

数理统计基本概念
n1 Γ( ) 2 n 1 x 2 fT ( x ) (1 ) 2 , n n n Γ ( ) 2
P{6.262 χ 2 24.996}
2 2
P{χ 6.262} P{χ 24.996}
0.975 0.05 0.925
注意 应注意分布表的定义与查法!
#
数理统计基本概念
3.自由度为 n的 t 分布 作笔名发表文章.
T~t(n)
又称学生氏分布--第一个研究者以Student
( X 1 , X 2 , , X n ) ~ ( 2 ) e
n 2 2
i 1
( xi )2 2 2
n
数理统计基本概念
四、统计量 定义6.1.2 设X1 , X2 , ·, Xn是总体X的样本, · · T为n元实值函数,若样本的函数 T=T(X1 , X2 , ·, Xn) · · 是随机变量且不含未知参数,称 T为统计量. 对相应的样本值( x1 , x2 , … , xn ) ,称 t =T( x1 , x2 , … , xn )






数理统计基本概念
某厂生产的一批产品中次品率为 p 。从中 抽取10件产品装箱。 概
1)没有次品的概率 2)平均有几件次品

3)为以 0.95的概率保证箱中 有10件正品,箱中至少要装多 少件产品。







数理统计基本概念
所有这些问题的关键是 p 是已知的! 如何获取 p ? 这就是数理统计的任务了!
定的α(0<α<1),数uα满足
P{ X u } ,
(C ) u1 ;

数理统计的基本概念

数理统计的基本概念
(n 2) n n

n 1 2
, x .
t 分布的概率密度图形
图形关于 x 0 对称, lim f ( x; n) 0 , 且 x 当 n 充分大时,f (x; n) 趋近于标准正态 分布的概率密度。
定理 4: X 1, 2, , n 是抽自正态总体 设 X X
若总体 X 是离散型的,其分布律为:
则样本的联合分布为
§6.2 抽样分布
6.2.1 统计量的概念 由样本推断总体的某些情况时,需要对样本进行“ 加工”,构造出若干个样本的已知 (确定)的函数, 其作用是把样本中所含的某一方面的信息集中起来 。 这种不含任何未知参数的样本的函数称为统计量。 它是完全由样本所决定的量。 定义2:设 X 1 , X 2 , , X n 是来自总体X的样本, g( X 1 , X 2 , , X n ) 是样本 X 1 , X 2 , , X n 的函数,如果 g( X 1 , X 2 , , X n ) 中不包含任何未知参数,则称它 是一个统计量。
1 (0.82)
1 0.7939 0.2061
X ~ N (0, 22 ), X1 , X 2 , X3 , X 4 为其样本,求a,b 例2:总体
(2). (n 1)S / ~ (n 1)
2
X (1). X ~ N ( , / n), 或 ~ N (0,) ; 1 / n 2 2 2
2
X (3). X 与 S 相互独立; (4). ~ t(n 1). S/ n
定理5:设X1, X2, …, Xm 与Y1, Y2, …, Yn分别来自总体 2 两样本独立, X ~ N ( 1 , 12 )和Y ~ N ( 2 , 2 )的样本, 2 S12 / S2 则有 F 2 ~ F ( m 1, n 1). 2 1 / 2 定理6*:设X1, X2, …, Xm 与Y1, Y2, …, Yn分别来自

数理统计的基本概念

数理统计的基本概念
首页 上页 返回 下页 结束
第6章
§6.1-6.2
第10页
设(X1,X2,…,Xn)为来自总体X的简单随机样本 1 n 1.样本均值: X X i 常用于估计总体分布的均值,或 检验有关总体分布均值的假设。 n i 1
n 1 2 S2 ( X X ) 2.样本方差: i n 1 i 1
首页 上页 返回 下页 结束
第6章
§6.1-6.2 §6.1 样本及抽样分布
第3页
数理统计的核心问题是由样本推断总体,即统计推断
6.1.1 总体、个体与样本
1. 总体:研究对象的全体称为总体(母体),用X表示, 它是一个随机变量. 总体分为有限总体和无限总体. 个体:组成总体的每个研究对象称为个体.
i 1 i 1
i
ki !
e
首页
上页
返回
下页
结束

第6章
§6.1-6.2
第8页
3 加工某零件时,每一件需要的时间服从均值为1 / 的 指数分布,今以加工时间为零件的数量指标,任取n件 零件构成一个容量为n的样本,求样本分布.
解:零件的加工时间为总体X,则X ~ E ( ), 其概率 e x x0 密度为 f ( x) x0 0 于是样本( X 1 , X 2 , X n )的密度为 f ( x1 , x2 , xn )
样本容量为5
首页 上页 返回 下页 结束
第6章
§6.1-6.2
第5页
样本是随机变量. 抽到哪5辆是随机的
容量为n的样本可以看作n维随机变量(X1, X2, …, Xn). 一旦取定一组样本,得到的是n个具体的数 (x1,x2,…,xn),称为样本的一次观察值,简称样本值 .

数理统计的基本概念

数理统计的基本概念

样本k阶原点矩 样本 阶原点矩 样本k阶中心矩 样本 阶中心矩
河南理工大学精品课程
1 Ak = n 1 Bk = n
∑ ∑
n
n
i =1
X ik ( k = 1, 2 , L )
i =1
( X i − X ) k ( k = 1, 2 , L )
概率论与数理统计
说明 (修正 样本方差还可表示为 修正)样本方差还可表示为 修正
n 1 S2 = [ ∑ X i2 − n X 2 ] n − 1 i =1
1 n 推导】 【推导】 S 2 = ( X i − X )2 ∑ n − 1 i =1 = = = =
河南理工大学精品课程
1 n ( X i2 − 2 X i X + X 2 ) ∑ n − 1 i =1 n n n 1 [ ∑ X i2 − 2 X ∑ X i + ∑ X 2 ] n − 1 i =1 i =1 i =1 n 1 [ ∑ X i2 − 2 n X 2 + n X 2 ] n − 1 i =1 n 1 [ ∑ X i2 −n X 2 ] n − 1 i =1
河南理工大学精品课程 概率论与数理统计
做法
从总体中随机地抽取若干个体(灯泡、 从总体中随机地抽取若干个体(灯泡、工大男
生),测试其所需数据(寿命、身高),最后对所得数据通过 ),测试其所需数据 寿命、身高), 测试其所需数据( ),最后对所得数据通过 整理加工和分析来推断总体(这批灯泡寿命、 整理加工和分析来推断总体(这批灯泡寿命、工大男生身 高)的分布情况,从而了解整体情况. 的分布情况,从而了解整体情况. 一般,我们所研究的总体的某项数量指标X 一般,我们所研究的总体的某项数量指标X是一个随 机变量,其取值在客观上有一定的分布.因此, 机变量,其取值在客观上有一定的分布.因此,对总体的研 究,就是对相应的随机变量X的研究。 就是对相应的随机变量X的研究。 今后,我们称X 今后,我们称X的分布函数和数字特征分别为总体的 分布函数和数字特征, 分布函数和数字特征,并不再区分总体与相应的随机变量 X.对总体的称呼 总体,总体X 总体F X.对总体的称呼:总体,总体X与总体F. 对总体的称呼:

第六章 数理统计的基本概念

第六章 数理统计的基本概念

1 n 2 S S ( X X ) i n 1 i 1
2
(4) 样本k阶(原点)矩
1 n k Ak X i n i 1
k 1, 2,
k 2,3,
(5) 样本k阶中心矩
1 n Bk ( X i X )k n i 1
§2
常用统计量的分布
统计量的分布称为抽样分布.下面介绍三种由 正态总体演化而来的统计量的分布:
• 从二战后到现在,是统计学发展的第三个时期,这是一个在 前一段发展的基础上,随着生产和科技的普遍进步,而使这 个学科得到飞速发展的一个时期,同时,也出现了不少有待 解决的大问题.
学科奠基者



数理统计作为一个进一步完善的数学学科的奠基者是英国人费歇尔。他1909 年入剑桥大学,攻读数学物理专业,三年后毕业。毕业后,他曾去投资办工 厂,又到加拿大农场管过杂务,也当过中学教员。1919年,他开始对生物统 计学产生了浓厚的兴趣,参加罗萨姆斯泰德试验站的工作,致力于数理统计 在农业科学和遗传学中(费歇尔1890—1962)的应用研究。 年轻的费歇尔主要的研究工作是用数学将样本的分布给以严格的确定。 在一般人看来枯燥乏味的数学,常能带给研究者极大的慰藉,费歇尔热衷于 数理统计的研究工作,后来的理论研究成果有:数据信息的测量、压缩数据 而不减少信息、对一个模型的参数估计等。 最使科学家称赞的工作则是试验设计,它将一切科学试验从某一个侧面 “科学化”了,不知节省了多少人力和物力,提高了若干倍的工效。 费歇尔培养了一个学派,其中有专长纯数学的,有专长应用数学的。在30- 50年代费歇尔是统计学的中心人物。1959年费歇尔退休后在澳大利亚度过了 最后三年。
若 x1 , x2 , , xn 是样本的观察值, 则 g ( x1 , x2 , xn ) 是 g ( X 1 , X 2 , X n )

数理统计基本概念

数理统计基本概念
2 ( n1 1) S12 ( n2 1) S2 n1 n2 2
1 1 n1 n2
~ t ( n1 n2 2)
定理 5 (两总体样本方差比的分布)
且X与Y独立, 设X ~ N ( 1, ), Y ~ N ( 2 , ), X1, X2,…, X n1是取自X的样本, Y1,Y2,…, Yn2 是
样本是联系二者的桥梁 总体分布决定了样本取值的概率规律, 也就是样本取到样本值的规律,因而可以由 样本值去推断总体.
二、统计量和抽样分布 1. 统计量 由样本值去推断总体情况,需要对样本 值进行“加工”,这就要构造一些样本的 函数,它把样本中所含的(某一方面)的 信息集中起来.
这种不含任何未知参数的样本的函数 称为统计量. 它是完全由样本决定的量.
2. 独立性: X1,X2,…,Xn是相互独立的随机 变量.
由简单随机抽样得到的样本称为简单 随机样本,它可以用与总体独立同分布的 n个相互独立的随机变量X1,X2,…,Xn表示.
若总体的分布函数为F(x),则其简单随机 样本的联合分布函数为 F(x1) F(x2) … F(xn) 简单随机样本是应用中最常见的情 形,今后,当说到“X1,X2,…,Xn是取自某 总体的样本”时,若不特别说明,就指简 单随机样本.
数理统计的基本概 念
一、总体和样本
1.总体
一个统计问题总有它明确的研究对象.
研究对象的全体称为总体(母体), 总体中每个成员称为个体.
总体

研究某批灯泡的质量
然而在统计研究中,人们关心总体仅仅 是关心其每个个体的一项(或几项)数量指标 和该数量指标在总体中的分布情况. 这时, 每个个体具有的数量指标的全体就是总体.
统计中,总体这个概念 的要旨是:总体就是一个 概率分布.

数理统计的基本概念

数理统计的基本概念

证明:设F~F(n1,n2),则
P{F F1 (n1 , n2 )} 1
1 1 P{ } 1 F F1 (n1 , n2 ) 1 1 P{ } F F1 (n1 , n2 )
得证!
1 P{ F (n2 , n1 )} F
5.1.4 统计量及抽样分布
2. F分布的分位点 对于:0<<1,
若存在F(n1, n2)>0,
满足
P{FF(n1, n2)}=, 则
称F(n1, n2)为 F(n1, n2)的 上侧分位点;
F (n1 , n2 )
注:
1 F1 (n1 , n2 ) F (n2 , n1 )
1 ~ F ( n2 , n1 ) F
列出其频数频率分布表。
组序 分组区间 组中值 1 (147,157] 152 2 (157,167] 162 3 (167,177] 172 4 (177,187] 182 5 (187,197] 192 合计
频数 4 8 5 2 1 20
频率 累计频率(%) 0.20 20 0.40 60 0.25 85 0.10 95 0.05 100 1
1、设X 1 , X 2 ,
, X n (n 2)为来自总体N (0,1)的简单随机样本, (n 1) X 12
2 X i i 2 n
X 为样本均值,S 2为样本方差,则统计量

从 __________ 分布。 (05—06二)
2、设 X 1 , X 2 , X 3是来自正态分布 N (0, 2 )总 体的简单随机样本,则 统计量 2 服从 ________ 分布。(05—06三) X1 X X
3.总体、样本、样本观察值的关系 总体
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
?是否均值相同?
第五章 回归分析
例1某工厂在分析产量与成本的关系时,选取8个 生产小组作样本,得到产量 x(万件)与成本y (万元)数据如下表:
产量 x 1.5 2.0 3.0 4.5 7.5 9.1 10.5 12.0 成本 y 5.6 6.6 7.2 7.8 10.1 10.8 13.5 16.5
(2)对上述回归模型进行检验(要写出相关的统计 量)。
表 15.6 某养猪场数据资料
序号
1 2 3 4 5 6 7 8 9 10 11 12 13
瘦肉量 眼肌面积
y(kg)
x1(cm2)
15.02 12.62 14.86 13.98 15.91 12.47 15.80 14.32 13.76 15.18 14.20 17.07 15.40
求 的矩估计值。
例2 设X1,X2,…,Xn是取自总体X的一个样本, X 的概率密度函数为
f
(x,
)
(
1)
x
,
0,
0 x 1 其它
其中 0
现有样本值0.5,0. 4,0.5,0. 7,0.6,0.9
(1)求 的极大似然估计量; (2)求 的极大似然估计值。
例3 设 X1, X 2,, X n 是泊松总体X ~ P()的样 本 , 判断下面估计量是否 的无偏估计量?
因素 A
SA
r 1 S A /(r 1)
F值
FA
S A /(r 1) Se / rs(m 1)
因素 B
SB
s 1
SB /(s 1)
FB
S B /(s 1) Se / rs(m 1)
交互 A×B
S AB
(r 1)(s 1)
S AB /(r 1)(s 1)
FAB
S AB /(r 1)(s 1) Se / rs(m 1)
80元无显著差异?(取显著性水平α=0.05 )
例2 某烟厂生产两种香烟,独立地随机抽取样 本容量相同的烟叶标本测其尼古丁含量,分别 测得:
甲:25, 28, 23, 26, 29, 22
乙:28, 23, 30, 25, 21, 27
假定尼古丁含量都服从正态分布,在显著性水
平α=0.05 下,检验两总体是否具有公共方差
Ⅲ 7 11 6 6 7 9 5 10 6 3 10
试分析三种不同的菌型对小白鼠的平均存活日数 影响是否显著? (取显著性水平α=0.01)
例 2 考察合成纤维弹性影响因素为拉伸倍数 A 与收缩
率 B 。A 与 B 各取 4 个水平,每个水平配合下做 2 次试
验,结果数据见下表:
试验结果
因素 B B1 (0) B2 (4) B3 (8) B4 (12)
误差 E 总和
Se rs(m 1) Se / rs(m 1)
S A + SB + rsm 1 + S AB S e
例 3 花莱留种培育问题,对花莱留种的生产条件进
行考察,通过试验确定 A、B、C、D 四个因素 2 个
水平及交互作用 A×B,A×C 对指标影响的重要性,
并找出最优生产方案。考察的因素与水平列于下表。
腰肉量 x3(kg)
1.21 1.35 1.92 1.49 1.56 1.50 1.85 1.51 1.46 1.66 1.64 1.90 1.66
序号
瘦肉量 眼肌面积
y(kg)
x1(cm2)
腿肉量 x2(kg)
14
15.94
23.52
5.18
15
14.33
21.86
4.86
16
15.11
28.95
23.73 22.34 28.84 27.67 20.83 22.27 27.57 28.01 24.79 28.96 25.77 23.17 28.57
腿肉量 x2(kg)
5.49 4.32 5.04 4.72 5.35 4.27 5.25 4.62 4.42 5.30 4.87 5.80 5.22
A1(460) 71 73
因 A2(520) 72 73
素 A3(580) 75 73
A
A4(640) 77 73
73 75 76 74 78 77 74 74
76 73 79 77 74 75 74 73
75 73 73 72 70 71 69 69
结果列于下面的方差分析表。
方差来源 平方和 自由度 均方
2.14 2.10 2.13 2.15 2.13 2.12 2.13 2.10
2.15 2.12 2.14 2.10 2.13 2.11 2.14 2.11 (1)估计该批零件的平均长度μ,(2)求μ的 置信度为95%的置信区间.
例6 假设某地区新生婴儿的体重服从正态分布 ,随机抽取12名新生婴儿,其体重(克)分别 是
(1)ˆ 1 X
(2)ˆ
2
1 n
n i 1
Xi X
2
例4 设X1, X 2, X3是来自某总体X的样本, 下列统计量作为E( X )的估计量,比较它们 的有效性。
ˆ1
1 2
X1
1 3
X2
1 6
X3
ˆ2
1 3
X1
1 3
X2
1 3
X3
ˆ3
1 6
X1
1 6
X2
2 3
X3
例5 随机地从一批服从正态分布N(μ,0.022)的零 件中抽取16个,分别测得其长度为:
因素
A
B
C
D
水平
浇水次数 喷药次数 施肥方法 进室时间
1
浇水 1~2 次 随机喷 开花期施 11 月初
2
随时浇
定期喷 施四次 11 月中
(1)选择正确的正交表,做好表头设计,给出试验
安排表;
(2)假定试验结果依次为 65,70,68,77,65,68,55,75,
请通过极差分析确定最优生产方案。
第二章 数理统计的基本概念
例1 设 X ~ t(n) ,试问 F X 2
服从什么分布?
例2设 X1, X 2 , , X10 是来自总体 N 0, 4 的简单
随机样本,设样本均值和样本方差分别为X , S 2 ,
求D(X ) ?;当c=?时,P(S 2 c) 0.1 ;统
计10S量X2 2
服从什么分布?
(1)建立y 关于 x的线性回归方程; (2)用F检验法作回归效果的显著性检验。(取 显著性水平α=0.01)
例 2 根据下表某猪场 25 头育肥猪 4 个胴体性状的数
据资料,试进行瘦肉量 y 对眼肌面积( x1 )、腿肉量
( x2 )、腰肉量( x3 )的多元回归分析。要求
(1)求 y 关于 x1, x2, x3 的线性回归方程;
5.18
17
13.81
24.53
4.88
18
15.58
27.65
5.02
19
15.85
27.29
5.55
20
15.28
29.07
5.26
21
16.40
32.47
5.18
22
15.02
29.65
5.0823Βιβλιοθήκη 15.7322.11
4.90
24
14.75
22.43
4.65
25
14.35
20.04
5.08
腰肉量 x3(kg)
2
2
(3)2( X 2) S
(4) S 2 3
第三章 参数估计
例1 某银行网点接受服务的顾客的服务时间X 服从指数分布, X 的概率密度函数为
e-x , x 0
f (x) 0,
其它
其中 0
(1)求 的矩估计量;(2)利用随机抽取到的
10名顾客的服务时间(分钟):
8,5,14,2,20,2,18,11,3,17
1.98 1.59 1.37 1.39 1.66 1.70 1.82 1.75 1.70 1.81 1.82 1.53
第六章 方差分析与正交试验设计
例1 下表给出分别在30只小白鼠身上接种三种不 同菌型的伤寒病菌后的存活日数:
菌型
接种后的存活日数
Ⅰ 2332477254
Ⅱ 5 6 8 5 10 7 12 6 6
例3 设X1, X 2 ,, X15 是总体X ~ N (0,22 ) 本,试问统计量
10
X
2 i
F
i 1 15
2
X
2 i
i 11
服从什么分布?
的样
例4设X 1, X 2 , X 3 , X 4 是总体X ~ N (2 , 32 ) 的
样本,试求下列统计量服从的分布。
(1)X
4
(2)
i1
Xi 3
3100 2520 3000 3000 3600 3160
3560 3320 2880 2600 3400 2540 求平均体重μ的置信度为95%的置信区间。
第四章 假设检验
例1 从某单位一年的发票存根中,随机抽取了 25张,分别记录下它们的金额(单位:元), 计算出样本均值为81.5,样本标准差为4.2。 假定该单位一年内的发票金额服从正态分布, (1)能否认为这一年内发票平均金额大于80 元?(2)能否认为这一年内发票平均金额与
相关文档
最新文档