统计学基础第八章

合集下载

统计学-第八章 假设检验

统计学-第八章  假设检验
验和单侧检验。以总体均值μ 的检验为例:
假设 原假设
双侧检验
单侧检验
左侧检验 右侧检验
H0 : m =m0 H0 : m m0 H0 : m m0
备择假设 H1 : m ≠m0 H1 : m <m0 H1 : m >m0
三、假设检验的程序---
4.例题分析
[例8.1] 某品牌洗衣粉在它的产品说明书中声称:平 均净含量不少于1250克。从消费者的利益出发,有关研 究人员要通过抽检其中的一批产品来验证该产品制造商 的说明是否属实。试写出用于检验的原假设与备择假设。
2.接受域:概率P>的区域,为大概率区域,称之 为原假设的接受区域。
3.拒绝域:概率P≤的区域,为小概率区域,称之 为原假设的拒绝区域。
三、假设检验的程序---
1.拒绝原假设H1 原则:临界值
2.接受原假设H0 原则:临界值
检验统计值的绝 对值大于临界值;
检验统计值的绝 对值小于临界值;
假设 H0为真实 H0为不真实
接受H0 判断正确
采伪错误()
拒绝H0 弃真错误()
判断正确
四、假设检验中的两类错误
第I类()错误和第II类()错误的关系
和的关系就像 翘翘板,小就 大, 大就小。
你要同时减少两类 错误的惟一办法是 增加样本容量!
关乎决策:三个与其
与其,人为地把显著性水平固定按某一水平上,不 如干脆选取检验统计量的P值;
第二节 一个正态总体的假设检验
二、均值m的假设检验
3.给出显著性水平(0.01、0.05或0.1)
4.确定接受域和拒绝域(以双侧检验为例)

2已知:当Z Z 2
,则拒绝原假设,反之则接受H0;

统计学基础(第六版)教学课件第8章

统计学基础(第六版)教学课件第8章

2009
呈现出一定的抛物
2008
趋势;管理成本则
2007
现一定的指数变化
2005
净利润呈现一定的
2006
2005
线性趋势;产量呈
净利润
《统计学基础》(第六版)
管理成本
第8章
8.3 时间序列预测的程序和方法
确定时间序列的成分
4000
年份
8 - 13
第8章
《统计学基础》(第六版)

8.3 时间序列预测的程序和方法
84
60
233
2007
2938
124
73
213

第2步,找出适合该时间序列的预测方法。
2008
3125
214
121
230
2009
3250
216
126
223
第3步,对可能的预测方法进行评估,以确定最
2010
3813
354
172
240

2011
4616
420
218
208
佳预测方案。
2012
4125
514
110.94
110.61
109.60
110.29
110.50
110.00
108.61

119.87
133.41
148.01
163.71
179.42
197.89
218.63)根据式(8.5)得:
ҧ =


− 1 × 100 =
0
9
27563
− 1 × 100 = 11.26%
2021/11/5

统计学第八章 抽样推断

统计学第八章 抽样推断


和P的使用及使用条件
(1)σ2取最大值;(2)P取接近于0.5的值
(3)可以用样本 s或2 代p替;(4)可以用估计值或实验值代替。
计算例题:
在10000只电池中,随机抽检1%的产品进行检查,检查结果如下:
电流强度 (安培) 4-4.5 4.5-5 5-5.5 5.5-6 6-6.5 6.5-7
2
f
P 2N 0 1 P 2 N1
f
N
P2N0 1 P2 N1 P2Q 1 P2 P
N
N
P2Q Q2P PQP Q PQ P1 P
例(1):已知某产品的合格率为95%,则其标准差为:
0.951 0.95 21.79%.
2、样本指标(统计量)
根据样本总体各单位的数量标志值或属性计算所得的指 标,称为样本指标。样本指标通常包括:
统计指标 抽样平均数 抽样成数 抽样平均数的标准差 抽样成数的标准差 抽样平均数的方差
抽样成数的方差
未分组资料
x x n
p n1 n
sx
xx 2
n
分组资料
x xf f
sx
x
2
x
f
f
sP p(1p)
s2
2
xx
x
n
sP2 p(1 p)
s2
2
xx f
x
f
四、抽样方法(P151)
(二)抽样极限误差的意义
(三)抽样极限误差的计算
平均数的抽样极限误差
Δx
t
μ x
成数的抽样极限误差
Δp
t
μ p
正态分布图示
68.27%
95.45%
99.73%

第八章 假设检验 (《统计学》PPT课件)

第八章  假设检验  (《统计学》PPT课件)
与其,为选取“适当的”的而苦恼,不如干脆 把真正的(P值)算出来。
第二节 一个正态总体的假设检验
一、正态总体
设总体X ~ N(m, 2),抽取容量为n的样本 x1, x2, xn
样本均值 X 与方差S2 计算公式分别为:
2
1 n 1
n i1
(xi
X)
我们将利用上述信息,来检验关于未知参数均值 和方差的假设。
总体参数
均值
方差
总体方差已知
z 检验
(单尾和双尾)
总体方差已知
t 检验
(单尾和双尾)
2 检验
(单尾和双尾)
第二节 一个正态总体的假设检验
二、均值m的假设检验
1.H0:m=m0
2.选择检验统计量:
2已知: Z X m0 ~ N(0,1)
/ n
2未知:
小样本: t X m0 ~ t(n 1)
这个值不像我 们应该得到的 样本均值 ...
...因此我们拒绝 原假设μ=50
... 如果这是总 体的假设均值
60
μ=80
H0
样本均值
第一节 假设检验概述
三、假设检验的程序
一个完整的假设检验过程,通常包括以下几个步骤:
首先,设立原假设H0与备选假设H1; 第二步,构造检验统计量,并根据样本观察数据
小样本:当 t t
2
,则拒绝原假设,反之则接受H0;
5.得出结论。
二、均值m的假设检验
6.例题分析
[例8.3] 某广告公司在广播电台做流行歌曲磁带广告 ,它的插播广告是针对平均年龄为21岁的年轻人的,标 准差为16。这家广告公司经理想了解其节目是否为目标 听众所接受。假定听众的年龄服从正态分布,现随机抽 取400多位听众进行调查,得出的样本结果为x 25 岁S2,18 。以0.05的显著水平判断广告公司的广告策划是否符合 实际?

统计学第八章 时间序列分析

统计学第八章 时间序列分析

季节指数
乘法模型中的季节成分通过季节指数来反映。 季节指数(季节比率):反映季节变动的相
对数。 1、月(或季)的指数之和等于1200%(或
400%) 。 2、季节指数离100%越远,季节变动程度
越大,数据越远离其趋势值。
用移动平均趋势剔除法计算季节指数
1、计算移动平均值(TC),移动期数为4或 12,注意需要进行移正操作。
移动平均的结果 4000 3500 3000 2500 2000 1500 1000 500 0
Example 2
移动平均法可以作为测定长期趋势的一种 较为简单的方法,在股市技术分析中有广 泛的应用。比如对某只股票的日收盘价格 序列分别求一次5日、10日、一个月的移动 平均就可以得到其5日、10日、一个月的移 动平均股价序列,进而得到5日线、10日线、 月线,用以反映股价变动的长期趋势。
1987 1800 1992 1980 1997 2880
1988 1620 1993 2520 1998 3060
1989 1440 1994 2559 1999 2700
4000
3500
销售收入
3000
2500
2000
1500
1000
500
0
年份
2000 2001 2002 2003 2004
销售 收入 3240 3420 3240 3060 3600
部分数据
销售 收入
t
1985 1080
1
1986 1260
2
1987 1800
3
1988 1620
4
1989 1440
5
……

2003 3060
19

统计学第八章

统计学第八章
19
8.1.3 两类错误
项目
没有拒绝H0
拒绝H0
H0为真
1-α(正确)
α(弃真错误)
H0为假
β(取伪错误)
1-β(正确)
假设检验中各种可能结果的概率
20
8.1.3 两类错误
α和β的关系: 1、 α和β的关系就像跷跷板, α小β就大, α大β就小。因为, 要减少弃真错误α,就要扩大接受域。而扩大接受域,就必然导致取 伪错误的可能性增加。因此,不能同时做到犯两种错误的概率都很 小。要使α和β同时变小,唯一的办法就是增大样本量。 α和β两者的 关系就像是区间估计当中可靠性和精确性的关系一样。 2、在假设检验中,大家都在执行这样一个原则,即首先控制犯α错 误原则。
一般来说,在研究问题的过程中,我们想要予以反对的那个结论, 我们就把它作为原假设。
比如,一家研究机构估计,某城市当中家庭拥有汽车的比例超过 30%。为了验证这种估计是否正确,该研究机构随机的抽取了一个样本 进行检验。试陈述用于检验的原假设和备择假设。
解:研究者想要收集证据予以支持的假设是:“该城市中家庭拥有 汽车的比例超过30%”。因此,原假设是总体比例小于等于30%,备择 假设是总体比例大于30%。可见,通常我们应该先确定备择假设,再确 定原假设。
6
8.1.2 假设的表达式
在假设检验中,一般要先设立一个假设(比如从来没做过坏事),然 后从现实世界的数据中找出假设与现实的矛盾,从而否定该假设。所以, 在多数统计教材当中,假设检验都是以否定事先设定的那个假设为目标的。
如果搜集到的数据分析结构不能否定该假设,只能说明我们掌握的现 实不足以否定该假设,但不能说明该假设一定成立。这是假设检验做结论 的时候尤其要注意的一点。比如一个人在数次的观察中都没有干坏事,但 并不说明他从来都没干过坏事。

统计学第8章假设检验

统计学第8章假设检验

市场调查中常用的假设检验方法包括T检验、Z检验和卡方 检验等。选择合适的检验方法需要考虑数据的类型、分布 和调查目的。例如,对于连续变量,T检验更为适用;对于 分类变量,卡方检验更为合适。
医学研究中假设检验的应用
临床试验
在医学研究中,假设检验被广泛应用于临床试验。研究 人员通过设立对照组和实验组,对不同组别的患者进行 不同的治疗,然后收集数据并使用假设检验来分析不同 治疗方法的疗效。
03 假设检验的统计方法
z检验
总结词
z检验是一种常用的参数检验方法,用于检验总体均值的假设。
详细描述
z检验基于正态分布理论,通过计算z分数对总体均值进行检验。它适用于大样本 数据,要求数据服从正态分布。z检验的优点是简单易懂,计算方便,但前提假 设较为严格。
t检验
总结词
t检验是一种常用的参数检验方法,用于检验两组数据之间的差异。
卡方检验
总结词
卡方检验是一种非参数检验方法,用于 比较实际观测频数与期望频数之间的差 异。
VS
详细描述
卡方检验通过计算卡方统计量来比较实际 观测频数与期望频数之间的差异程度。它 适用于分类数据的比较,可以检验不同分 类之间的关联性。卡方检验的优点是不需 要严格的假设前提,但结果解释需谨慎。
04 假设检验的解读与报告
详细描述
t检验分为独立样本t检验和配对样本t检验,分别用于比较两组独立数据和同一组数据在不同条件下的 差异。t检验的前提假设是小样本数据近似服从正态分布。t检验的优点是简单易行,但前提假设需满 足。
方差分析
总结词
方差分析是一种统计方法,用于比较两个或多个总体的差异。
详细描述
方差分析通过分析不同组数据的方差来比较各组之间的差异。它适用于多组数据的比较,可以检验不同因素对总 体均值的影响。方差分析的前提假设是各组数据服从正态分布,且方差齐性。

统计学第八章(抽样推断)

统计学第八章(抽样推断)

ni n
N i i
i 1

k
N i i
层的标准差。
i 是各
25
(3)经济分配法
既考虑每层中总体单位的变异程度不同 ,又考虑每层的调查费用。所以在样本容 量一定的条件下,标志变异大的层样本容 量也大一些,调查费用大的层,样本容量 相对小些。则
ni n
N i i / C i
i 1
20
* 抽样的组织方式 简单随机抽样 类型抽样
机械抽样
整群抽样
多阶段抽样
21
(一)简单随机抽样 : 简单随机抽样 又称纯随机抽样,是直接从总体中按随 机的原则抽容量为 n 的样本,每一个总 体单位有相同的可能性被抽中。
特点:最遵循随机原则,但不一定能 保证样本单位在总体中分布的均匀性; 适宜于单位数不多,标志变异较小、分 布较均匀的总体。
15
抽样框
STAT
某外国公司在深圳进 应当调查的对 福田区 … 在商场的大门口 行微波炉市场调查: 象(居民户) 南山区 桃源街道办 … 微波炉普及情况 已购或未购微 在微波炉柜台前 波炉的住户 南头街道办 居民的喜好特征 桂庙村… 南 在市区街道旁边 已购该公司微 居民购买力水平 新居委会 波炉的住户 在某个住宅小区 居民一组 公司产品知名度 有购买微波炉 居民二 公司产品信誉度 意向的住户 组 …
样本标准差公式
未分组数据:
2 ( x x ) i i 1 n
n 1 分组数据
S2
S2
(x x)
i 1 i
k
n
2
S
n 1 分组数据
2 ( x x ) fi i i 1 k
(x
i 1 k
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

statistics
统计学——第八章参数估计
例2:已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得 其使用寿命如表8-5所示。建立该批灯泡平均使用寿命95%的置信区间。 表8-5
1510 1450 1480 1460
16只灯泡使用寿命数据
1520 1480 1490 1460 1480 1510 1530 1470
x t α 2
σ n
σ n
x t α 2
S n
S n
非正态分布 大样本(n≥30) x Z α 2
x Zα 2
statistics
统计学——第八章参数估计
二、总体比例的区间估计 1. 样本比例经标准化后的随机变量则服从正态分布,即:
Z p π π(1 π) n ~ N(0,1)
2. 总体比例在1-置信水平下的置信区间为:
即全部灯泡的平均使用寿命,在置 信水平1-α =0.95下的置信区间 为(1476.8,1503.2)h。
statistics
统计学——第八章参数估计
总结:
表8-6
总体分布
总体均值的区间估计
σ已知
σ n
样本容量
σ未知
x Zα 2 S n
大样本(n≥30) x Z α 2 正态分布 小样本(n<30)
即该批食品平均重量95%的置信区间为101.44~109.28 g。
statistics
统计学——第八章参数估计 利用Excel来计算置信区间
• 1.将样本数据输入Excel工作表中A1︰E5
statistics
统计学——第八章参数估计
• 2.计算样本均值。点击粘贴函数“fx”,选择“统计”下的“AVERAGE”函 数。在出现的“函数参数”对话框中,“Number1”一栏填入样本数据所在 x 区域A1︰E5,然后“确定”,在输出区域内(本例放置在F1)得结果105.36, 此即样本均值。
单位:h
1500 1520 1510 1470
解:根据样本数据,计算样本均值=1490 h,样本方差S=24.77 h 根据α =0.05查t分布表得(n-1)=t0.025 (15)=2.131 于是,平均使用寿命的置信区间为:
x tα 2 S 24.77 1490 2.131 n 16 1490 13.2 1476.8, 1503.2
statistics
统计学——第八章参数估计
一、抽样推断 (一)抽样推断的概念:按照随机性原则,从研究对象中 抽取一部分进行观察,并根据所得到的观察数据,对研究 对象的数量特征做出具有一定可靠程度的估计和推断,以 达到认识总体的一种统计方法。 (二)抽样推断的特点: 1.样本资料对总体的数量特征作出具有一定可靠性。 2.按照随机性原则从全部总体中抽取样本单位。 3.抽样推断必然会产生抽样误差。
解:根据样本数据计算样本方差:
S2 =93.21; 已知n=25,1-=95% ,查χ 2分布表可得临界值为:
2 χ 2 2 (n 1) χ 0.025 (24) 39.3641 α
2 2 χ 1α 2 (n 1) χ 0.975 (24) 12.4011
总体方差 2置信水平为95%的置信区间为 :
statistics
统计学——第八章参数估计
二、参数估计的一般问题 (一)参数估计(parameter estimation)就是用样本统 计量去估计总体的参数。
1. 估计量:用于估计总体参数的随机变量 • 如样本均值、样本比率、样本方差等 • 样本均值就是总体均值的一个估计量 2. 参数用表示,估计量用 ˆ 表示 3. 估计值:估计参数时计算出来的统计量的具体值 • 如果样本均值 x =5600,则5600就是总体均值 的估计值
ˆ P( )
较大的样本容量
B A
较小的样本容量

图8-5 两个不同容量样本统计量的抽样分布
ˆ
statistics
统计学——第八章参数估计
有效性:对同一总体参数的两个无偏点估计量,有更小 标准差的估计量更有效。
ˆ P( )
ˆ1 的抽样分布
B A
ˆ2 的抽样分布
ˆ

图8-6 两个无偏点估计量的抽样分布
statistics
统计学——第八章参数估计
第二节
单总体参数的区间估计
statistics
统计学——第八章参数估计
一、总体均值的区间估计
(一)大样本的估计方法 1.样本均值经过标准化以后的随机变量则服从正态分布,
x μ 即Z ~ N(0, 1) σ n
2.总体均值所在(1-α )置信水平下的置信区间为:
即该城市家庭中,拥有电脑的比例在置信水平95%下的置信区间为: (50.396%,69.604%)。
statistics
统计学——第八章参数估计 三、总体方差的区间估计 总体方差在(1-α )置信水平下的置信区间为:
n 1 S σ 2 n 1 S 2 2 χ α 2 n 1 χ 1α 2 n 1
p z α 2 p(1- p) n
式中,1-α 称为置信水平;
Z 2 是标准正态分布上侧面积为α
Zα 2
/2时的临界值;
p(1- p) 是估计总体比例时的允许误差。 n
statistics
统计学——第八章参数估计
例3:为了解某城市家庭电脑的普及情况,随机抽取了100户家庭,其中有60户 有电脑。试以95%的置信水平估计该城市家庭中拥有电脑比例的置信区间。
statistics
统计学——第八章参数估计
表8-2
样本统计量和总体参数符号对应关系
总体参数 均值 比例 方差
符号表示 μ π σ
2
样本统计量
x
p S
2
statistics
统计学——第八章参数估计
(二)点估计与区间估计
1.点估计 根据样本统计量直接估计出总体参数θ 的值,称为参 数的点估计。常用的方法有两种:矩估计法和极大似然估 计法。 2.区间估计 在点估计的基础上,给出总体参数估计的一个范围。 图8-1给出了区间估计的示意图:
statistics
统计学——第八章参数估计
解: 已知总体服从正态分布, 且标准差为σ =10, n=25, 置信水平为 1-α =95%,查标准正态分布表得:
Z 2
=1.96
根据样本计算均值,得 x =105.36 g 于是有:
x Zα 2 σ 10 105.36 1.96 n 25 105.36 3.92 101.44,109 .28
x μ t ~ t(n 1) S n
statistics
统计学——第八章参数估计
t 分布是类似正态分布的一种对称分布,它通常要比正 态分布平坦和分散。一个特定的分布依赖于称之为自由度的 参数。随着自由度的增大,分布也逐渐趋于正态分布,如图 8-7和图8-8所示:
图8-7
t分布与标准正态分布的比较 图8-8 不同自由度的t分布
statistics
统计学——第八章参数估计
• 总体均值 在1-置信水平下的置信区间为:
x t α 2
S n
式中:tα /2是自由度为n-1时,t分布中上侧面积 为α /2时的临界值,该值可通过t分布表查得。
statistics
统计学——第八章参数估计
利用Excel中的TINV统计函数 计算t分布临界值
第八章
参数估计
统计学——第八章参数估计
本章内容
第一节 参数估计的一般问题
第二节
第三节
单总体参数的区间估计
样本容量的确定
statistics
统计学——第八章参数估计
第一节
参数估计的一般问题
statistics
统计学——第八章参数估计
参数估计在统计方法中的地位
统计方法
描述统计 推断统计 参数估计 假设检验
x Z α 2
x Z α 2 σ n
称为置信下限,
σ n
x Z α 2 σ n
称为置信上限。
statistics
统计学——第八章参数估计
例1:一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企 业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产 的一批食品中随机抽取了25 袋,测得每袋重量如表8-3所示。已知产品重量 的分布服从正态分布,且总体标准差为10 g。试估计该批产品平均重量的置 信区间,置信水平为95%。 表8-3
25 1 93.21 2 25 1 93.21
39.3641 12.4011
即:总体方差的置信区间为(56.83,180.39)。
statistics
统计学——第八章参数估计
三、评估估计量的标准
无偏性:估计量抽样分布的数学期望等于被估计的总体 参数。
ˆ P( )
无偏 有偏
A
B

图8-4 有偏和无偏估计量的例子
ˆ
statistics
统计学——第八章参数估计
一致性:随着样本容量的增大,估计量的值越来越接 近被估计的总体参数。
statistics
统计学——第八章参数估计
• 5.置信下限为105.36-3.78=101.58,置信上限为105.36+3.78= 109.14,即置信区间为(101.58,109.14)g。
statistics
统计学——第八章参数估计
(二)小样本的估计方法 总体方差σ 2未知,而且是在小样本的情况下,则需要用 样本方差S2代替σ 2,这时样本均值经过标准化以后的随机变 量则服从自由度为(n-1)的t分布,即:
statistics
统计学——第八章参数估计
相关文档
最新文档