统计学基础第八章
统计学-第八章 假设检验

假设 原假设
双侧检验
单侧检验
左侧检验 右侧检验
H0 : m =m0 H0 : m m0 H0 : m m0
备择假设 H1 : m ≠m0 H1 : m <m0 H1 : m >m0
三、假设检验的程序---
4.例题分析
[例8.1] 某品牌洗衣粉在它的产品说明书中声称:平 均净含量不少于1250克。从消费者的利益出发,有关研 究人员要通过抽检其中的一批产品来验证该产品制造商 的说明是否属实。试写出用于检验的原假设与备择假设。
2.接受域:概率P>的区域,为大概率区域,称之 为原假设的接受区域。
3.拒绝域:概率P≤的区域,为小概率区域,称之 为原假设的拒绝区域。
三、假设检验的程序---
1.拒绝原假设H1 原则:临界值
2.接受原假设H0 原则:临界值
检验统计值的绝 对值大于临界值;
检验统计值的绝 对值小于临界值;
假设 H0为真实 H0为不真实
接受H0 判断正确
采伪错误()
拒绝H0 弃真错误()
判断正确
四、假设检验中的两类错误
第I类()错误和第II类()错误的关系
和的关系就像 翘翘板,小就 大, 大就小。
你要同时减少两类 错误的惟一办法是 增加样本容量!
关乎决策:三个与其
与其,人为地把显著性水平固定按某一水平上,不 如干脆选取检验统计量的P值;
第二节 一个正态总体的假设检验
二、均值m的假设检验
3.给出显著性水平(0.01、0.05或0.1)
4.确定接受域和拒绝域(以双侧检验为例)
2已知:当Z Z 2
,则拒绝原假设,反之则接受H0;
统计学第八章课后题及答案解析

第八章一、单项选择题1.时间数列的构成要素是()A.变量和次数 B.时间和指标数值C.时间和次数 D.主词和时间2.编制时间数列的基本原则是保证数列中各个指标值具有()A.可加性 B.连续性C.一致性 D.可比性3.相邻两个累积增长量之差,等于相应时期的()A.累积增长量 B.平均增长量C.逐期增长量 D.年距增长量4.统计工作中,为了消除季节变动的影响可以计算()A.逐期增长量 B.累积增长量C.平均增长量 D.年距增长量5.基期均为前一期水平的发展速度是()A.定基发展速度 B.环比发展速度C.年距发展速度 D.平均发展速度6.某企业2003年产值比1996年增长了1倍,比2001年增长了50%,则2001年比1996年增长了()A.33% B.50%C.75% D.100%7.关于增长速度以下表述正确的有()A.增长速度是增长量与基期水平之比 B.增长速度是发展速度减1C.增长速度有环比和定基之分 D.增长速度只能取正值8.如果时间数列环比发展速度大体相同,可配合()A.直线趋势方程 B.抛物线趋势方程C.指数曲线方程 D.二次曲线方程二、多项选择题1.编制时间数列的原则有()A.时期长短应一致 B.总体范围应该统一C.计算方法应该统一 D.计算价格应该统一E.经济内容应该统一2.发展水平有()A.最初水平 B.最末水平C.中间水平 D.报告期水平E.基期水平3.时间数列水平分析指标有()A.发展速度 B.发展水平C.增长量 D.平均发展水平E.平均增长量4.测定长期趋势的方法有()A.时距扩大法 B.移动平均法C.序时平均法 D.分割平均法E.最小平方法三、填空题1.保证数列中各个指标值的_______是编制时间数列的最主要规则。
2.根据采用的基期不同,增长量可以分为逐期增长量和_______增长量两种。
3.累积增长量等于相应的_______之和。
两个相邻的_______之差,等于相应时期的逐期增长量。
统计学基础(第六版)教学课件第8章

2009
呈现出一定的抛物
2008
趋势;管理成本则
2007
现一定的指数变化
2005
净利润呈现一定的
2006
2005
线性趋势;产量呈
净利润
《统计学基础》(第六版)
管理成本
第8章
8.3 时间序列预测的程序和方法
确定时间序列的成分
4000
年份
8 - 13
第8章
《统计学基础》(第六版)
8.3 时间序列预测的程序和方法
84
60
233
2007
2938
124
73
213
➢
第2步,找出适合该时间序列的预测方法。
2008
3125
214
121
230
2009
3250
216
126
223
第3步,对可能的预测方法进行评估,以确定最
2010
3813
354
172
240
➢
2011
4616
420
218
208
佳预测方案。
2012
4125
514
110.94
110.61
109.60
110.29
110.50
110.00
108.61
—
119.87
133.41
148.01
163.71
179.42
197.89
218.63)根据式(8.5)得:
ҧ =
− 1 × 100 =
0
9
27563
− 1 × 100 = 11.26%
2021/11/5
统计学第八章 抽样推断

②
和P的使用及使用条件
(1)σ2取最大值;(2)P取接近于0.5的值
(3)可以用样本 s或2 代p替;(4)可以用估计值或实验值代替。
计算例题:
在10000只电池中,随机抽检1%的产品进行检查,检查结果如下:
电流强度 (安培) 4-4.5 4.5-5 5-5.5 5.5-6 6-6.5 6.5-7
2
f
P 2N 0 1 P 2 N1
f
N
P2N0 1 P2 N1 P2Q 1 P2 P
N
N
P2Q Q2P PQP Q PQ P1 P
例(1):已知某产品的合格率为95%,则其标准差为:
0.951 0.95 21.79%.
2、样本指标(统计量)
根据样本总体各单位的数量标志值或属性计算所得的指 标,称为样本指标。样本指标通常包括:
统计指标 抽样平均数 抽样成数 抽样平均数的标准差 抽样成数的标准差 抽样平均数的方差
抽样成数的方差
未分组资料
x x n
p n1 n
sx
xx 2
n
分组资料
x xf f
sx
x
2
x
f
f
sP p(1p)
s2
2
xx
x
n
sP2 p(1 p)
s2
2
xx f
x
f
四、抽样方法(P151)
(二)抽样极限误差的意义
(三)抽样极限误差的计算
平均数的抽样极限误差
Δx
t
μ x
成数的抽样极限误差
Δp
t
μ p
正态分布图示
68.27%
95.45%
99.73%
统计学第八章 时间序列分析

季节指数
乘法模型中的季节成分通过季节指数来反映。 季节指数(季节比率):反映季节变动的相
对数。 1、月(或季)的指数之和等于1200%(或
400%) 。 2、季节指数离100%越远,季节变动程度
越大,数据越远离其趋势值。
用移动平均趋势剔除法计算季节指数
1、计算移动平均值(TC),移动期数为4或 12,注意需要进行移正操作。
移动平均的结果 4000 3500 3000 2500 2000 1500 1000 500 0
Example 2
移动平均法可以作为测定长期趋势的一种 较为简单的方法,在股市技术分析中有广 泛的应用。比如对某只股票的日收盘价格 序列分别求一次5日、10日、一个月的移动 平均就可以得到其5日、10日、一个月的移 动平均股价序列,进而得到5日线、10日线、 月线,用以反映股价变动的长期趋势。
1987 1800 1992 1980 1997 2880
1988 1620 1993 2520 1998 3060
1989 1440 1994 2559 1999 2700
4000
3500
销售收入
3000
2500
2000
1500
1000
500
0
年份
2000 2001 2002 2003 2004
销售 收入 3240 3420 3240 3060 3600
部分数据
销售 收入
t
1985 1080
1
1986 1260
2
1987 1800
3
1988 1620
4
1989 1440
5
……
…
2003 3060
19
统计学第八章时间数列

2020/1/19
增长速度growth rate 表明现象的增长程度
某现 基象 期报 水 告 平 报期 告 基的 期 期 基 增 水 水 期 长 平 平 发 水 量 展 平 1速
环比增长速度=环比发展速度-1 定基增长速度=定基发展速度-1
2020/1/19
增 1长 的 % 绝 环 对 逐 比 期 增 1 值 增 0 长 0上 长 1速 0 期 量 0度 水平
n 1
n 1
(5)间隔不相等不连续时点的时点数列
2020/1/19
aa1 2a2t1a2 2a3t2an12 antn1 t1t2tn1
增长量和平均增长量 •增长量growth amount
总量指标报告期水平与基期水平之差,表明 该指标在一定时期内增加或减少的绝对数量。
社会经济现象以若干年为周期的 涨落起伏相同或基本相同的一种 波浪式的变动
随机变动(I)
客观社会经济现象由于天灾、人 祸、战乱等突发事件或偶然因素 引起是无周期性波动
2020/1/19
一般模型 加法模型
Y=T+S+C+I
乘法模型 Y=T×S×C×I
分解方法
加法模型 T=Y-(S+C+I)
乘法模型
2020/1/19
✓水平法(几何平均法)
n
X
n
Xi
i1
n
an a0
适用:水平指标的平均发展速度计算
2020/1/19
✓方程法(累计法)
a 0 x a 0 x 2 a 0 x 3 a 0 x n a i
xx2x3xnai a0
适用:侧重于考察中长期间的累计总量
平均增长速度 = 平均发展速度-100% 表明现象在一个较长时期中逐期平均增长变化的程度
统计学第八章课后习题答案
8.1解:建立假设: H0:μ=4.55;H1:μ≠4.55这是双侧检验,并且方差已知,检验的统计量 Z 值为:=-1.833而=1.96>|-1.833|,因此不能拒绝原假设,即可认为现在生产的铁水平均含碳量为 4.558.2解:建立假设: H0:μ≥700;H1:μ<700这是左侧检验,并且方差已知,检验统计量 Z 为:Z==-2而-=-1.645>-2,因此拒绝原假设,即在显著性水平 0.05 下这批元件是不合格的。
8.3解:建立假设: H0:μ≤250;H1:μ>250这是右侧检验,并且方差已知,检验的统计量 Z 值为:Z==3.33 而=1.645<3.33,因此拒绝原假设,即这种化肥使小麦明显增产。
8.4解:建立假设: H0:μ=100;H1:μ≠1009/108.055.4484.4−=Z Z 025.036/60700680−Z 05.025/30250270−Z05.0由样本数据可得: ==99.978S===1.212这是双侧检验,并且方差未知,又是小样本,故采用 t 统计量,检验统计量的值为: t==-0.054而(8)=2.306>|-0.054|,因此不拒绝原假设,即该日打包机工作正常8.5、由题意先建立假设,显然不符合标准的比例越小越好,由于采用的是产品质量抽查,即使总体不合标准的比例没有超过5%,属于合格范围,采用右单侧检验。
P=6/50=12%属于单侧检验,当α=0.05时,有,因此拒绝原假设,即认为该批食品不能出厂n X ni ix∑==195.100....7.983.99+++1)(12−−∑=n x ni i x 8)978.995.100(...978.99-7.98978.99-3.99222−+++)()(9/2122.1100-978.99t025.0%5:%,5:1>≤ππH H o 27.250%)51(%5%5%12=−−−=Z 27.2645.105.0<=Z8.6、由题意建立假设:单侧检验,并且方差未知,n=15,属于小样本,故采用t 统计量,检验统计量的值为:α=0.05,,因此不能拒绝原假设,认为该厂家的广告不真实8.7、建立假设:,由样本数据可以得出,这是单侧检验,并且方差未知,是小样本,因此采用t 检验量,检验统计量的值为25000:,25000:10>≤μμH H 549.115/50002500027000/0=−=−=n s x t μ549.1761.1)14(05.0>=t 225,22510>≤H H 5.24116170485 (2121012801591)=++++++==∑=nxx ni i7.9815)5.241170(....)5.241280()5.241159(12221=−++−+−=−=∑=n xs ni in s x t /μ−=669.016/7.982255.241=−=通过查表可得出,,因此不能拒绝原假设,没有理由认为元件的平均寿命显著地大于225小时。
统计学第八章
8.1.3 两类错误
项目
没有拒绝H0
拒绝H0
H0为真
1-α(正确)
α(弃真错误)
H0为假
β(取伪错误)
1-β(正确)
假设检验中各种可能结果的概率
20
8.1.3 两类错误
α和β的关系: 1、 α和β的关系就像跷跷板, α小β就大, α大β就小。因为, 要减少弃真错误α,就要扩大接受域。而扩大接受域,就必然导致取 伪错误的可能性增加。因此,不能同时做到犯两种错误的概率都很 小。要使α和β同时变小,唯一的办法就是增大样本量。 α和β两者的 关系就像是区间估计当中可靠性和精确性的关系一样。 2、在假设检验中,大家都在执行这样一个原则,即首先控制犯α错 误原则。
一般来说,在研究问题的过程中,我们想要予以反对的那个结论, 我们就把它作为原假设。
比如,一家研究机构估计,某城市当中家庭拥有汽车的比例超过 30%。为了验证这种估计是否正确,该研究机构随机的抽取了一个样本 进行检验。试陈述用于检验的原假设和备择假设。
解:研究者想要收集证据予以支持的假设是:“该城市中家庭拥有 汽车的比例超过30%”。因此,原假设是总体比例小于等于30%,备择 假设是总体比例大于30%。可见,通常我们应该先确定备择假设,再确 定原假设。
6
8.1.2 假设的表达式
在假设检验中,一般要先设立一个假设(比如从来没做过坏事),然 后从现实世界的数据中找出假设与现实的矛盾,从而否定该假设。所以, 在多数统计教材当中,假设检验都是以否定事先设定的那个假设为目标的。
如果搜集到的数据分析结构不能否定该假设,只能说明我们掌握的现 实不足以否定该假设,但不能说明该假设一定成立。这是假设检验做结论 的时候尤其要注意的一点。比如一个人在数次的观察中都没有干坏事,但 并不说明他从来都没干过坏事。
统计学第8章假设检验
市场调查中常用的假设检验方法包括T检验、Z检验和卡方 检验等。选择合适的检验方法需要考虑数据的类型、分布 和调查目的。例如,对于连续变量,T检验更为适用;对于 分类变量,卡方检验更为合适。
医学研究中假设检验的应用
临床试验
在医学研究中,假设检验被广泛应用于临床试验。研究 人员通过设立对照组和实验组,对不同组别的患者进行 不同的治疗,然后收集数据并使用假设检验来分析不同 治疗方法的疗效。
03 假设检验的统计方法
z检验
总结词
z检验是一种常用的参数检验方法,用于检验总体均值的假设。
详细描述
z检验基于正态分布理论,通过计算z分数对总体均值进行检验。它适用于大样本 数据,要求数据服从正态分布。z检验的优点是简单易懂,计算方便,但前提假 设较为严格。
t检验
总结词
t检验是一种常用的参数检验方法,用于检验两组数据之间的差异。
卡方检验
总结词
卡方检验是一种非参数检验方法,用于 比较实际观测频数与期望频数之间的差 异。
VS
详细描述
卡方检验通过计算卡方统计量来比较实际 观测频数与期望频数之间的差异程度。它 适用于分类数据的比较,可以检验不同分 类之间的关联性。卡方检验的优点是不需 要严格的假设前提,但结果解释需谨慎。
04 假设检验的解读与报告
详细描述
t检验分为独立样本t检验和配对样本t检验,分别用于比较两组独立数据和同一组数据在不同条件下的 差异。t检验的前提假设是小样本数据近似服从正态分布。t检验的优点是简单易行,但前提假设需满 足。
方差分析
总结词
方差分析是一种统计方法,用于比较两个或多个总体的差异。
详细描述
方差分析通过分析不同组数据的方差来比较各组之间的差异。它适用于多组数据的比较,可以检验不同因素对总 体均值的影响。方差分析的前提假设是各组数据服从正态分布,且方差齐性。
统计学第八章练习题
第八章相关与回归分析一、填空题8.1.1客观现象之间的数量联系可以归纳为两种不同的类型,一种是_____________ ,另一种是__________________ 。
8.1.2回归分析中对相互联系的两个或多个变量区分为__________________ 和___________ 。
8.1.3 _____________ 是指变量之间存在的严格确定的依存关系。
8.1.4 变量之间客观存在的非严格确定的依存关系,称为_____________________ 。
8.1.5按 ____________ 的多少不同,相关关系可分为单相关、复相关和偏相关。
8.1.6两个现象的相关,即一个变量对另一个变量的相关关系,称为。
8.1.7在某一现象与多个现象相关的场合,当假定其他变量不变时,其中两个变量的相关关系称为____________________________ 。
8.1.8按变量之间相关关系的 _______________ 不同,可分为完全相关、不完全相关和不相关。
8.1.9按相关关系的 ____________________ 不同可分为线性相关和非线性相关。
8.1.10 线性相关中按_________________ 可分为正相关和负相关。
8.1.11 研究一个变量与另一个变量或另一组变量之间相关方向和相关密切程度的统计分析方法,称为__________________ 。
8.1.12当一个现象的数量由小变大,另一个现象的数量也相应由小变大,这种相关称为。
8.1.13当一个现象的数量由小变大,而另一个现象的数量相反地由大变小,这种相关称为。
8.1.14 当两种现象之间的相关只是表面存在,实质上并没有内在的联系时,称之为__________________ 。
8.1.15根据相关关系的具体形态,选择一个合适的数学模型来近似地表达变量间平均变化关系的统计分析方法,称为_____________________ 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
点估计值
图8-3 重复构造出置信水平95%,的20个置信区间
三、评估估计量的标准
无偏性:估计量抽样分布的数学期望等于被估计的总体 参数。
P(ˆ)
无偏
有偏
A
B
ˆ
图8-4 有偏和无偏估计量的例子
一致性:随着样本容量的增大,估计量的值越来越接 近被估计的总体参数。
P(ˆ) 较大的样本容量 B
较小的样本容量
t x μ ~ t(n1) S n
t 分布是类似正态分布的一种对称分布,它通常要比正 态分布平坦和分散。一个特定的分布依赖于称之为自由度的 参数。随着自由度的增大,分布也逐渐趋于正态分布,如图 8-7和图8-8所示:
图8-7 t分布与标准正态分布的比较 图8-8 不同自由度的t分布
• 总体均值 在1-置信水平下的置信区间为:
数的点估计。常用的方法有两种:矩估计法和极大似然估 计法。 2.区间估计
在点估计的基础上,给出总体参数估计的一个范围。 图8-1给出了区间估计的示意图:
图8-1 区间估计的图示
3. 在区间估计中,由样本统计量所构造的总体参数 的估计区间,称为置信区间,其中区间的最小值称为置信 下限,最大值称为置信上限。
• 3.计算样本标准差,选择的函数为“统计”下的“STDEV”函数。本例 放在G1,得结果9.6545。
• 4.计算允许误差。选择“统计”下的“CONFIDENCE”函数,在出现的 “函数参数”对话框中,“Alpha”一栏填入显著性水平“0.05”, “Standard_dev”一栏填入总体标准差“G1”(大样本情况下,可用样 本标准差代替),“Size”一栏填入样本容量“25”,然后“确定”,在 输出区域内得允许误差“3.784490”(取近似值3.78)。即Zx源自μ σ~N(0,1)
n
2.总体均值所在(1-α)置信水平下的置信区间为:
σ x Zα 2 n
x Zα 2
σ n
称为置信下限, x Z α 2
σ n
称为置信上限。
例1:一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企 业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产 的一批食品中随机抽取了25 袋,测得每袋重量如表8-3所示。已知产品重量 的分布服从正态分布,且总体标准差为10 g。试估计该批产品平均重量的置 信区间,置信水平为95%。
4.置信水平:如果将构造置信区间的步骤重复多次, 置信区间包含总体参数真值的次数所占的比率。
5.比较常用的置信水平及正态分布曲线下的右侧面积 为时的值(即临界值Zα/2)。
表8-3 常用置信水平的值
置信水平 90 95 99
α 0.1 0.05 0.01
α/2 0.05 0.025 0.005
Zα/2 1.645 1.96 2.58
表8-3 25袋食品的重量
单位:g
112.5 102.6 100.0 116.6 136.8
101.0 107.5 123.5
95.4 102.8
103.0 95.0
102.0 97.8
101.5
102.0 108.8 101.6 108.6
98.4
100.5 115.6 102.2 105.0
93.3
利用Excel来计算置信区间
• 1.将样本数据输入Excel工作表中A1︰E5
• 2.计算样本均值。点击粘贴函数“fx”,选择“统计”下的“AVERAGE”函 数。在出现的“函数参数”对话框中,“Number1”一栏填入样本数据所在 区域A1︰E5,然后“确定”,在输出区域内(本例放置在F1)得结果105.3x6, 此即样本均值。
第八章
参数估计
本章内容
第一节 参数估计的一般问题 第二节 单总体参数的区间估计 第三节 样本容量的确定
第一节 参数估计的一般问题
参数估计在统计方法中的地位
统计方法
描述统计
推断统计
参数估计 假设检验
一、抽样推断 (一)抽样推断的概念:按照随机性原则,从研究对象中 抽取一部分进行观察,并根据所得到的观察数据,对研究 对象的数量特征做出具有一定可靠程度的估计和推断,以 达到认识总体的一种统计方法。
(二)抽样推断的特点: 1.样本资料对总体的数量特征作出具有一定可靠性。 2.按照随机性原则从全部总体中抽取样本单位。 3.抽样推断必然会产生抽样误差。
二、参数估计的一般问题 (一)参数估计(parameter estimation)就是用样本统 计量去估计总体的参数。
1. 估计量:用于估计总体参数的随机变量 • 如样本均值、样本比率、样本方差等 • 样本均值就是总体均值的一个估计量
A
ˆ
图8-5 两个不同容量样本统计量的抽样分布
有效性:对同一总体参数的两个无偏点估计量,有更小 标准差的估计量更有效。
P(ˆ)
ˆ1 的抽样分布
B
A
ˆ2 的抽样分布
ˆ
图8-6 两个无偏点估计量的抽样分布
第二节 单总体参数的区间估计
一、总体均值的区间估计
(一)大样本的估计方法 1.样本均值经过标准化以后的随机变量则服从正态分布,
解:已知总体服从正态分布,且标准差为σ=10,n=25,
置信水平为 1-α=95%,查标准正态分布表得:
Z 2 =1.96 根据样本计算均值,得x =105.36 g
于是有: x Zα 2
σ 105.36 1.96 n
10 25
105.36 3.92
101.44,109.28
即该批食品平均重量95%的置信区间为101.44~109.28 g。
2. 参数用表示,估计量用ˆ 表示 3. 估计值:估计参数时计算出来的统计量的具体值
• 如果样本均值 x =5600,则5600就是总体均值 的估计值
表8-2 样本统计量和总体参数符号对应关系
总体参数 均值 比例 方差
符号表示 μ π σ2
样本统计量
x
p S2
(二)点估计与区间估计
1.点估计 根据样本统计量直接估计出总体参数θ的值,称为参
• 5.置信下限为105.36-3.78=101.58,置信上限为105.36+3.78= 109.14,即置信区间为(101.58,109.14)g。
(二)小样本的估计方法 总体方差σ2未知,而且是在小样本的情况下,则需要用
样本方差S2代替σ2,这时样本均值经过标准化以后的随机变 量则服从自由度为(n-1)的t分布,即: