统计学第六版贾俊平第9章
贾俊平《统计学》配套题库 【课后习题】详解 第9章~第10章【圣才出品】

第9章分类数据分析一、思考题1.简述列联表的构造与列联表的分布。
答:列联表是由两个以上的变量进行交叉分类的频数分布表。
列联表的分布可以从两个方面看,一个是观察值的分布,又称为条件分布,每个具体的观察值就是条件频数;一个是期望值的分布。
2.用一张报纸、一份杂志或你周围的例子构造一个列联表,说明这个调查中两个分类变量的关系,并提出进行检验的问题。
答:对三个生产厂甲、乙、丙提供的学习机的A、B、C 三种性能进行质量检验,欲了解生产厂家同学习机性能的质量差异是否有关系。
抽查了450部学习机次品,整理成为如表9-2所示的3×3列联表。
表9-2A B C 总计甲乙丙204015459065357070100200150总计75200175450根据抽查检验的数据表明:次品类型与厂家(即哪一个厂)生产是无关的(即是相互独立的)。
建立假设:H 0:次品类型与厂家生产是独立的,H 1:次品类型与厂家生产不是独立的。
次品类型生产厂可以计算各组的期望值,如表9-3所示(表中括号内的数值为期望值)。
表9-3各组的期望值计算表A B C 总计甲乙丙20(17)40(33)15(25)45(44)90(89)65(67)35(39)70(78)70(58)100200150总计75200175450所以2222(2017)(4033)(7058)9.821173358χ---=+++=…。
而自由度等于(R -1)(C -1)=(3-1)×(3-1)=4,若以0.01的显著性水平进行检验,查χ2分布表得20.01(4)13.277χ=。
由于220.019.821(4)13.277χχ=<=,故接受原假设H 0,即次品类型与厂家生产是独立的。
3.说明计算2χ统计量的步骤。
答:计算2χ统计量的步骤:(1)用观察值o f 减去期望值e f ;(2)将(o f -e f )之差平方;(3)将平方结果2)(e o f f -除以e f ;(4)将步骤(3)的结果加总,即得:22()o e ef f f χ-=∑。
(完整版)统计学贾俊平考研知识点总结

统计学重点笔记第一章导论一、比较描述统计和推断统计:数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。
(1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。
内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。
(2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。
研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。
其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。
(3)两者的关系:描述统计是基础,推断统计是主体二、比较分类数据、顺序数据和数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
(1)分类数据是只能归于某一类别的非数字型数据。
它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。
(2)顺序数量是只能归于某一有序类别的非数字型数据。
也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。
(3)数值型数据是按数字尺度测量的观察值。
其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。
总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。
三、比较总体、样本、参数、统计量和变量:(1)总体是包含所研究的全部个体的集合。
通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。
统计学第九章课后习题答案

9.1(1)设原假设为H:不同收入群体对某种特定商品的购买习惯相同:即不同收入群体对某种特定商品的购买习惯不完全相同H1(2)由SPSS计算可得χ2值为17.626(3)自由度=(3-1)×(4-1)=6,当α=0.1时,χ0.12(6)=10.64∵χ2=17.626>10.64=χ0.12(6)故拒绝原假设,即不同收入群体对某种特定商品的购买习惯不完全相同。
(4)由SPSS计算可得φ系数为0.183、c系数为0.180、V系数为0.1299.2解:设原假设为H0:现在情况与经验数据相比没有发生变化;H1:现在情况与经验数据相比发生了变化。
由已知条件可得χ2值为:χ2=(28−0.1×200)20.1×200+(56−0.2×200)20.2×200+(48−0.3×200)20.3×200+(36−0.2×200)20.2×200+(32−0.2×200)20.2×200=14P[χ2(5−1)>14]=0.007295<0.1=α,故拒绝原假设。
9.3设原假设为H0:π1=π2=π3=π4(即阅读习惯与文化程度无关)H1:π1,π2,π3,π4不完全相等(即阅读习惯与文化程度有关)表中各项的期望值:E11=n1×n1n=77×50254=15.16E12=n2×n1n=91×50254=17.91E13=n3×n1n=42×50254=8.27E14=n4×n1n=44×50254=8.66E21=n1×n2n=77×44254=13.34E22=n2×n2n=91×44254=15.76E23=n3×n2n=42×44254=7.28E24=n4×n2n=44×44254=7.62E31=n1×n3n=77×95254=28.80E32=n2×n3n=91×95254=34.04E33=n3×n3n=42×95254=15.71E34=n4×n3n=44×95254=16.46E41=n1×n4n=77×65254=19.70E42=n2×n4n=91×65254=23.29E43=n3×n4n=42×65254=10.75E44=n4×n4n=44×65254=11.26所以χ2=(6-15.16)2/15.16+(12-13.34)2/13.34+……+(13-11.26)2/11.26=31.86。
《统计学》完整袁卫-贾俊平

总体 N
N1 N2
n1
n2
样本 n
n1 n2 nk
等额
k
n ni
i 1
等比例
n1
Ni N
n
··· ···
N k nk
最优
n1
Ni
2 i
Ni
2 iBiblioteka n整群抽样方法:首先把总体中的N个单位划分成为若干个群, 并要求每个群对整个总体都具有代表性,然后对群进 行简单随机抽样,并对抽中群内的所有单位进行调查 研究。
1. 描述统计
关于搜集、展示一批数据,并反映这 批数据特征的各种方法,其目的是为 了正确地反映总体的数量特点。
2. 推断统计 根据样本统计量估计和推断总体参 数的技术和方法。
描述统计是推断统计的前提, 推断统计是描述统计的发展。
二、数据
(一) 为何需要数据 ?
统计学要研究各种随机变量,通过对这些随机变量的 观察所获取的数据包含了我们所需的信息,这些信息 能有助于我们在许多场合中做出更为正确的决策。
就是把定量数据按从大到小或从小到大的顺序排列, 把定性数据按习惯的文字顺序排列,便于我们研究其 条理。
统计分组
对于定性数据就是依据属性的不同将数据划分成若干 组,对于定量数据就是依据属性数值的不同将数据划 分成若干组。
组内同质性,组间差异性。
频数分布编制
分组的关键 变量的选择,选择与研究的问题有关的 变量 。 组限的确定。应遵循穷尽和互斥原则 。
就是把政府机构、各种组织和公司所公布的数据作为 来源,这种数据往往是次级数据。 2. 设计一次试验以获取必要的数据。
例如,在检验洗衣机洗净程度的研究中,研究人员通 过实际洗涤脏衣服,来研究哪种牌子的洗衣机效果最 佳。
统计学第六版贾俊平

精品教材
统计学
拟合优度检验
(例题分析)
H0: 1= 2= 3= 4 H1: 1234 不全相等 = 0.1 df = (2-1)(4-1)= 3 临界值(s):
=0.1
0 3.0319 6.215 c2
9 - 27
统计量:
r
c2
c (fij eij)2 3.0319
i1 j1
eij
结论:
可以认为广告后各公司产品
0
5.99 8.18 c
市场占有率发生显著变化
9 - 29
精品教材
统计学
拟合优度检验
(例题分析—用P值检验)
第1步:将观察值输入一列,将期望值输入一列 第2步:选择“函数”选项 第3步:在函数分类中选“统计”,在函数名中选
“CHITEST”,点击“确定” 第4步:在对话框“Actual_range”输入观察数据区域
的百分比,称为百分比分布
行百分比:行的每一个观察频数除以相应的行 合计数(fij / ri)
列百分比:列的每一个观察频数除以相应的列 合计数( fij / cj )
总百分比:每一个观察值除以观察值的总个数( fij / n )
9 - 15
精品教材
统计学
百分比分布
(图示)
行百分比
列百分比
总百分比
0.3000
e
36 0.9730 3.0319
合计:3.0319
精品教材
统计学
拟合优度检验
9 - 24
精品教材
统计学
品质数据的假设检验
品质数据
比例检验
一个总体 两个以上总体
Z 检验 Z 检验 c 检验
统计学第六版贾俊平 无水印

率各为1/2;投掷一枚骰子出现1~6点的频率 各为1/6 3. 农作物的产量与施肥量之间存在相关关系
统计方法
统计方法
描述统计
推断统计
参数估计
假设检验
描述统计
(descriptive statistics)
1. 内容
¥
? 搜集数据
50
? 整理数据
? 展示数据
25? 描述性分析2. 目的0? 描述数据特征
什么是统计学 ?
? 收集、分析、表述和解释数据的科学
1. 数据搜集:取得数据 2. 数据分析:分析数据 3. 数据表述:图表展示数据 4. 数据解释:结果的说明
statistics 的定义 (不列颠百科全书)
statistics : the science of collecting, analyzing, presenting, and interpreting data.
election forecasting and projection (选举预测和策划 )
engineering (工程)
epidemiology (流行病学 )
finance (金融)
fisheries research (水产渔业研究 )
gambling (赌博)
genetics (遗传学)
geography (地理学)
? 找出数据的基本规律
Q1 Q2 Q3 Q4
x = 30 s2 = 105
推断统计
(inferential statistics)
1. 内容
总体
? 参数估计
? 假设检验
2. 目的
? 对总体特征作出
统计学基础(第六版)教学课件第8章

2009
呈现出一定的抛物
2008
趋势;管理成本则
2007
现一定的指数变化
2005
净利润呈现一定的
2006
2005
线性趋势;产量呈
净利润
《统计学基础》(第六版)
管理成本
第8章
8.3 时间序列预测的程序和方法
确定时间序列的成分
4000
年份
8 - 13
第8章
《统计学基础》(第六版)
8.3 时间序列预测的程序和方法
84
60
233
2007
2938
124
73
213
➢
第2步,找出适合该时间序列的预测方法。
2008
3125
214
121
230
2009
3250
216
126
223
第3步,对可能的预测方法进行评估,以确定最
2010
3813
354
172
240
➢
2011
4616
420
218
208
佳预测方案。
2012
4125
514
110.94
110.61
109.60
110.29
110.50
110.00
108.61
—
119.87
133.41
148.01
163.71
179.42
197.89
218.63)根据式(8.5)得:
ҧ =
− 1 × 100 =
0
9
27563
− 1 × 100 = 11.26%
2021/11/5
《统计学》课后答案(第二版,贾俊平版)附录答案第6章-9章方差分析

《统计学》课后答案(第二版,贾俊平版)附录答案第6章-9章方差分析第6章方差分析6.1 0215.86574.401.0=<=F F (或01.00409.0=>=-αvalue P ),不能拒绝原假设。
6.2 579.48234.1501.0=>=F F (或01.000001.0=<=-αvalue P ),拒绝原假设。
6.3 4170.50984.1001.0=>=F F (或01.0000685.0=<=-αvalue P ),拒绝原假设。
6.4 6823.37557.1105.0=>=F F (或05.0000849.0=<=-αvalue P ),拒绝原假设。
6.5 8853.30684.1705.0=>=F F (或05.00003.0=<=-αvalue P ),拒绝原假设。
85.54.14304.44=>=-=-LSD x x B A ,拒绝原假设;85.58.16.424.44=<=-=-LSD x x C A ,不能拒绝原假设;85.56.126.4230=>=-=-LSD x x C B ,拒绝原假设。
6.6554131.3478.105.0=<=F F (或05.0245946.0=>=-αvalue P ),不能拒绝原假设。
第7章相关与回归分析7.1 (1)散点图(略),产量与生产费用之间正的线性相关关系。
(2)920232.0=r 。
(3)检验统计量2281.24222.142=>=αt t ,拒绝原假设,相关系数显著。
7.2 (1)散点图(略)。
(2)8621.0=r 。
7.3 (1)0?β表示当0=x 时y 的期望值。
(2)1?β表示x 每变动一个单位y 平均下降0.5个单位。
(3)7)(=y E 。
7.4 (1)%902=R 。
(2)1=e s 。
7.5 (1)散点图(略)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
列边缘分布
列观察值的合计数的分布 例如,四个分公司接受调查的人数分别为 100 人, 120 人, 90人,110人
2. 条件分布与条件频数
变量 X 条件下变量 Y 的分布,或在变量 Y 条件下变 量 X 的分布 每个具体的观察值称为条件频数
9 - 13
精品教材
统计学
条件频数
观察值的分布
9 - 27
c2
可以认为四个分公司对改革方 案的赞成比例是一致的
精品教材
统计学
拟合优度检验
(例题分析)
【例】为了提高市场占有率, A 公司 和B 公司同时开展了广告宣传。在广 告宣传战之前, A 公司的市场占有率 为 45% , B 公司的市场占有率为 40% ,其他公司的市场占有率为15%。为 了了解广告战之后 A 、 B 和其他公司 的市场占有率是否发生变化,随机抽 取了 200 名消费者,其中 102 人表示 准备购买A公司产品,82人表示准备 购买B公司产品,另外16人表示准备 购买其他公司产品。检验广告战前后 各公司的市场占有率是否发生了变化 ( 0.05)
(例题分析)
统计量:
c 2
i 1 j 1 r c
H0:地区与原料等级之间独立 H1:地区与原料等级之间不独立 = 0.05 df = (3-1)(3-1)= 4 临界值(s): =0.05
( f ij eij ) 2 eij
19.82
决策:
在 = 0.05的水平上拒绝H0
9 - 28
精品教材
统计学
拟合优度检验
(例题分析)
H0: 1=0.45 2=0.4 3= 0.15 统计量: H1:原假设中至少有一个不成立 r = 0.1 c2 df = (2-1)(3-1)= 2 i 1 临界值(s):
j 1
c
( f ij eij ) 2 eij
8.18
学习目标
拟合优度检验 独立性检验
3. 测度列联表中的相关性
9-3
精品教材
统计学
数据的类型与列联分析
数据
定量数据
(数值型数据)
定性数据
(品质数据)
离散数据
9-4
连续数据
列联分析
精品教材
统计学
分类数据
例如:性别 (男, 女)
1. 分类变量的结果表现为类别 2. 各类别用符号或数字代码来测度 3. 使用分类或顺序尺度
1. 2. 3. 4. 5.
列联表
(contingency table)
由两个以上的变量交叉分类的频数分布表 行变量的类别用 r 表示, ri 表示第 i 个类别 列变量的类别用 c 表示, cj 表示第 j 个类别 每种组合的观察频数用 fij 表示 表中列出了行变量和列变量的所有可能的组 合,所以称为列联表 6. 一个 r 行 c 列的列联表称为 r c 列联表
一分公司 二分公司 三分公司 四分公司 赞成该方案 反对该方案
合计 279 141 420
68 32
75 75
57 33
79 31
合计
9 - 11
100
120
90
110
精品教材
统计学
列联表的分布
9 - 12
精品教材
统计学
1. 边缘分布
观察值的分布
行边缘分布
行观察值的合计数的分布 例如,赞成改革方案的共有279人,反对改革方案的141人
(r c 列联表的一般表示)
列(cj) 合计
j =1
j=2
…
… … : …
i =1 i=2 : 合计
9 - 10
f11 f21
:
f12 f22
:
r1 r2
:
c1
c2
n
fij 表示第 i 行第 j 列的观察频数
精品教材
统计学
列联表
(例题分析)
【例】一个集团公司在四个不同的地区设有分公司,现该集 团公司欲进行一项改革,此项改革可能涉及到各分公司的利 益,故采用抽样调查方式,从四个分公司共抽取 420个样本 单位(人),了解职工对此项改革的看法,调查结果如下表
r1 c1 n n
由于观察频数的总数为n ,所以f11 的期望频数 e11 应为
r1 c1 r1c1 279 100 e11 n 66.43 66 420 n n n
9 - 18
精品教材
决策:
=0.05 在 = 0.05的水平上拒绝H0
结论:
0
9 - 29
5.99 8.18
c
可以认为广告后各公司产品 市场占有率发生显著变化
精品教材
统计学
拟合优度检验
(例题分析—用P值检验)
第1步:将观察值输入一列,将期望值输入一列 第2步:选择“函数”选项 第3步:在函数分类中选“统计”,在函数名中选 “CHITEST”,点击“确定” 第4步:在对话框“Actual_range”输入观察数据区域 在对话框“Expected_range”输入期望数据区域 得到P值为0.016711,所以拒绝原假设
(图示)
行边缘分布
一分公司 二分公司 三分公司 四分公司 赞成该方案 反对该方案
合计 279 141 420
68 32
75 75
57 33
79 31
合计
100
120
90
110
列边缘分布
9 - 14
精品教材
统计学
百分比分布
(概念要点)
1. 条件频数反映了数据的分布,但不适合对比 2. 为在相同的基数上进行比较,可以计算相应 的百分比,称为百分比分布
i 1 j 1 r c
H0: 1= 2= 3= 4 H1: 1234 不全相等 = 0.1 df = (2-1)(4-1)= 3 临界值(s):
=0.1
( f ij eij ) 2 eij
3.0319
决策:
在 = 0.1的水平上不能拒绝H0
结论:
0 3.0319 6.215
9 - 22
— 列联表中第i行第j列类别的实际频数
eij — 列联表中第i行第j列类别的期望频数
精品教材
统计学
实际频数 期望频数
c 统计量
(例题分析)
(eij)
66 80 60 73 34 40 30 37
(fij)
68 75 57 79 32 45 33 31
9 - 23
fij - eij
2 -5 -3 6 -2 5 3 -6
统计学
期望频数的分布
(例题分析)
一分公司 二分公司 三分公司 四分公司
赞成该 方案
实际频数 期望频数
实际频数 期望频数
68 66
32 34
75 80
75 40
57 60
33 30
79 73
31 37
反对该 方案
9 - 19
精品教材
统计学
9.2 拟合优度检验
一. c 统计量
二. 拟合优度检验
9 - 20
结论:
i 1 j 1
r
c
( f ij eij ) 2 eij
进行决策
9 - 32
根据显著性水平和自由度(r-1)(c-1)查出临界值c2 若c2c2,拒绝H0;若c2<c2,接受H0
精品教材
统计学
独立性检验
(例题分析)
【例】一种原料来自三个不同的地区,原料质量被分成三个 不同等级。从这批原料中随机抽取 500件进行检验,结果如 下表。检验各地区与原料之间是否存在依赖关系( 0.05)
9 - 24
精品教材
统计学
品质数据的假设检验
品质数据
比例检验
一个总体 两个以上总体
独立性检验
Z 检验
Z 检验
两个总体
c 检验
c 检验
9 - 25
精品教材
统计学
拟合优度检验
(goodness of fit test)
1. 检验多个比例是否相等 2. 检验的步骤
提出假设
H0:1 = 2 = … = j;H1: 1 , 2 , … , j 不全相等
(fij - eij)2 4 25 9 36 4 25 9 36
(fij- eij)2
f
0.0606 0.3125 0.1500 0.4932 0.1176 0.6250 0.3000 0.9730
2 ( f e ) c2 e 3.0319
合计:3.0319
精品教材
统计学
拟合优度检验
地区
甲地区
乙地区 丙地区
一级
二级
三级
合计
52
60 50
64
59 65
24
52 74
140
171 189 500
合计
9 - 33
162
188
150
精品教材
统计学
1. 提出假设
独立性检验
(例题分析)
H0:地区与原料等级之间独立 H1:地区与原料等级之间不独立
2. 计算检验的统计量
c
2 i 1 j 1 r c
用Excel计算p值
9 - 30精品教材 Nhomakorabea统计学
9.3 独立性检验
9 - 31
精品教材
统计学
1. 2.
独立性检验
(test of independence)
检验列联表中的行变量与列变量之间是否独立 检验的步骤为