应用统计学第九章分类数据分析-学生版
应用统计学:经济与管理中的数据分析9

0.49
3.24 1.21 16.00 2.56 0.25 1.96 0.25 0.49 0.64 —
0.0860
0.2746 0.0676 0.7619 0.1376 0.0200 0.3063 0.1000 0.7000 3.2000 5.9255
解:
①建立原假设与备择假设 H0:男青年身高分布服从N( , 2); H1:男青年身高分布不服从N( , 2); ②因为总体参数 、2均未知,须以样本平均数 x 和样本 s 2 56.7 方差s2作为它们的估计量。易算得 x 170.28 , ③若H0成立,则总体分布在各组区间上的概率P1可以通过 下面的过程求得:
表9-1 200名顾客购买偏好的观察频数 观察频数 A工厂的 B工厂的 C工厂的 产品 产品 产品 48 98 54 ③ 现在进行拟合优度检验,计算200名顾客的购 买偏好的期望,结果如表9-2所示 期望频数 A工厂的 B工厂的产 C工厂的 产品 品 产品 0.30=60 0.50=100 0.20=40
144 4 196 —
2.40 0.04 4.90 7.34
⑤ 2检验统在显著性水平α=0.05 下,查2分布表,自由度为 k-1=3-1=2,相应的20.05 =5.99,有2=7.44> 2 α 所以拒绝H0,认为C工厂引进的新产品将改变当前市场份额
二、泊松分布拟合优度检验
泊松分布拟合优度检验:这里我们在假定总体分 布服从泊松分布的情况下,阐述利用 统计量来进 行拟合优度检验。注意,泊松分布只有一个参数, 如果参数未知,则需要事先通过收集的样本资料 对其进行估计。
P1 P(148 ≤ X ≤ 152) 152 170.28 148 170.28 P ≤z≤ 7.53 7.53 P(2.96 ≤ z 2.43) 0.449 0.493 0.006
应用统计学 第九章 回归分析

1 的置信水平下,可以认为总体上两个变量之间是线性相关的。如果 | t | t/2 ,则表明相关
系数 在统计上是不显著的,也就是说在 1 的置信水平下,不能认为总体上两个变量之间是
线性相关的。
由表9-1中的样本数据所计算出来的样本相关系数为: r 0.945 。在 0.05 的显著性
水平上进行相关系数显著性检验的步骤如下。
析
度的线性相关关系;而当 0.75 | r |1 时,则认为变量间的线性相关关系很强。
20
第一节 相关分析概述
第 九 章
三、相关系数的显著性检验
回
归 分
若总体中两个变量的全部取值已知,则可以根据总体的数据计算出两个变量之间相关系数
析
的理论真值。但这在现实中是做不到的,也就是说,两变量之间总体上的相关系数的理论真
关联起来,估计出不同收入水平居民家庭的“平均每户每月日用杂货支出”,这才符合分析报告
写作的要求。“每月日用杂货支出”与“月收入”两变量的样本数据如表9-1所示。
目
录
页
2
CONTENTS PAGE
目
录
页
3
CONTENTS PAGE
目
录
页
4
CONTENTS PAGE
相关分析概 回归模型与
述
回归方程
若总体相关系数等于零,则与样本相关系数有关的上述t统计量的值就不应过大或过小,
回 归
因为t统计量过大或过小都是总体上两个变量之间具备线性相关关系的证据。因此,给定一个
分 析
显著性水平 ,就可以在自由度为 n 2 的t分布下,确定衡量这个t统计量的值过大或过小的
一个标准,即临界值 t /2 。如果 | t | t/2 ,则表明相关系数r在统计上是显著的,也就是说在
贾俊平《统计学》(第7版)考研真题与典型题详解 第9章~第10章【圣才出品】

这个表格是( )。 A.4×3 列联表 B.3×2 列联表 C.2×3 列联表 D.3×4 列联表 【答案】B 【解析】表中的行是态度变量,这里划分为三类,即赞成、中立和反对;表中的列是单 位变量,这里划分为两类,即男同学和女同学,因此这个表格是 3×2 列联表。
2 / 60
圣才电子书
十万种考研考证电子书、题库视频学习平台
第 9 章 分类数据分析
一、单项选择题 1.列联分析是利用列联表来研究( )。 A.两个数值型变量的关系 B.两个分类变量的关系 C.两个数值型变量的分布 D.一个分类变量和一个数值型变量的关系 【答案】B 【解析】列联表是由两个或以上的变量进行交叉分类的频数分布表,列联分析是利用列 联表来研究两个分类变量之间的关系。
10.某大学为了解男女毕业生对开设《职业规划》这门课程的看法,分别抽取了 500 名男学生和 500 名女学生进行调查,得到的结果如表 9-7 所示。
表 9-7 关于开设《职业规划》课子书、题库视频学习平台
如果要检验男女毕业生对开设《职业规划》这门课程的看法是否相同,即检验假设 H0: π1=π2=850/1000=0.85,χ2 检验统计量的自由度是( )。
表 9-5
根据这个列联表计算的χ2 统计量的值为( )。 A.0.6176 B.1.2352 C.2.6176 D.3.2352 【答案】B 【解析】非参数检验中的χ2 拟合优度检验和可以应用于列联表的独立性检验来测定两 个分类变量之间的相关程度。用 fo 表示观察值频数,用 fe 表示期望值频数,则χ2 统计量为:
4 / 60
圣才电子书 十万种考研考证电子书、题库视频学习平台
【解析】赞成研究生奖学金制度改革的行百分比分别为:(90/174)×100%=51.7%; (84/174)×100%=48.3%。
《分类数据分析》PPT课件 (2)

精选课件ppt
2
分类数据分析的应用范围
政治学领域:研究政治立场是否影响政治派别。 社会学和心理学领域:分析不同类别的人不同的心理
特征。 公共政策分析领域:研究不同政策在不同地区产生的
效果。 文化传播领域:研究人们对媒体的看法。 分类数据分析是社会科学中最重要的课题之一。一方
面因为它的用途广泛,另一方面因为它解决的是基本 问题
PRE是不对称的,即需要区分自变量和 因变量。
在样本高度不均匀时,会出现不独立但 是结果为0的情况。
精选课件ppt
31
Goodman and Kruskal’s Lambda
Lambda方法是PRE方法的一种,原理是分别计算在 两种情况下预测错误的比例,然后进行比较。
X
c
d
Totals
Y
a
0.3 0.1 0.4
民主党
X:党派 独立党
共和党
革命的
Y:
场 立
中立的
保守的
33% (193)
41% (241)
26% (153)
100% (587)
30% (161)
37% (199)
34% (182)
100% (542)
11% (46)
33% (134)
56% (229)
100% (409)
400 574 564 1538
y
j1
(1Pm)
j1 (1Pm)
J
J
(1Pm)(1 Pim ) 1 (1Pm)
J
( nmj ) nm
ˆy
j 1
(n nm )
精选课件ppt
33
Lambda的方差
J
贾俊平《统计学》(第5版)课后习题-第9章 分类数据分析【圣才出品】

第9章 分类数据分析一、思考题1.简述列联表的构造与列联表的分布。
答:列联表是由两个以上的变量进行交叉分类的频数分布表。
列联表的分布可以从两个方面看,一个是观察值的分布,又称为条件分布,每个具体的观察值就是条件频数;一个是期望值的分布。
2.用一张报纸、一份杂志或你周围的例子构造一个列联表,说明这个调查中两个分类变量的关系,并提出进行检验的问题。
答:对三个生产厂甲、乙、丙提供的学习机的A、B、C三种性能进行质量检验,欲了解生产厂家同学习机性能的质量差异是否有关系。
抽查了450部学习机次品,整理成为如表9-2所示的3×3列联表。
表9-2根据抽查检验的数据表明:次品类型与厂家(即哪一个厂)生产是无关的(即是相互独立的)。
建立假设:H0:次品类型与厂家生产是独立的,H1:次品类型与厂家生产不是独立的。
可以计算各组的期望值,如表9-3所示(表中括号内的数值为期望值)。
表9-3 各组的期望值计算表所以2222(2017)(4033)(7058)9.821173358χ---=+++=…。
而自由度等于(R -1)(C -1)=(3-1)×(3-1)=4,若以0.01的显著性水平进行检验,查χ2分布表得20.01(4)13.277χ=。
由于220.019.821(4)13.277χχ=<=,故接受原假设H 0,即次品类型与厂家生产是独立的。
3.说明计算2χ统计量的步骤。
答:计算2χ统计量的步骤:(1)用观察值o f 减去期望值e f ;(2)将(o f -e f )之差平方;(3)将平方结果2)(e o f f -除以e f ;(4)将步骤(3)的结果加总,即得:22()o e ef f f χ-=∑。
4.简述ϕ系数、c 系数、V 系数的各自特点。
答:(1)ϕ相关系数是描述2×2列联表数据相关程度最常用的一种相关系数。
它的计算公式为:ϕ,式中,∑-=ee of f f 22)(χ;n 为列联表中的总频数,也即样本量。
《统计学》(贾俊平第七版)课后题及答案-统计学课后答案第七版

第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。
2.解释描述统计与推断统计。
描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计研究的是如何利用样本数据来推断总体特征的统计方法。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。
4.解释分类数据、顺序数据和数值型数据的含义。
分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。
5.举例说明总体、样本、参数、统计量、变量这几个概念。
总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。
6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。
分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。
7.举例说明离散型变量和连续型变量。
离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。
使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。
2.比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
《应用统计学教学资料》统计学 第九章 分类数据分析

本PPT课件仅供学习用 本PPT课件仅供学习用 本PPT课件仅供学习用
学完请删除!
学习目标
本章学习目标
➢ 理解分类数据与χ2 统计量 ➢ 掌握拟合优度检验及其应用 ➢ 掌握性检验及其应用 ➢ 掌握测度列联表中的相关性
2
9.1 理解分类数据与χ2 统计量 3
【例】1912年4月15日,豪华巨轮泰坦尼克号与冰 山相撞沉没。当时船上共有共2208人,其中男性 1738人,女性470人。海难发生后,幸存者为718 人,其中男性374人,女性344人,以的显著性水
平检验存活状况与性别是否有关。 ( 0.05)
10
9.2 拟合优度检验
习题
答案
解:要回答观察频数与期望频数是否一致,
(a b)(c d )(a c)(b d )
22
9.4 φ 相关系数
➢将入 相关系数的计算公式得
2
ad bc
n (a b)(c d )(a c)(b d)
▪ad 等于 bc , = 0,表明变量X 与 Y 之间 ▪若 b=0 ,c=0,或a=0 ,d=0,意味着各观察频数全 部落在对角线上,此时| | =1,表明变量X 与 Y 之间 完全相关
并随行数和列数的增大而增大 ▪ 根据不同行和列的列联表计算的列联系数不
便于比较
25
9.4 V 相关系数(V correlation coefficient)
1. 计算公式为
V
2
n min (r 1),(c 1)
式中:min (r 1), (c 1) 表示取(r 1), (c 1)中较小的一个
检验如下假设:
H0:观察频数与期望频数一致 H1:观察频数与期望频数不一致
贾俊平《统计学》章节题库(分类数据分析)详解【圣才出品】

第9章分类数据分析一、单项选择题1.列联分析是利用列联表来研究()。
A.两个数值型变量的关系B.两个分类变量的关系C.两个数值型变量的分布D.一个分类变量和一个数值型变量的关系【答案】B【解析】列联表是由两个或以上的变量进行交叉分类的频数分布表,列联分析是利用列联表来研究两个分类变量之间的关系。
2.列联表中的每个变量()。
A.只能有一个类别B.只能有两个类别C.对类别没有限制D.可以有两个或两个以上的类别【答案】D3.设列联表的行数为3,列数为4,则χ2检验的自由度为()。
A.3B.4C.6D.12【答案】C【解析】列联分析中,χ2检验的自由度=(行数-1)(列数-1)=(R-1)(C-1)=(3-)×(4-1)=6。
4.一所大学准备采取一项学生对餐厅改革意见的调查,为了解男女学生对这一措施的看法,分别抽取了300名男学生和240名女学生进行调查,得到的结果如表9-1所示。
这个表格是()。
A.4×3列联表B.3×2列联表C.2×3列联表D.3×4列联表【答案】B【解析】表中的行是态度变量,这里划分为三类,即赞成、中立和反对;表中的列是单位变量,这里划分为两类,即男同学和女同学,因此这个表格是3×2列联表。
5.一所大学为了解男女学生对后勤服务质量的评价,分别抽取了300名男学生和240名女学生进行调查,得到的结果如表9-2所示。
这个列联表的最下边一行称为()。
A.总频数B.条件频数C.行边缘频数D.列边缘频数【答案】D6.某中学为了解教师对新课标改革的看法,分别抽取了300名男教师和240名女教师进行调查,得到的结果如表9-3所示。
这个列联表的最右边一列称为()。
A.总频数B.条件频数C.行边缘频数D.列边缘频数【答案】C7.某大学为了解学生对研究生奖学金制度改革的看法,分别抽取了300名男研究生和240名女研究生进行调查,得到的结果如表9-4所示。