《商务统计分析》课件—07分类数据分析
合集下载
商务数据分析图表PPT模板

请输入标题
您的内容请写在这里您的内容请写在这 里您的内容请写在这里您的内容
Please enter your title here, and edit the text according to logical thinking, pay attention to left-right alignment.
7 6 5 4 3 2 1 0
一季度
二季度
三季度
2018年 2019年
四季度
各组事迹对照
39%
20%
15%
30%
输入小标题
Please enter your title here, and edit the text according to logical thinking, pay
attention to left-right
01
02
A
B
C
D
输入小标题
Please enter your title here, and edit the text according to logical thinking, pay attention to left-right
alignment,
03
04
05
输入小标题
Please enter your title here, and edit the
08
09
10
20XX年每个月成交量对照
01
02
03
04
05
06
07
08
09
10
A
B
C
请输入标题
Please enter your title here, and edit the text according to logical thinking, pay attention to left-right alignment.
商务数据分析PPT

汇报人:
汇报时间:xx年xx月
CONTENTS
01 年度工作概述 Add your the title
03 成功项目展示 Add your the title
02 工作完成情况 Add your the title
04 明年工作计划 Add your the title
Part 01
年度工作概述
70% 50% 20% 10%
明年工作计划
添加标题
此处添加详细文本描述,建议 与标题相关并符合整体语言风 格,
添加标题
此处添加详细文本描述,建议 与标题相关并符合整体语言风 格,
添加标题
此处添加详细文本描述,建 议与标题相关并符合整体语 言风格,
添加标题
此处添加详细文本描述,建议 与标题相关并符合整体语言风 格,
请替换文字内容
Please replace text, click add relevant headline, modify the text content, also can copy your content to this directly.
请替换文字内容
Please replace text, click add relevant headline, modify the text content, also can copy your content to this directly.
标题四
文字是简单的熊猫图案再现 口语的 声音,因而更加清晰,
文字是简单的熊猫图案再现 口语的 声音,因而更加清晰,
成功项目展示
单击添加文本单击添加文本单击添加文本单击添加文本单击添加文本单击添加单击添加文本单击添加文本 单击添加文本单击添加文本单击添加文本单击添加
商务数据分析报告PPT模板

LOGO
CONTENTS
1 工作内容概述
Your content is typed here
3 市场数据分析
Your content is typed here
2 工作重点介绍
Your content is typed here
4 下步工作计划
Your content is typed here
LOGO
LOGO
PART.03
市场数据分析
Your content is typed here
Looking back at this stage of our work, we are aware of the shortcomings and problems in our work, and looking ahead to the next stage, we will continue our efforts and strive to take our work to a new level
添加标题
点击输入本栏的具体文字,简明扼要的说明分项内 容,请根据您的具体内容酌情修改。
市场数据分析
Your content is typed here
01.添加标题
点击输入本栏的具体文字,简 明扼要的说明分项内容,请根 据您的具体内容酌情修改。
02.添加标题
点击输入本栏的具体文字,简 明扼要的说明分项内容,请根 据您的具体内容酌情修改。
03.添加标题
点击输入本栏的具体文字,简 明扼要的说明分项内容,请根 据您的具体内容酌情修改。
04.添加标题
点击输入本栏的具体文字,简 明扼要的说明分项内容,请根 据您的具体内容酌情修改。
05.添加标题
商务通用数据分析工作汇报PPT

ADD THE TITLE WORDS
Click On Add Related Title Words点击添加相关标题文字
ADD THE TITLE WORDS
Click On Add Related Title Words点击添加相关标题文字
ADD THE TITLE WORDS
About Company
请替换文字内容
请替换文字内容
请替换文字内容
Click On Add Related Title Words点击添加相关标题文字
ADD THE TITLE WORDS
请替换文字内容
请替换文字内容
请替换文字内容
01
02
03
Click On Add Related Title Words点击添加相关标题文字
Your Sub Title
LOREM IPSUM DOLOR sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam,
请替换文字内容
输入文本内容
输入文本内容
输入文本内容
输入文本内容
请替换文字内容
请替换文字内容
请替换文字内容
请替换文字内容
请替换文字内容
请替换文字内容
请替换文字内容
Click On Add Related Title Words点击添加相关标题文字
ADD THE TITLE WORDS
点击请替换文字内容
请替换文字内容
请替换文字内容
请替换文字内容
Click On Add Related Title Words点击添加相关标题文字
ADD THE TITLE WORDS
Click On Add Related Title Words点击添加相关标题文字
ADD THE TITLE WORDS
About Company
请替换文字内容
请替换文字内容
请替换文字内容
Click On Add Related Title Words点击添加相关标题文字
ADD THE TITLE WORDS
请替换文字内容
请替换文字内容
请替换文字内容
01
02
03
Click On Add Related Title Words点击添加相关标题文字
Your Sub Title
LOREM IPSUM DOLOR sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam,
请替换文字内容
输入文本内容
输入文本内容
输入文本内容
输入文本内容
请替换文字内容
请替换文字内容
请替换文字内容
请替换文字内容
请替换文字内容
请替换文字内容
请替换文字内容
Click On Add Related Title Words点击添加相关标题文字
ADD THE TITLE WORDS
点击请替换文字内容
请替换文字内容
请替换文字内容
请替换文字内容
商务统计学ppt课件

精选ppt课件
17
统计的应用领域
hydrology(水文学)
industry(工学)
linguistics(语言学)
literature(文学)
manpower planning(劳动力计划)
management science(管理科学)
marketing(市场营销学)
medical diagnosis(医学诊断)
称
离散变量:取有限个值 连续变量:可以取无穷多个值
精选ppt课件
30
统计中的几个基本概念
总体(参数) 平均数 μ 标准差 σ 比例 Π
样本(统计量) ¯x s p
精选ppt课件
31
几个常用的统计软件 (software)
典型的统计软件
SAS SPSS MINITAB STATISTICA EXCEL
所研究的全部元素的集合,其中的每一个元素称为 个体
分为有限总体和无限总体
有限总体的范围能够明确确定,且元素的数目是有限的 无限总体所包括的元素是无限的,不可数的
2、样本(sample)
从总体中抽取的一部分元素的集合 构成样本的元素的数目称为样本容量
精选ppt课件
28
参数和统计量
1、参数(parameter)
商务统计学 Business Statistics
精选ppt课件
1
参考书籍:
• 商务统计学 戴维.M.莱文等著 贾俊平改编
•
中国人民大学出版社
• 统计学原理 谢启南 主编 暨南大学出版社
• 统计学原理 贾俊平 中国人民大学出版社
精选ppt课件
2
成绩评定方法
• 1.闭卷考试成绩(70%) • 2.平时作业、考勤和上机。(30%)
商务统计学教学课件

(三)指标体系中指标的分类
• 1、水平指标——(1)存量指标与流量 指标,(2)实物指标与价值指标。
• 2、比率指标——(1)比例相对指标, (2)比值相对指标,(3)动态相对指 标,(4)弹性相对指标,(5)强度相 对指标。
(四)指标体系设计的内容
1、确定统计指标体系的框架; 2、确定每一个指标的内涵和外延; 3、确定每个统计指标的计量单位; 4、确定每个统计指标的计算方法。
N0 CNn
(四)泊松分布
泊松分布是稀有事件出现次数的理 论分布模型,如自然灾害、意外事故、 机器故障等事件出现的次数都近似地服 从泊松分布。泊松分布概率模型为:
Pxmm e
m!
六、连续变量概率分布模型
连续型随机变量的取值范围可以是数轴上的 某个区间,也可以是整个数轴。由于它可以取 无穷多个不同的数值,所以描述其概率分布的 最完善方法是概率函数式。在理论分析中,描 述连续变量概率分布的最常用的概率函数式是 概率分布密度函数。
P x n 1 C n n 1p n 1 q n 0
(三)超几何分布
假设0-1总体中共有N个个体,其中取
“是”值的个体有N1个,取“非”值的 个体有N0个。现从不放回地随机抽取n个 个体,记x为取“是”值的个体数目,则
其 中 恰 有 n1 个 个 体 取 “ 是 ” 值 、 且 有 n0=n-n1个个体取“非”值的概率为:
二、统计学的作用
• (一)统计学在科学研究中的作用——提出假 说并判定假说的正确与否
• (二)统计学在生产中的作用——通过试验分 析找出最佳工艺,并对生产过程进行统计质量 控制。
• (三)统计学在管理中的作用——抽样调查了 解社会与市场,为决策提供依据;并可建立各 种社会与经济发展模型,定量地模拟社会与经 济的运行,既可分析社会与经济的发展及其结 构变化,又可进行政策效果的评价。
商务数据分析课件:分类模型应用

商务数据分析
5. 模型评价
• 案例通过精确度(Accuracy)、F值(F-value)、召回率(Recall)、 准确率(Precision)和AUC来评估模型性能。
• 从分类的整体准确度来看,神经网络的分类准确率达到70%以上,并且 优于其他算法;
• 使用了不平衡数据的处理后,代价敏感函数和集成方法取得了较好的 提升,而过采样和欠采样的处理对分类结果并无正面影响。
3. 数据预处理
商务数据分析
• (1)数据集成
• 将分属于不同数据表中的数据进行集成,依据各类编码,将所需 要的信息汇总到一个表上。
• (2)数据清洗
• 对集成后的数据进行数据缺失值、异常值的处理。具体操作如下:
• (I)删除严重缺失信息的特征; • (II)删除严重缺失的记录; • (III)删除存在异常值属性的记录; • (IV)填充空白未知类属性。
6.案例小结
商务数据分析
• 本案例将某保险公司的客户按照客户价值理论进行细分,选择客户 的总保险费和理赔得分两个变量分别代表客户的当前价值和潜在价 值,以此聚类得到客户的分类特征,最后利用分类算法构建新客户 的分类模型。由实验过程及结果对比分析可以得出以下结论:
• 首先,保险客户根据保费和理赔次数可以明显地分为四类,符合客户价值 矩阵理论,最有价值一类客户,即保费高、理赔少的客户只占到所有客户 的1%,大部分占到70%以上的客户都是保费较少的普通客户。
• (II)离散化
• 属性如车辆使用年限、座位数和排量有现实含义,可以根据车辆管理部门的规 定对连续型数据进行划分。
• 属性如年龄、使用年限,可以通过等宽或等频方式实现离散化。
• (III)标准化
• 利用标准化操作,将保险费映射到[0,9]区间上。
500页微立体商务汇报数据分析统计图表课件PPT模板

标题
标题
标题
标题
点击添加文字说明详情介绍点击添加文字说明详情介绍点击添加文字文字说明详情介绍
点击添加文字说明详情介绍点击添加文字说明详情介绍点击添加文字文字说明详情介绍
点击添加文字说明详情介绍点击添加文字说明详情介绍点击添加文字文字说明详情介绍
单击添加详细文字说明,或复制文本黏贴自此右键只保留文字单击添加详细文字说明,或复制文本黏贴自此右键只保留文字单击添加详细文字说明,或复制文本黏贴自此右键只保留文字单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
单击添加详细文字说明或复制文本黏贴自此右键只保留文字单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
在此添加标题
单击添加详细文字说明,或复制文本黏贴自此右键只保留文字单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
添加标题
在此添加标题
单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
在此添加标题
单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
在此添加标题
单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
在此添加标题
单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
点击添加您的标题
添加文本信息单击此处添加对图片的说明文字单击此处添加对图片的说明文字单击此处添加对图片的说明文字
专业能力
执行力
工作热情
专业能力
单击此处 / 添加标题样式
单击此处 / 添加标题样式
单击此处 / 添加标题样式
单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
标题
标题
标题
点击添加文字说明详情介绍点击添加文字说明详情介绍点击添加文字文字说明详情介绍
点击添加文字说明详情介绍点击添加文字说明详情介绍点击添加文字文字说明详情介绍
点击添加文字说明详情介绍点击添加文字说明详情介绍点击添加文字文字说明详情介绍
单击添加详细文字说明,或复制文本黏贴自此右键只保留文字单击添加详细文字说明,或复制文本黏贴自此右键只保留文字单击添加详细文字说明,或复制文本黏贴自此右键只保留文字单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
单击添加详细文字说明或复制文本黏贴自此右键只保留文字单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
在此添加标题
单击添加详细文字说明,或复制文本黏贴自此右键只保留文字单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
添加标题
在此添加标题
单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
在此添加标题
单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
在此添加标题
单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
在此添加标题
单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
点击添加您的标题
添加文本信息单击此处添加对图片的说明文字单击此处添加对图片的说明文字单击此处添加对图片的说明文字
专业能力
执行力
工作热情
专业能力
单击此处 / 添加标题样式
单击此处 / 添加标题样式
单击此处 / 添加标题样式
单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
单击添加详细文字说明,或复制文本黏贴自此右键只保留文字
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 对于两个分类变量的分析,主要是判断两个分类变量是否独立。 比如学生存在逃课与否的情况,学生又有性别之分。是否逃课和 性别就是两个分类变量。我们关心两者是否有关联,是不是某个 性别的学生逃课更加频繁。
• 独立性检验(test of independence):对于两个分类变量的分
析,主要是判断两个分类变量是否有关联。
0.05的临界值为7.815,所以未落入拒绝域。同样可以得到p=0.532>α=0.05,
所以不能拒绝 H0,即观察频数和期望频数之间的差异可能归因于随机因素,
顾客在四种主食之间是没有明显偏好的。
• 注意拟合优度检验除了可以处理期望频数相同的数据,同样可以处理 期望频数不同的分类数据。
7
7.2 两个分类变量的独立性检验
第7章 分类数据分析
1
第7 章 分类数据分析——目录
7.1 一个分类变量的拟合优度检验 7.2 两个分类变量的独立性检验 7.3 卡方检验中需要注意的地方
2
7.1 一个分类变量的拟合优度检验
• 当只研究一个分类变量时,利用 检验来判断各类别的 观察频数与期望频数是否一致。比如,各年度的汽车 销售量是否符合均匀分布、不同高校的就业率是否有 显著差异。
8
7.2 两个分类变量的独立性检验
➢ 独立性检验的原假设和备择假设的一般形式如下:
H0:变量A和变量B独立 H1:变量A和变量B不独立
➢ 独立性检验的检验统计量如下:
2
( f0 fe )2 . fe
式中,f0表示观察频数,fe表示期望频数,该统计量服 从自由度为 (r-1)(c-1)的 分布,r为行数,c为列数。
女性
合计
甜葡萄酒
51
39
90
半干葡萄酒
56
21
77
干葡萄酒
25
8
33
合计
132
68
200
解:首先提出如下假设:
H0 :饮酒者性别与葡萄酒偏好独立 H1:饮酒者性别与葡萄酒偏好不独立
11
7.2 两个分类变量的独立性检验
SPSS输出的结果如表7-5和表7-6所示:
表7-5 饮酒者性别与葡萄酒偏好的频数分布 饮酒者性别 * 葡萄酒偏好 交叉制表
表7-1 120人样本中最爱点的主食
最爱点的主食
频数
杂粮
24
面条
29
米饭
32
馒头
35
合计
120
解:首先提出如下假设:
H0 :观察频数与期望频数一致(无明显偏好) H1:观察频数与期望频数不一致(有明显偏好)
6
7.1 一个分类变量的拟合优度检验
SPSS输出的结果如表7-2和表7-3所示:
表7-2 顾客主食偏好的拟合优度检验(一) 人数
表7-3 顾客主食偏好的拟合优度检验(二) 检验统计量
杂粮 面条 米饭 馒头 总数
观察数 24 29 32 35 120
期望数 30.0 30.0 30.0 30.0
剩余残差 -6.0 -1.0 2.0 5.0
卡方
df 渐近显著性
主食偏好
2.200 3
.532
表7-3给出的检验统计量
,查 临界值表确定自由度为3、显著水平α为
验统计量的样本观察值得出的原假设可被拒绝的最小显著性水平,
若p值≤α,则在显著性水平α下拒绝H0;若p值>α,则在显著性水平 α下不能拒绝H0。
5
7.1 一个分类变量的拟合优度检验
例:B连锁餐厅老板想要了解顾客在餐厅就餐时最喜欢的主食,对120位顾 客进行调查,结果如表7-1所示。试评价顾客在这四种主食中选择时是否 存在明显偏好。
表7-6 饮酒者性别与葡萄酒偏好的 χ2独立性检验 卡方检验
Pearson 卡方 似然比 有效案例中的 N
值 6.447 6.461 200
渐进 Sig.
df (双侧)
2
.040
2
.040
表7-6给出的检验统计量2 6.447,查 临界值表确定自由度为2、显著水平α 为0.05的临界值为5.991,所以落入拒绝域。同样可以得到p=0.04<α=0.05, 所以拒绝H0,即饮酒者性别与葡萄酒偏好不独立,男性和女性饮酒者的葡萄 酒偏好不同。
葡萄酒偏好 甜葡萄酒 半干葡萄酒 干葡萄酒
合计
计数 期望的计数
计数 期望的计数
计数 期望的计数
计数 期望的计数
饮酒者6
25
8
21.8 11.2
56
21
50.8 26.2
132 68
132.0 68.0
合计 90 90.0 33 33.0 77 77.0 200 200.0
1
90
92
2
10
8
表7-8 准则2说明表
12
7.3 卡方检验中需要注意的地方
卡方检验中需要注意的地方有:
• 单元数量为2,各单元的期望频率需大于5, 如表7-7;
• 单元数量大于2,期望频率小于5的单元比例 不超过20%,如表7-8。
特殊情况该如何处理:
• 扩大样本量; • 将期望频数小于5的类别合并。
表7-7 准则1说明表
单元
fo
fe
2
( f0 fe )2 . fe
式中,f0表示观察频数,fe表示期望频数,该统计量服 从自由度为k-1的 分布,k为类别的个数。
4
7.1 一个分类变量的拟合优度检验
拟合优度检验的具体步骤为:
• 第一步:提出检验假设,建立检验标准; • 第二步:计算检验统计量 ;
• 第三步:用p值法进行判断,做出决策。假设检验问题的p值是由检
9
7.2 两个分类变量的独立性检验
独立性检验的具体步骤为:
• 第一步:提出检验假设,建立检验标准; • 第二步:计算期望频数和检验统计量 ;
• 第三步:用p值法进行判断,做出决策。若p值≤α,则在显著性水平 α下拒绝H0;若p值>α,则在显著性水平α下接受H0。
10
7.2 两个分类变量的独立性检验
例:葡萄酒行业协会想要了解饮酒者性别与葡萄酒偏好是否有关联,对 200名饮酒者进行调研,其中男性132人、女性68人,共三种葡萄酒类型: 甜葡萄酒、半干葡萄酒、干葡萄酒,样本资料见表7-4。试评价饮酒者性 别与葡萄酒偏好是否独立。
表7-4 男性与女性饮酒者葡萄酒偏好的样本资料
葡萄酒偏好
饮酒者性别
男性
• 拟合优度检验(goodness of fit test):当只研究
一个分类变量时,利用 检验来判断各类别的观察频数 与期望频数是否一致。
3
7.1 一个分类变量的拟合优度检验
➢ 拟合优度检验的原假设和备择假设的一般形式如下:
H0:观察频数与期望频数一致 H1:观察频数与期望频数不一致
➢ 拟合优度检验的检验统计量如下:
• 独立性检验(test of independence):对于两个分类变量的分
析,主要是判断两个分类变量是否有关联。
0.05的临界值为7.815,所以未落入拒绝域。同样可以得到p=0.532>α=0.05,
所以不能拒绝 H0,即观察频数和期望频数之间的差异可能归因于随机因素,
顾客在四种主食之间是没有明显偏好的。
• 注意拟合优度检验除了可以处理期望频数相同的数据,同样可以处理 期望频数不同的分类数据。
7
7.2 两个分类变量的独立性检验
第7章 分类数据分析
1
第7 章 分类数据分析——目录
7.1 一个分类变量的拟合优度检验 7.2 两个分类变量的独立性检验 7.3 卡方检验中需要注意的地方
2
7.1 一个分类变量的拟合优度检验
• 当只研究一个分类变量时,利用 检验来判断各类别的 观察频数与期望频数是否一致。比如,各年度的汽车 销售量是否符合均匀分布、不同高校的就业率是否有 显著差异。
8
7.2 两个分类变量的独立性检验
➢ 独立性检验的原假设和备择假设的一般形式如下:
H0:变量A和变量B独立 H1:变量A和变量B不独立
➢ 独立性检验的检验统计量如下:
2
( f0 fe )2 . fe
式中,f0表示观察频数,fe表示期望频数,该统计量服 从自由度为 (r-1)(c-1)的 分布,r为行数,c为列数。
女性
合计
甜葡萄酒
51
39
90
半干葡萄酒
56
21
77
干葡萄酒
25
8
33
合计
132
68
200
解:首先提出如下假设:
H0 :饮酒者性别与葡萄酒偏好独立 H1:饮酒者性别与葡萄酒偏好不独立
11
7.2 两个分类变量的独立性检验
SPSS输出的结果如表7-5和表7-6所示:
表7-5 饮酒者性别与葡萄酒偏好的频数分布 饮酒者性别 * 葡萄酒偏好 交叉制表
表7-1 120人样本中最爱点的主食
最爱点的主食
频数
杂粮
24
面条
29
米饭
32
馒头
35
合计
120
解:首先提出如下假设:
H0 :观察频数与期望频数一致(无明显偏好) H1:观察频数与期望频数不一致(有明显偏好)
6
7.1 一个分类变量的拟合优度检验
SPSS输出的结果如表7-2和表7-3所示:
表7-2 顾客主食偏好的拟合优度检验(一) 人数
表7-3 顾客主食偏好的拟合优度检验(二) 检验统计量
杂粮 面条 米饭 馒头 总数
观察数 24 29 32 35 120
期望数 30.0 30.0 30.0 30.0
剩余残差 -6.0 -1.0 2.0 5.0
卡方
df 渐近显著性
主食偏好
2.200 3
.532
表7-3给出的检验统计量
,查 临界值表确定自由度为3、显著水平α为
验统计量的样本观察值得出的原假设可被拒绝的最小显著性水平,
若p值≤α,则在显著性水平α下拒绝H0;若p值>α,则在显著性水平 α下不能拒绝H0。
5
7.1 一个分类变量的拟合优度检验
例:B连锁餐厅老板想要了解顾客在餐厅就餐时最喜欢的主食,对120位顾 客进行调查,结果如表7-1所示。试评价顾客在这四种主食中选择时是否 存在明显偏好。
表7-6 饮酒者性别与葡萄酒偏好的 χ2独立性检验 卡方检验
Pearson 卡方 似然比 有效案例中的 N
值 6.447 6.461 200
渐进 Sig.
df (双侧)
2
.040
2
.040
表7-6给出的检验统计量2 6.447,查 临界值表确定自由度为2、显著水平α 为0.05的临界值为5.991,所以落入拒绝域。同样可以得到p=0.04<α=0.05, 所以拒绝H0,即饮酒者性别与葡萄酒偏好不独立,男性和女性饮酒者的葡萄 酒偏好不同。
葡萄酒偏好 甜葡萄酒 半干葡萄酒 干葡萄酒
合计
计数 期望的计数
计数 期望的计数
计数 期望的计数
计数 期望的计数
饮酒者6
25
8
21.8 11.2
56
21
50.8 26.2
132 68
132.0 68.0
合计 90 90.0 33 33.0 77 77.0 200 200.0
1
90
92
2
10
8
表7-8 准则2说明表
12
7.3 卡方检验中需要注意的地方
卡方检验中需要注意的地方有:
• 单元数量为2,各单元的期望频率需大于5, 如表7-7;
• 单元数量大于2,期望频率小于5的单元比例 不超过20%,如表7-8。
特殊情况该如何处理:
• 扩大样本量; • 将期望频数小于5的类别合并。
表7-7 准则1说明表
单元
fo
fe
2
( f0 fe )2 . fe
式中,f0表示观察频数,fe表示期望频数,该统计量服 从自由度为k-1的 分布,k为类别的个数。
4
7.1 一个分类变量的拟合优度检验
拟合优度检验的具体步骤为:
• 第一步:提出检验假设,建立检验标准; • 第二步:计算检验统计量 ;
• 第三步:用p值法进行判断,做出决策。假设检验问题的p值是由检
9
7.2 两个分类变量的独立性检验
独立性检验的具体步骤为:
• 第一步:提出检验假设,建立检验标准; • 第二步:计算期望频数和检验统计量 ;
• 第三步:用p值法进行判断,做出决策。若p值≤α,则在显著性水平 α下拒绝H0;若p值>α,则在显著性水平α下接受H0。
10
7.2 两个分类变量的独立性检验
例:葡萄酒行业协会想要了解饮酒者性别与葡萄酒偏好是否有关联,对 200名饮酒者进行调研,其中男性132人、女性68人,共三种葡萄酒类型: 甜葡萄酒、半干葡萄酒、干葡萄酒,样本资料见表7-4。试评价饮酒者性 别与葡萄酒偏好是否独立。
表7-4 男性与女性饮酒者葡萄酒偏好的样本资料
葡萄酒偏好
饮酒者性别
男性
• 拟合优度检验(goodness of fit test):当只研究
一个分类变量时,利用 检验来判断各类别的观察频数 与期望频数是否一致。
3
7.1 一个分类变量的拟合优度检验
➢ 拟合优度检验的原假设和备择假设的一般形式如下:
H0:观察频数与期望频数一致 H1:观察频数与期望频数不一致
➢ 拟合优度检验的检验统计量如下: