《数据模型决策第五部分》200609
数据、模型与决策第九章到十章

追求至善 凭技术 开拓市 场,凭 管理增 创效益 ,凭服 务树立 形象。2 020年1 1月4日 星期三 下午5 时33分5 7秒17: 33:572 0.11.4
专业精神 和专业 素养, 进一步 提升离 退休工 作的质 量和水 平。202 0年11 月下午5 时33分 20.11. 417:33 Novemb er 4, 2020
第三节 控制图的制作与识别
第三节 控制图的制作与识别
第三节 控制图的制作与识别
第三节 控制图的制作与识别
第三节 控制图的制作与识别
第三节 控制图的制作与识别
第三节 控制图的制作与识别
第三节 控制图的制作与识别
第四节 工序能力分析
工序能力指数是产品质量规定的变化范围与产品质量实际变化范围相比较 的结果。通常,我们就是依据Cp判断工序实际能力
第三节 控制图的制作与识别
控制图是质量过程监测的重要工具,统计过程控制实质上 是指运用控制图对产品生产过程中发生的质量波动实施实 时观察,并在这个基础上决定是否需要对生产过程进行调 整。控制图是贝尔实验室工程师休哈特博士发明滴,故又 称为哈特控制图,它是运用统计方法确定管理界限,并用 于管理监控的一种图表
3 控制图制作与识别
4 工序能力分析
第一节 质量因素与质量数据
质量管理是指确定质量方针、质量目标和质量职责,并在 质量体系中贯彻质量策划、质量控制、质量保证和质量改 进,从而使全部管理职能能得到有效实施的各种活动。
第一节 质量因素与质量数据
第一节 质量因素与质量数据
第二节 质量分析的一般方法
人生不是 自发的 自我发 展,而 是一长 串机缘 。事件 和决定 ,这些 机缘、 事件和 决定在 它们实 现的当 时是取 决于我 们的意 志的。2 020年1 1月4日 星期三 5时33 分57秒W ednesd ay, No vember 04, 2 020
MBA第九章数据模型决策

第九章决策分析顾名思义,所谓决策分析就足各行各业的管理人员为解决当询发生的问题或未來叫能发生的问题,决定应对之策的过程。
般來说,决策问题有F而四个要素:1)决策者:例如管理人员:2)行动方案:供决策者选择采用的乞个应对之策略:3)环境状态:决策问题很可能处I :不尽相同的环境状态,例如市场的需求不同,川能使产品热销,也可能••般,其至滞销。
显然,各行动方案在不同的环境状态下可能有不同的结果例如收益,或损失等。
4)各个行动方案不同环境状态下的收益(或损失)。
在决策时,倘若环境状态完全确疋,例如第八辛所讨论的线性观划与非线性观划求解问题就称为确定世决策问题。
否则,就是不确定型决策问题。
对于确定型决策问题,山于决策的环境状态定全确左,•曰・选定行动方案,所产生的结果例如利润或成木等就可准确预料,因而人们往往能求得例如录人利润或最小成木的呆佳方案,1仙不确定型决策问题,Lh于有不同的环境状态,以致于■个行动方案在不同的环境状态下很可能会产工不同的结果。
伏II佃往往难以求得方方面面令人家都满意的行动方案。
垠佳方案的选择与决策音的价值观、偏好等有尖。
保守稳妥的管理者倾向于选择风险比较小的行动方案,血百险进収的管理石爱好选择利润比较人的行动方案。
这也就定说,他们有不同的决策准则。
不确定型决策问题有两种类型:1)«■个环境状态发生的概率例如市场需求热销、•股9滞销发生的町能性,决策咅勺先未知,难以预料:2 ;如果并个环境状态发生的概率都12知,此时通常特称这个不确定型决策问题为风险型决策问题。
例如本书第三章§ 3. 3节“期望■方差的决策分析”中所讨论的开发还足不开发新产品,中型扩建还足大型扩建为好的决策问题就足风险型决策问趣。
本章将介绍不确定情况下的决策分析常用的几个准则,以及贝叶斯(Bayes)决策分析与效用(Utility)函数理论,最后简要介绍博弈论。
必须扌旨出的肚,尽管确朮型决策问题的决策环境状念淀全确朮,人们能选择到垠仕力案•但通滋仍需讨论,:当决策环境状态有所变化时最住方案能否保持稳H,以及倘若不能保持稳定时它是如何变化的。
数据模型与决策 习题答案

数据模型与决策习题答案数据模型与决策习题答案在当今信息时代,数据的价值越来越受到重视。
数据模型作为一种描述和组织数据的方式,对于决策过程起着重要的作用。
本文将通过解答一些与数据模型和决策相关的习题,来探讨数据模型在决策中的应用和意义。
1. 什么是数据模型?为什么在决策过程中需要使用数据模型?数据模型是对现实世界进行抽象和描述的一种方式。
它通过定义实体、属性和关系的方式,将现实世界中的事物转化为计算机可以处理的形式。
数据模型可以帮助我们更好地理解和组织数据,为决策提供支持。
在决策过程中,数据模型的使用具有以下几个重要的作用:1) 数据模型可以帮助我们对现实世界进行建模和描述,将复杂的现实问题转化为可计算的形式,从而更好地理解问题的本质。
2) 数据模型可以帮助我们组织和管理大量的数据,使得数据更易于存储、检索和分析,为决策提供必要的信息支持。
3) 数据模型可以帮助我们对不同的决策方案进行评估和比较,通过模拟和预测的方式,帮助我们选择最佳的决策方案。
2. 数据模型的种类有哪些?请简要介绍其中的几种。
常见的数据模型包括层次模型、网状模型、关系模型和面向对象模型等。
层次模型是最早的数据模型之一,它将数据组织成一种树状结构,其中每个节点代表一个实体,每个节点之间通过父子关系连接。
层次模型的优点是结构简单,易于理解和实现,但缺点是不适合处理复杂的关系和多对多的关联。
网状模型是层次模型的扩展,它允许多个父节点指向同一个子节点,从而解决了层次模型不适合处理多对多关联的问题。
但网状模型的缺点是结构复杂,不易理解和维护。
关系模型是目前应用最广泛的数据模型,它将数据组织成一张二维表格,其中每一行代表一个实体,每一列代表一个属性。
关系模型通过定义实体间的关系和约束,实现了数据的灵活查询和操作。
面向对象模型是一种基于对象的数据模型,它将数据组织成一组对象,每个对象包含了数据和对数据的操作。
面向对象模型适用于处理复杂的关系和行为,但在实际应用中较为复杂和庞大。
《数据模型与决策》案例分析报告预测销售的损失.ppt

消除季节影响后的销售额 Y
65.0
62.5
2.83442 1.71942 4.55534
60.0
57.5
55.0 1 5 10 15 20 25 30 指数 35 40 45 50
2.5 利用季节指数调整预测值
因此,我们预测全县百货公司在无飓风情况下可能会实现销售额 291.59百万美元。
三、卡尔森公司销售损失的预测
一、卡尔森公司无飓风情况下销售额预测
下表是卡尔森百货公司1999年9月-2003年8月销售额数据
预测思路
1.计算卡尔森公司销售额时间序列的中心 化移动平均数及季节不规则值和季节指数
3.利用消除季节影响 的时间序列确定趋势
2.利用季节指数消除原 时间序列的季节影响, 得到新的时间序列
4.利用季节指数调整趋势预测值
从图2可以看出消除影响后的卡尔森公司的 销售额数据有着较为明显的直线趋势,因此 可以拟定模型:Tt=b0+b1t Tt:t期卡尔森公司销售额的趋势值 b0:趋势线的截距 周期 b1:趋势线的斜率 49 拟合趋势方程为: 50 Tt = 2.1483 + 0.0114×t 51 准确度度量 52 平均百分误差 (MAPE) 4.67980 平均绝对误差 (MAD) 0.10607 平均偏差平方和 0.02675 从准确度量数据可以看出,该模型拟合较好 预测
1.1 计算季节指数
1.2 利用季节指数消除原时间数列对季节的影响, 得到新的时间序列
1.3 利用消除影响的时间序列确定趋势
图 2 消除影响后的数据 Y 的时间序列图
3.00 2.75
消除影响后的数据 Y
2.50 2.25 2.00 1.75 1.50 1 5 10 15 20 25 时间 30 35 40 45
数据模型与决策9决策分析ppt课件

制
建
确
收
定
立
定
集
评
决
目
情
价
策
标
报
标
模
准
型
多 方 案 评 估
方 案 选 择 、 决 策
反 馈
1
决策的类型
非确定型决策
确定型决策
有概率的决策
无概率的决策
风险型决策
有对手的决策
2
非确定型决策
大中取大准则——最乐观的决策原则,损失无论多大, 不能影响方案的选择,也是最危险的决策。 大中取小准则——较悲观的决策准则,从损失角度看, 找出各个方案损失的最大值,在损失最大值中取损失最小 的方案;从收益角度看,找出各个方案收益最小的值,然 后在这些收益最小值中,取收益最大的方案。 最小悔值准则——建立在悔值基础上的决策准则,在 某种自然状态的发生时,决策者因没有选择该状态下的最 优方案而后悔,是后悔程度最小的决策准则。
3
风险型决策
✓ 在无试验情况下,哪一个决策最优——无实验 决策。
✓ 决策要不要试验,如果要,哪种试验最优—— 有实验决策:
✓ 试验最多允许花费多少——完全情报决策 ✓ 各种试验获得的情报最多允许花费多少——不完全
情报决策。
4
无试验型决策模型
行为集合A 自然状态集合S 定义在S集合上的概率分布 后果集合C 在C集合上函数
110
101
105
110
115
105
110
115
a5 (480)
64
78
92
106
120
7
无试验的决策模型(报童问题)续2
行为方案
《数据模型与决策》复习试题和参考题答案

《数据模型与决策》复习试题和参考题答案一、选择题1. 下列哪种数据模型不是数据库系统常用的数据模型?()A. 关系模型B. 层次模型C. 网状模型D. 面向对象模型2. 以下哪项不是数据库系统的主要功能?()A. 数据存储B. 数据检索C. 数据更新D. 数据加密3. 在关系数据库中,下列哪个概念表示表之间的关系?()A. 外键B. 主键C. 候选键D. 索引4. 下列哪种决策方法属于定量决策方法?()A. 直觉决策法B. 经验决策法C. 线性规划法D. 逻辑推理法5. 以下哪个概念不属于数据挖掘的范畴?()A. 关联规则B. 聚类分析C. 决策树D. 文本挖掘二、填空题6. 数据模型通常包括________、________和________三个基本要素。
7. 数据库系统的核心是________。
8. 在关系数据库中,为了实现表之间的连接,通常使用________。
9. 数据挖掘的方法主要包括________、________和________。
10. 线性规划法在决策过程中主要用于解决________问题。
三、判断题11. 数据模型是数据库设计和实现的基础,它描述了数据如何存储、组织和访问。
()12. 数据库系统只能用于存储数据,不能进行数据检索和更新操作。
()13. 在关系数据库中,主键可以唯一标识表中的每一行数据。
()14. 数据挖掘是一种从大量数据中提取有价值信息的方法,它包括关联规则、聚类分析和决策树等技术。
()15. 定量决策方法主要依赖于数学模型和算法,通常比定性决策方法更加准确和有效。
()四、简答题16. 简述数据模型的作用。
17. 简述数据库系统的四个主要功能。
18. 简述数据挖掘的主要应用领域。
19. 简述线性规划法的基本原理。
五、综合题20. 设某公司销售三种产品A、B、C,每种产品的销售价格、成本和销售量如下表所示。
请根据这些数据,计算该公司每种产品的利润,并确定哪种产品的销售利润最高。
数据模型与决策习题与参考答案
《数据模型与决策》复习题及参考答案第一章绪言一、填空题1.运筹学的主要研究对象是各种有组织系统的管理问题,经营活动。
2.运筹学的核心是运用数学方法研究各种系统的优化途径及方案,为决策者提供科学决策的依据。
3.模型是一件实际事物或现实情况的代表或抽象。
4、通常对问题中变量值的限制称为约束条件,它可以表示成一个等式或不等式的集合。
5.运筹学研究和解决问题的基础是最优化技术,并强调系统整体优化功能。
运筹学研究和解决问题的效果具有连续性。
6.运筹学用系统的观点研究功能之间的关系。
7.运筹学研究和解决问题的优势是应用各学科交叉的方法,具有典型综合应用特性。
8.运筹学的发展趋势是进一步依赖于_计算机的应用和发展。
9.运筹学解决问题时首先要观察待决策问题所处的环境。
10.用运筹学分析与解决问题,是一个科学决策的过程。
11.运筹学的主要目的在于求得一个合理运用人力、物力和财力的最佳方案。
12.运筹学中所使用的模型是数学模型。
用运筹学解决问题的核心是建立数学模型,并对模型求解。
13用运筹学解决问题时,要分析,定议待决策的问题。
14.运筹学的系统特征之一是用系统的观点研究功能关系。
15.数学模型中,"s·t"表示约束。
16.建立数学模型时,需要回答的问题有性能的客观量度,可控制因素,不可控因素。
17.运筹学的主要研究对象是各种有组织系统的管理问题及经营活动。
二、单选题1.建立数学模型时,考虑可以由决策者控制的因素是〔 AA.销售数量B.销售价格C.顾客的需求D.竞争价格2.我们可以通过〔 C来验证模型最优解。
A.观察B.应用C.实验D.调查3.建立运筹学模型的过程不包括〔 A 阶段。
A.观察环境B.数据分析C.模型设计D.模型实施4.建立模型的一个基本理由是去揭晓那些重要的或有关的〔 BA数量 B变量 C 约束条件 D 目标函数5.模型中要求变量取值〔 DA可正 B可负 C非正 D非负6.运筹学研究和解决问题的效果具有〔 AA 连续性B 整体性C 阶段性D 再生性7.运筹学运用数学方法分析与解决问题,以达到系统的最优目标。
数据模型决策
数据、模型与决策第一章数据的意义、分类和来源第一节数据、模型与决策的联系一、决策,是指从思维到作出决定的过程。
从管理学的角度说,决策可以表述为:为了达到某一预定目标,掌握充分、必要的数据的前提下,本着一定的价值评判标准,运用逻辑和数学推理方法,对几种可能采取的方案作出合理的选择。
在企业管理中,无论是上层、中层还是下层,无论是生产运作、营销,还是人力资源管理、财务管理,都需要决策。
诸如是否要推出一个新品种,是否要打进一个新市场,选择哪一套物流路线,如何对新招聘的员工进行培训,等等。
只不过不同层次、不同部门的决策机会或者决策权力有所不同,而且人们通常把一些决策不称为“决策”,而称为“决定”。
对有些决策问题决策者可以根据其经验和判断力作出决断,而许多管理决策问题需要决策者从描述决策目标有关联的事物和现象状态、规模、变化趋势的数值出发,按照一定的思维方式和思维方法找出方案的评价值,再进行方案的选择。
前一种情况是定性决策,后一种情况是定量决策。
本课程讲述的是进行定量决策的科学方法。
二、数据,是我们所研究的事物、现象的属性的具体描述。
这里所说的描述,包括定性的文字型描述和定量描述。
数据是决策所依据的数值,在企业管理决策中,它们表现为各种资料。
1、数据按存在空间分类:分为内部资料和外部资料。
2、数据按资料特征分类:分为数据型资料和文字型资料。
3、数据按时间属性分类:分为往期资料、当期资料和预测资料。
资料的准确性对于决策是至关重要的,从虚假的数据出发,很难作出正确的决策,“歪打正着”在复杂的决策中能够凑效的可能性几乎不存在。
三、模型,是真实事物的人为再现,它是真实世界中对应事物的概要复制。
它略去了次要枝节,突出主干,因而浓缩了问题的核心。
在管理决策中用到的模型属于图解模型和数学模型。
1、图解模型,是以图画形式浓缩决策所投入的要素之间的关系。
2、数学模型,是以数学公式刻画决策所投入的要素与决策评价值之间的关系。
两种模型在一定意义上是相通的。
数据模型与决策5PPT课件
假设及p值
显著性检验会找对原假设不利但对备择假设有利的证据。如果 观测到的结果,在原假设为真的情况下是出人意料的,而在备 择假设为真时却较易发生,这个证据就很强。比如说,当事实 上总体只有一半喜欢现煮咖啡时,发现50位受试对象中有36位 喜欢,就会出人意料。有多么出人意料呢?显著性检验用概率 来回答这个问题:这个概率指的就是,在 H 0 正确时得到的结果 跟预期结果的差距。怎么样算是“跟预期结果的差距很大”?
这既和 H 0 有关,也和 H a 有关。在口味测试中,我们希望得到
4)概率 我们可以用概率来度量对断言不利的证据到底有多 强。当总体的真正比例是0.5时,一个样本的值会这么大或更大 的概率是多少?
若 pˆ 0.5,6 这个概率就是图13.2中正态曲线之下的阴影区面积。 这个面积是0.20.
我们的样本比例值事实上是 pˆ 0.72,只有0.001的机率会得到 这样大的样本结果,它对应的区域小到在图13.2里根本看不到。
假设检验的基本概念
例 咖啡是现煮的吗?
注重口味的人,想来应该是喜欢现煮咖啡超过即溶咖啡的。 但从另一方面来看,有些喝咖啡的人也可能只是对咖啡因有 瘾。一位持怀疑态度的人断言:喝咖啡的人里,只有一半偏 好现煮咖啡。让我们做个实验来检定这个断言。
让50个受试对象都品尝两杯没有做记号的咖啡,并且要说出 喜欢哪一杯。两杯中有一杯是即溶咖啡,另一杯是现煮咖啡。 实验结果得到的统计量是样本中说比较喜欢现煮咖啡的人的 比例。
(2)事实上,偏好现煮咖啡的总体比例大于0.5,所以 样本结果差不多就是预期的结果。
我们不能确定(1)一定不对,因为我们的口味测试结果 有可能真的就只是机遇造成的。但是,这样的一个结果完全 是由机遇造成的概率非常小(0.001),所以我们相当有信心 的认为(2)才是对的。
《数据模型与决策》课件
通过分析交易数据和用户行为, 识别和预防潜在的欺诈行为,保 护金融机构的资产安全。
基于市场数据和风险评估,为投 资者提供最佳的投资组合配置建 议。
推荐系统领域
协同过滤模型
通过分析用户的历史行为和偏好,为用户推荐与其兴趣相似的物品 或服务。
内容过滤模型
根据物品的内容特征和用户的历史行为,为用户推荐与其兴趣相关 的物品或服务。
特征工程
根据业务需求和数据特点,选择和构造对模型预测性 能有利的特征。
特征筛选
去除冗余、无关或低质量的特征,提高模型效率和准 确性。
特征转换
对特征进行转换,如归一化、标准化、离散化等,以 适应模型需求。
模型训练与优化
模型评估
使用测试数据集对模型进行评估,分析模型 的性能和误差。
模型训练
使用训练数据集对模型进行训练,得到初步 模型。
决策树模型
分类决策树
通过递归地将数据集划分为更小的子集来预测 分类结果。
回归决策树
用于预测连续目标变量的值,而不是分类结果 。
集成学习决策树
通过结合多个决策树模型来提高预测精度和稳定性。
神经网络模型
前馈神经网络
将输入数据传递给隐藏层,然后输出 结果。
循环神经网络
能够处理序列数据,并记忆先前状态 的信息。
ERA
数据模型定义
总结词
数据模型是用于描述数据、数据关系以及数据操作的抽象表示。
详细描述
数据模型是通过对现实世界的数据和数据关系的抽象,建立一个结构化的模型,以便更好地组织、管理和处理数 据。它提供了一种通用的语言和框架,用于描述数据的属性、关系和操作。
数据模型分类
总结词
数据模型可以根据不同的分类标准进行划分。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
有利数目 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
概率 0.00000 0.00007 0.00058 0.00311 0.01167 0.03268 0.07082 0.12140 0.16692 0.18547 0.16692 0.12140 0.07082 0.03268 0.01167 0.00311 0.00058 0.00007 0.00000
5、 收益的概率分布
6、95%的置信区间
200
0.095
[ x 1.96 s
1414.39, 2237.93
n , x 1.96 s
n]
直方图
0.160 0.140 0.120 0.100
频率
0.080 0.060 0.040 0.020 0.000 -10500 -9000 -7500 -6000 -4500 -3000 -1500 0 1500 3000 4500
调查数据如下表: (注:“+”表示喜欢A饮料的口 味,“—”表示喜欢B饮料的口味,“0”表示没有 偏爱)
消费者 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
符号 品牌
+ - 0 A B
- B
- B
- - B B
0
0
- B
+ A
- B
- B
- B
- B
市场咨询公司据此将给出结论性的意见。
ER的分布通过大量的在R港口的销售记录来获得(但投资不能试 验)
用随机模拟方法求得在Rockport港口的200天的收益:
Day 1 2 3 4 5 195 196 197 198 199 200 Demand 0 5000 4000 6000 5000 5000 2000 4000 4000 5000 4000 Quantity 0 3500 3500 3500 3500 3500 2000 3500 3500 3500 3500 Price 3.045397 3.682013 3.476843 3.824653 3.692945 3.671822 3.36051 3.618142 3.483058 3.752711 3.539529 Earning -10000.00 2887.05 2168.95 3386.29 2925.31 2851.38 -3278.98 2663.50 2190.70 3134.49 2388.35
用函数 if(and(b2=1,c2=1),1000,if(or(b2=1,c2=1),450,-100)) 模拟收益情况
Number
1 2 3 4 5 996 997 998 999 1000
Asset A
1 1 1 1 1
Asset B
1 1 1 1 1
Asset P
1000 1000 1000 1000 1000 1000 1000 450 450 1000
平均每条渔船每日的成本为$10000。假定总能捕足一船 鱼(3500LBS)。并且可选择Gloucester或Rockport两个港 口, Gloucester是一个主要的Codfish市场, Codfish的价格 为$3.25/LB; Rockport的价格还稍高一些,但不稳定,其 每日价格服从 $3.65 / LB $0.20 / LB 的正态分 布。 Gloucester是一个很大的市场,没有卖不出去的问题; 而Rockport的市场不稳定,其需求服从离散概率分布(如 表)。并假定Rockport市场每日的价格和需求独立。
有关Rockport港口的部分结果:
1、 期望收益
E ( ER) 1826 .16
2、 收益的标准差
Std Var( ER) 2971 .10
3、 收益大于Gloucester港口的概率 4、 亏损的概率
P( ER 1375 ) 159 0.795 200
P( ER 0) 19
公司的渔船每天早晨出海捕鱼,到下午大多数船只 完成了捕捞计划(3500LBS of Codfish),然后渔船选择某 个港口(码头)靠岸,卖出Codfish。不同港口的卖出价 格由于所在港口的需求量不同或其它原因而呈现出不确 定性,如果渔船到了某个港口而又没有把Codfish全部卖 出,则剩下的要全部倒在大海里。
Expect( A) 1000 0.90 (100) 0.10 890 Std Var ( A) (1000 890) 2 0.90 (100 890) 2 0.10 330
考虑分散投资,各用一半的钱投资两个Apartment, 除了Asset A 外再拥有Asset B,两者的收益概率 分布相同且独立, 即:
二、大样本情形
类似的问题,如果原假设 H 0: p 0.5 ,样本 规模超过20个,正号出现的数量的抽样分布 可用正态分布来表达,其分布的两个参数 (均值和标准差)分别为: np 0.50 n
npq
0.25 n
例:考虑就在某个场合禁止吸烟的规定进行民 意调查,随机访问了200个公众,结果103个 同意实施这个规定,72个反对,25个不表示 意见。这个结果是否反映公众对这个规定有 鲜明的看法呢? 该问题的原假设仍是有一半的支持意见
最好的办法是比较它们的期望收益:
在Gloucester港口的收益
EG $3.25 3500 (lb) $10000 $1375
在Rockport港口的收益:不能直接求得
随机变量 价格PR 需求量D 概率分布 N (3.65, 0.202 ) 如上表的离散分布
PR 3500 10000 D 3500 ER D 3500 PR D 10000 ER PR min(3500 , D) 10000
组合投资可降低风险
我们也可以模拟该组合投资的收益情况:
1、该组合投资收益的概率分布
事 件 Apartment A没有烧掉 概 率 0.90 收 益 1000
Apartment A 烧掉了
事 件
0.10
概 率
-100
收 益
Apartment B没有烧掉
Apartment B 烧掉了
0.90
0.10
1000
1 1 0 1 1 1 1 1 0 1
3、计算相应参数
Expect(P)=average(d2:d1001)= 900.45 Std Var(P)=stdev(d2:d1001)= 227.04
第十一章 非参数方法 Nonparametric Methods
符号检验 Sign Test 2 检验:分布的拟合优度检验和变 量的独立性检验 Tests of Goodness of Fit and Independence
R港口的需求Demand(LB) 0 概率P 0.02
1000
2000 3000 4000 5000 6000
0.03
0.05 0.08 0.33 0.29 0.20
Clint Conley面临的问题是:选择Gloucester还 是Rockport卖出他的Codfish?在Rockport的价 格是渔船到达之前未知的,要等与买主谈判确 定的,而船一旦驶到任何一个港口,则必须卖 完不能再移到另一个港口。 比较聪明的办法是选择Gloucester港口,没有 风险,但是失去了潜在的最大收益。
n k nk P( X k ) k p q n 12, p 0.5, q 0.5 k 0, 1, , 12
根据该抽样分布来确定假设检验的拒绝规则, 采用的方法与参数检验的方法相似。
设定显著水平 0.04 ,我们将在分布的两侧各取
0.02的区域作为假设检验的拒绝域。 3个以下正号出现的概率是0.0002 0.0029 0.0161 0.0192 对应的有大于9个正号出现的概率也是0.0192 ,两侧 相加为0.0384,接近0.04。如果拒绝域的范围扩大到4 个以下正号和8个以上正号,被拒绝的概率会超过设 定的显著水平。 因此确定:正号的数目少于3个或者大于9个,则拒 绝原假设。实际调查数据表明,正号只出现了2个, 所以拒绝原假设。即顾客更喜欢B饮料的口味。
例:股票分割是否有利于股东?SNL证券公司 研究了1993年1月1日至1994年6月30日这一时段内 的银行业的股票分割情况,发现股票分割会导致 个人所持股票的价值上升(Barron’s,1994.8.3)。 假定在一个由20次近期的股票分割组成的样本 中,14次导致了价格的上升,4次导致了价格的下 降,还有两次没有引起变化。 检验确定股票分割是否对银行股票的持有人持 续有利。( 0.04 )
H 0: p 0.50 H a: p 0.50
采用符号检验,去除不表示意见的人数,样本大小为
n=200-25=175,出现正号(表示同意)的数量服从正态 分布, 其均值 , 0.50 n 0.50 175 87.5 标准差 0.25 n 0.25175 43.75 6.6 选定显著水平 0.05 ,查表得 z / 2 1.96 , 而统计量
在 H 0 的假定下,正号出现的数目应该服从p 0.50, n 12 的二项分布,下表列出了该二项分布的概率值。
“+”数目 概率 0 0.0002 1 0.0029 2 0.0161 3 0.0537 4 0.1208 5 0.1934 6 0.2256 7 0.1934 8 0.1208 9 0.0537 10 0.0161 11 0.0029 12 0.0002
-100
ቤተ መጻሕፍቲ ባይዱ
事 件
两个Apartment都没有烧掉 Apartment A 烧掉了 Apartment B 烧掉了 两个Apartment都烧掉了