(四川大学)研究生的博弈论课程:第九章 对应分析

合集下载

博弈论讲义完整版

博弈论讲义完整版

同样的情形发生在: 公共产品的供给 美苏军备竞赛 经济改革 中小学生减负 ……
第一章 导论-囚徒困境

囚徒困境的性质:
个人理性和集体理性的矛盾; 个人的‚最优策略‛使整个‚系统‛处于不利 的状态。

思考:为什么会造成囚徒困境 是否由于‚通讯‛问题造成了囚徒困境? ‚要害‛是否在于‚利己主义‛即‚个人理 性‛?
第一章 导论-囚徒困境
通俗地讲:
纳什均衡的含义是:给定别人战略情况下,没有 任何单个参与人有积性选择其他战略,从而没有人 有积极性打破这种均衡。
第一章 导论-囚徒困境 一只河蚌正张开壳晒太阳,不料,飞来了 一只鸟,张嘴去啄他的肉,河蚌连忙合起两张 壳,紧紧钳住鸟的嘴巴,鸟说:‚今天不下雨, 明天不下雨,就会有死蚌肉。‛河蚌说:‚今 天不放你,明天不放你,就会有死鸟。‛谁也 不肯松口,有一个渔夫看见了,便过来把他们 一起捉走了。
不开发
1000,0 0,0
开发商A
博弈的战略式表述
一 、博弈的基本概念及战略表述

需求小时,售价7千万;
如果市场上只有一栋楼 需求大时,可卖1.8亿 需求小时,可卖1.1亿
一 、博弈的基本概念及战略表述
需求大的情况 开发商A 开发 不开发 需求小的情况 开发 不开发
开发商B 开发 不开发
4000,4000 0,8000 8000,0 0,0
开发商B
开发
-3000,-3000 0,1000

第一章 导论
注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了‚星期五‛

石匠的决策与拳击手的决策的区别
第一章 导论
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。

第九章 方差分析与回归分析

第九章 方差分析与回归分析

由于yi =α + βxi +εi,
εi相互独立且εi~N(0,σ ),
2
故yi~N(α + βxi,σ 2 ),i =1 ⋯ n, ,, .
由正态分布的性质和a,b的表达式,可得
E(b) = β,D(b) = σ 2 / Sxx; 1 x 2 而, E(a) =α,D(a) = ( + )σ 。从 n Sxx 1 x2 2 ( b~N(β, ),a~N(α, + )σ )。 Sxx n Sxx
x1
x2
设 µ(x)=E(Y|x) =α+βx ,称其为总体回归方程, 称 β为回归系数。
由于α、β是未知的,设想通过样本观察值得出α、 β的估计值a、b。于是
y = a + bx ≈ E(Y|x) = µ(x).
称其为经验回归方程或样本回归方程。 问题:如何估计a、b的值? 三、参数估计 设抽样得到一组样本观察值(x1,y1),….,(xn,yn), 则样本回归方程的值为
∑r = n,特别,当r = r
i=1 i 1
a
2
= ⋯= ra = r,有ar = n。
前提假设:所有试验单元的试验条件一致(无系统 误差)。 方差分析的作用: 1. 通过对试验数据的统计分析,推断造成试验数据 间的差异的原因是试验水平差异还是随机误差的影 响。
2. 推断哪些因素的影响是显著的。 3. 分析出“最佳”的试验水平(固定模型);或估 计总体变量的参数(随机模型)。 方差分析与假设检验的区别: 方差分析能同时检验多个总体的某个参数(如均 值)是否相等,而假设检验每次只能检验两个总体 的某个参数是否相等。 方差分析与回归分析的区别: 1. 回归分析主要是为了得到自变量与因变量之间的定 量关系 回归方程。回归系数显著性讨论的目的, 是把影响不显著的自变量从回归方程中剔除,以提高 回归方程的稳健性,使预测, i =α + βxi +εi, y i =1 ⋯ n, i相 独 且εi~ (0,σ ). ,, ε 互 立 N

第九章回归分析和相关分析课件

第九章回归分析和相关分析课件

软件实现
• lm.reg<-lm(y~x1+x2+x3+x4, data=A) • summary(lm.reg)
x4<-c(8.2, 6.9, 10.8, 8.3, 7.5, 13.6, 8.5, 11.5,7.9, 7.1, 8.7, 7.8, 9.9, 6.9, 10.5, 8.0,10.3, 7.1, 8.9, 9.9, 8.0, 11.3, 12.3, 9.8,10.5, 6.4, 9.6) A=data.frame(y,x1,x2,x3,x4) 第九章回归分析和相关分析
第九章 回归分析和相关分析
第九章回归分析和相关分析
本章目录
•9.1 相关性及其度量 •9.2 一元线性回归分析 •9.3 多元线性回归分析 •9.4 回归诊断 •9.5 logistics回归
•目的:通过研究变量间的相互关系,测定其紧密程度,揭示 数据后的规律,构建模型,来进行结构分析,政策评价,预测 和控制。
第九章回归分析和相关分析
R软件实现
• lm(y~x) • summary(lm(y~x))
第九章回归分析和相关分析
一元线性回归步骤
•散点图(判断能否进行回归分析)
•回归分析 需要对回归系数(t值); 拟合优度(R方); 方程进行检验(F值)
•残差分析 •预测:
第九章回归分析和相关分析
举例:粮食需求量x和人口增加量y
• x和y的相关系数为0.68,p值=0.03≤0.05,故拒绝原假设,从而认 为x和y相关。
• 如何算x和y的Spearman秩相关系数?
• 练习:P271,9.1
第九章回归分析和相关分析
9.2 一元线性回归分析
•数学模型:

博弈论知识点总结完整版

博弈论知识点总结完整版

博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。

即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。

1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。

1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。

两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。

倘若不能,则称非合作博弈(Non-cooperative game)。

合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。

目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。

博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。

把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。

精品课程《博弈论》PPT课件(全)

精品课程《博弈论》PPT课件(全)
人博弈 两人博弈有多种可能性,博弈方的利益方向可
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16

博弈论原理与方法-关于均衡的分析

博弈论原理与方法-关于均衡的分析
胜的关键是不能让另一方猜到自己的策略而
同时自己又要尽可能猜出对方的策略。
在一次博弈中结果取决于机会,在多次重复
中,如果双方决策都正确,则我们可求得平
均的双方收益。彼此得益相同。
绪论-博弈基本要素

参与人players
又称“局中人”或”博弈方”,是指博弈中独
立决策、独立承担后果、以自身利益最大化来
选择行动的决策主体(可以是个人、也可以是
策略,假设寡头2采用低价策略,那么寡头1采用高
价策略得益20,采用低价策略得益60,它也应采用
低价策略。用同样方法可得寡头2也应采用低价策略。
低价-低价对双方不是理想的结果,但因为双方均无
法信任,所以均坚持采用低价策略。
绪论-几个典型模型
猜方
正面

猜硬币游戏
反面
正面
盖方
反面
分析:
在本博弈什均衡动态化,加入了
接近实际的不完全信息条件。他们的工作为后
人继续发展博弈论,提供了基本思路和模型

绪论-博弈论的历史沿革

博弈论根据其所采用的假设不同而分为合作博
弈理论和非合作博弈理论。两者的区别在于参
与人在博弈过程中是否能够达成一个具有约束
力的协议(binding agreement) 。倘若不能,则

博弈理论开始于1944年由冯·诺依曼(Von
Neumann)和摩根斯坦恩(Oskar Morgenstern)合
作的《博弈论和经济行为》(The Theory of
Games and Economic Behaviour)一书由Princeton
University Press出版。

20世纪50年代以来,纳什(Nash)、泽尔腾

研究生教学讲稿博弈论与信息经济学3年9月0日ppt2


发展阶段
精练纳什均衡(完全 贝叶斯纳什均衡(不完全信息静态,
1960年-1979年
信息动态)(泽尔腾, 海萨尼,1967)与贝叶斯精练纳什
1965)
均衡(不完全信息动态,海萨尼,1975)
繁荣阶段 1980年以后
纳什,泽尔腾和海 维克里和莫里斯 萨尼共同获得诺贝 获诺贝尔经济学 尔经济学奖(1994) 奖(2019)
囚徒B
坦白
抵赖
囚徒A
坦白 抵赖
-8,-8 -10, 0
0, -10 -1, -1
19
囚徒A
坦白 抵赖
囚徒B
坦白
抵赖
-8,-8
0, -10
-10, 0
-1, -1
在这个例子里,战略组合有四个:(坦白,坦白),(坦白, 抵赖),(抵赖,坦白),(抵赖,抵赖)。给定B坦白的情况 下,A的最优战略是坦白;同样,给定A坦白的情况下,B的最优 战略也是坦白。各方最优战略的组合是(坦白、坦白)。
收益。
8
一个例子
参与人 (局中人)
两个OPEC成员国: 沙特 与 科威特
每个国家都有两种行动:增产 或 保持产 量结果和报酬
行动
两国如何决策呢?

威 特
(5, 5) (7, 4) 结果:双方都增
(4, 7) (6, 6)
产……
9
2 博弈分类
1)非合作博弈和合作博弈。
合作博弈与非合作博弈之间的区别主要在于人们的 行为相互作用时,当事人能达成—个具有约束力的 协议。如果有,就是合作博弈;反之.则是非合作 博弈。例如两个寡头企业,如果它们之间达成一个 协议,联合最大化垄断利润.并按这个协议生产, 就是合作博弈。协议没有约束力,两个寡头企业各 自优化其最优产量(或价格),则成为非合作博弈。 用非合作博弈研究问题的较多、近几年合作博弈研 究呈现上升态势。

第 九章 方差分析与回归分析


One-Way ANOVA过程
One-Way ANOVA过程用于进行两组及多 组样本均数的比较,即成组设计的方差分 析,如果做了相应选择,还可进行随后的 两两比较,甚至于在各组间精确设定哪几 组和哪几组进行比较
1、界面选项说明
【Dependent List框】选入需要分析的变量,可 选入多个结果变分析表。给出了单因素方差 分析的结果,可见F=84.544,P<0.001。因此可认为三组量不 同。上表的标题内容翻译如下:
组间变异 组内变异
总变异
离均差平方和 自由度 SS
均方MS
F值 P值
9.266
2
4.633 84.544 .000
1.534
28 5.480E-02
第 九章 方差分析 与回归分析
方差分析介绍
方差分析和回归分析是使用最多的两种统 计方法。方差分析是一种定性的统计方法; 而回归分析是一种定量的方法。方差分析 主要分析各效应的显著性即方差齐次性, 主要有以下几个内容,单因素方差分析、 双因素方差分析、多因素方差分析协方差 分析、多元方差分析、重复设计方差分析 等等。这些方法在现实生活中有着极大的 应用范围。
【Factor框】选入需要比较的分组因素,只能选 入一个。
【Contrast钮】弹出Contrast对话框,用于对精 细趋势检验和精确两两比较的选项进行定义,由 于该对话框太专业,也较少用,这里只做简单介 绍。
Polynomial复选框 定义是否在方差分析中进行 趋势检验。
Degree下拉列表 和Polynomial复选框配合使用, 可选则从线性趋势一直到最高五次方曲线来进行 检验。
10.800
30
Post Hoc Tests
Homogeneous Subsets

最新九章相关与回归分析


散点图
(例题分析)
散点图
(不良贷款对其他变量的散点图)
不良贷款
14
12
10
8
6
4
2
0
0
100
200
300
400
贷款余额 不良贷款与贷款余额的散点图
14
12
10
8
6
4
2
0 0
10
20
30
40
贷款项目个数
不良贷款与贷款项目个数的散点图
不良贷款
不良贷款
14
12
10
8
6
4
2
0 0
10
20
30
累计应收贷款
1. 度量变量之间线性关系强度的一个统计量 2. 对两个变量之间线性相关强度的度量称为简单相
关系数 3. 若相关系数是根据总体全部数据计算的,称为总
体相关系数,记为
4. 若相关系数是根据样本数据计算的,则称为样本 相关系数,简称为相关系数,记为 r
– 也称为线性相关系数(linear correlation coefficient) – 或称为Pearson相关系数 (Pearson’s correlation
不良贷款与累计应收贷款的散点图
14 12 10
8 6 4 2 0
0
50
100
150
200
固定资产投资额
不良贷款与固定资产投资额的散点图
不良贷款
散点图
(5个变量的散点图矩阵)
不良贷款 贷款余额
累计应收贷款
贷款项目个数
固定自产投资
相关关系的描述与测度 (相关系数)
相关系数
(correlation coefficient)

第九章 相关分析和回归分析.

相关关系,基本思想与Pearson简单相关系数相同, 只是数据为非定距的,故计算时并不直接采用原始数 据 ( xi , yi ),而是利用数据的秩,用两变量的秩 (U i ,Vi ) 代替 ( xi , yi ) 代入Pearson简单相关系数计算公式中 ,于是其中的 xi 和 y i 的取值范围被限制在1和n之间 ,且可被简化为:
• 偏相关分析也称净相关分析,它在控制其他变量的
线性影响的条件下分析两变量间的线性关系,所采 用的工具是偏相关系数。 • 控制变量个数为1时,偏相关系数称一阶偏相关; 当控制两个变量时,偏相关系数称为二阶偏相关; 当控制变量的个数为0时,偏相关系数称为零阶偏 相关,也就是简单相关系数。
利用偏相关系数进行分析的步骤
y y
平方和(SSR)
2
2 y y y y


2
即:总离差平方和(SST)=剩余离差平方和(SSE) +回归离差
其中;SSR是由x和y的直线回归关系引起的,可以由回归直线
1 ˆ X X X Y
e
2Байду номын сангаас
n-k-1 n - k 1
2 i
e e
9.4.3 线性回归方程的统计检验 9.4.3.1回归方程的拟合优度
回归直线与各观测点的接近程度称为回归方程的拟合优度,也就 是样本观测值聚集在回归线周围的紧密程度 。 1、离差平方和的分解:
9.4.2 线性回归模型参数估计 一元线性回归模型的数学模型:
Yi 0 1 X i ui E(Y / X i ) ui
其中x为自变量;y为因变量; 0 为截距,即常量; 1 为回归系数,表明自变量对因变量的影响程度。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 第九章 对应分析 §9.1 什么是对应分析及基本思想 一、 什么是对应分析 1.对应分析的概念与基本形式 对某一行业所属的企业进行经济效益评价时,不仅要研究经济效益指标间的关系,还要将企业按经济效益的好坏进行分类,研究哪些企业与哪些经济效益指标的关系更密切一些,为各级领导部门正确指导企业的生产经营活动提供更多的信息。这就需要有一种统计方法,将指标和企业放在一块进行分类、作图,便于做经济意义上的解释。 在社会科学研究中,一个经常会遇到的问题就是要对定性变量数据进行量化分析,因为研究中往往使用一些定性(Nonmetric)变量,例如名义变量或序次变量来反映研究对象的行为、态度等,研究不同性别的顾客对不同品牌商品的喜好,不同职业的人在吸烟行为上的差异等。在上述情况下,就可以使用对应分析方法。 对应分析(Correspondence Analysis)方法是近年来新发展起来的一种多元相依变量(Interdependece)统计分析技术,它通过分析由定性变量构成的交互汇总表来揭示变量间的联系。当以变量的一系列类别以及这些类别的分布图来描述变量之间的联系时,使用这一分析技术可以揭示同一变量的各个类别之间的差异以及不同变量各个类别之间的对应关系。 对应分析的基本形式是对由两个定性或类型(Category)变量构成的交互表进行分析,将定性变量数据转变成可度量的分值、减少维度并作出分值分布图。在减少维度方面,对应分析与因子分析(Factor Analysis)相似;在作分布图方面,对应分析与多维标度(Multidimensional Scaling)方法相似。对应分析的优点就在于可以同时做到这几方面,这是以往的统计方法所不能做的,因此,在定性变量数据分析方面,对应分析提供了一种新的多元相依变量(Interdependece)的分析技术。 2.有关多元对应分析 2

虽然对应分析的基本形式是对两个定性变量进行分析,实际上对于由三个或三个以上变量形成的交互表也可以进行对应分析,这样的对应分析称为多元对应分析(Multiple Correspondence Analysis)。(在SPSS软件里使用Optimal Scaling完成,HOMALS程序)多元对应分析可以采取两种方法,第一种方法与二元对应分析非常相似,只是需要对超过二元的变量进行转换,从而使各个变量的所有类别都表现在同一个多维空间里。 以同时分析三个名义变量为例,假设我们想分析不同性别、分别居住在城市和农村的人对在过去一年取得的收入是否满意,如果要将这三个变量放在同一张交互表里,就要进行转换。我们可以将性别与城乡这两个变量合并成一个变量,原来性别分为两个类型(男、女),城乡也分为两种类型(城、乡),合并后的变量可以记为“性别城乡”分为四个类型:男_城市、男_农村、女_城市、女_农村,这样就又可以使用对应分析的基本形式(二维形式)对上述问题进行分析了。但是,从上述变量类型转换中也可以看出,当我们所要分析的变量超过三个时,用这种方法就会感到很不方便了,这时就要使用以下介绍的另一种方法。 多元对应分析的第二种方法是采用同质性分析(Homogeneity Analyisis)技术,这是一种对多个名义变量进行主成分分析的技术,其优势是可以同时对多个定性变量进行对应分析。 从上述两种多元对应分析方法的比较看,当对两个变量进行分析时(可以看作是多元对应分析的特例),用两种方法得到的统计结果并不一致(但是用各自的解释方式得出的结论是一样的)。

在变量数为两个的情况下,建议使用对应分析的基本形式;在变量数为三个的情况下,建议使用上述多元对应分析的第一种方法,即将其中两个变量合并成一个后再进行分析;当变量数为四个或以上时,建议使用上述多元对应分析的第二种方法,即运用同质性分析的方法。 3

二、对应分析的基本思想 对应分析是将R型因子分析与Q型因子分析结合起来进行统计分析,它是从R型因子分析出发,而直接获得Q型因子分析的结果。克服了由样品容量大,作Q型分析所带来的计算上的困难。另外根据R型和Q型分析的内在联系,可将指标(变量)和样品同时反映到相同坐标轴(因子轴)的一张图形上,便于对问题的分析。 对应分析,概括起来可提供如下三方面的信息即指标之间的关系,样品之间的关系,以及指标与样品之间的关系。 基本思想:由于R型因子分析和Q型因子分析都是反映一个整体的不同侧面,因此它们之间一定存在内在的联系。对应分析就是通过一个过渡矩阵Z将二者有机地结合起来,具体地说,首先给出变量点的协差阵ZZA和样品点的协差阵ZZB,由于ZZ

和ZZ有相同的非零特征根,记为m21,),min(0npm,如果A的特征根i对应的特征向量为iU,则B的特征根i对应的特征向量就是iiVZU,根据这个结论就可以很方便的借助R型因子分析而得到Q型因子分析的结果。因为求出A的特征根和特征向量后很容易地写出变量点协差阵对应的因子载荷阵,记为F。则





mpmppmmmmuuuuuuuuuF







221122221211212111

这样一来样品点协差阵B对应的因子载荷阵记为G,则 



mnmnnmmmmVVVVVVVVVG







221122221211212111

由于A和B具有相同的非零特征根,而这些特征根又正是各个公共因子的方差,因 4

此可以用相同的因子轴同时表示变量点和样品点,即把变量点和样品点同时反映在具有相同坐标轴的因子平面上,以便对变量点和样品点一起考虑进行分类。 三、对应分析方法的优点 对应分析方法的出现为我们分析定性变量提供了许多方便条件,这表现在以下几个方面。 1 定性变量划分的类别越多,这种方法的优势越明显 尽管其他统计方法也可以对交叉汇总表进行分析,但当变量是名义或序列变量、而且变量的类别很多时,用这些方法就很难看出变量之间的关系。例如,当我们调查不同职业的顾客对不同品牌香烟的喜好时,职业变量可以分成十多个类别,而香烟品牌也可以有十个之多。这样一个由名义变量构成的庞大的交叉表就很难看出变量间的联系。对于这样的研究,对应分析的优势就表现得十分明显。 2揭示行变量类别间与列变量类别间的联系 对应分析不但可以表现行变量与列变量之间的联系,而且可以揭示行变量类别间与列变量类别间的联系。 3将类别联系直观地表现于图形中 对应分析最大的优势是可以将所有行变量类别和列变量类别的联系直观地表现在同一张分布图上,从中可以看出哪些行变量类别与列变量类别有密切的联系,从而能够清楚地解释统计分析结果。 4可以将名义变量或序次变量转变为间距变量 以对应分析方法为基础还可以将名义变量或序次变量转变为间距变量,从而可以应用更多的统计方法含有这样变量的调查数据。

§9.2 对应分析方法的原理 一、原始数据的规格化 5

在处理实际问题时,如果指标(变量)的量纲不同以及数量级相差很大时,通常先将指标作标准化处理。 但标准化处理对于指标和样品是非对等的,为了使之有对等性,以便将R型与Q型建立起联系,就需设法将原始数据阵)(ijxX变换成矩阵)(ijzZ,即将ijx变换成ijz之后,使ijz对指标和样品具有对等性。1970年,法国统计学家J.P.Beozecri提出了上述求Z的方法。 在用列联表进行检验时,给出了2统计量:



ijjijiijnnnnnnn

/..

..2

在它的启发下,将原始数据阵作如下变换,而给出矩阵)(ijzZ 其中:

......ijijij

ijxx

x

xxxz

为便于理解此变换,作如下解释: 设有n个样品,每个样品有p项指标,原始资料阵为:



npnnppnpxxxxxxxxxXXXxxx2122221112112121X

假定矩阵X的元素0ijx,否则对所有的数据同加上一数,便可满足这个要求, 6

然后写出X的行和、列和与总和,分别记为 xxxji,,

...2.1..21.222221.111211xxxxxxxxxxxxxxxx

pnnpnnpp



其中 pjijiXx1. niijjxx1. ijijxx..

为了书写方便,将..x记为T。用它去除矩阵X中的每一个元素,这不过相当于改

变了测度尺度,使变量与样品具有相同比例大小,即Txxxpijijij..,显然10ijp,且ijijp1,因而ijp可解释为“概率”,这样得到一个规格化的“概

率”矩阵pnijp)(P。类似地可写出P阵的行和、列和分别记为.ip和jp.:

1.2.1..21.222221.111211pjnnpnniijpppppppppppppppppppp





 其中pjijipp1.,niijjpp1.。 如果将n个样品,看成p维空间的点,则其n个点的坐标用

相关文档
最新文档