zz-多元统计分析方法(含答案)

合集下载

(完整版)多元统计分析思考题答案

(完整版)多元统计分析思考题答案

《多元统计分析》思考题答案记得老师课堂上说过考试内容不会超出这九道思考题,如下九道题题目中有错误的或不清楚的地方,欢迎大家指出、更改、补充。

1、 简述信度分析答题提示:要答可靠度概念,可靠度度量,克朗巴哈α系数、拆半系数、单项与总体相关系数、稀释相关系数等(至少要答四个系数,至少要给出两个指标的公式)答:信度(Reliability )即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。

信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。

信度分析的方法主要有以下四种:1)、重测信度法这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。

重测信度属于稳定系数。

重测信度法特别适用于事实式问卷,如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见式问卷。

由于重测信度法需要对同一样本试测两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一定困难。

2)、复本信度法复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。

复本信度属于等值系数。

复本信度法要求两个复本除表述方式不同外,在内容、格式、难度和对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。

3)、折半信度法折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。

折半信度属于内在一致性系数,测量的是两半题项得分间的一致性。

这种方法一般不适用于事实式问卷(如年龄与性别无法相比),常用于态度、意见式问卷的信度分析。

在问卷调查中,态度测量最常见的形式是5级李克特(Likert )量表。

进行折半信度分析时,如果量表中含有反意题项,应先将反意题项的得分作逆向处理,以保证各题项得分方向的一致性,然后将全部题项按奇偶或前后分为尽可能相等的两半,计算二者的相关系数。

应用多元统计分析习题解答_第五章(1)

应用多元统计分析习题解答_第五章(1)

第五章聚类分析5.1 判别分析和聚类分析有何区别?答:即根据一定的判别准则,判定一个样本归属于哪一类。

具体而言,设有n 个样本,对每个样本测得p 项指标〔变量的数据,已知每个样本属于k 个类别〔或总体中的某一类,通过找出一个最优的划分,使得不同类别的样本尽可能地区别开,并判别该样本属于哪个总体。

聚类分析是分析如何对样品〔或变量进行量化分类的问题。

在聚类之前,我们并不知道总体,而是通过一次次的聚类,使相近的样品〔或变量聚合形成总体。

通俗来讲,判别分析是在已知有多少类及是什么类的情况下进行分类,而聚类分析是在不知道类的情况下进行分类。

5.2 试述系统聚类的基本思想。

答:系统聚类的基本思想是:距离相近的样品〔或变量先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品〔或变量总能聚到合适的类中。

5.3 对样品和变量进行聚类分析时,所构造的统计量分别是什么?简要说明为什么这样构造? 答:对样品进行聚类分析时,用距离来测定样品之间的相似程度。

因为我们把n 个样本看作p 维空间的n 个点。

点之间的距离即可代表样品间的相似度。

常用的距离为 〔一闵可夫斯基距离:1/1()()pq qij ik jk k d q X X ==-∑q 取不同值,分为 〔1绝对距离〔1q = 〔2欧氏距离〔2q =〔3切比雪夫距离〔q =∞ 〔二马氏距离 〔三兰氏距离对变量的相似性,我们更多地要了解变量的变化趋势或变化方向,因此用相关性进行衡量。

将变量看作p 维空间的向量,一般用 〔一夹角余弦 〔二相关系数5.4 在进行系统聚类时,不同类间距离计算方法有何区别?选择距离公式应遵循哪些原则? 答:设d ij 表示样品X i 与X j 之间距离,用D ij 表示类G i 与G j 之间的距离。

〔1. 最短距离法 〔2最长距离法 〔3中间距离法 其中 〔4重心法 〔5类平均法 〔6可变类平均法 其中β是可变的且β <1〔7可变法 22221()2kr kp kq pq D D D D ββ-=++其中β是可变的且β <1 〔8离差平方和法2222(1)()p q kr kp kq pq r rn n D D D D n n ββ=-++通常选择距离公式应注意遵循以下的基本原则:〔1要考虑所选择的距离公式在实际应用中有明确的意义。

多元统计分析第二章部分课后习题

多元统计分析第二章部分课后习题

年第二章课后习题1•现选取内蒙古、广西、贵州、云南、西藏、宇夏、新疆、甘肃和青海等9个内陆边远省区。

选取人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口等五项能够较好的说明各地区社会经济发展水平的指标,验证一下边远及少数民族聚居区的社会经济发展水平与全国平均水平有无显著差异。

五项指标的全国平均水平为:“° = (6212.01 32.87 2972 9.5 15.78/解:(1)先利用SPSS软件检验各变量是否遵从多元正态分布(见输出结果1-1)输出结果]a. Li 11 iefors显著水平修正上表给岀了对每一个变量进行正态性检验的结果,因为该例中样本数n二9,所以此处选用Shapiro-Wilk统计量。

则Sig.值分别为0. 781、0. 437、0. 131、0.682、0.242均大于显著性水平,由此可以知道,人均GDP、三产比重、人均消费、人口增长、文盲半文盲这五个变量组成的向量均服从正态分布,即我们认为这五个指标可以较好对各地区社会经济发展水平做出近似的度量。

(2)提出原假设及备选假设Hi :(3)做出统讣判断,最后对统讣判断作出具体的解释SPSS的GLM模块可以完成多元正态分布有关均值与方差的检验。

依次点选Analyze —>General Linear Mode^ IMultivariate ..................... 进入Multivariate 对话框,将人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口等这五项指标选入Dependent列表框,将分类指标选入Fixed Factor (s)框,点击OK运行,则可以得到如下结果(见输出结果1-2)。

输出结果1-2a.设计:截距+分类b.精确统计虽少年易学老难成,上面第一张表是样本数据分别来自边远及少数民族聚居区社会经济发展水平、全国的个数。

多元统计分析课后习题解答第四章

多元统计分析课后习题解答第四章
• 题目:简述主成分分析的步骤。 答案:主成分分析是一种降维技术,其步骤包括标准化原始数据、计算样本相关系数矩阵、计算 特征值和特征向量、选择主成分并解释其意义等。通过主成分分析,可以将多个变量简化为少数几个综合变量,便于分析和解释。 • 答案:主成分分析是一种降维技术,其步骤包括标准化原始数据、计算样本相关系数矩阵、计算特征值和特征向量、选择主成分并解 释其意义等。通过主成分分析,可以将多个变量简化为少数几个综合变量,便于分析和解释。
习题解析
• 题目:简述多元统计分析的基本思想 答案:多元统计分析是通过对多个变量进行综合分析,揭示数据之间的内在关 系和规律,进而解决实际问题的方法。其基本思想包括多变量综合分析、多变量分类分析、多变量预测分析等。
• 答案:多元统计分析是通过对多个变量进行综合分析,揭示数据之间的内在关系和规律,进而解决实际问题的方法。其基本 思想包括多变量综合分析、多变量分类分析、多变量预测分析等。
汇报人:XX
多元统计分析的 方法和技术广泛 应用于各个领域, 如心理学、经济 学、医学等。
多元统计分析的 基本步骤包括数 据收集、数据探 索、模型选择、 模型拟合和模型 评估等。
多元统计分析的基本思想
综合多个变量进行全面分析,以揭示数据之间的内在联系和规律 强调变量之间的交互作用和协同效应,以实现更准确的预测和推断 通过对数据的降维处理,简化复杂数据集,提取关键信息
• 题目:解释因子分析的基本思想。 答案:因子分析是一种探索性统计分析方法,其基本思想是通过寻找隐藏在多个变量背后的共 同因子来解释变量之间的相互关系。通过因子分析,可以揭示数据的基本结构,简化数据的复杂性,并加深对数据内在规律的认识。 • 答案:因子分析是一种探索性统计分析方法,其基本思想是通过寻找隐藏在多个变量背后的共同因子来解释变量之间的相互关系。通 过因子分析,可以揭示数据的基本结构,简化数据的复杂性,并加深对数据内在规律的认识。

多元统计分析习题与答案

多元统计分析习题与答案

多元统计分析习题与答案多元统计分析是一种在社会科学研究中广泛应用的方法,它通过同时考虑多个变量之间的关系,帮助研究者更全面地理解和解释现象。

在本文中,我将分享一些多元统计分析的习题和答案,希望能够帮助读者更好地掌握这一方法。

习题一:相关分析假设你正在研究一个学生的学习成绩和他们每天花在学习上的时间之间的关系。

你收集了100个学生的数据,学习成绩用分数表示,学习时间用小时表示。

以下是你的数据:学习成绩(X):75, 80, 85, 90, 95, 70, 65, 60, 55, 50学习时间(Y):5, 6, 7, 8, 9, 4, 3, 2, 1, 0请计算学习成绩和学习时间之间的相关系数,并解释其含义。

答案一:首先,我们需要计算学习成绩和学习时间之间的协方差和标准差。

根据公式,协方差可以通过以下公式计算:协方差= Σ((X - X平均) * (Y - Y平均)) / (n - 1)其中,X和Y分别表示学习成绩和学习时间,X平均和Y平均表示它们的平均值,n表示样本数量。

标准差可以通过以下公式计算:标准差= √(Σ(X - X平均)² / (n - 1))根据以上公式,我们可以得出学习成绩和学习时间之间的协方差为-22.5,标准差分别为18.03和2.87。

然后,我们可以通过以下公式计算相关系数:相关系数 = 协方差 / (X标准差 * Y标准差)根据以上公式,我们可以得出相关系数为-0.93。

由于相关系数接近于-1,可以得出结论:学习成绩和学习时间之间存在强烈的负相关关系,即学习时间越长,学习成绩越低。

习题二:多元线性回归假设你正在研究一个人的身高(X1)、体重(X2)和年龄(X3)对其收入(Y)的影响。

你收集了50个人的数据,以下是你的数据:身高(X1):160, 165, 170, 175, 180, 185, 190, 195, 200, 205体重(X2):50, 55, 60, 65, 70, 75, 80, 85, 90, 95年龄(X3):20, 25, 30, 35, 40, 45, 50, 55, 60, 65收入(Y):5000, 5500, 6000, 6500, 7000, 7500, 8000, 8500, 9000, 9500请利用多元线性回归分析,建立一个预测人的收入的模型,并解释模型的结果。

应用多元统计分析课后答案 (2).doc

应用多元统计分析课后答案 (2).doc

2.1.试叙述多元联合分布和边际分布之间的关系。

解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=L 的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=L 的子向量的概率分布,其概率密度函数的维数小于p 。

2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。

解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。

2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1ax b ≤≤,2c x d ≤≤。

求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数;(3)判断1X 和2X 是否相互独立。

(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 121222202()()2[()2()]()()()()dd c c d c x a x b a t x a t dt b a d c b a d c ------=+----⎰ 2212122222()()[()2()]1()()()()d cdc d c x a x b a t x a t b a d c b a d c b a------=+=----- 所以 由于1X 服从均匀分布,则均值为2b a+,方差为()212b a -。

多元统计分析习题答案

多元统计分析习题答案

多元统计分析习题答案多元统计分析习题答案多元统计分析是一种应用广泛的统计方法,用于研究多个变量之间的关系。

在实际应用中,我们常常会遇到一些多元统计分析的习题,通过解答这些习题可以更好地理解和掌握多元统计分析的方法和技巧。

下面我将为大家提供一些多元统计分析习题的答案,希望对大家的学习有所帮助。

1. 在一个实验中,研究者想要探究三种不同的肥料对植物生长的影响。

他们随机选取了30个样本,将它们分为三组,分别施加不同的肥料。

最后测量了每个样本的植物高度、叶片数量和花朵数量。

请问该如何分析这个实验的数据?答案:这是一个多元方差分析(MANOVA)问题。

由于我们有三个不同的肥料处理组,每个组有三个观测变量(植物高度、叶片数量和花朵数量),所以我们可以使用MANOVA来分析这个实验的数据。

MANOVA可以同时考虑多个因变量之间的差异,并判断这些差异是否显著。

2. 一个公司想要了解员工的满意度与工资、工作时长以及晋升机会之间的关系。

他们随机选取了100个员工,并收集了他们的满意度得分、工资水平、工作时长和晋升机会的数据。

请问该如何分析这个问题的数据?答案:这是一个多元回归分析问题。

我们可以使用多元回归分析来探究员工的满意度与工资、工作时长以及晋升机会之间的关系。

满意度得分可以作为因变量,而工资水平、工作时长和晋升机会可以作为自变量。

通过多元回归分析,我们可以得出各个自变量对于因变量的影响程度以及它们之间的相互关系。

3. 一家餐厅想要了解顾客满意度与菜品质量、服务质量和价格之间的关系。

他们随机选取了200个顾客,并要求他们对菜品质量、服务质量和价格进行评分。

请问该如何分析这个问题的数据?答案:这是一个主成分分析问题。

我们可以使用主成分分析来降维和提取数据中的主要信息。

首先,我们将菜品质量、服务质量和价格作为变量进行主成分分析,得到几个主成分。

然后,我们可以根据这些主成分的得分来评估顾客的满意度。

主成分分析可以帮助我们理解哪些因素对于顾客满意度的贡献最大。

应用多元统计分析课后答案

应用多元统计分析课后答案
图5.1系统分析法主界面
2.点击Statistics按钮,设置在结果输出窗口中给出的聚类分析统计量。我们选择Agglomeration schedule与Cluster Membership中的Range of solution 2-4,如图5.2所示,点击Continue按钮,返回主界面。
(其中,Agglomeration schedule表示在结果中给出聚类过程表,显示系统聚类的详细步骤;Proximity matrix表示输出各个体之间的距离矩阵;Cluster Membership表示在结果中输出一个表,表中显示每个个体被分配到的类别,Range of solution 2-4即将所有个体分为2至4类。)
(1)用最短距离法进行聚类分析。
采用绝对值距离,计算样品间距离阵
0
1 0
2 1 0
5 4 3 0
8 7 6 3 0
10 9 8 5 2 0
由上表易知 中最小元素是 于是将 , , 聚为一类,记为
计算距离阵
0
3 0
6 3 0
8 5 2 0
中最小元素是 =2于是将 , 聚为一类,记为
计算样本距离阵
0
3 0
a)系统聚类法:
1.在SPSS窗口中选择Analyze→Classify→HierachicalCluster,调出系统聚类分析主界面,并将变量 移入Variables框中。在Cluster栏中选择Cases单选按钮,即对样品进行聚类(若选择Variables,则对变量进行聚类)。在Display栏中选择Statistics和Plots复选框,这样在结果输出窗口中可以同时得到聚类结果统计量和统计图。
100
2.73
-12.31
-2.77
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
均变动bi个标准单位 E. 是由偏回归系数标准化得到的
判别分析是一种(C)的统计方法。
A. “无师可循”,对个体归类 B. “无师可循”,对群体分 类 C. “有师可循”,对个体归类 D. “有师可循”,对群体分 类
E. 以上都不对
Fisher准则下的判别分析,判别临界值YC的确定从 理论上讲,(B)方法最合理。
新样品的判断分类也越可靠。√
逐步判别中Λ大,表明该函数在K类之间的判别能
力越强。×
Q型聚类分析是对变量进行聚类。 ×
有序样品聚类中,为了求出最优分割,必须定义
类的直径和目标函数。 √
有序样品聚类中,如果Si到Sj为一类,其间有j-i+1个样品, 则类直径只能定义为j-i+1个样品观察值的离均差平方和。 ×
多元线性回归要求应变量为定量资料;
Logistic回归要求应变量为二分类或多分类资料; Cox比例风险回归要求应变量为表示时间长短的资
料。
8. 某医师用B超测量一批4岁男孩心脏纵径x1(cm)、 心脏横径x2(cm)和心象面积y(cm2)三项指标,在 统计软件包的支持下,得到多元线性回归方程:
3. 聚类分析常被分为哪两大类?常用的距离 有哪几种?
聚类分析常被分为:
R型聚类(变量聚类)
Q型聚类(样品聚类) 常用的距离:
绝对值距离、欧氏距离、马氏距离、明氏距 离、切比雪夫距离和兰氏距离。
4. 常用的类间距离分类的方法有哪几种?
最短距离法、最长距离法、中间距离法、重心法、 类平均法、可变类平均法、离差平方和法和可变 法。
无=0,有=1 对照=0,病例=1
对上面6个危险因素按连续变量采用逐步法 进行多变量筛选,最终进入方程的危险因素分 别为X2,X3,X4,X6结果见下表:
表2 进入方程中的自变量及有关参数
入选变量 吸烟量X2 声嘶史X3 摄食新鲜蔬菜X4 癌症家族史X6
b 1.487 1.917 -3.764 3.632
b2=3.662086的含义是:对于心脏纵径相同的4岁 男孩,其心脏横径每增加1 cm,则心象面积平均 增加3.662086 cm2。
R2=0.81表示:4岁男孩心象面积的变异中可由 其心脏纵径和心脏横径解释的部分占81%。
9. 某北方城市研究喉癌发病的危险因素,用1:2配 对的病例-对照研究进行了调查。现选取6个可能 的危险因素并节录25对数据,各因素的赋值如下:
增加有统计学意义的自变量后,R2增大;增加无
统计学意义的自变量后, R2减小。 ×
对于R型聚类,它的聚类指标是相似系数,包括相
关系数、列联系数、点相关系数。 √
当多元回归方程中,增加一个作用不大的自变量 时,剩余平方和肯定会减少,所以剩余标准差也
会减少。 ×
决定系数开方得R,称为多元相关系数或复相关系数, 它表示多元回归中应变量Y与各个自变量线性组合间 的相关。√
B. 一组,各类一个 D. 事先不能确定
逐步判别中,变量的判别能力和函数的判别能力 的检验统计量分别是(A )
A. F、X2
B. X2 、 F
C. 均为F E. T 、X2
D. 均为X2
逐步判别中,剔选变量时,(B)变量Xi判别能力 越强。
A. Ui越大 C. Pi越大 E. 以上均不对
B. Ui越小 D. Pi越小
表1 喉癌的危险因素与赋值说明
危险因素
变量名
赋值说明
咽炎
X1
吸烟量(支/日)
X2
无=1,偶尔=2,经常=3
每日0支=1,每日1~4支=2, 每日5~9支=3,每日10~19支=4, 每日20支~=5
声嘶史
X3
摄食新鲜蔬菜
X4
摄食水果
X5
癌症家族史
X6
是否患喉癌
Y
无=1,偶尔=2,经常=3 少=1,经常=2,每天=3 很少=1,少量=2,经常=3
多元回归方程中,自变量作用显著当然很好,但即使 有些自变量作用不显著,只要有点作用,多几个自变 量总比少几个好。×
若X1、X2与周围其他变量没有什么关系,则用简单相 关系数r表示它们的相关性是可以的。若还存在着对X1、 X2关系密切的其他变量,则r就不能真实地反映X1、X2 之间的关系,需要用偏相关系数。 √
A. 两均数平均值
B. 用样本含量加权
C. 用方差加权平均
D. 目视法
E. 以上方法均可
Bayes公式法理论上要求(D )
A. 各类指标Xi间相互独立 B. 各类别AG间互斥
C. 各类别AG构成完备事件
D. ABC
E. AC
Bayes准则下所建立判别函数式有(B )
A. 一个 C. 一组,各指标一个 E. 以上均不对
Sb 0.551 0.944 1.825 1.866
X2 7.921 4.119 4.253 3.983
P 0.0069 0.0424 0.0392 0.0471
OR 4.423 6.798 0.023 37.793
问:写出logistic回归方程 试分析4个自变量回归系数的意义
logistic回归方程如下:
5. Fisher判别和Bayes判别的判别准则有何 不同?
Fisher判别准则:
变异用离均差平方和表示,要求各类之间 的变异尽可能地大,而各类内部的变异尽可能 地小(既类类之间变异最大,类内之间变异最 小)。
Bayes判别的判别准则:
是聚类分析与判别分析关系?
多元线性回归分析中,反映回归平方和在应变量Y 的总离均差平方和中所占比重的统计量是( E)
A.复相关系数
B.偏相关系数
C.偏回归系数
D.回归均方
E.决定系数
作多元回归分析时,若降低进入的F界值,则进入 方程的变量一般会(A)
A. 增多
B. 减少
C. 不变
D. 可增多也可减少
E. 以上都不对
10. 某医生对218例成年男子的3个指标:身高X1、
体重X2、肺活量X3进行了测量,并计算出它们的 简单相关系数和一级偏相关系数,r12=0.807, r13=0.935,r23=0.770,r13.2=0.832,r23.1=0.075 (前四个相关系数有统计学意义,第五个没有统 计学意义)。
判别分析是根据某些指标的观测值对所研究的对
象判断其归属类别的一种统计分析方法。√
所谓训练样本就是一定数量的已知实际类别且各
指标的观测值均齐全的样本。 √
建立Fisher两类判别的准则是使类间差别最大,而
类内变异最小。 √
系统聚类法不仅试用于对样本的聚类,也可用于
对指标的聚类。 √
判别分析效果好坏的关键是训练样本,训练样品 数越多,则所建立的判别函数就越有效,用于对
A. Pi最大者
B. Pi最大且有统计学意义者
C. Pi最小者
D. Pi最小且有统计学意义者
E. 只要有统计学意义者
向后剔除法中,方程和偏回归系数的检验依次 是(A)
A. F检验、t检验
B. t检验、F检验
C. 均为F检验
D. 均为t检验
对于标准偏回归系数,下列哪些是错误的?(A)
A. 其大小受自变量所取单位的影响 B. 无单位,可直接用以比较 C. 其数值大小可以衡量每个自变量对y作用的大小 D. 它表示固定其他变量,当Xi变动一个标准差单 位,y平
有序样品聚类中,如果n个样品要分为k类,分类方案会有 许多种,不同的分类方案所求得的目标函数也会不同。√
目标函数一般定义为类直径之和。一般目标函数越大,这 个分类方案就越合理。 ×
有序样品聚类中,计算n个样品分为k类的最小目标函数, 即分别算出所有可能的分法的k类的类直径之和,其中最 小者就是最小目标函数。此分类方式即为最优分割。 √
二者同属分类问题。 聚类分析“无师可循”,其目的就是把相似的东
西归成类;判别分析“有师可循”,对个体进行 归类。 当各类总体不清楚时,可先用聚类分析法进行聚 类,然后建立判别函数,再对新个体判别其归属。
7. 一般情况下,多元线性回归、Logistic回 归和Cox比例风险回归对应变量的资料类 型各有什么要求?
➢ β4=-3.764,其相应的优势比OR4=0.023,表示摄食新 鲜蔬菜为保护因素,说明在其他因素不变的情况下, 每天摄食新鲜蔬菜比少摄食新鲜蔬菜或经常摄食新鲜 蔬菜患喉癌的危险低。
➢ β6=3.623表示,其相应的比数比OR6=37.793,表示喉 癌家族史为危险因素,说明在其他因素不变的情况下, 有癌症家族史者患喉癌的危险是没有癌症家族史的 37.793倍 。
多元统计分析 方法习题指导
赵珍 Tel:4366365 流行病学与卫生统计学教研室
主要章节:
▪ 多重线性回归 ▪ 聚类分析 ▪ 判别分析 ▪ Logistic族回归
简答题
1. 评价多重线性回归方程的方法? 方差分析法
F检验是把所有自变量作为一个整体,检验它 们对应变量Y的影响是否具有统计学意义。
决定系数R2法
R2表示方程中的自变量能够解释应变量Y变化 的百分比,其值越接近1,说明模型对数据的拟合 程度越好。
2. 常用的衡量方程优劣的标准有哪些?
复相关系数R,其值越大方程拟合越好。 校正复相关系数Radj,其值越大方程拟合越好。 剩余标准差Sy.12….m ,其值越小说明回归效果越好。 赤池信息准则AIC,其值越小越好。 Cp统计量。
Y=-3.12695+3.210445x1+3.662086x2,经检 验,方程与两个自变量均有统计学意义。
– 结合专业知识解释以上两个偏回归系数的含义。
– 若决定系数R2=0.81,请解释其含义。
答:
相关文档
最新文档