多元统计分析习题分为三部分思考题验证题和论文题

合集下载

多元统计分析实验报告

第二部分：实验过程记录（可加页）（包括实验原始数据记录，实验现象记录，实验过程发现的问题
等）操作步骤： 1、执行“分析”—“比较均值”—“单因素方差分析” ； 2、在弹出的单因素方差分析对话框中，将时期选为因子，将 X1、X2、X3、X4 选为因变量； 3、单击“对比” ，选择“多项式” ，在后面的下拉菜单中选择“线性” ，然后继续； 4、单击“两两比较” ，选择“LSD”和“S-N-K” ，显著性水平默认为 0.05，然后继续； 5、单击“选项” ，选择“方差同质性检验”和“均值图” ，然后继续，点击“确定”后即可输出结果。
12
题目：研究者提出，随着时间的推移头骨尺寸会发生变化，这是外来移民与原住民人口民族融合的证据。表 6.13 是古埃及三个时期的男性头骨的四个观测值得观测数据，这是个观测变量是： X1=头骨最大的最大宽度 X2=头骨高度 X3=头骨底穴至齿槽的长度 X4=头骨鼻梁高度对古埃及头骨数据构造单因子 MANOVA 表， a=0.05.并构造 95%联合置信区间来判断在三个时期中哪个分令量的均值发生了改变。同常的 MANOVA 假设对这些数据是不是合理的？请解释。部分数据如下：
实验课程名称：多元统计分析-均值向量检验
实验项目名称实验者同组者
均值向量检验习题均值向量检验习题 6.24
专业班级
实验成绩实验成绩组别年月日
实验日期
一部分：实验预习报告（包括实验目的、意义，实验基本原理与方法，主要仪器设备及耗材，实验
方案与技术路线等）实验目的：深入了解方差分析及方差分析的概念，掌握方差分析的基本原理；掌握方差分析的过程；增强实践能力，能够动手用统计软件解决实际问题，熟练掌握方差分析的基本操作。实验原理：多个正态总体均值向量检验（多元方差分析）设有 k 个 p 元正态总体 N p ( µ1 , Σ), L , N p ( µ k , Σ) ，从每个总体抽取独立样品个数分别为

(完整版)多元统计分析思考题答案

《多元统计分析》思考题答案记得老师课堂上说过考试内容不会超出这九道思考题，如下九道题题目中有错误的或不清楚的地方，欢迎大家指出、更改、补充。

1、简述信度分析答题提示：要答可靠度概念，可靠度度量，克朗巴哈α系数、拆半系数、单项与总体相关系数、稀释相关系数等（至少要答四个系数，至少要给出两个指标的公式）答：信度（Reliability ）即可靠性，它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。

信度指标多以相关系数表示，大致可分为三类：稳定系数（跨时间的一致性），等值系数（跨形式的一致性）和内在一致性系数（跨项目的一致性）。

信度分析的方法主要有以下四种：1)、重测信度法这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测，计算两次施测结果的相关系数。

重测信度属于稳定系数。

重测信度法特别适用于事实式问卷，如果没有突发事件导致被调查者的态度、意见突变，这种方法也适用于态度、意见式问卷。

由于重测信度法需要对同一样本试测两次，被调查者容易受到各种事件、活动和他人的影响，而且间隔时间长短也有一定限制，因此在实施中有一定困难。

2)、复本信度法复本信度法是让同一组被调查者一次填答两份问卷复本，计算两个复本的相关系数。

复本信度属于等值系数。

复本信度法要求两个复本除表述方式不同外，在内容、格式、难度和对应题项的提问方向等方面要完全一致，而在实际调查中，很难使调查问卷达到这种要求，因此采用这种方法者较少。

3)、折半信度法折半信度法是将调查项目分为两半，计算两半得分的相关系数，进而估计整个量表的信度。

折半信度属于内在一致性系数，测量的是两半题项得分间的一致性。

这种方法一般不适用于事实式问卷（如年龄与性别无法相比），常用于态度、意见式问卷的信度分析。

在问卷调查中，态度测量最常见的形式是5级李克特（Likert ）量表。

进行折半信度分析时，如果量表中含有反意题项，应先将反意题项的得分作逆向处理，以保证各题项得分方向的一致性，然后将全部题项按奇偶或前后分为尽可能相等的两半，计算二者的相关系数。

(完整版)多元统计分析试题及答案

2009学年第2学期考试科目：多元统计分析考试类型：（闭卷）考试时间：100 分钟学号姓名年级专业一、填空题（5×6=30）22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。

()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________， __________，________________。

215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。

二、计算题（5×11=50）(),123设X=x x x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫ ⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪⎪⎝⎭12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立？11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量，得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。

多元统计复习资料

多元统计分析考试内容最后成绩作业50% 考试50% 他们班这样不知咱们班什么情况估计也差不多考试一共八道题分三大类（卷面值100分最后折合成50分）一计算题（每题12分）1 计算性的判别分析题主要用Fisher 判别法要掌握公式的方法原理2 聚类分析题主要应用两种聚类法：系统聚类法和模糊聚类法题中会给出距离或相关系数矩阵直接计算老师强调要看清题意不要做无用功！ 3如何将非线性函数形式用线性回归的方法将其线性化写出其过程可能不涉及计算二简答（简答哦不要长篇大论免得后面的题没时间做主要作概略性总结即可）在这一部分中主要有三道题（分值分别10 10 12）老师没有具体给出三道题的题目只是举了些例子回答问题的主要思路是：统计分析方法的基本思想，基本原理与应用，在应用中要注意的问题个别要回答与其他方法的对比举的主要例子有（个人以为前两个比较重要）：1 回归分析模型：回归方程的基本假定，涉及到回归分析方程系数为何作显著性检验统计性的依据是什么（方差分析）给出一个回归分析方程如何作显著性检验2 判别分析：判别分析的优良性两方面考虑：（1）组与组之间的差别是否显著有无必要作判别分析（2）误判率下面的几个例子主要也是按上面的思路回答因子分析聚类分析（不会四种方法一块考，会选其中某个或某两个）主成分分析的基本思想可以做什么应用及在应用中要选几个主成分对应分析的基本思想三发挥题（每题16分）这个部分老师会给出问题的背景及所问的问题，个人结合自己所学的几种分析方法选择适合的作分析没有标准答案，只要能自圆其说即可注意：第一步一定要先指出自己所用的分析方法老师没有说具体会考什么题只是说不会考很专业的自由发挥简单提到一个例子就是教学评价的问题也没有说用什么方法他说不同的人会采用不同的方法一道题不会只有一种解决方法.题量大，做不完1 计算题1.1 计算性的判别分析题主要用Fisher 判别法要掌握公式的方法原理处理概率分布未知的判别问题中的最著名的方法。

多元统计学多元统计分析试题(A卷)(答案)

《多元统计分析》试卷1、若),2,1(),,(~)(n N X p =∑αμα 且相互独立，则样本均值向量X 服从的分布为2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。

3、判别分析是判别样品所属类型的一种统计方法，常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。

4、Q 型聚类是指对_样品_进行聚类，R 型聚类是指对_指标(变量)_进行聚类。

5、设样品),2,1(,),,('21n i X X X X ip i i i ==，总体),(~∑μp N X ，对样品进行分类常用的距离有：明氏距离，马氏距离2()ijd M =)()(1j i j i x x x x -∑'--，兰氏距离()ij d L =6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。

7、一元回归的数学模型是：εββ++=x y 10，多元回归的数学模型是：εββββ++++=p p x x x y 22110。

8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。

9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。

一、填空题（每空2分，共40分）1、设三维随机向量),(~3∑μN X ，其中⎪⎪⎪⎭⎫ ⎝⎛=∑200031014，问1X 与2X 是否独立？),(21'X X 和3X 是否独立？为什么？解：因为1),cov(21=X X ，所以1X 与2X 不独立。

把协差矩阵写成分块矩阵⎪⎪⎭⎫⎝⎛∑∑∑∑=∑22211211，),(21'X X 的协差矩阵为11∑因为12321),),cov((∑='X X X ，而012=∑，所以),(21'X X 和3X 是不相关的，而正态分布不相关与相互独立是等价的，所以),(21'X X 和3X 是独立的。

多元统计学多元统计分析试题(A卷)(答案)

3、判别分析是判别样品所属类型的一种统计方法，常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。

4、Q 型聚类是指对_样品_进行聚类，R 型聚类是指对_指标(变量)_进行聚类。

7、一元回归的数学模型是：εββ++=x y 10，多元回归的数学模型是：εββββ++++=p p x x x y 22110。

8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。

9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。

应用多元统计分析课后习题答案详解北大高惠璇部分习题解答课件

则
W X X X X ( ( 1 2 ) ) X X ( ( 1 1 ) ) X X ( ( 1 2 ) ) X X ( (2 2 ) ) W W 1 21 1 W W 1 2 2 2 , 即
W 1 1 X ( 1 ) X ( 1 )W ,2 2 X ( 2 ) X ( 2 )
性质4 分块Wishart矩阵的分布:设X(α) ～ Np(0,Σ) (α
＝1,…,n)相互独立，其中
又已知随机矩阵
1211
12 r 22pr
W n 1X ()X ( ) W W 1 21 1W W 1 2 2 2p r r~ W p(n , )
因 X H ~ 0 下 N p(0 ,1 n 0 ),n (X 0 )H ~ 0 下 N p(0 , 0 )
所以由§3“一﹑2.的结论1”可知
2ln~2(p).
20
第三章多元正态总体参数的检验
3-6 (均值向量各分量间结构关系的检验) 设总体
X～Np(μ ,Σ )(Σ ＞0),X(α) (α ＝1,…,n)(n＞p)为来自p维正态总体X的样本，记μ ＝(μ 1,…,μ p)′.C 为k×p常数(k<p),rank(C)=k,r为已知k维向量.试给出检验H0:Cμ ＝r的检验统计量及分布.
6
第三章多元正态总体参数的检验
证明记rk(A)=r.
若r=n,由AB＝O,知B＝ On×n,于是 X′AX与X′BX
若r=0时,则A＝0,则两个二次型也是独立的. 以下设0＜r＜n.因A为n阶对称阵,存在正交阵Γ,使得
7
第三章多元正态总体参数的检验
其中λi≠0为A的特征值(i=1,…,r).于是

多元统计分析的重点和内容和方法

一、什么是多元统计分析❖多元统计分析是运用数理统计的方法来研究多变量（多指标）问题的理论和方法，是一元统计学的推广。

❖多元统计分析是研究多个随机变量之间相互依赖关系以及内在统计规律的一门统计学科。

二、多元统计分析的内容和方法❖1、简化数据结构（降维问题）将具有错综复杂关系的多个变量综合成数量较少且互不相关的变量，使研究问题得到简化但损失的信息又不太多。

（1）主成分分析（2）因子分析（3）对应分析等❖2、分类与判别（归类问题）对所考察的变量按相似程度进行分类。

（1）聚类分析：根据分析样本的各研究变量，将性质相似的样本归为一类的方法。

（2）判别分析：判别样本应属何种类型的统计方法。

例5：根据信息基础设施的发展状况，对世界20个国家和地区进行分类。

考察指标有6个：1、X1：每千居民拥有固定电话数目2、X2：每千人拥有移动电话数目3、X3：高峰时期每三分钟国际电话的成本4、X4：每千人拥有电脑的数目5、X5：每千人中电脑使用率6、X6：每千人中开通互联网的人数❖3、变量间的相互联系一是：分析一个或几个变量的变化是否依赖另一些变量的变化。

（回归分析）二是：两组变量间的相互关系（典型相关分析）❖4、多元数据的统计推断点估计参数估计区间估计统 u检验计参数 t检验推 F检验断假设相关与回归检验卡方检验非参秩和检验秩相关检验❖1、假设检验的基本原理小概率事件原理❖ 小概率思想是指小概率事件（P<0.01或P<0.05等）在一次试验中基本上不会发生。

反证法思想是先提出假设(检验假设H0)，再用适当的统计方法确定假设成立的可能性大小，如可能性小,则认为假设不成立；反之，则认为假设成立。

❖ 2、假设检验的步骤（1）提出一个原假设和备择假设❖ 例如：要对妇女的平均身高进行检验，可以先假设妇女身高的均值等于 160 cm （u=160cm ）。

这种原假设也称为零假设（ null hypothesis ），记为 H 0 。

多元统计分析重点.doc

多元统计分析重点宿舍版第一讲：多元统计方法及应用；多元统计方法分类（按变量、模型、因变量等）多元统计分析应用选择题：①数据或结构性简化运用的方法有：多元回归分析，聚类分析，主成分分析，因子分析 ②分类和组合运用的方法有：判别分析，聚类分析，主成分分析 ③变量之间的相关关系运用的方法有：多元回归，主成分分析，因子分析， ④预测与决策运用的方法有：多元回归，判别分析，聚类分析 ⑤横贯数据：{因果模型(因变量数)：多元回归，判别分析相依模型(变量测度)：因子分析，聚类分析多元统计分析方法选择题：①多元统计方法的分类：1）按测量数据的来源分为：横贯数据（同一时间不同案例的观测数据），纵观数据（同样案例在不同时间的多次观测数据） 2）按变量的测度等级（数据类型）分为：类别（非测量型）变量，数值型（测量型）变量3）按分析模型的属性分为：因果模型，相依模型 4）按模型中因变量的数量分为：单因变量模型，多因变量模型，多层因果模型第二讲：计算均值、协差阵、相关阵；相互独立性第三讲：主成分定义、应用及基本思想，主成分性质，主成分分析步骤主成分定义：何谓主成分分析就是将原来的多个指标（变量）线性组合成几个新的相互无关的综合指标（主成分），并使新的综合指标尽可能多地反映原来的指标信息。

主成分分析的应用：（1）数据的压缩、结构的简化；（2）样品的综合评价，排序主成分分析概述——思想：①（1）把给定的一组变量X1,X2,…XP ,通过线性变换，转换为一组不相关的变量Y1，Y2，…YP 。

（2）在这种变换中，保持变量的总方差（X1，X2，…Xp 的方差之和）不变，同时，使Y1具有最大方差，称为第一主成分；Y2具有次大方差，称为第二主成分。

依次类推，原来有P 个变量，就可以转换出P 个主成分（3）在实际应用中，为了简化问题，通常找能够反映原来P 个变量的绝大部分方差的q （q<p ）个主成分。

主成分性质：1）性质1：主成分的协方差矩阵是对角阵：（2）性质2：主成分的总方差等于原始变量的总方差（3）性质3：主成分Yk 与原始变量Xi 的相关系数为：ρ（YK,Xi ）=√λ√σiitki,并称之为因子负荷量（或因子载荷量）。

(完整版)多元统计分析课后练习答案

第1章多元正态分布1、在数据处理时，为什么通常要进行标准化处理？数据的标准化是将数据按比例缩放，使之落入一个小的特定区间。

在某些比较和评价的指标处理中经常会用到，去除数据的单位限制，将其转化为无量纲的纯数值，便于不同单位或量级的指标能够进行比较和加权。

其中最典型的就是0-1标准化和Z 标准化。

2、欧氏距离与马氏距离的优缺点是什么？欧氏距离也称欧几里得度量、欧几里得度量，是一个通常采用的距离定义，它是在m 维空间中两个点之间的真实距离。

在二维和三维空间中的欧氏距离的就是两点之间的距离。

缺点：就大部分统计问题而言，欧氏距离是不能令人满意的。

每个坐标对欧氏距离的贡献是同等的。

当坐标表示测量值时，它们往往带有大小不等的随机波动，在这种情况下，合理的方法是对坐标加权，使变化较大的坐标比变化较小的坐标有较小的权系数，这就产生了各种距离。

当各个分量为不同性质的量时，“距离”的大小与指标的单位有关。

它将样品的不同属性之间的差别等同看待，这一点有时不能满足实际要求。

没有考虑到总体变异对距离远近的影响。

马氏距离表示数据的协方差距离。

为两个服从同一分布并且其协方差矩阵为Σ的随机变量与的差异程度:如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧氏距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离。

优点：它不受量纲的影响，两点之间的马氏距离与原始数据的测量单位无关。

由标准化数据和中心化数据计算出的二点之间的马氏距离相同。

马氏距离还可以排除变量之间的相关性的干扰。

缺点：夸大了变化微小的变量的作用。

受协方差矩阵不稳定的影响，马氏距离并不总是能顺利计算出。

3、当变量X1和X2方向上的变差相等，且与互相独立时，采用欧氏距离与统计距离是否一致？统计距离区别于欧式距离，此距离要依赖样本的方差和协方差，能够体现各变量在变差大小上的不同，以及优势存在的相关性，还要求距离与各变量所用的单位无关。

如果各变量之间相互独立,即观测变量的协方差矩阵是对角矩阵, 则马氏距离就退化为用各个观测指标的标准差的倒数作为权数的加权欧氏距离。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

《多元统计分析》习题分为三部分：思考题、验证题和论文题
思考题
第一章绪论
1﹑什么是多元统计分析？
2﹑多元统计分析能解决哪些类型的实际问题？
第二章聚类分析
1﹑简述系统聚类法的基本思路。

2﹑写出样品间相关系数公式。

3﹑常用的距离及相似系数有哪些？它们各有什么特点？
4﹑利用谱系图分类应注意哪些问题？
5﹑在SAS和SPSS中如何实现系统聚类分析？
第三章判别分析
1﹑简述距离判别法的基本思路，图示其几何意义。

2﹑判别分析与聚类分析有何异同？
3﹑简述贝叶斯判别的基本思路。

4﹑简述费歇判别的基本思路。

5﹑简述逐步判别法的基本思想。

6﹑在SAS和SPSS软件中如何实现判别分析？
第四章主成分分析
1﹑主成分分析的几何意义是什么？
2﹑主成分分析的主要作用有那些？
3﹑什么是贡献率和累计贡献率，其意义何在？
4﹑为什么说贡献率和累计贡献率能反映主成分中所包含的原始变量的信息？
5﹑为什么要用标准化数据去估计V的特征向量与特征值？
6﹑证明：对于标准化数据有S=R。

7﹑主成分分析在SAS和SPSS中如何实现？
第五章因子分析
1﹑因子得分模型与主成分分析模型有何不同？
2﹑因子载荷阵的统计意义是什么？
3﹑方差旋转的目的是什么？
4﹑因子分析有何作用？
5﹑因子模型与回归模型有何不同？
6﹑在SAS和SPSS中如何实现因子分析？
第六章对应分析
1﹑简述对应分析的基本思想。

2﹑简述对应分析的基本原理。

3﹑简述因子分析中Q型与R 型的对应关系。

4﹑对应分析如何在SAS和SPSS中实现？
第七章典型相关分析
1﹑典型相关分析适合分析何种类型的数据？
2﹑简述典型相关分析的基本思想。

3﹑典型变量有哪些性质？
4﹑典型相关系数和典型变量有何意义？
5﹑典型相关分析有何作用？
6 ﹑在SAS和SPSS中如何实现典型相关分析？
验证题
第二章聚类分析
1、为了更深入了解我国人口的文化程度，现利用1990年全国人口普查数据对全国30个省、直辖市、自治区进行聚类分析。

分析选用了三个指标：(1)大学以上文化程度的人口占全部人口的比例(DXBZ)；(2)初中文化程度的人都占全部人口的比例(CZBZ)；(3)文盲半文盲人口占全部人口的比例(WMBZ)，分别用来反映较高、中等、较低文化程度人口的状况。

计算样品之间的相似系数，使用最长距离法、重心法和Ward法，将上机结果按样品号画出聚类图，并根据聚类图将30个样品分为四类。

2、根据信息基础设施的发展状况，对世界20个国家和地区进行分类。

只要采用6个指标：(1)Call—每千人拥有电话线数，(2)movecall—每千户居民蜂窝移动电话数，(3)fee—高峰时期每三分钟国际电话的成本，(4)Computer—每千人拥有的计算机数，(5)mips—每千人中计算机功率(每秒百万指令)，(6)net—每千人互联网络户主数。

计算样本之间的距离采用欧式距离，用最长距离法、重心法、离差平方和法进行计算。

3、按照城乡居民消费水平，对我国30个省市自治区分类。

第三章判别分析
1、从1995年世界各国人文发展指数的排序中，选取高发展水平、中等发展水平的国家各五个作为两组样本，另选四个国家作为待判样品做距离判别分析。

2、对全国30个省市自治区1994年影响各地区经济增长差异的制度变量：1x —经济增长率(%)、
—非国有化水平(%)、3x —开放度(%)、4x —市场化程
度(%)作判别分析。

3、为了解全国各地职工生活费用上涨水平，对29个省市自治区九项指标作判别分析。

第四章主成分分析
1、对全国30个省市自治区经济发展基本情况的八项指标作主成分分析。

2、对30个省市自治区工业企业经济效益作综合评价。

3、对我国城市居民生活费支出作主成分分析。

第五章因子分析
1、利用1995年的数据对我国社会发展状况进行综合考察。

2、对我国30个省市自治区的农业生产情况作因子分析。

从农业生产条件和生产结果济效益出发，选取六项指标分别为：1X —乡村劳动力人口(万人)，2X —人均经营耕地面积(亩)，3X —户均生产性固定资产原值(元)，4X —家庭基本纯收入(元)，5X —人均农业总产值(千元/人)，6X —增加值占总产值比重(%)。

3、对1979-1988年中国人民银行资金来源的10项指标作因子分析。

第六章对应分析
1、用对应分析研究我国部分省份的农村居民家庭人均消费支出结构。

选取7个变量：1X —食品支出比重，2X —衣着支出比重，3X —居住支出比重，4X —家庭设备及服务支出比重，5X —医疗保健支出比重，6X —交通和通讯支出比重，7X —文教娱乐、用品及服务支出比重。

样品为10个：山西、内蒙古、辽宁、吉林、黑龙江、海南、四川、贵州、甘肃、青海。

2、对全国31个省市自治区按各种经济类型资产占总资产比重(%)，利用1997年数据作对应分析。

选取6个变量：1X —国有经济/总资产，2X —集体经济/总资产，3X —联营经济/总资产，4X —股份制经济/总资产，5X —外商投资经济/总资产，6X —港澳台经济/总资产
3、用对应分析研究1991年全国各地区独立核算工业企业的经济效益情况。

第七章典型相关分析
1、对某高中一年级男生38人进行体力测试(共有七项指标)及运动能力测试(共有五项指标)，试对两组指标作典型相关分析。

体力测试指标：1X —反复横向跳(次)，2X —纵跳(cm)，3X —背力(kg)，4X —握力(kg)，5X —台阶试验(指数)，6X —立定体前屈(cm)，7X —俯卧上体后仰(cm)。

运动能力测试的指标为：8X —50米跑(秒)，9X —跳远(cm)，10X —投球(m)，11X —引体向上(次)，12X —耐力跑(秒)。

2、全国30个省市自治区农村居民收入和支出的典型相关分析。

反映农村居民收入的变量取4个：1X —劳动者报酬(元)，2X —家庭经营收入(元)，3X —转移性收入(元)，4X —财产性收入(元)。

反映农村居民生活费支出的变量取8个：5X —食品支出(元)， 6X —衣着支出(元)，7X —居住支出(元)，8X —家庭设备及服务支出(元)，9X —医疗保健支出(元)，10X —交通和通讯支出(元)，11X —文教、娱乐用品及服务支出(元)，12X —其它商品及服务支出(元)。

3、社会经济综合发展水平与邮电发展状况的典型相关分析。

论文题
通过论文题，可以让学生掌握如何在图书馆查阅数据，录入数据，并根据论文要求对数据进行预处理，使学生了解各分析方法适合解决的问题类型，能够运用所学的多元统计分析方法解决实际数据分析问题。

1、自拟题目，论文中的数据处理方法至少选用对应分析、典型相关分析中的一种。

2、自拟题目，论文中的数据处理方法至少选用主成分分析、因子分析中的一种。

3、自拟题目，论文中的数据处理方法至少选用聚类分析、判别分析中的一种。