多元统计分析报告 课程设计

合集下载

多元统计分析课程设报告计

多元统计分析课程设报告计

XXXX课程设计任务书课程名称多元统计分析课题判别分析与因子分析专业班级学生姓名学号指导老师审批任务书下达日期任务完成日期目录课题一判别分析摘要 (1)一、指标和数据 (1)二、聚类分析的实施 (1)三、判别分析的实施 (2)四、结果分析 (5)课题二因子分析摘要 (6)一、数据 (6)二、因子分析的实施 (6)三、结果分析 (10)总结 (11)参考文献 (11)评分标准 (12)附表 (13)课题一判别分析摘要聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。

而判别分析是根据表明事物特点的变量值和它们所属的类,求出判别函数。

根据判别函数对未知所属类别的事物进行分类的一种分析方法。

核心是考察类别之间的差异。

本课题正是基于多元统计分析中聚类分析和判别分析的方法,以《各地区按行业分城镇单位就业人员平均工资》的调查数据为对象(预留出待判样本),借助Spss统计软件用聚类分析进行分类,并以分好的类别为依据对待判样本进行判别分类以及对已分类样本进行回判分析。

一、指标和数据按要求于国家统计局网站查找变量数大于等于10,样本数大于等于20的合适数据并整理。

得到整理后的《各地区按行业分城镇单位就业人员平均工资》(见附表一)。

其体系共有31个地区,19项指标。

具体指标x1:农、林、牧、渔业就业人员平均工资,简写“农、林、牧、渔业”(以下具以简写形式省略“就业人员平均工资”);x2:采矿业;x3:制造业;x4:电力、燃气及水的生产和供应;x5:建筑业;x6:交通运输、仓储和邮政业;x7:信息传输、计算机服务和软件业;x8:批发和零售业;x9:住宿和餐饮业;x10:金融业;x11:房地产业;x12:租赁和商务服务业;x13:科学研究、技术服务和地质勘查业;x14:水利、环境和公共设施管理业;x15:居民服务和其他服务业;x16:教育;x17:卫生、社会保障和社会福利业;x18:文化、体育和娱乐业;x19:公共管理和社会组织。

多元统计课程设计

多元统计课程设计

多元统计 课程设计一、课程目标知识目标:1. 让学生掌握多元统计的基本概念、原理和方法,如多元线性回归、主成分分析等。

2. 使学生了解多元统计在实际问题中的应用,如数据分析、市场研究等领域。

3. 帮助学生理解各统计方法之间的联系与区别,提高学生的数据分析能力。

技能目标:1. 培养学生运用多元统计方法对实际问题进行分析、解决问题的能力。

2. 提高学生运用统计软件(如SPSS、R等)进行数据处理、分析和结果解读的能力。

3. 培养学生独立思考和团队协作的能力,提高学生的学术素养。

情感态度价值观目标:1. 激发学生对多元统计学科的兴趣,培养学生主动探索、积极进取的精神风貌。

2. 引导学生关注社会热点问题,运用多元统计方法进行分析,增强学生的社会责任感。

3. 培养学生严谨、客观的学术态度,提高学生的综合素质。

本课程针对高中年级学生,结合学生特点,注重理论与实践相结合,培养学生运用多元统计方法解决实际问题的能力。

课程目标具体、可衡量,旨在使学生掌握多元统计知识,提高数据分析技能,培养积极的学习态度和价值观。

后续教学设计和评估将围绕这些具体学习成果展开。

二、教学内容1. 多元统计基本概念:介绍多元随机变量、多元分布、协方差矩阵等基本概念,使学生理解多元统计的数学基础。

教材章节:第一章 多元统计分析基础2. 多元线性回归:讲解多元线性回归模型的建立、参数估计、显著性检验等,使学生掌握多元线性回归分析方法。

教材章节:第二章 多元线性回归分析3. 主成分分析:阐述主成分分析的原理、步骤和实际应用,培养学生运用主成分分析进行数据降维的能力。

教材章节:第三章 主成分分析4. 聚类分析:介绍聚类分析的类别、方法及算法,使学生能够根据实际需求选择合适的聚类方法。

教材章节:第四章 聚类分析5. 多元统计软件应用:教授SPSS、R等统计软件的基本操作,培养学生运用软件进行数据处理和分析的能力。

教材章节:第五章 多元统计分析软件应用6. 实践案例分析:分析实际案例,使学生将所学多元统计方法应用于实际问题,提高学生的数据分析能力。

应用多元统计分析课程设计

应用多元统计分析课程设计

应用多元统计分析课程设计摘要多元统计分析是现代数据分析领域中非常重要的一部分。

在本课程设计中,我们将探讨多元统计分析方法在实际应用中的应用,并且使用R语言对真实数据进行分析,以掌握该领域的分析方法和技能。

在本课程设计中,我们将从多方面、多个角度对多元统计分析方法进行研究和评估。

其中涵盖了线性回归、面板数据分析、主成分分析、因子分析、聚类分析等方面的内容。

本课程设计的主要目标是让学生培养多元统计分析的相关技能,能够熟练使用R语言进行数据分析。

课程大纲第一部分:线性回归1.介绍回归模型2.线性回归3.多重线性回归4.变量选择5.模型评估6.模型诊断第二部分:面板数据分析1.面板数据结构2.固定效应模型3.随机效应模型4.模型评估第三部分:主成分分析1.主成分分析介绍2.数据标准化3.因子选择4.主成分分析的应用5.主成分得分的解释第四部分:因子分析1.因子分析介绍2.因子数的选择3.因子旋转4.因子得分的解释5.因子分析的应用第五部分:聚类分析1.聚类分析介绍2.度量距离3.分类方法4.聚类数的选择5.聚类分析的应用实验要求本课程设计需要学生使用R语言对真实数据进行多元统计分析。

学生需要完成以下实验任务:1.确定一个研究问题和相应的数据源2.在R环境中导入数据3.使用多元统计分析方法对数据进行分析4.生成分析报告,解释分析结果实验数据我们将提供一组真实的数据,供学生完成实验分析。

数据包括了多种因素影响某家公司销售量的情况。

学生需要使用多元统计分析方法对数据进行探索和解释,并撰写相关统计报告。

总结在本课程设计中,我们将学习多元统计分析的各种方法和技能,并且使用R语言对真实数据进行分析。

通过本课程设计,学生将掌握多元统计分析的实际应用,为以后的数据分析工作打下坚实的基础。

多元统计分析课程设计报告样例女性空腹及摄入食糖后体内血糖含量主成分分析

多元统计分析课程设计报告样例女性空腹及摄入食糖后体内血糖含量主成分分析

目录目录 (I)一、问题分析 (1)1.1 问题重述 (1)1.2 问题分析 (1)二、主成分分析方法基本原理 (2)2.1 主成分分析基本思想 (2)2.2 主成分分析的数学模型 (2)2.3 主成分分析的计算步骤 (3)三、问题求解 (5)四、结果分析 (7)4.1 相关系数矩阵 (7)4.2 协方差阵 (8)五、总结 (9)六、课程设计心得体会 (9)参考文献 (10)一、问题分析1.1 问题重述49位女性在空腹情况下三个不同时刻的血糖含量(用321,,X X X 表示)和摄入等量食糖一小时后的三个时刻的血糖含量(用小654,,X X X 表示)的观测值(单位:mg/100ml ).问题:分别从样本协方差阵S 和样本相关系数矩阵R 出发做主成分分析,求主成分的贡献率和各个主成分. 在两种情况下,你认为应保留几个主成分?其意义如何解释?就此而言,你认为基于S 和R 的分析那个结果更为合理?1.2 问题分析我们根据主成分分析的基本思想,设法将原来众多的具有一定相关性的指标,重新组合成一组新的互不相关的综合指标来代替原来指标。

通常数学上的处理就是将原来p 个指标作线性组合,作为新的综合指标。

然后,在所有的线性组合中分别从样本协方差阵S 和样本相关系数矩阵R 出发做主成分分析,计算出各个主成分,进而代表原来p 个指标的信息。

进一步,建立主成分分析的数学模型。

最后利用sas 统计软件来求解出各个主成分和各主成分的贡献率。

二、主成分分析方法基本原理2.1 主成分分析基本思想主成分分析是数学上对数据降维的一种方法。

其基本思想是设法将原来众多的具有一定相关性的指标(比如p 个指标),重新组合成一组新的互不相关的综合指标来代替原来指标。

通常数学上的处理就是将原来p 个指标作线性组合,作为新的综合指标。

但是这种线性组合,如果不加限制,则可以有很多,应该如何去选取呢?在所有的线性组合中所选取的1F 应该是方差最大的,故称1F 为第一主成分。

应用多元统计分析第三版课程设计

应用多元统计分析第三版课程设计

应用多元统计分析第三版课程设计一、引言多元统计分析是利用各种不同的统计方法对大规模数据进行分析的方法。

本课程旨在介绍多元统计分析的基本理论、应用和实现方法,帮助学生掌握多元统计分析的技术,为学生提供在更广泛的领域中应用多元统计分析的工具和技术基础。

本课程主要教授多元线性回归分析、因子分析、聚类分析、判别分析、结构方程模型等多元统计分析的基本概念和方法,并针对实际问题进行案例分析。

学生将用R语言实现多元统计分析任务。

二、课程目标1.理解多元统计分析的基本理论和方法;2.掌握多元线性回归分析、因子分析、聚类分析、判别分析、结构方程模型等多元统计分析的技术;3.能够运用R语言进行多元统计分析,解决实际问题;4.能够识别和评估多元统计分析的局限性和假设条件。

三、课程大纲第一章课程导入1.1 多元统计分析概述1.2 多元统计分析的基本流程第二章多元线性回归分析2.1 一元线性回归分析回顾2.2 多元线性回归分析基本概念2.3 多元线性回归分析假设条件2.4 多元线性回归分析的评估指标2.5 多元线性回归分析实例第三章因子分析3.1 因子分析介绍3.2 主成分分析基本概念3.3 因子分析假设条件3.4 因子数选取和因子旋转3.5 因子分析实例第四章聚类分析4.1 聚类分析概述4.2 层次聚类4.3 K均值聚类4.4 聚类分析应用4.5 聚类方法比较第五章判别分析5.1 判别分析的基本概念5.2 判别变量选择5.3 判别分析实例5.4 判别分析与逻辑回归比较第六章结构方程模型6.1 结构方程模型概述6.2 模型设定和假设条件6.3 模型评估指标6.4 结构方程模型实例四、课程任务1.多元线性回归分析–数据收集和清洗–建立模型和选择变量–模型拟合和诊断2.因子分析–数据分析和因子数确定–因子旋转和命名–计算得分和统计推断3.聚类分析–数据预处理和聚类数选择–对象聚类和变量聚类4.判别分析–数据拆分和模型建立–模型拟合和预测5.结构方程模型–模型构建和假设条件–模型拟合和结构验证五、总结本课程介绍了多元统计分析的基本理论、应用和实现方法,并通过实际案例对学生进行指导。

多元统计分析课程设报告计参考Word

多元统计分析课程设报告计参考Word

XXXX课程设计任务书课程名称多元统计分析课题判别分析与因子分析专业班级学生姓名学号指导老师审批任务书下达日期任务完成日期目录课题一判别分析摘要 (1)一、指标和数据 (1)二、聚类分析的实施 (1)三、判别分析的实施 (2)四、结果分析 (5)课题二因子分析摘要 (6)一、数据 (6)二、因子分析的实施 (6)三、结果分析 (10)总结 (11)参考文献 (11)评分标准 (12)附表 (13)课题一判别分析摘要聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。

而判别分析是根据表明事物特点的变量值和它们所属的类,求出判别函数。

根据判别函数对未知所属类别的事物进行分类的一种分析方法。

核心是考察类别之间的差异。

本课题正是基于多元统计分析中聚类分析和判别分析的方法,以《各地区按行业分城镇单位就业人员平均工资》的调查数据为对象(预留出待判样本),借助Spss统计软件用聚类分析进行分类,并以分好的类别为依据对待判样本进行判别分类以及对已分类样本进行回判分析。

一、指标和数据按要求于国家统计局网站查找变量数大于等于10,样本数大于等于20的合适数据并整理。

得到整理后的《各地区按行业分城镇单位就业人员平均工资》(见附表一)。

其体系共有31个地区,19项指标。

具体指标x1:农、林、牧、渔业就业人员平均工资,简写“农、林、牧、渔业”(以下具以简写形式省略“就业人员平均工资”);x2:采矿业;x3:制造业;x4:电力、燃气及水的生产和供应;x5:建筑业;x6:交通运输、仓储和邮政业;x7:信息传输、计算机服务和软件业;x8:批发和零售业;x9:住宿和餐饮业;x10:金融业;x11:房地产业;x12:租赁和商务服务业;x13:科学研究、技术服务和地质勘查业;x14:水利、环境和公共设施管理业;x15:居民服务和其他服务业;x16:教育;x17:卫生、社会保障和社会福利业;x18:文化、体育和娱乐业;x19:公共管理和社会组织。

多元统计学课程设计

多元统计学课程设计

多元统计学课程设计一、课程目标知识目标:1. 学生能理解多元统计学的基本概念,掌握多元数据的描述性统计分析、推断性统计分析及相应的数学模型。

2. 学生能运用多元回归分析、主成分分析、因子分析等多元统计方法对实际问题进行数据分析和解释。

3. 学生能掌握多元统计软件的使用,对实际数据集进行有效处理和分析。

技能目标:1. 学生具备运用多元统计方法解决实际问题的能力,包括数据收集、整理、分析及结果解释。

2. 学生能够熟练运用统计软件进行多元数据分析,并撰写分析报告。

3. 学生能够通过小组合作,共同探讨解决复杂数据分析问题,提高团队协作能力。

情感态度价值观目标:1. 学生能够认识到多元统计学在科学研究、社会生活中的重要作用,培养对统计学学习的兴趣和热情。

2. 学生能够树立正确的数据观,遵循科学、严谨的态度对待数据分析,避免数据误用和滥用。

3. 学生能够在多元统计分析过程中,培养批判性思维,敢于质疑,勇于探索,形成独立思考和判断的能力。

课程性质:本课程为高年级本科或研究生统计学相关专业的核心课程,旨在帮助学生掌握多元统计方法,培养数据分析能力。

学生特点:学生具备一定的统计学基础,对统计方法有一定的了解,但可能缺乏实际应用经验。

教学要求:结合学生特点,注重理论与实践相结合,强调实际案例分析和操作练习,提高学生的实际应用能力。

同时,注重培养学生的团队协作、批判性思维和独立判断能力。

通过本课程的学习,使学生能够在实际工作中运用多元统计学知识解决复杂问题。

二、教学内容1. 多元数据的描述性统计分析:包括多元数据的收集、整理、图示方法,如散点图矩阵、相关系数等;多元分布特征,如均值、协方差、协方差矩阵等。

教材章节:第一章 多元数据的描述性分析2. 多元推断性统计分析:多元正态分布、多元回归分析、多元方差分析、判别分析等。

教材章节:第二章 多元推断性分析3. 多元统计方法的应用:主成分分析、因子分析、聚类分析、时间序列分析等。

多元统计课程设计参考范本

多元统计课程设计参考范本

多元统计课程设计参考范本一、课程目标知识目标:1. 理解并掌握多元统计的基本概念、原理及方法,如多元线性回归、聚类分析等;2. 学会运用多元统计方法对实际问题进行数据分析,并得出有效结论;3. 了解多元统计在实际应用领域的价值,如经济、生物、社会等。

技能目标:1. 能够运用多元统计软件(如SPSS、R等)进行数据处理和分析;2. 培养学生的团队协作能力,学会与他人共同探讨、分析并解决实际问题;3. 提高学生的数据解读和报告撰写能力,能够清晰、准确地向他人表达分析结果。

情感态度价值观目标:1. 培养学生对多元统计学科的兴趣,激发学习热情;2. 增强学生的数据分析意识,使其认识到数据分析在解决实际问题中的重要性;3. 培养学生严谨、客观、批判性的思维品质,面对数据不盲目迷信,敢于质疑和探究。

课程性质:本课程旨在帮助学生掌握多元统计的基本理论和方法,提高学生运用数据分析实际问题的能力。

学生特点:高中年级学生,具备一定的数学基础,对数据分析有一定了解,但对多元统计知识掌握不足。

教学要求:结合学生特点,注重理论与实践相结合,充分调动学生的积极性,提高其多元统计素养。

通过具体案例教学,引导学生学会运用多元统计方法解决实际问题,并注重培养学生的团队协作和表达能力。

在教学过程中,关注学生的情感态度变化,激发其学习兴趣,培养其批判性思维。

将课程目标分解为具体的学习成果,为后续教学设计和评估提供依据。

二、教学内容1. 多元统计概述:介绍多元统计的基本概念、应用领域及研究方法,使学生初步了解多元统计的整体框架。

教材章节:第一章 多元统计分析导论2. 多元线性回归:讲解多元线性回归模型的建立、参数估计、假设检验等,使学生掌握多元线性回归分析方法。

教材章节:第二章 多元线性回归分析3. 聚类分析:介绍聚类分析的基本原理、方法及步骤,使学生学会对数据进行分类处理。

教材章节:第三章 聚类分析4. 主成分分析:讲解主成分分析的基本概念、计算方法及其应用,帮助学生掌握降维技术在数据分析中的应用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多元统计分析课程设计题目:《因子分析在环境污染方面的应用》姓名:***专业班级:统计学2014级2班学院:数学与系统科学学院时间:2016年1月 3 日目录1.摘要: (1)2.引言: (1)2.1背景 (1)2.2问题的研究意义 (1)2.3方法介绍 (2)3.实证分析 (10)3.1指标 (10)3.2原始数据 (10)3.3数据来源 (13)3.4分析过程: (13)4.结论及建议 (25)5.参考文献 (26)1.摘要:中国的环境问题,由于中国政府对环境问题的关注,环境法律日趋完善,执法力度加大,对环境污染治理的投人逐年有较大幅度的增加,中国环境问题已朝着好的方面发展。

但是,仍存在着环境问题,主要体现在环境污染问题,其中主要为水污染和大气污染。

关键词:环境污染水污染大气污染因子分析2.引言:2.1背景:我国的环境保护取得了明显的成就,部分地区环境质量有所改善。

但是,从整体上看,我国的环境污染仍在加剧,环境质量还在恶化。

大气二氧化硫含量居高不下,境质量呈恶化趋势,固体废弃物污染量大面广,噪声扰民严重,环境污染事故时有发生。

据中国社会科学院公布的一项报告表明:中国环境污染的规模居世界前列。

2.2问题的研究意义:为分析比较各地环境污染特点,利用因子分析对环境污染的各个指标进行降维处理并得到影响环境的内在因素,进一步对环境污染原因及治理措施进行分析,让更多的人认识到环境的重要性,准确把握各地区环境治理方法以及针对不同地区制定不同的政策改善环境问题,这对综合治理环境问题具有重要意义。

2.3方法介绍因子分析的意义:变量间的信息的高度重叠和高度相关会给统计方法的应用设置许多障碍。

为解决此问题,最简单和最直接的解决方案是削减变量个数,但这必然会导致信息丢失和信息不完全等问题的产生。

为此人们希望探索一种更有效地解决方法,它既能大幅减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。

因子分析正是这样一种能够有效降低变量维数的分析方法。

因子分析的步骤:·因子分析的前提条件:要求原有变量之间存在较强的相关关系。

·因子提取:将原有变量综合成少数几个因子是因子分析的核心内容。

若存在随机向量)(),,(1p q F F F q ≤'= 及),,(1'=p εεε ,使⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡+⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡p q pq p q p F F a a a a X X εε 1111111简记为ε+=AF X ,且 (1)qI F D F E ==)(,0)((标准化);(2)⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡==221)(,0)(p D E σσεε (中心化);(3)0),(=F Cov ε(不相关)。

那么,称指标向量X 具有正交因子结构(所有因子相互正交,即ji q j i F F E j i ≠==,,,1,,0)( );称此模型为正交因子模型;称qF F ,,1 为公共因子(对整个X 有影响的公共因素);称pεε,,1 为特殊因子(只对X 的各对应分量有影响的特殊因素);称qp ij a A ⨯=)(为因子载荷矩阵,ija 为第i 个指标在第j 个公共因子上的载荷。

因子载荷矩阵的建立因子分析的最基本任务之一就是建立因子载荷矩阵A 。

对于正交因子模型,有=)(X D )(εD A A +'若X 已标准化,则=)(X R )(εD A A +'在绝大多数实际问题中,)(εD 往往都是未知的,由此求出A 是不可能的,这时可以通过主成分分析给出一组公共因子及其因子载荷矩阵。

具体方法如下: (1)求出R 的特征根1>≥≥p λλ ,以及相应的单位特征向量),,1(),,(1)(p i u u u ip i i ='=。

(2)建立主成分。

,)(X u Y i i '=XU Y '=),,()()1(p u u U =是正交矩阵。

∧=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡='=='=p U X R U Y D X E U Y E λλ 1)()(,0)()((3)构造公共因子,并建立因子载荷矩阵。

Y U UY X 2121-∧∧== (逆问题)令Y F 21-∧=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=∧=p pp p p u u u u U A λλ1111121⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=pp p p p p u uu u λλλλ111111 容易验证:pI F D F E ==)(,0)(X 具有如下正交因子结构:AF X = (Y F U A ----,?)完全忽略了特殊因子的影响。

pi F u F u F u F u X ppi p q i q q q qi q i i ,,11)1(1111 =+++++=+++λλλλppi p q i q q i F u F u λλε++=+++ 1)1(1iq qi q i i F u F u X ελλ+++= 111若只取前q 个主成分,且令=A ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡qp q pq q u u u u λλλλ 111111,),,(1'=q F F F ,),,(1'=p εεε则有ε+=AF X其中,q I F D F E ==)(,0)(A A R D F Cov E '-===)(,0),(,0)(εεε。

忽略了不重要的公共因子,由特殊因子解析。

换句话说,用主成分法获得了X 的正交因子分解(近似)中的F A ,。

这里的主要问题是如何确定因子数k 方法一:根据特征值确定因子数。

观察各个特征值,一般取特征值大于1的。

方法二:根据因子的累计方差贡献率确定因子数。

通常选取累计方差贡献率大于0.85时的特征值个数为因子个数k 。

·使因子具有命名解释性实际分析工作中人们总是希望对因子的实际含义有比较清楚的认识。

未解决这个问题,可通过因子旋转的方法使一个变量只在尽可能少的几个因子上有比较高的载荷。

最理想状态下,使某个变量在某个因子上的载荷趋于1,在其他的因子上的载荷趋于0。

这样,一个因子就能够成为某个变量的典型代表,于是因子的实际含义也就清楚了。

因子正交旋转当指标向量X 具有正交因子结构时,其公共因子向量、因子载荷矩阵及正交因子分解均不唯一确定。

ε+=AF X对任一q 阶正交矩阵T ,有ε+'=F T AT X令AT A F T F ='=**,则ε+=**F A XI T T T F D T F D F E ='='==**)()(,0)( 0)()(),(=''='=**εεεF E T F E F Cov ),)(,)((22说明的问题i i h h A A A A ='='***利用正交因子分解的这一性质,在因子分析(正交因子模型)中,常常在建立了初始因子载荷矩阵之后,再对其作适当的正交变换(几何解释:因子轴旋转),以使得因子载荷矩阵AT A =*具有更简洁、更理想(近乎分块对角矩阵形式)的结构,公共因子向量F T F '=*具有更明显、更直观的实际意义,正交因子分解ε+=**F A X 更合理、更能反映客观实际。

目前,已经提出了各种因子旋转的方法。

比较常用的一种是方差极大因子轴正交旋转法,简称方差极大法。

先考虑两个公共因子的平面正交旋转。

⎥⎦⎤⎢⎣⎡-=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=φφφφcos sin sin cos ,211211T a a a a A p p⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡+-++-+=211211212112111211cos sin sin cos cos sin sin cos p p p p p p b b b b a a a a a a a a ATφφφφφφφφ具有更理想、更简化的结构,即使其各列的因子载荷值尽可能地两极分化,大者尽可能大,小者尽可能小。

各载荷值可正可负,iX 的依赖程度2i h 也不同,消除其影响:[])2,1;,1(10/22==∈=*j p i h b b i ij ij ,(规格化)2,14)(12)(1)(=≤-=*=*∑j b b p V j p i ij j正交旋转的目的就是要使新因子载荷矩阵的各列方差之和(总方差))2()1(V V V +=达到最大。

记2,1;,,1===j p i h a iij ij αpi i i i i i i , ,12,212221==-=ααβαααipi i ipi ip i i p i i βαδβαγββαα∑∑∑∑=====-===1212112),(,,则φ可由下式确定:tgg ep p =---=)(2422βαγαβδφ且φ的符号可由e 的符号确定:)0,4(0);4,0(0πφπφ-∈⇒<∈⇒>e e当公共因子数2>q 时,需要对因子载荷矩阵中的q 列因子载荷向量配两两对旋转,共旋转2)1(2-=q q C q 次。

t s ,列。

先确定φ,后旋转。

tsT st ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡-=11cos sin sin cos 11φφφφ仅t s ,列元素改变。

全部列两两配对旋转完毕后,就完成了第一轮旋转。

如果因子载荷矩阵还不能达到要求,那么进行第二轮旋转,如此进行下去,直到满足要求为止。

每经一轮旋转,都可算出因子载荷矩阵的总方差。

→→→→→→=)2()1()0()2()1()0(;V V V A A A A,,212)1()2()1()2(12)1()2(1)1()1()1(120)1(T AT T A T T A AAT T T A A q q q q =====--)(,,,)2()1()0(V V V 是一非降序列,且有上界(为q 4),故必收敛于某一极限值*V ,*V 即为最大总方差。

实际中,通常旋转到总方差改进不大,即ξ<--)1()(k k V V (给定精度)时,旋转停止。

最后,取ATT AT A A k k ===* 1)(作为最终因子载荷矩阵。

·计算因子得分因子得分是因子分析的最终体现。

在因子分析的实际应用中,当因子确定以后,便可计算各因子在每个样本观测上的具体数值,这些数值称为因子得分,形成的变量称为因子得分变量。

于是,在以后的分析中就可以因子得分变量代替原有变量进行数据建模,或利用因子得分变量对样本进行分类或评价等研究,进而实现降维和简化问题的目的。

Y F F F Y F F F F p q p q q 2112111),,,(,),,,,,(-+-+∧=''∧='))()(0,()0,(),,,)(0,(121211X U U U T Y T F F F T F T F p q '∧'∧'=∧'='''='=--+*X R U T X U U U T 121121))(0,())()(0,(--'∧'='∧'∧'=X R u u u u T p q q p q q1)()1()()1(110000)0,(-++⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡''''⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡+⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡'=λλλλXR A X R AT X R A T 111)()(0)0,(-*--'='=⎥⎦⎤⎢⎣⎡''≈**≈F A X ,**-*-*'≈'F A R A X R A 11)()(,U U R '∧=--11,AT A =*⎥⎦⎤⎢⎣⎡∧=⨯-⨯q q p q q I U A )(210,q q I A R A ⨯*-*==' 1)(3.实证分析 3.1指标:废水排放总量、需氧量排放总量、氨氮排放总量、二氧化硫排放总量、氮氧化物排放总量、烟尘灰尘排放总量 3.2原始数据:3.3数据来源:《中国环境年鉴》3.4分析过程:利用SPSS软件进行分析,首先录入数据,然后一次进行如下处理:一、考察原有变量是否适合进行因子分析首先考察收集到的原有变量之间是否存在一定的线性关系,是否适合采用因子分析。

相关文档
最新文档