实验指导三主成分分析
《生物制药技术》实验指导-实验三、四

《生物制药技术》实验指导实验三四环素、金霉素的薄层层析鉴定(验证型)实验目的:掌握薄层层析的原理,四环素族抗生素的定性鉴定方法。
实验原理:层析(色谱,chromatograpby)是相当重要、且相当常见的一种技术,在把微细分散的固体或是附着于固体表面的液体作为固定相,把液体(与上述液体不相混合的)或气体作为移动相的系统中(根据移动相种类的不同,分为液相层析和气相层析二种),使试料混合物中的各成分边保持向两相分布的平衡状态边移动,利用各成分对固定相亲和力不同所引起的移动速度差,将它们彼此分离开的定性与定量分析方法,称为层析,亦称色谱法。
用作固定相的有硅胶、活性炭、氧化铝、离子交换树脂、离子交换纤维等,或是在硅藻土和纤维素那样的无活性的载体上附着适当的液体。
将作为固定相的微细粉末状物质装入细长形圆筒中进行的层析称为柱层析(column chromatography),在玻璃板上涂上一层薄而均的支持物(硅胶、纤维素和淀粉等)作为固定相的称为薄层层析(thin layer chromatography),或者用滤纸作为固定相的纸上层析。
层析根据固定相与溶质(试料)间亲和力的差异分为吸附型、分配型、离子交换型层析等类型。
但这并不是很严格的,有时常见到其中间类型。
此外,近来也应用亲和层析,即将与基质类似的化合物(通常为共价键)结合到固定相上,再利用其特异的亲和性沉淀与其对应的特定的酶或蛋白质。
分配层析在支持物上形成部分互溶的两相系统。
一般是水相和有机溶剂相。
常用支持物是硅胶、纤维素和淀粉等亲水物质,这些物质能储留相当量的水。
被分离物质在两相中都能溶解,但分配系数不同,展层时就会形成以不同速度向前移动的区带。
一种溶质在两种互不混溶的溶剂系统中分配时,在一定温度下达到平衡后,溶质在固定相和流动相溶剂中的浓度之比为一常数,称为分配系数。
当欲被分离的各种物质在固定相和流动相中的分配系数不同时,它们就能被分离开。
分配系数大的移动快(阻力小)。
几种分析法的优缺点

几种分析法的优缺点主成分分析就是将多项指标转化为少数几项综合指标,用综合指标来解释多变量的方差- 协方差结构。
综合指标即为主成分。
所得出的少数几个主成分,要尽可能多地保留原始变量的信息,且彼此不相关。
因子分析是研究如何以最少的信息丢失,将众多原始变量浓缩成少数几个因子变量,以及如何使因子变量具有较强的可解释性的一种多元统计分析方法。
聚类分析是依据实验数据本身所具有的定性或定量的特征来对大量的数据迚行分组归类以了解数据集的内在结构,并且对每一个数据集迚行描述的过程。
其主要依据是聚到同一个数据集中的样本应该彼此相似,而属于不同组的样本应该足够不相似。
三种分析方法既有区别也有联系,本文力图将三者的异同迚行比较,并举例说明三者在实际应用中的联系,以期为更好地利用这些高级统计方法为研究所用有所裨益。
二、基本思想的异同(一) 共同点主成分分析法和因子分析法都是用少数的几个变量(因子) 来综合反映原始变量(因子) 的主要信息,变量虽然较原始变量少,但所包含的信息量却占原始信息的85 %以上,所以即使用少数的几个新变量,可信度也很高,也可以有效地解释问题。
并且新的变量彼此间互不相关,消除了多重共线性。
这两种分析法得出的新变量,并不是原始变量筛选后剩余的变量。
在主成分分析中,最终确定的新变量是原始变量的线性组合,如原始变量为x1 ,x2 ,. . . ,x3 ,经过坐标变换,将原有的p个相关变量xi 作线性变换,每个主成分都是由原有p 个变量线性组合得到。
在诸多主成分Zi 中,Z1 在方差中占的比重最大,说明它综合原有变量的能力最强,越往后主成分在方差中的比重也小,综合原信息的能力越弱。
因子分析是要利用少数几个公共因子去解释较多个要观测变量中存在的复杂关系,它不是对原始变量的重新组合,而是对原始变量迚行分解,分解为公共因子与特殊因子两部分。
公共因子是由所有变量共同具有的少数几个因子;特殊因子是每个原始变量独自具有的因子。
《农业生态学》实验实习指导

(2)在组分确立后,分别确定各亚系统的输入和输出项目 对于生产者亚系统的输入,包括太阳辐射能和燃油、电力、农业机械、化肥、农药、除
草剂等各种工业辅助能以及人畜力、秸秆、有机肥料等可再生生物能;输出则包括主要目的 产品—粮食和收获的秸杆等。
对于畜牧业亚系统来说,输入部分有饲料、饲草、畜牧机械、管理畜牧的人工、畜舍和 棚圈等建筑物形式的能量输入部分;其输出部分则有肉、奶、蛋、皮、毛等畜产品以及畜力 和粪便等。在各亚系统中,有对系统外部的输出,也有其它系统的输出。例如,作物亚系统 的粮食和秸秆输出,通常可作为畜牧亚系统的饲料输入。畜牧业系统的畜力和粪便输出,可 做为作物亚系统的动力和肥料输入。
一、实验目的
通过本实验使学生了解种间竞争生物现象。具有竞争关系的物种其生会在生态、形态及 生理等方面产生一定的变化,本实验主要是观察形态变化。
二、实验性质和学时
1.实验性质:必修 2.实验学时:2 学时
三、仪器及材料
1.仪器:花盆、烘箱、天秤、直尺 2.材料:腐熟土壤、小麦、大麦、蚕豆种子
四、方法与步骤
4
⑴以分蘖数为指标进行比较,分析不同处理对小麦和大麦分蘖数的影响。当混作分蘖数 大于单作时,说明混作两种作物具有互补性,反之则说明有竞争作用;
⑵以株高为参考指标,做同(1)相同的分析; ⑶混作模式中,两作物间相对竞争力的量化
以侵占率作参考指标: Aab=a 混作产量/a 单作产量-b 混作产量/b 单作产量 其中,Aab 表示混作作物 a 相对于 b 的竞争力,如果侵占率 A=0,则说明组分竞争能力 相等;A>0 时,说明作物 a 的竞争力较强,反之较弱。A 值越大说明竞争力越强。预期产量常 以间作对照为标准。
因子分析实验报告

因子分析实验报告因子分析实验报告引言:因子分析是一种常用的统计分析方法,用于探索变量之间的内在关系。
通过因子分析,我们可以找到隐藏在观测变量背后的潜在因素,从而更好地理解数据的结构和解释变量之间的关系。
本实验旨在通过因子分析方法,对某一特定数据集进行分析,以探索其内在因素和变量之间的关系。
实验设计:本实验选取了一个涉及消费者购买行为的数据集,包含了多个观测变量,如消费金额、购买频率、品牌忠诚度等。
我们希望通过因子分析,找出这些变量背后的潜在因素,以便更好地理解消费者购买行为的本质。
实验步骤:1. 数据准备:首先,我们收集了一份关于消费者购买行为的数据集,包含了1000个样本和10个观测变量。
这些变量包括消费金额、购买频率、品牌忠诚度等。
我们将这些变量进行了标准化处理,以消除量纲差异。
2. 因子提取:接下来,我们使用主成分分析方法进行因子提取。
主成分分析是一种常用的因子提取方法,通过线性变换将原始变量转化为一组互相无关的主成分。
我们计算了每个主成分的特征值和特征向量,并选取了特征值大于1的主成分作为因子。
3. 因子旋转:在因子提取后,我们进行了因子旋转,以使得因子更易于解释。
常用的因子旋转方法有方差最大旋转和极大似然旋转等。
在本实验中,我们选择了方差最大旋转方法,以最大化因子的方差。
4. 因子解释:最后,我们对提取出的因子进行解释。
通过观察每个因子所对应的变量载荷,我们可以确定每个因子的含义和影响因素。
同时,我们还计算了每个因子的方差贡献率,以评估其在解释总体方差中的贡献程度。
实验结果:经过因子分析,我们成功地提取出了3个主要因子,并对其进行了旋转和解释。
这些因子分别代表了消费者的购买能力、购买偏好和品牌忠诚度。
具体而言,第一个因子与消费金额和购买频率相关,代表了消费者的购买能力;第二个因子与购买偏好和购买意愿相关,代表了消费者的购买偏好;第三个因子与品牌忠诚度相关,代表了消费者对品牌的忠诚程度。
实验三-复方对乙酰氨基酚片的含量测定

实验三复方对乙酰氨基酚片的含量测定、目的要求1、掌握复方片剂中各成分含量测定的基本原理和操作方法。
2、掌握复方片剂的分析特点。
二、基本原理复方对乙酰氨基酚片中含有对乙酰氨基酚、乙酰水杨酸和咖啡因三种主成分。
各成分之间性质差异大。
乙酰水杨酸为芳酸类药物,具酸性,K a =3.27X 10-4,可用酸量法测定;对乙酰氨基酚为芳酰胺类药物,具酰胺基,呈中性,但具潜在芳伯氨基,可将其在酸性条件下水解后用重氮化法测定;咖啡因为黄嘌呤类生物碱,碱性极弱,K b =0.7X 10-14,不能采用一般生物碱的含量测定方法,但可将其与碘发生定量沉淀以后,剩余的碘用硫代硫酸钠滴定从而求得咖啡因的含量。
反应式表示如下: 1、乙酰水杨酸的测定原理等当点时,由于生成物水杨酸钠的水解,溶液呈微碱性,所以选用碱性区域变色的指示剂--酚酞。
2、对乙酰氨基酚的测定原理COOHOOC +NaOH CH 3 3 COONa O +H 2O OCCH 3 33、咖啡因的测定原理O CH3H 3CNH 3CN 3N +2I+KI+H 2SO 4NO N N OCH 33 I 2(剩余)+2Na 2s 2O 32NaI+Na 2s 4O 6三、实验方法取本品20片,精密称定,研细备用。
(一)乙酰水杨酸的含量测定药典规定每片检品中含乙酰水杨酸应为0.219g 〜0.242g 。
精密称取上述细粉适量(约相当于乙酰水杨酸0.4g ),置分液漏斗中,加水15ml ,摇匀,用氯仿振摇提取4次(20ml ,10ml ,10ml ,10ml ),提取氯仿液用同一分水10ml 洗涤,合并氯仿洗液,置水浴上蒸干,残渣加中性乙醇(对酚酞指示液显中性)20ml 溶解后,加酚酞指示液3滴,用0.1mol/L 氢氧化钠液滴定,即得。
每1ml0.1mol/L 氢氧化钠液相当于18.02mg 的C 9H 804。
按下式计算每片含乙酰水杨酸的克数g /片=T ".f xWW 平均片重称样量其中:T 一为滴定度;V —消耗滴定液体积;f-为滴定液浓度校正因子酣战指示液取酶酰1外加乙醉100ml 使溶解,即得付变色池围仅无色》红人(二)对乙酰氨基酚的含量测定CH 3N HII 4+KHs04 CH 3 3COOH碘与淀粉作用,变蓝OII—C-CHj 终点时4HCI+2Kl +2KCL+2Mme1+2 +NaNO 2——AHO药典规定每片检品中含对乙酰氨基酚应为0.120g〜0.132g。
聚类分析与主成分分析SAS的程序

实验三我国各地区城镇居民消费性支出的主成分分析和聚类分析(王学民编写)一、实验目的1.掌握如何使用SAS软件来进行主成分分析和聚类分析;2.看懂和理解SAS输出的结果,并学会以此来作出分析;3.掌握对实际数据如何来进行主成分分析;4.对同一组数据使用五种系统聚类方法及k均值法,学会对各种聚类效果的比较,获取重要经验;5.掌握使用主成分进行聚类二、实验内容数据集sasuser.examp633中含有1999年全国31个省、直辖市和自治区的城镇居民家庭平均每人全年消费性支出的八个主要变量数据。
对这些数据进行主成分分析,可将这31个地区的前两个主成分得分标示于平面坐标系内,对各地区作直观的比较分析。
对同样的数据使用五种系统聚类方法及k均值法聚类,并对聚类效果作比较。
最后,对主成分的图形聚类和正规聚类的效果进行比较。
实验1进行主成分分析,根据前两个主成分得分所作的散点图对31个地区进行比较分析。
实验2分别使用最长距离法、中间距离法、两种类平均法、离差平方和法和k均值法进行聚类分析,并比较其聚类效果。
实验3主成分聚类,并与上述正规的聚类方法进行比较三、实验要求1.用SAS软件的交互式数据分析菜单系统完成主成分分析;2.完成五种系统聚类方法及k均值法,比较其聚类效果;3.根据前两个主成分得分的散点图作直观的聚类,并与上述正规的聚类方法进行比较。
四、实验指导1.进行主成分分析在inshigt中打开数据集sasuser.examp633,见图1。
选菜单过程如下:在图1中选分析⇒多元(Y X)⇒在变量框中选x1,x2,x3,x4,x5,x6,x7,x8(见图2)⇒Y⇒选输出⇒选主分量分析,主分量选项(见图3)⇒在图4中作图中的选择(主成分个数缺省时为“自动”选项,此时只输出特征值大于1的主成分)⇒确定⇒确定⇒确定图1图2图3图4 得到如图5、图6所示的结果:图5图6从图5可以看出,前两个和前三个主成分的累计贡献率分别达到80.6%和87.8%,第一主成分1ˆy 在所有变量(除在*2x 上的载荷稍偏小外)上都有近似相等的正载荷,反映了综合消费性支出的水平,因此第一主成分可称为综合消费性支出成分。
成分分析报告是什么

成分分析报告是什么成分分析报告是指通过对某种物质或产品进行系统的分析和检测,得出其中各种成分的含量、性质、浓度等相关信息的一种科学报告。
它主要通过物理、化学等技术手段,对样品中的成分进行定性、定量分析,从而为该物质或产品的质量评价、生产工艺改进以及质量控制提供科学依据。
成分分析报告的主要目的是为了确定物质或产品的各种成分含量,从而评估其性能、品质和安全性。
在工业生产中,成分分析报告可以帮助企业了解原材料的质量,指导生产工艺的改进,并确保产品的一致性和稳定性。
在食品行业中,成分分析报告可以检测食品中的营养成分、添加剂、重金属等,确保食品的安全和合法性。
在医药领域,成分分析报告可以确定药品的有效成分含量,判定其质量和疗效。
成分分析报告主要包括样品采集、分析方法、实验过程、结果数据和结论等几个部分。
首先是样品采集,这一步是整个成分分析的起点,正确的样品采集对后续的分析结果至关重要。
其次是分析方法,根据不同的样品和需要分析的成分,选择相应的分析方法,如光谱分析、色谱分析、质谱分析等。
实验过程是根据分析方法的要求进行实验操作,包括样品的制备、分析仪器的调校和样品的测试等。
结果数据是实验所得的定量或定性数据,可以通过图表、图像等形式展示出来。
最后是结论,根据结果数据进行分析和判断,得出对样品成分的评价和总结。
成分分析报告的准确性和可信度对于质量控制和质量改进至关重要。
为了确保成分分析报告的准确性,一方面需要有经验丰富的分析师和专业的实验室设备,另一方面需要严格的质量控制体系和标准操作规程。
只有在这样的条件下,才能保证成分分析报告的结果是可靠的,并能为企业和消费者提供有力的科学依据。
成分分析报告的意义不仅在于评价和监控产品的质量,还可以为企业和消费者提供更多的信息和选择。
对于企业来说,成分分析报告不仅可以用于质量控制,还可以为技术改进和创新提供参考。
通过对产品成分的分析,企业可以了解到其竞争对手的产品特点和差异化点,从而调整自己的产品结构和市场战略。
甜玉米自交系性状的相关分析和主成分分析

甜玉米自交系性状的相关分析和主成分分析1. 引言1.1 研究背景甜玉米是一种常见的经济作物,其自交系性状的研究对于甜玉米的品种改良和种质资源的挖掘具有重要意义。
甜玉米自交系性状的研究,可以为甜玉米育种提供重要的理论基础和实验数据,促进甜玉米的品质提高和产量增加。
甜玉米自交系性状的相关分析和主成分分析是深入了解甜玉米遗传特性的重要方法,可以帮助揭示甜玉米自交系不同性状之间的关联性和主要影响因素,为甜玉米的品种改良提供科学依据。
随着现代生物技术的不断发展和进步,甜玉米自交系性状研究的深入将为甜玉米的遗传育种提供更多的可能性和机遇。
深入研究甜玉米自交系性状的相关分析和主成分分析,对于推动甜玉米育种领域的发展具有积极的意义和重要的价值。
中关于的文章将在接下来的内容中详细探讨和分析。
1.2 研究目的研究目的:甜玉米是一种重要的作物,其自交系性状对品质和产量有着重要的影响。
本研究旨在通过对甜玉米自交系性状的相关分析和主成分分析,探讨其性状之间的关联性和主要影响因素,为甜玉米的育种和生产提供理论依据和参考。
具体目的包括:1. 确定甜玉米自交系性状之间的相关性,探讨各性状之间的影响关系;2. 通过主成分分析,找出影响甜玉米自交系性状的主要因素,为选育高产高质甜玉米自交系提供科学依据;3. 对甜玉米自交系性状的影响因素进行分析和讨论,为进一步研究提供参考。
通过本研究的探索和分析,旨在为甜玉米的生产和品质提升提供重要的理论支持。
2. 正文2.1 甜玉米自交系性状的测定方法第一步,选择适当的甜玉米自交系。
在进行性状测定之前,需要选择合适的自交系作为研究对象。
这些自交系应当具有代表性,能够反映出该品种的性状变化。
第二步,准备甜玉米种子和种苗。
需要准备好足够数量的甜玉米种子,并进行适当的处理,保证其品质和纯度。
然后,将种子播种在适当的土壤中,培育成幼苗,并进行适当的管理和保养。
第三步,进行性状观察和测定。
一般来说,甜玉米的性状包括生长期、产量、耐病性等方面。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
上机实验指导二:主成分分析实验目的:能利用原始数据与相关矩阵、协主差矩阵作主成分分析,并能理解标准化变量主成分与原始数据主成分的联系与区别;能根据SAS输出结果选出满足要求的几个主成分。
实验每组人数及学时:组人数1人,学时数:2学时实验要求:要求每位实验人员于课堂时间完成相关练习实验环境:装有版本8.0以上的SAS系统的个人电脑实验类型:设计型实验内容:多元统计分析处理的是多变量(多指标)问题。
在实际问题中,为了尽可能完整地获取有关的信息,往往需要考虑众多的变量,这虽然可以避免重要信息的遗漏,但增加了分析的复杂性。
同一问题所涉及到的众多变量之间会存在一定的相关性,这种相关性会使各变量的信息有所“重叠”。
人们自然希望通过克服相关性、重叠性,即对这些彼此相关的变量加以“改造”,用较少的变量来代替原来较多的变量,而这种代替可以反映原来多个变量的大部分信息,从而通过对为数较少的新变量的分析达到解决问题的目的。
这实际上是一种“降维”的思想。
成分分析也称主分量分析,是由Hotelling于1933年首先提出的。
由于多个变量之间往往存在着一定程度的相关性。
人们自然希望通过线性组合的方式,从这些指标中尽可能快地提取信息。
当第一个线性组合不能提取更多的信息时,再考虑用第二个线性组合继续这个快速提取的过程,……,直到所提取的信息与原指标相差不多时为止。
这就是主成分分析的思想主成分分析着眼于考虑变量的“分散性”信息,主要目的是对原变量加以“改造”,在不致损失原变量太多信息的条件下尽可能地降低原变量的维数,即用较少的“新变量”代替原来的各变量,即:(1)变量的降维;(2)主成分的解释。
一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。
以各个主成分为分量,就得到一个更低维的随机向量;因此,通过主成分既可以降低数据“维数”又保留了原数据的大部分信息。
主成分的贡献率与累计贡献率:实用中, 要求累计达到80%~90%的前m个主成份,既能降维又不损失原始变量中的太多信息实际应用一般是求样本主成分:五、实验步骤:(一)过程格式proc princomp选项;var变量表;partial 变量表;freq 变量;weight变量;by变量;(二)语句说明proc princomp语句选项DA TA=输入数据集,可以用type=cov或type=corr指明数据类型,data=new (type=corr) ; 表明new 为一相关系数(corr)数据集.out=输出数据集,存储原始数据和主分量得分等 .outstat=输出数据集,存储变量的平均数、标准差、相关系数、特征值、特征向量等。
Cov指定要求从协方差阵出发计算主成份。
缺省为从相关阵出发计算。
N=指要计算的主成份个数。
缺省时全算。
STD 要求在OUT=的数据集中把主成份得分标准化为单位方差。
不规定时方差为相应特征值。
Noint不含截距;Noprint不输出分析结果.Var语句指明分析的数值变量.Partial语句指明偏相关或协方差矩阵进行分析的数值变量.六、应用:1999年我国经济发展情况分析1999年我国的经济出现了良好的发展势头。
下面我们选取全国31个省市自治区的八项指标(见表1),利用国际先进软件SAS对我国1999年经济发展情况作主成分分析表1 1999年全国31个省市自治区经济发展基本情况国内生产总值居民消费水平固定资产投资职工平均工资货物周转量98居民消费价格指数商品零售价格指数工业总产值省份亿元元亿元元亿吨公里% % 亿元x1 x2 x3 x4 x5 x6 x7 x8北京2174.46 5784 1171.16 14054 333.8 100.6 98.9 1999.97 天津1450.06 5551 576.45 11056 365.9 98.9 97.5 2261.49 河北4569.19 2312 1770.47 7022 1952.5 98.1 97.8 2994.58 山西1506.78 1833 477.57 6065 762.4 99.6 96.8 1096.83 内蒙1268.2 2279 348.22 6347 759.5 99.8 97.7 640.68 辽宁4171.69 4128 1119.47 7895 1229.9 98.6 96.1 3390.14 吉林1669.56 3132 500.02 7158 464.8 98 96.7 1366.92 黑龙2897.41 3431 751.66 7094 844 96.8 96.1 1854.57 上海4034.96 10328 1855.76 16641 206.3 101.5 97.3 5452.91江苏7697.82 3594 2441.88 9171 1075.1 98.5 96.9 8915.04浙江5364.89 3877 1958.05 11201 897.9 98.5 97.7 5191.56安徽2908.59 2523 703.45 6516 887.2 97.5 96.6 1533.9福建3550.24 4066 1084.66 9490 674.1 99.1 96.5 2210.28江西1962.98 2056 454.44 6749 569.4 98.6 96.8 854.65山东7662.1 3194 2220.57 7656 1238.9 99.3 97.1 6944.52河南4576.1 1902 1206.83 6194 1519.7 96.9 96.2 3109.18湖北3857.99 2691 1239.14 6991 830.3 97.8 95.9 2834.35湖南3326.75 2594 883.94 7269 969 100.5 97.6 1414.12广东8464.31 4760 2937.02 12245 935.2 98.2 96.7 10538.17广西1953.27 2079 578.76 6776 647.5 97.7 97.2 911海南471.23 2729 194.78 6865 270.2 98.3 96.6 188.67重庆1479.71 2336 525.26 7182 215.2 99.3 96.5 858.55四川3711.61 2191 1224.4 7249 614.9 98.5 97.3 1895.82贵州911.86 1542 311.93 6595 330.3 99.2 97.9 551.93云南1855.74 2340 663.97 8276 415.2 99.7 98.3 988.53西藏105.61 1708 53.56 12962 7.9 100 98.8 14.98陕西1487.61 1884 587.79 6931 527 97.8 97.5 1035.88甘肃931.98 1650 355.51 7427 533.6 97.6 97.2 667.53青海238.39 2150 117.15 9081 73.6 99.5 98.5 160.77宁夏241.49 2014 128.1 7392 168.4 98.7 97.9 197.66新疆1168.55 2936 526.65 7611 413.4 97.4 96.2 631.84一、主成分分析(一)主成分分析的主要步骤:第一步:计算协方差矩阵以确定利用协方差矩阵还是利用相关系数矩阵进行主成分分析第二步:建立变量之间的相关系数阵R第三步:求R的特征值和特征向量第四步:写出主成分并进行分析第五步:将原始观测数据代入前m个数据获得前m个主成分的得分。
第六步:利用主成分得分进行聚类分析或回归分析(二)主成分分析SAS实现和分析过程:第一步:计算协方差矩阵以确定利用协方差矩阵还是利用相关系数矩阵进行主成分分析(程序见1,结果见表2)程序1:data econ1;data econ1;input prov $ x1 x2 x3 x4 x5 x6 x7 x8 ; /*$表示它前面的变量读取字符*/ card;北京 2174.46 5784 1171.16 14054 333.8 100.6 98.9 1999.97天津 1450.06 5551 576.45 11056 365.9 98.9 97.5 2261.49河北 4569.19 2312 1770.47 7022 1952.5 98.1 97.8 2994.58山西 506.78 1833 477.57 6065 762.4 99.6 96.8 1096.83内蒙 1268.2 2279 348.22 6347 759.5 99.8 97.7 640.68辽宁 4171.69 4128 1119.47 7895 1229.9 98.6 96.1 3390.14吉林 1669.56 3132 500.02 7158 464.8 98 96.7 1366.92黑龙 2897.41 3431 751.66 7094 844 96.8 96.1 1854.57上海 4034.96 10328 1855.76 16641 206.3 101.5 97.3 5452.91江苏 7697.82 3594 2441.88 9171 1075.1 98.5 96.9 8915.04浙江 5364.89 3877 1958.05 11201 897.9 98.5 97.7 5191.56安徽 2908.59 2523 703.45 6516 887.2 97.5 96.6 1533.9福建 3550.24 4066 1084.66 9490 674.1 99.1 96.5 2210.28江西 1962.98 2056 454.44 6749 569.4 98.6 96.8 854.65山东 7662.1 3194 2220.57 7656 1238.9 99.3 97.1 6944.52河南 4576.1 1902 1206.83 6194 1519.7 96.9 96.2 3109.18湖北 3857.99 2691 1239.14 6991 830.3 97.8 95.9 2834.35湖南 3326.75 2594 883.94 7269 969 100.5 97.6 1414.12广东 8464.31 4760 2937.02 12245 935.2 98.2 96.7 10538.17广西 1953.27 2079 578.76 6776 647.5 97.7 97.2 911海南 471.23 2729 194.78 6865 270.2 98.3 96.6 188.67重庆 1479.71 2336 525.26 7182 215.2 99.3 96.5 858.55四川 3711.61 2191 1224.4 7249 614.9 98.5 97.3 1895.82贵州 911.86 1542 311.93 6595 330.3 99.2 97.9 551.93云南 1855.74 2340 663.97 8276 415.2 99.7 98.3 988.53西藏 105.61 1708 53.56 12962 7.9 100 98.8 14.98陕西 1487.61 1884 587.79 6931 527 97.8 97.5 1035.88甘肃 931.98 1650 355.51 7427 533.6 97.6 97.2 667.53青海 238.39 2150 117.15 9081 73.6 99.5 98.5 160.77宁夏 241.49 2014 128.1 7392 168.4 98.7 97.9 197.66新疆 1168.55 2936 526.65 7611 413.4 97.4 96.2 631.84;Run;proc corr cov nosimple data=econ1; /*计算协方差矩阵以查看各变量之间的方差是否相差过大,如果方差相差不大,利用协方差矩阵进行主成分分析,如果方差相差过大,利用相关系数矩阵进行主成分分析*/var x1-x8;run;协方差矩阵的结果如下:表2Covariance Matrix, DF = 30x1 x2 x3 x4 x5 x6 x7 x8x1 4918748.50 1298158.84 1567758.78 1168879.09 656699.684 -236.638 -547.174 5339861.000 x2 1298158.84 3018800.09 611396.599 3568734.98 -73875.217 832.415 -18.018 2167025.621x3 1567758.78 611396.599 536757.959 721355.891 185789.398 9.112 -108.234 1793939.754 x4 1168879.09 3568734.98 721355.891 6615087.99 -351479.052 1592.779 831.877 2674981.193 x5 656699.684 -73875.217 185789.398 -351479.052 189108.104 -178.660 -126.766 527213.405 x6 -236.638 832.415 9.112 1592.779 -178.660 1.213 0.523 7.535x7 -547.174 -18.018 -108.234 831.877 -126.766 0.523 0.642 -443.097 x8 5339861.0 2167025.62 1793939.7 2674981.19 527213.405 7.535 43.097 6584811.592从协方差矩阵可以看出:各变量的样本方差差异过大,因此从样本相关系数矩阵出发做主成分分析。