统计作业
统计作业指导书

统计作业指导书引言概述:统计学是一门研究数据采集、分析和解释的学科,它在各个领域都有广泛的应用。
在学习统计学的过程中,作业是不可或者缺的一部份。
本文将为您提供一份统计作业指导书,匡助您更好地完成统计学作业。
一、数据采集1.1 选择适当的数据源:在开始采集数据之前,确定数据的来源是非常重要的。
可以选择公开数据集、实地调查或者自己设计实验等方式来获取数据。
1.2 数据采集方法:根据研究目的和数据类型,选择合适的数据采集方法。
例如,可以使用问卷调查、观察、实验等方法来采集数据。
1.3 数据质量控制:在数据采集过程中,要注意数据的准确性和完整性。
可以通过重复测量、数据清洗和筛选等方法来保证数据的质量。
二、数据分析2.1 数据整理和描述统计:在进行数据分析之前,首先要对数据进行整理和描述统计。
包括计算数据的均值、中位数、标准差等统计指标,绘制直方图、散点图等图表来展示数据的分布情况。
2.2 探索性数据分析:通过图表和统计分析方法,对数据进行进一步的探索。
可以使用相关分析、回归分析、方差分析等方法来探索变量之间的关系。
2.3 假设检验和判断统计:根据研究目的,进行假设检验和判断统计。
可以使用t检验、方差分析、卡方检验等方法来验证研究假设,并对总体参数进行判断。
三、数据解释和报告3.1 结果解释:在数据分析完成后,要对结果进行解释。
解释应该清晰、准确地表达出数据的含义和结果的统计学意义。
3.2 结果展示:将数据分析的结果以图表、表格等形式进行展示,使读者能够更直观地理解数据和结果。
3.3 结果报告:根据具体要求,撰写数据分析的报告。
报告应包括研究目的、数据采集和分析方法、结果和结论等内容。
四、常见问题和解决方法4.1 数据异常值处理:在数据分析过程中,可能会遇到异常值的问题。
可以通过删除异常值、替换异常值或者使用鲁棒统计方法来处理异常值。
4.2 样本量不足问题:当样本量较小时,可能会影响结果的可靠性。
可以通过增加样本量、使用非参数统计方法或者进行摹拟分析来解决样本量不足的问题。
统计学作业——精选推荐

作业一一、简述中心极限定理和大数定理。
答:中心极限定理:中心极限定理的具体内容是:如果从任何一个具有均值μ和方差σ2的总体(可以具有任何分布形式)中重复抽取容量为n 的随机样本,那么当n 变得很大时,样本均值X 的抽样分布接近正态,并具有均值μ和方差n2 。
大数定理:我们知道,概率论中用来阐明大量随机现象平均结果的稳定性的定理,是著名的大数定理。
其具体内容是:频率稳定于概率,平均值稳定于期望值。
二、试述正态分布的性质与特点。
——P109答:(1)正态曲线以x=μ呈钟型对称,均值=中位数=众数(2)在x=μ处,概率密度最大;当区间离μ越远,x 落在这个区间的概率越小。
(3)正态曲线的外形由σ值确定。
对于固定的σ值,不同均值μ的正态曲线的外形完全相同,差别只在于曲线在横轴方向上整体平移了一个位置 。
(4)对于固定的μ值,改变σ值,σ值越小,正态曲线越陡峭;σ值越大,正态曲线越低平。
(总之,正态分布曲线的位置是由μ决定的,而正态分布曲线的“高、矮、胖、瘦” 由σ决定的。
)(5)E(X)= μ D(X)= σ2三、简述统计量成为总体参数的合理估计的三个标准——P143答:估计量如果具有无偏性、一致性和有效性这三个要求或标准,就可以认为这种统计量是总体参数的合理估计或最佳估计。
如下:1、无偏性。
如果统计量的抽样分布的均值恰好等于被估计的参数之值,那么这一估计便可以认为是无偏估计。
换句话说,从最终的结果来看,估计量的期望值就是参数本身。
2、一致性。
虽然随机样本和总体之间存在一定的误差,但当样本容量逐渐增加时,统计量起来越接近总体参数,满足这种情况,我们就说该统计量对总体参数是一个一致的估计量。
3、有效性。
估计量的有效性指统计量的抽样分布集中在真实参数周围的程度。
如果估计是无偏的,就可以用估计量的标准差来量度这种集中程度。
标准差越小,估计量的有效性越高。
然而效率总是相对的,没有一种估计量完全有效,完全有效意味没有丝毫抽样误差。
统计学A主观题作业

《统计学A》第一次作业二、主观题(共4道小题)6. 指出下面的数据类型:(1)年龄(2)性别(3)汽车产量(4)员工对企业某项改革措施的态度(赞成、中立、反对)(5)购买商品时的支付方式(现金、信用卡、支票)参考答案:(1)年龄: 离散数值数据(2)性别: 分类数据(3)汽车产量: 离散数值数据(4)员工对企业某项改革措施的态度(赞成、中立、反对): 顺序数据(5)购买商品时的支付方式(现金、信用卡、支票): 分类数据(5)购买商品时的支付方式(现金、信用卡、支票):分类数据7. 某研究部门准备抽取2000个职工家庭推断该城市所有职工家庭的年人均收入。
要求:(1)描述总体和样本。
(2)指出参数和统计量。
参考答案:(1)总体: 全市所有职工家庭;样本: 2000个职工家庭(2)参数: 全市所有职工家庭的人均收入;统计量: 2000个职工家庭的人均收入。
统计量:2000个职工家庭的人均收入。
8. 一家研究机构从IT从业者中随机抽取1 000人作为样本进行调查, 其中60%回答他们的月收入在5 000元以上, 50%的人回答他们的消费支付方式是用信用卡。
要求:(1)这一研究的总体是什么?(2)月收入是分类变量、顺序变量还是数值型变量?(3)消费支付方式是分类变量、顺序变量还是数值型变量?(4)这一研究涉与截面数据还是时间序列数据?参考答案:(1) 所有IT从业者。
(2) 月收入十数值型变量(3)消费支付方式是分类变量(4) 涉与截面数据9. 一项调查表明, 消费者每月在网上购物的平均花费是200元, 他们选择在网上购物的主要原因是“价格便宜”。
要求:(1)这一研究的总体是什么?(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值型变量?(3)研究者所关心的参数是什么?(4)“消费者每月在网上购物的平均花费是200元”是参数还是统计量?(5)研究者所使用的主要是描述统计方法还是推断统计方法?参考答案:(1)网上购物的所有消费者(2) 分类变量(3) 所有消费者网上购物的平均花费、所有消费者选择网上购物的主要原因(4) 统计量(5) 描述统计《统计学A》第二次作业二、主观题(共1道小题)31.自填式、面访式、电话式各有什么长处和弱点?参考答案:自填式优点: 调查成本最低;适合于大范围的调查;适合于敏感性问题的调查。
统计学作业

第一章1.简述统计的含义及其相互间的关系统计一词的三种含义:统计工作、统计资料和统计学。
(1)统计工作。
指搜集、整理和分析客观事物总体数量方面资料的工作过程,是统计的基础。
(2)统计资料。
统计工作所取得的各项数字资料及有关文字资料,一般反映在统计表、统计图、统计手册、统计年鉴、统计资料汇编和统计分析报告中。
(3)统计科学。
研究如何搜集、整理和分析统计资料的理论与方法。
(4)统计工作、统计资料、统计科学三者之间的关系是:统计工作的成果是统计资料,统计资料和统计科学的基础是统计工作,统计科学既是统计工作经验的理论概括,又是指导统计工作的原理、原则和方法。
统计工作和统计资料是过程与结果的关系,统计资料是统计工作达到成果或结晶,它来源于统计工作又服务于统计工作,统计工作和统计学是理论与实践的关系,统计学是统计活动发展到一定阶段的产物,是统计实践经验的理论概括,并用于指导统计实践,为统计工作提供理论依据。
统计工作的发展会不断完善和丰富统计理论,而统计理论的丰富又促进了统计工作的发展,使之更有效,更为科学。
2.一个完整的统计工作过程包括统计设计、统计调查、统计整理和统计分析。
3.简述统计指标和标志的关系统计指标和标志既有区别又有联系。
其区别:第一,标志说明总体单位属性或特征的名称;厄尔指标是说明总体数量特征的名称。
第二,标志有智能用文字表达的品质标志和用数量表达的数量标志两种;儿指标都只能用数值表示。
其联系:有许多指标的数值是由总体单位的数量标志值汇总而来。
第二,由于总体和总体单位是可变的,则总体的指标和反映总体单位的标志之间存在变化关系。
4.如何理解统计指标体系比同级指标的应用更为广泛和重要?第二章1.统计调查是根据调查的目的与要求,运用科学的调查方法,有计划、有组织地搜集数据信息资料的统计工作过程。
统计调查方案一般包括几项基本内容:确定调查目的;确定调查对象和调查单位;确定调查项目;设计调查问卷;选择调查方法;确定调查时间和调查期限;制定调查的组织和实施计划。
统计学作业及参考答案(小)

统计学A练习题教学班号:学号:姓名:第一章导论一、思考题1、简述(jiǎn shù)统计的涵义及其关系。
2、简述(jiǎn shù)统计学与其他学科的关系。
3、什么(shén me)是统计学的研究对象?它有什么特点?4、统计(tǒngjì)研究的基本方法是什么?5、社会(shèhuì)经济统计的任务和职能是什么?6、统计活动过程阶段及各阶段的关系如何?7、什么是总体与总体单位?8、简述标志和指标的关系。
9、什么是统计指标体系?为什么统计指标体系比统计指标更重要?10、什么是变量和变量值?11、什么是连续变量和离散变量?如何判断?二、单项选择题(在每小题的四个备选答案中选出一个正确的答案,并将正确答案的号码填在题干后的括号内)1、统计学的基本方法包括()。
A、调查方法、汇总方法、预测方法B、相对数法、平均数法、指数法C、大量观察法、综合分析法、归纳推断法D、整理方法、调查方法、分析方法2、社会经济统计学的研究对象是()。
A、抽象的数量关系B、社会经济现象的数量关系C、社会经济现象的规律性D、数量关系和研究方法3、几位学生的某门课程成绩分别是67分、78分、88分、89分、和 96分,则成绩是()。
A、质量指标B、数量指标C、数量标志D、品质标志4、要了解20个工业企业的职工的工资情况时,则总体是()。
A、20个工业企业B、20个工业企业的职工工资总额C、每一个工业企业的职工D、20个工业企业的全部职工5、标志是说明()。
A、总体单位特征的B、总体特征的C、单位量的特征的名称D、单位值的特征的名称6、工业企业的设备台数、产品产值是()。
A、连续变量B、离散变量C、前者是连续变量,后者是离散变量D、前者是离散变量,后者是连续变量7、为了了解某市高等学校的基本情况,对该市所有高等学校进行调查,其中某一高等学校有学生(xué sheng)5285人,教师950人,该校最大系有师生780,其中教师120人,正、副教授36人,占教师总数的19.3%,上述数值中属于统计指标的有()。
统计学分章作业及答案

一、判断题:1、社会经济统计的研究对象是社会经济现象总体的各个方面。
(×)2、统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查. (×)3、总体的同质性是指总体中的各个单位在所有标志上都相同。
(×)4、个人的工资水平和全部职工的工资水平,都可以称为统计指标。
(×)5、对某市工程技术人员进行普查,该市工程技术人员的工资收入水平是数量标志.(×)6、某一职工的文化程度在标志的分类上属于品质标志,职工的平均工资在指标的分类上属于质量指标。
( √ )7、总体和总体单位是固定不变的. (×)8、质量指标是反映总体质的特征,因此可以用文字来表述。
(×)9、指标与标志一样,都是由名称和数值两部份组成的。
(×)10、数量指标由数量标志值汇总而来,质量指标由品质标志值汇总而来. (× )11、一个统计总体可以有多个指标. ( √ )二、单选题:1、属于统计总体的是(B )A、某县的粮食总产量B、某地区的全部企业C、某商店的全部商品销售额D、某单位的全部职工人数2、构成统计总体的个别事物称为( D)。
A、调查单位B、标志值C、品质标志D、总体单位3、对某城市工业企业未安装设备进行普查,总体单位是(B )。
A、工业企业全部未安装设备B、工业企业每一台未安装设备C、每一个工业企业的未安装设备D、每一个工业企业4、工业企业的设备台数、产品产值是(D )。
A、连续变量B、离散变量C.前者是连续变量,后者是离散变量D、前者是离散变量,后者是连续变量5、在全国人口普查中(B ) .A、男性是品质标志B、人的年龄是变量C、人口的平均寿命是数量标志D、全国人口是统计指标6、总体的变异性是指(B ) .A.总体之间有差异B、总体单位之间在某一标志表现上有差异C.总体随时间变化而变化D、总体单位之间有差异7、几位学生的某门课成绩分别是67 分、78 分、88 分、89 分、96 分,“学生成绩”是(B )。
《统计学》作业(60题)

《统计学》课程习题(修订)1.举例说明统计分组可以完成的任务。
2.举一个单向复合分组表的例子,再举一个双向复合分组表的例子。
3.某市拟对该市专业技术人员进行调查,想要通过调查来研究下列问题:(1)通过描述专业技术人员队伍的学历结构来反映队伍的整体质量;(2)研究专业技术人员总体的职称结构比例是否合理;(3)描述专业技术人员总体的年龄分布状况;(4)研究专业技术人员完成的科研成果数是否与其最后学历有关。
请回答:(1)该项调查研究的调查对象是;(2)该项调查研究的调查单位是;(3)该项调查研究的报告单位是;(4)为完成该项调查研究任务,对每一个调查单位应询问下列调查项目。
4根据上表指出:(1)变量、变量值、上限、下限、次数(频数);(2)各组组距、组中值、频率。
5注:年龄以岁为单位,小数部分按舍尾法处理。
6.对下列指标进行分类。
(只写出字母标号即可)A手机拥有量B商品库存额C市场占有率D人口数E 出生人口数F 单位产品成本G人口出生率H利税额(1)时期性总量指标有:;(2)时点性总量指标有:;(3)质量指标有:;(4)数量指标有:;(5)离散型变量有:;(6)连续型变量有:。
7.现有某地区50户居民的月人均可支配收入数据资料如下(单位:元):886 928 999 946 950 864 1050 927 949 8521027 928 978 816 1000 918 1040 854 1100 900866 905 954 890 1006 926 900 999 886 1120893 900 800 938 864 919 863 981 916 818946 926 895 967 921 978 821 924 651 850 要求:(1)试根据上述资料作等距式分组,编制次(频)数分布和频率分布数列;(2)编制向上和向下累计频数、频率数列;(3)用频率分布列绘制直方图、折线图和向上、向下累计图;(4)根据图形说明居民月人均可支配收入分布的特征。
统计作业

统计作业1、有一批枪弹,出厂时其初速v~N(950,100)(单位:m/s),经过较长时间储存,取9发进行测试,得样本值(单位:m/s )如下:914 920 910 934 953 945 912 924 940 据经验枪弹经储存后其初速度仍服从正态分布,且标准差保持不变,问是否可以认为这批枪弹的初速度有显著降低(05.0=α)?解:这是一个单侧假设检验问题,总体v~N(950,100),待检验的原假设H 0,和备择假设H 1分别为950:0=μH vs 950:1<μH在显著性水平为α下,检验的拒绝域为}{0μμ≤,若取05.0=α,查表知道645.105.0-=μ,经计算得6.63/10950928,928-=-==μx ,此处μ值落入拒绝域内,故拒绝原假设可以判定这批枪弹的初速度有显著降低。
2、已经某炼铁厂铁水含碳量服从正态分布N (4.55,0.1082),现在测定了9炉铁水,其平均含碳量为4.484,如果铁水含碳量的方差没有变化,可否认为现在生产的铁水平均含碳量仍为4.55(05.0=α)?解:这是关于正态总体均值的双侧假设检验问题,原假设H 0,和备择假设H 1分别为 55.4:0=μH vs 55.4:1≠μH由于总体方差已知,故采用μ检验,检验的拒绝域为}{2/1αμμ-≥,当05.0=α时,查表知道96.1975.0=μ,由已知条件484.4=x ,得83.13/108.055.4484.4-=-=μ这里μ值没有落入拒绝域,故不能拒绝原假设,因而可以认为生长的铁水平均含碳量仍为4.55.6、从一批钢管抽取10根,测得其内径(单位:mm )为: 100.36 100.31 99.99 100.11 100.64 100.85 99.42 99.91 99.35 100.10设这批钢管内直径服从正态分布),(2σμN 试分别在下列条件下检验假设(05.0=α) 100:0=μH vs 100:1>μH(1) 已知5.0=σ (2) σ未知解:(1)当5.0=σ已知时,应采用μ检验,此时检验的拒绝域为}{2/1αμμ-≥,若取05.0=α,查表知道96.1975.0=μ,由样本数据计算如下结果6578.05.0)100104.100(10,104.100=-==u x检验统计量未落入拒绝域中,应该接受原假设,不能认为100>μ. (2)当σ未知,应采用t 检验,拒绝域为{)1(2/1-≥-n t t α}, 检验统计量ns x t /0μ-=取显著性水平05.0=α,查表得2622.2)9(975.0=t ,由样本观测值计算s=-.4760 , 4760.0)100104.100(10-=t =0.6909<2.2622. 故接受原假设。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
姓名:郭露露学号:1022018952年级:2010专业:金融数学应用统计软件大作业题目:各地区城镇居民家庭人均收支情况摘要:本题研究全国范围内北京、天津、河北、内蒙古、辽宁、黑龙江、上海、江苏、浙江、福建、山东、河南、湖北、广东、海南、重庆、贵州、云南、西藏、陕西、青海、宁夏、新疆等地的总收入、可支配收入、总支出、消费性支出、非消费性支出以及恩格尔系数(%)的样本,使用多种系统聚类统计方法,比较得出最优分类,分析形成此种结果的原因,并在以后的工作中得以扬长避短,促进全国各地区全方位的发展。
引言:随着社会的发展,我国各地区区域性发展日趋明显,地方特色在经济的发展过程中体现的尤为重要。
我国是社会主义国家,追求的是共产主义,在建设和谐社会的过程中,快速发展、均衡发展显得特别重要。
故我们要研究各地区发展的现况以及形成此种局面的原因,并在我们以后的工作中加以体现,以促进我们的社会主义经济的发展。
基本假设:在进行分类和判别的时候样品间距离为欧氏距离。
符号说明:x1=总收入(元)x2=可支配收入(元)X3=总支出(元)X4=消费性支出(元)X5=非消费性支出(元)X6=恩格尔系数(%)数据:各地区城镇居民家庭人均收支情况(2005年)X1x2x3x4x5x6北京 19533.3 17653.0 17174.3 13244.2 3930.1 31.8天津 13563.3 12638.6 14450.3 9653.3 4797.1 36.7河北 9616.8 9107.1 8461.6 6699.7 1761.9 34.6内蒙古 9565.1 9136.8 9064.2 6928.6 2135.6 31.4辽宁 9837.2 9107.6 9844.8 7369.3 2475.5 38.8黑龙江 8722.5 8272.5 8008.6 6178.0 1830.6 33.5上海 20602.9 18645.0 19368.4 13773.4 5595.0 35.9江苏 13330.0 12318.6 11898.0 8621.8 3276.2 37.2浙江 17877.4 16293.8 16906.1 12253.7 4652.4 33.8福建 13407.6 12321.3 11896.5 8794.4 3102.0 40.9山东 11607.8 10744.8 9888.9 7457.3 2431.6 33.7河南 9146.0 8668.0 7830.7 6038.0 1792.7 34.2湖北 9395.1 8785.9 8582.8 6736.6 1846.2 39.0广东 16249.9 14769.9 15570.4 11809.9 3760.6 36.1海南 8670.2 8123.9 7932.7 5928.8 2003.9 47.6重庆 11079.2 10243.5 10832.2 8623.3 2208.9 36.4贵州 8385.1 8151.1 7644.5 6159.3 1485.2 39.9云南 9994.7 9265.9 8993.0 6996.9 1996.1 42.8西藏 10659.3 9431.2 12719.4 8617.0 4102.3 44.5陕西 8902.3 8272.0 8572.4 6656.5 1915.9 36.1青海 8766.7 8057.9 8424.4 6245.3 2179.1 36.3宁夏 8744.9 8093.6 9107.8 6404.3 2703.5 34.8新疆 8693.7 7990.2 7822.4 6207.5 1614.8 36.4数据来源:《中国统计摘要2006》--国家统计局编模型求解:以下分别用四种系统聚类方法对数据进行处理和分类。
最短距离法(SIN)的并类过程:由R2和半偏R2可以得出最优分类为3类,4类;由伪F统计量(列标题为PSF)可得出最优分类为4类,5类;由伪t2统计量可得出最优分类为3类,4类。
综合分析,认为用最短距离法23个地区分为三类、四类、五类较合适。
分为五类的结果为:G1={北京,浙江,广东},G2{天津},G3={黑龙江,河南,陕西,青海,河北,新疆,宁夏,湖北,贵州,辽宁,内蒙古,山东,重庆,江苏,福建,云南,海南},G4={上海},G5={西藏}.若分为四类,则第一类=G1,第二类={G2,G3},第三类=G4,第四类=G5.若分为三类,则第一类={G1,G2,G3},第二类=G4,第三类=G5.重心法(CEN)的并类过程:综合分析,认为用重心法23个地区分为二类、四类比较合适。
分为四类的结果为:G1={北京,浙江,广东,上海},G2={天津,江苏,福建,西藏},G3={黑龙江,河南,陕西,青海,新疆,河北,湖北,贵州,宁夏,山东,重庆,辽宁,云南,内蒙古},G4={海南}.若分为三类,则第一类=G1,第二类={G2,G3},第三类=G4.类平均法(AVE)的并类过程:综合分析,认为用类平均法23个地区分为二类、四类较合适。
(与重心法所得结果基本相似)分为四类时分类结果完全同上。
若分为二类,则第一类=G1,第二类={G2,G3,G4}.离差平方和法(Ward)的并类过程:综合分析,认为用离差平方和法23个地区分为二类、三类较合适。
分为三类的结果为:G1={北京,浙江,上海,天津,广东},G2={黑龙江,河南,陕西,青海,新疆,河北,宁夏,内蒙古},G3={湖北,贵州,辽宁,云南,海南,山东,重庆,江苏,福建,西藏}.若分为二类,则第一类=G1,第二类={G2,G3}结果分析:多种方法分析后,比较来说用离差平方和法分为三类更合适些,具体如上。
三类分别为经济发达地区、经济欠发达地区和其他。
由此数据,执行者可得出一些结论,经济发达地区是因为地域或者地位的差异而成为发达地区的,而经济欠发达地区是否是因为地区差异,交通等原因造成的。
这些都是需要考虑的,进而可以做出“以点带面”、“发达带动周边”等可行性政策。
参考文献:《应用统计软件SAS》《中国统计摘要2006》附录(一):使用最短距离法(SIN)的谱系聚类图:使用重心法(CEN)的谱系聚类图:类平均法(AVE)的谱系聚类图:使用离差平方和法(Ward)的谱系聚类图:附录(二)使用离差平方和法(Ward)的程序:data d634;input group $x1-x6;cards;北京 19533.3 17653.0 17174.3 13244.2 3930.1 31.8 天津 13563.3 12638.6 14450.3 9653.3 4797.1 36.7 河北 9616.8 9107.1 8461.6 6699.7 1761.9 34.6内蒙古 9565.1 9136.8 9064.2 6928.6 2135.6 31.4辽宁 9837.2 9107.6 9844.8 7369.3 2475.5 38.8黑龙江 8722.5 8272.5 8008.6 6178.0 1830.6 33.5上海 20602.9 18645.0 19368.4 13773.4 5595.0 35.9 江苏 13330.0 12318.6 11898.0 8621.8 3276.2 37.2 浙江 17877.4 16293.8 16906.1 12253.7 4652.4 33.8 福建 13407.6 12321.3 11896.5 8794.4 3102.0 40.9 山东 11607.8 10744.8 9888.9 7457.3 2431.6 33.7河南 9146.0 8668.0 7830.7 6038.0 1792.7 34.2湖北 9395.1 8785.9 8582.8 6736.6 1846.2 39.0广东 16249.9 14769.9 15570.4 11809.9 3760.6 36.1 海南 8670.2 8123.9 7932.7 5928.8 2003.9 47.6重庆 11079.2 10243.5 10832.2 8623.3 2208.9 36.4 贵州 8385.1 8151.1 7644.5 6159.3 1485.2 39.9云南 9994.7 9265.9 8993.0 6996.9 1996.1 42.8西藏 10659.3 9431.2 12719.4 8617.0 4102.3 44.5陕西 8902.3 8272.0 8572.4 6656.5 1915.9 36.1青海 8766.7 8057.9 8424.4 6245.3 2179.1 36.3宁夏 8744.9 8093.6 9107.8 6404.3 2703.5 34.8新疆 8693.7 7990.2 7822.4 6207.5 1614.8 36.4;proc cluster data=d634 method=ward stdpseudo ccc outtree=b634;var x1-x6;id group;run;proc tree data=b634 horizontal graphics n=5out=c634; copy group x1-x6;run;proc sort data=c634 ;by cluster;run;proc print data=c634;var cluster group x1-x6;run;proc means data=c634;by cluster;var x1-x6;run;。