《 数据分析 》课程期末考试试题A卷
第六章数据分析期末复习专练答案解析

数据分析期末复习专练一、选择题:本题共10小题,每小题3分,共30分。
在每小题给出的选项中,只有一项是符合题目要求的。
1.为了考察库存2000只灯泡的使用寿命,从中任意抽取15只灯泡进行实验,在这个问题中.下列说法正确的是()A.总体是2000只灯泡B.样本是抽取的15只灯泡C.个体是每只灯泡的使用寿命D.个体是2000只灯泡的使用寿命2.某校举办了一次“交通安全知识”测试,王老师从全校学生的答卷中随机抽取了200名学生的答卷,并将测试成绩分为,,,四个等级,绘制出如图所示的条形统计图.若该校学生共有1000名,则估计该校成绩为的学生人数为()A.30B.75C.150D.2003.以下调查中,适宜全面调查的是()A.了解某班学生的身高情况B.了解某批灯管的使用寿命C.了解当代大学生的主要娱乐方式D.了解全国中学生的课外阅读情况4.某班统计了该班全体学生60秒内高抬腿的次数,绘制出频数分布表:次数60≤<8080≤<100100≤<120120≤<140140≤<160160≤<180180≤<200频数1241417134给出以下结论:①组数是6;②组距是20;③全班有55名学生;④高抬腿次数在120≤<180范围内的学生占全班学生的80%.其中正确结论的个数为()A.1B.2C.3D.45.将数据83,85,87,89,84,85,86,88,87,90分组,86.5∼88.5这组的频数是()A.1B.2C.3D.46.如图,一、二两组同学将本组最近5次数学平均成绩分别绘制成折线统计图.由统计图可知,成绩进步幅度大的组是()A.一组B.二组C.一组、二组进步幅度一样大D.无法判断7.某校开展了“爱阅读”活动,七(1)班统计了1~6月全班同学的课外阅读数量(单位:本),绘制了折线统计图(如图所示),则下列说法中正确的是()A.6月份阅读数量最大B.阅读数量超过40本的月份共有5个C.相邻的两个月中,1月到2月的阅读数量增长最快D.4月份阅读数量为38本8.下图所示的两个统计图中,女生人数多的学校是()A.甲校B.乙校C.甲、乙两校女生人数一样多D.无法确定9.下列四种统计图:条形图、扇形图、折线图、直方图,能够显示数据分布情况的是()A. B. C. D.10.下图是某种学生快餐的营养成分统计图,若脂肪有30 ,则蛋白质有()A.135 B.130 C.125 D.120 二、填空题:本题共9小题,每小题3分,共27分。
数据分析期末考试试卷

数据分析期末考试试卷一、选择题(每题2分,共20分)1. 在数据分析中,以下哪项不是数据清洗的目的?A. 去除重复数据B. 纠正错误数据C. 增加无关数据D. 标准化数据格式2. 描述性统计分析中,以下哪个指标不能反映数据的集中趋势?A. 平均数B. 中位数C. 众数D. 方差3. 以下哪种图形最适合展示时间序列数据的变化趋势?A. 柱状图B. 饼图C. 折线图D. 散点图4. 假设检验中,如果P值小于显著性水平α,我们通常会得出什么结论?A. 拒绝原假设B. 接受原假设C. 无法得出结论D. 需要更多的数据5. 以下哪种分析方法主要用于探索数据的潜在结构?A. 回归分析B. 因子分析C. 描述性统计D. 假设检验二、简答题(每题10分,共30分)6. 请简述数据可视化的重要性及其在数据分析中的应用场景。
7. 描述一下什么是相关性分析,并举例说明其在实际问题中的应用。
8. 解释什么是数据挖掘,并简述其在商业智能中的作用。
三、计算题(每题15分,共30分)9. 给定一组数据:3, 5, 7, 9, 11, 13, 15, 17, 19, 21。
请计算这组数据的平均数、中位数、众数和标准差。
10. 假设你正在进行一项研究,研究的目的是检验某种新药是否比传统药物更有效。
你已经收集了两组数据,一组是使用新药的患者,另一组是使用传统药物的患者。
请描述你将如何使用假设检验来分析这些数据。
四、案例分析题(每题20分,共20分)11. 假设你是一家电子商务公司的数据分析员,公司最近推出了一款新产品。
你被要求分析销售数据,以确定产品是否成功。
请描述你将如何收集和分析数据,以及你将使用哪些关键指标来评估产品的表现。
五、论述题(共10分)12. 论述大数据时代下,数据分析对于企业决策的重要性,并举例说明数据分析如何帮助企业实现更精准的市场定位。
试卷结束语:请同学们认真审题,仔细作答。
数据分析是一门实践性很强的学科,希望本次考试能够检验你们对数据分析理论知识的掌握和应用能力。
长春财经学院《跨境电商数据分析》2023-2024学年第一学期期末试卷

长春财经学院《跨境电商数据分析》2023-2024学年第一学期期末试卷考试时间:120 分钟;考试课程:《跨境电商数据分析》;满分:100分;姓名:——;班级:——;学号:——一、填空题(每题2分,共20分)1. 跨境电商的特征包括随时性、小批量、多批次、便捷性和__________。
2. 人们利用各种方式达到信息交流的目的,使面对面的直接交谈转变为采用各种现代化传递媒介进行信息交流的过程称为__________。
3. 卖家在选品时可以从广泛、专业、精选、__________、坚持、重复六个角度出发,理性、有逻辑地开展选品工作。
4. 折线图是将点和线连接在一起的图表,它可以反映__________和分布情况。
5. 知识产权合规性数据分析一般包括广告合规、__________和财税合规。
6. 客户生命周期标签包括:认知—兴趣—购买—成长—__________—流失。
7. 不直接通过站外渠道进入店铺页面,而是先到站外活动承接页、速卖通首页等中间页,然后再进入店铺的方式称为__________。
8. 客户消费金额较高,消费频次偏低,且已很久没有消费行为的客户类型属于__________。
9. 不采取任何措施并支付仓储费,要比采取措施(如降低价格或移除库存)花费更高成本的商品称为__________。
10. 市场数据分析不需要结合__________数据展开。
二、单选题(每小题3分,共30分)1. 跨境电商数据分析中,哪个指标通常用于衡量用户对商品的购买意向?()A. 页面浏览量(PV)B. 跳出率(Bounce Rate)C. 转化率(Conversion Rate)D. 平均访问时长2. 在进行跨境电商市场细分时,主要依据的数据类型不包括以下哪一项?()A. 消费者地理位置B. 年龄与性别C. 社交媒体互动记录D. 宗教信仰3. 下列哪项是跨境电商数据分析中常用的可视化工具?()A. PhotoshopB. ExcelC. TableauD. Instagram4. A/B测试主要用于评估跨境电商网站中哪两个版本的效果差异?()A. 广告文案与图片B. 产品价格与库存量C. 网站布局与颜色搭配D. 物流方式与支付选项5. 在跨境电商数据分析中,RFM模型主要用于分析什么?()A. 用户活跃度与忠诚度B. 产品成本与利润C. 物流效率与配送时间D. 市场容量与竞争态势6. 下列哪项数据不属于跨境电商销售数据分析的范畴?()A. 销售额与销售量B. 退货率与差评率C. 网站流量来源D. 供应商交货准时率7. 跨境电商数据分析中,使用聚类分析的主要目的是什么?()A. 预测未来销售趋势B. 识别不同消费者群体C. 确定最佳物流路径D. 优化广告投放位置8. 以下哪个因素不是影响跨境电商数据分析准确性的关键因素?()A. 数据来源的多样性B. 数据清洗的彻底性C. 分析方法的适用性D. 数据分析师的经验水平9.在跨境电商中,以下哪个指标最能直接反映网站的盈利能力?A. 访问量(Visits)B. 跳出率(Bounce Rate)C. 平均订单价值(Average Order Value, AOV)D. 用户留存率10. 下列哪种数据分析方法适用于发现隐藏在大量数据中的关联规则?A. 回归分析B. 聚类分析C. 关联规则挖掘D. 因子分析三、判断题(每小题3分,共30分)1. 跨境电商数据分析主要是通过社交媒体平台的互动数据来评估市场趋势和消费者行为的。
《数据的分析》综合测试题(A)

A . 半
A 极差 是 1 . 5
B .
) . B 众数是 2 . 8
c .
C 中位数 是 2 . 6 ) .
D . 等
D 平 均数是 2 . 7
2 一次 数学测 试 后 , . 随机 抽取八 年 级 ( ) 6名学 生 的成绩 如下 :O 2 ,6 2 ,8 3 . 3班 2 ,5 2 ,8 2 ,5 关于 这组 数据 的说法 , 错误 的是 (
3 下列 各组数 据 中 , . 众数 、 中位 数 和平均 数都 相等 的是 (
A.1 l l l 7, 7, 8, 9 B. 4, 5, 3, 4 2 2 2 2
C. 42, 2, 4 41, 0 4
D. 2, 5 4, 3,
4 某商 店选 用每 千克 2 . 8元 的 甲种 糖 3千克 , 千克 2 每 2元 的 乙种糖 2千 克 , 每千 克 l 2元 的丙种
组数 据 的 中位 数是 . , 差 方
_
已知 。 : 的平 均 数为 , 差 为 s, 么 3 1- ,x +5 3 。 ,, 方 那 45 3 ,x +5的平 均 数 为
为一
某校选 择 2 6名 身 高基 本相 同的女 同学 组成 表 演 方 阵 , 这个 问题 中我 们最 值 得 关 注 的是 _ 5 在 该校 所有 女生 身高 的 ( “ 均 数” “ 填 平 、中位 数 ” “ 数 ” . 或 众 ) :
A. 6
) .
B.8 C. 0 1 D.1 2
1. 、 0 甲 乙两 人 各 射击 6次 , 甲所 中的 环 数是 8 5 5 a b c 且 甲所 中 的 环数 的平 均 数 是 6 众 , , ,, ,, ,
电子商务数据分析 期末试卷(二)含答案

电子商务数据分析期末试卷(二)1. 单选题(分值:1分)标准答案:A()影响店铺的利润,与销售额及成交人数密切相关。
•A、客单价•B、动销率•C、成交转化率•D、咨询成交率2. 单选题(分值:1分)标准答案:A()指标是电子商务数据监控的核心,包括访问电子商务网站的访客数、访问深度等数据指标。
•A、流量•B、销售及转化•C、商品•D、客户3. 单选题(分值:1分)标准答案:B( )是以高亮的形式展示数据信息,并且可以清楚直观地看到页面上每一个区域的访客兴趣焦点。
•A、柱形图•B、热力图•C、雷达图•D、交叉图4. 单选题(分值:1分)标准答案:B报表是用表格的形式呈现电子商务运营过程中特定时间段的各项数据,关于报表制作,下列说法错误的是()。
•A、报表根据展现形式的不同可分为列表式和矩阵式•B、报表的目标用户对报表中数据指标的选择没有影响•C、数据报表的制作根据围绕电子商务日常数据汇报需求展开•D、通过报表有助于运营人员了解电子商务经营动态,进行整体评估5. 单选题(分值:1分)标准答案:B仓储费用、库存周转率、残次库存比及售罄率等指标属于()。
•A、商品类目指标•B、供应链指标•C、流量指标•D、营销推广指标6. 单选题(分值:1分)标准答案:C关于报表,下列说法错误的是( )。
•A、电商企业的日、周、月报表各有不同的侧重点•B、报表根据展现形式的不同可以分为列表式和矩阵式•C、报表是通用的,发送给运营人员和管理层人员的报表完全无需区分•D、通过报表有助于运营人员了解电商企业经营动态,进行整体评估7. 单选题(分值:1分)标准答案:C进行分组分析时需要遵循相应原则,其中()指进行分组的每一个单位都只能属于一个分组,不能同时属于两个或两个以上的分组。
•A、无遗漏原则•B、时间范围可比•C、排他性原则•D、整体性质可比答案解析:时间范围可比、整体性质可比属于对比分析在选择指标时遵循原则。
8. 单选题(分值:1分)标准答案:C某店铺2019年9月访客数为1896人,2019年8月的访客数为1756人,2018年9月访客数为1359人,其2019年9月同比增长率为()。
2020-2021学年第二学期《R语言数据分析方法与实验》期末试卷

2020-2021学年第二学期《R语言数据分析方法与实验》期末考试试题第一题(共35分)探索nycflights13数据集1.从flights数据中找出到达时间延误2小时或者更多的所有航班,并将生成的新数据保存为flight_arr2hr。
(5分)2.将生成的flight_arr2hr数据集根据目的地(dest)进行分组,统计出抵达每个目的地的航班数量,筛选出抵达航班数量前十名的目的地,将结果命名为top10_dest。
(5分) 3.从weather表中挑选出以下变量:year, month, day, hour, origin, humid, wind_speed,并将其与flight_arr2hr表根据共同变量进行左连接, 生成的新数据保存为flight_weather (5分)4.基于flight_weather数据集,根据不同出发地(origin)在平行的三个图中画出风速wind_speed(x轴)和出发延误时间dep_delay(y轴)的散点图,以及平滑曲线。
(5分)5.flights中每家航空公司在2013年有多少班次的航班被取消了?提示:依据dep_time来判断某班次航班是否被取消(5分)6.找出flights中每一家航空公司的航班最常去的目的地机场,以及flights中每家航空公司飞往最常去的目的地机场的航班数量(10分)第二题(共20分)探索diamonds数据集1.对diamonds数据集,生成一个新变量id,用于存储每条观测值所在的行数。
挑选出id, x, y, z四个变量,将宽数据转换为长数据:将x, y, z的变量名存为新变量dimension,将x, y, z的值存为新变量length。
转换后的长数据存为xyz_long。
(5分)2.将xyz_long数据集转换回宽数据xyz_wide。
宽数据xyz_wide包含id, x, y, z四个变量。
(5分)3.写代码找出diamonds中最常见和最不常见的color,即出现次数最多和最少的color。
《大数据分析师(初级)》考前模拟A3卷

《大数据分析师(初级)》考前模拟A3卷1.【单选题】搜狗搜索引擎的爬虫叫()。
A:百度蜘蛛B:360SpiderC:SogouspiderD:Bingbot正确答案:C2.【单选题】数据采集的()与技术执行的速度、团队内部成员协同以及数据分析需求和目标实现的效率有关。
A:全面性B:多维性C:无序性D:高效性正确答案:D答案解析:数据采集的高效性与执行速度、协调性有关。
3.【单选题】下列数据预处理任务,( )可以用来平滑数据,消除数据噪声。
A:数据清洗B:数据集成C:数据变换D:数据规约正确答案:A答案解析:消除噪声属于数据清洗阶段的任务4.【单选题】下列不是用于大数据查询分析计算的产品是( )。
A:HiveB:HBaseC:SparkSQLD:Dremel正确答案:B答案解析:Hbase是分布式存储技术。
5.【单选题】数据仓库—般都是存在层次架构的,比如可以分为ODS、DW、DM层,不同粒度的表,不同作用的表,一般会分布在不同的层级中,如下相关信息表存放在ODS层的有( )。
A:从源系统同步至数仓的粒度相同的一张登录日志表B:日期为天粒度的登录统计表C:从人的角度统计的登录情况表D:日期为月粒度的登录统计表正确答案:A答案解析:ODS层存储的明细数据。
6.【单选题】从数据量方面来看,互联网系统和机器系统产生的数据量要()企业系统的数据量。
A:远远大于B:远远小于C:等于D:无法确定正确答案:A7.【单选题】数据规约的目的是( )。
A:填补数据中的空缺值B:集成多个数据源的数据C:得到数据集的压缩表示D:规范化数据正确答案:C8.【单选题】下列陈述不正确的是()。
A:大数据将实现科学决策B:大数据使政府决策更加精准化C:大数据彻底将群体性事件化解在萌芽状态D:大数据将实现预测式决策正确答案:C答案解析:由于大数据是从量变到质变的过程,加之数据被广泛挖掘,决策依据的信息完整性越来越高,依据信息的理性决策要高于以盲目决策。
《 数据分析 》课程期末考试试题A卷

命题方式:单独命题佛山科学技术学院2008—2009学年第一学期《数据分析》课程期末考试试题A卷专业、班级:姓名:学号:共3 页第 2 页共 3 页第3 页一(1)SAS界面包括输出框,日志框,编辑器(2)在非数值变量后面家上”$”符号.(3) 自由格式输入数据应加上”@@”标记.(4) 三均值的计算公式^M=1/4Q1+1/2M+1/4Q3二程序:data t1;input x@@;cards;100.00 107.57 112.42 96.21 121.58 107.21 117.16 116.19 101.37 109.78 112.83 104.37 105.40 109.50 111.60 112.10 113.50 112.40 proc univariate plot normal;run;proc capability graphics normal;histogram x/normal;qqplot x/normal(….);run;(1)由上图可知道均值:109.510556 方差:40.5703938变异系数:5.81632451 峰度:0.05978054偏度:-0.3324812(2)中位数:上四分位数:下四分位数:四分位极差:(3)做出直方图、QQ图、茎叶图、箱线图直方图:QQ图茎叶图:箱线图:(4)进行正态性W 检验(取05.0=α).由上图可以知道Wo=0.978265,P=0.9304>05.0=α; 故不能拒绝原假设Ho,所以是高度显著的。
三data t2; input x1-x4; cards ;16.7 26.7 6.4 35.0 18.2 28.0 3.2 29.7 16.7 26.7 2.1 34.9 18.1 26.7 4.3 31.5 16.7 26.0 3.0 32.7 18.1 30.2 7.0 34.9 20.2 30.5 4.8 34.4 20.2 29.5 5.5 36.2 21.5 31.5 5.8 36.5 18.8 30.6 5.4 35.4 21.6 27.8 5.4 34.1 21.3 29.5 5.8 35.8proc corr cov pearson ; run ;(1)计算协方差矩阵,Pearson 相关矩阵; 协方差矩阵:Pearson 相关矩阵:(2)分析各指标间的相关性(取10.0=α)由Pearson 相关矩阵的上三角矩阵看出r13,r14都大于10.0=α 故这些向量的相关性不是很强。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
命题方式:单独命题佛山科学技术学院2008—2009学年第一学期《数据分析》课程期末考试试题A卷专业、班级:姓名:学号:共3 页第 2 页共 3 页第3 页一(1)SAS界面包括输出框,日志框,编辑器(2)在非数值变量后面家上”$”符号.(3) 自由格式输入数据应加上”@@”标记.(4) 三均值的计算公式^M=1/4Q1+1/2M+1/4Q3二程序:data t1;input x@@;cards;100.00 107.57 112.42 96.21 121.58 107.21 117.16 116.19 101.37 109.78 112.83 104.37 105.40 109.50 111.60 112.10 113.50 112.40 proc univariate plot normal;run;proc capability graphics normal;histogram x/normal;qqplot x/normal(….);run;(1)由上图可知道均值:109.510556 方差:40.5703938变异系数:5.81632451 峰度:0.05978054偏度:-0.3324812(2)中位数:上四分位数:下四分位数:四分位极差:(3)做出直方图、QQ图、茎叶图、箱线图直方图:QQ图茎叶图:箱线图:(4)进行正态性W 检验(取05.0=α).由上图可以知道Wo=0.978265,P=0.9304>05.0=α; 故不能拒绝原假设Ho,所以是高度显著的。
三data t2; input x1-x4; cards ;16.7 26.7 6.4 35.0 18.2 28.0 3.2 29.7 16.7 26.7 2.1 34.9 18.1 26.7 4.3 31.5 16.7 26.0 3.0 32.7 18.1 30.2 7.0 34.9 20.2 30.5 4.8 34.4 20.2 29.5 5.5 36.2 21.5 31.5 5.8 36.5 18.8 30.6 5.4 35.4 21.6 27.8 5.4 34.1 21.3 29.5 5.8 35.8proc corr cov pearson ; run ;(1)计算协方差矩阵,Pearson 相关矩阵; 协方差矩阵:Pearson 相关矩阵:(2)分析各指标间的相关性(取10.0=α)由Pearson 相关矩阵的上三角矩阵看出r13,r14都大于10.0=α 故这些向量的相关性不是很强。
四:data t4;input num$ y x1 x2; cards ;1 169 265 3782 2 81 98 30083 192 330 24504 116 195 2137 5 55 53 25606 162 274 24507 120 180 32548 223 375 38029 131 205 2838 10 67 86 2347 ;proc reg data =t4; model y=x1-x2/i ; run ;(1) 求回归方程,给出各参数的实际解释由上图可以知道B=4.14260 ,1B=0.49482,2B=0.00890回归方程为y=4.14260+0.49482x1+0.00890x2;工厂产量y及工人数x1、成本x2的有关数据如下B为基本产量,当成本x2固定时,工人数x1每增加一个单位,产量y就增加0.49482个0单位,同理当成本x1固定时,成本x2每增加一个单位,产量y就增加0.00890个单位。
(2)求出方差分析、参数估计的结果方差分析:由方差分析图可以知道2=4.645152R=SSM/SST=27272/27304=0.9988F值为2935.52参数估计第五题:data t5;input x1-x7;cards;12.5 16.4 16.7 22.8 29.3 3.017 26.67.8 9.9 10.2 12.6 17.6 0.841 10.613.4 10.9 9.9 10.9 13.9 1.772 17.819.1 19.8 19.0 29.7 39.6 2.449 35.88.0 9.8 8.9 11.9 16.2 0.789 13.79.7 4.2 4.2 4.6 6.5 0.874 3.90.6 0.7 0.7 0.8 1.1 0.056 1.013.9 9.4 9.3 9.8 13.3 2.126 17.19.1 11.3 9.5 12.2 16.4 1.327 11.6;proc princomp;run;特征值:x1=6.36880695,x2=0.39792475,x3=0.16038442,x4=0.04542733,x5=0.02241485,x6=0.00474882. X7=0.00029289;贡献率和累计贡献率分别为:各主成分分别为:由于W1已经达到了90%所以第一主成分为w1=0.348824X1+0.390078X2+0.391810X3+0.385562X4+0.383622X5+0.353720X6+0.389491x 7六:data t6;input xy$ x1-x7;cards;1 36.05 7.13 7.75 16.67 11.68 2.38 12.88 1 37.69 7.01 8.94 16.15 11.08 0.83 11.67 1 38.69 6.01 8.82 14.79 11.44 1.74 13.23 1 37.75 9.61 8.49 13.15 9.76 1.28 11.28 1 35.71 8.04 8.31 15.13 7.76 1.41 13.25 1 39.77 8.49 12.94 19.27 11.05 2.04 13.29 1 40.91 7.32 8.94 17.60 12.75 1.14 14.80 1 33.70 7.59 10.98 18.82 14.73 1.78 10.101 35.02 4.72 6.28 10.03 7.15 1.93 10.392 52.41 7.70 9.98 12.53 11.70 2.31 14.69 2 52.65 3.84 9.16 13.03 15.26 1.98 14.57 2 55.85 5.50 7.45 9.55 9.52 2.21 16.30 2 44.68 7.32 14.51 17.13 12.08 1.26 11.57 2 45.79 7.66 10.36 16.56 12.86 2.75 11.69 2 50.37 11.35 13.30 19.25 14.59 2.75 14.87 ;data t61;input x1-x7;cards;64.34 8.00 22.22 20.06 15.12 0.72 22.89;proc discrim data=t6 testdata=t61out=a1outstat=a2 outcross=a3testout=a4 method=normallist crosslist testlist all;class xy;var x1-x7;priors equal;run;(1)求出三个协方差矩阵;S!=S2=S=(2)用距离判别求出线性判别函数,用交叉确认法计算误判率;由上图可以知道线性判别函数为:W!=-206.18758+16.6024x1-2.77150x2-5.80267x3+14.17359x4-8.00073x5+7.4917 4x6-22.87514x7W2=-382.57458+23.14210x1-3.89531x2-5.94472x3+17.23215x4-10.19191x5+12.6 0276x6-32.83581x7用交叉确认法计算误判率P=2/15=13.33%(3)判别待判样品属于哪一类.判别待判样品属于2类七、(15分)利用上一题的数据(共16个)进行聚类分析:(1)最短距离法,写出聚类过程,画出谱系图(取nclusters=4);(2)最长距离法,写出聚类过程,画出谱系图(取nclusters=4),求出四个聚类统计量;(3)快速聚类法分3类的结果,在平面坐标系中画出分类图.data t7;input x1-x7;cards;36.05 7.13 7.75 16.67 11.68 2.38 12.8837.69 7.01 8.94 16.15 11.08 0.83 11.6738.69 6.01 8.82 14.79 11.44 1.74 13.2337.75 9.61 8.49 13.15 9.76 1.28 11.2835.71 8.04 8.31 15.13 7.76 1.41 13.2539.77 8.49 12.94 19.27 11.05 2.04 13.2940.91 7.32 8.94 17.60 12.75 1.14 14.8033.70 7.59 10.98 18.82 14.73 1.78 10.1035.02 4.72 6.28 10.03 7.15 1.93 10.3952.41 7.70 9.98 12.53 11.70 2.31 14.6952.65 3.84 9.16 13.03 15.26 1.98 14.5755.85 5.50 7.45 9.55 9.52 2.21 16.3044.68 7.32 14.51 17.13 12.08 1.26 11.5745.79 7.66 10.36 16.56 12.86 2.75 11.6950.37 11.35 13.30 19.25 14.59 2.75 14.8764.34 8.00 22.22 20.06 15.12 0.72 22.89;proc cluster data=t7 method=sin std nonorm outtree=tree1;var x1-x7;run;proc tree data=tree1 graphics horizontal out=c1 nclusters=4;run;proc print data=c1;run;proc cluster data=t7 method=com std nonorm outtree=tree2;var x1-x7;run;proc tree data=tree2 graphics horizontal out=c2 nclusters=4; run;proc print data=c2;run;proc fastclus maxc=3distance list cluster=cdata=t6 out=d;run;proc plot;plot x2*x1=c;run;(1)最短距离法,写出聚类过程,画出谱系图(取nclusters=4);(2)最长距离法,写出聚类过程,画出谱系图(取nclusters=4),求出四个聚类统计量;(3)快速聚类法分3类的结果,在平面坐标系中画出分类图.。