计量地理学期末试卷A
计量地理学复习题

计量地理学复习题一、名称解释1. 计量地理学:2. 间隔尺度数据:3. 统计分组:4. 属性数据:5. 定性数据:6. 总体7. 中项中心8. 众数:9. 中位数:10. 偏度系数:11. 集中化指数:12. 数学模型13. 多样化指数:14. 物理模型15. 空间数据:16. 概念模型17. 峰度系数:18. “计量革命”:19. “4S”技术20. 计算地理学:21. 估计22. 罗伦次曲线:23. 采样误差24. 基尼系数:25. 最优中心26. 方差:27. 峰态数28. 次序量29. 锡尔系数:30. 假设检验31. 变异系数:32. 样本33. 非采样误差34. 比例量35. 间隔量36. 循环变动:37. 马尔可夫过程:38. 逐步回归分析:39. 复相关系数:40. 相关分析显著性检验,当可信度一定时,N越大,其临界相关系数_________________。
41. 战略决策模型:42. 状态转移过程:43. 长期趋势:44. 地理区45. 模糊综合评判法46. 秩相关系数:47. 地理类型48. 季节变动:49. 回归分析方法:50. 时间序列:51. 直接聚类法:52. 最优回归方程:53. 主成分分析:54. 马尔可夫预测法:55. 趋势面分析:56. 随机变动57. 偏相关系数:58. ARMA过程59. 灰色预测法:60. 趋势变动61. 时间哑元62. 聚类分析:63. 人工神经网络方法64. 时间序列分析:65. 判别分析66. ARIMA67. 有向图68. 地理学第一定律:69. 网络图70. 无向图71. 网络分析:72. 截:73. 区域化变量:74. 最小支撑树:75. 地统计学:76. 连通性77. 距离分析78. 节点79. 空间自相关:80. Moran散点图:81. 弧82. 强连通性83. 克立格插值法:84. 变异函数:85. 网络86. 直接消耗系数:87. 最优解:88. 静态投入产出模型:89. 可行解:90. 投入产出分析:91. 动态投入产出模型:92. 数值模拟93. 四维同化94. AHP决策分析方法:95. 自然状态:96. 状态概率:97. 最佳决策方案:98. 益损值:99. 积累量00. 数字神经系统01. 系统动力学方法02. 辅助变量03. 地理专家系统04. 决策问题:05. 行动方案:06. 速率量07. 系统仿真二、简答题(每题6分,共462分)1. 简述属性数据的类型2. 地理数据的基本特征?3. 地理建模过程中,针对复杂数据处理采用的措施4. 计量地理学主要应用在哪些方面?5. 判断下列图中平均数、中位数、众数的大小。
计量地理学期末试题

/view/f45fbf303968011 ca3009174.html、名词解释(每题6分,共30分)1.4D产品:数字正射影像图(Digital Orthophoto Map ,即DOM)、数字高程模型(Digital elevation model ,即DEM)、数字栅格地图(Digital raster graphic 即DRG)、数字线划地图(Digital Line Graphic,即DLG)。
2.空间数据引擎:简称SDE,是一种空间数据库管理系统的实现方法,即在常规管理系统之上添加一层空间数据库引擎,以获得常规数据库管理系统功能之外的空间数据存储和管理能力,主要是为了解决存储在关系数据库中空间数据与应用程序之间的数据接口问题。
其中有代表性的是ESRI的ArcSDE。
(参考)3.LBS:(Location-Based Service,位置服务)在移动计算机环境下,利用GIS技术、空间定位技术和网络通信技术,为移动对象提供基于空间位置的信息服务。
(课本P355页)4.数字高程模型:(Digital Elevation Model,简称DEM)是通过有限的地形高程数据实现对地形曲面的数字化模拟(即地形表面形态的数字化表示),高程数据常采用绝对高程(即从大地水准面起算的高度)。
(课本P236页)5.嵌入式GIS:GIS与嵌入式设备集成应用的产物,它以应用为中心,以计算机技术为基础,软件硬件可裁剪,适应应用系统对功能、可靠性、成本、体积、功耗严格要求的微型专用计算机系统。
(课本P350页)二、问答题(共120分)1.阐述地理信息系统的主要特征(10分)答:①数据的空间定位特征:地理数据的三要素中,除属性和时间外,空间位置特征是地理空间数据有别于其他数据的本质特征。
②空间关系处理的复杂性:地理信息系统除要完成一般信息系统的工作外,还要处理与之对应的空间位置和空间关系,以及与属性数据一一对应的处理;空间关系处理复杂性的另一技术难点是数据的管理,一般事务性数据都是定长数据,地理数据是不定长的,存储和管理这些空间数据是GIS数据库设计必须面对的问题。
计量地理学模拟试题答案(A卷闭卷考试)

《计量地理学》模拟试题答案(A 卷:闭卷考试)1、(1)确定中位数所在的组位置:∑==868217362i f ,所以中位数在第六组中;(3分) (2)求中位数:503.5286724173621152111=-⨯⨯+=-⨯+=-=∑mm ni ie f S fd L M或 503.5286726173621162111=-⨯⨯-=-⨯-=+=∑m m n i i e f S f d U M (7分)2. 解:设x 1为生产甲种商品的数量,x 2为生产乙种商品的数量(1) 建立模型: 线形规划模型为:(7分)(2)对模型求解:引入松弛变量3x 和4x ,把原模型转化为标准形式:在上述问题中,⎥⎦⎤⎢⎣⎡=10210112A , ⎥⎦⎤⎢⎣⎡=121P , ⎥⎦⎤⎢⎣⎡=212P , ⎥⎦⎤⎢⎣⎡=013P , ⎥⎦⎤⎢⎣⎡=104P ,⎥⎦⎤⎢⎣⎡=1215b ,[]00108=c 。
(5分)第一步,[]431P P B = ,对应与B 1的初始单纯形表为:(2分)2x 1+x 2≤15x 1+2x 2≤12 x 1, x 2≥0maxz=8 x 1 +10 x 22x 1+x 2+x 3 =15 x 1+2x 2 +x 4=12 x 1, x 2≥0maxz=8 x 1 +10 x 2第二步,P 2调入基,P 4退出基,得一新基[]⎥⎦⎤⎢⎣⎡==2011,232p p B ,它的单纯形表为:(2分)第三步,P 3调出基,P 1调入基,得新基[]⎥⎦⎤⎢⎣⎡==2112,213p p B ,它的单纯形表为:(2分)结果:x 1=6, x 2=3, Z '-=-78,所以, Z=78。
即:甲、乙两种商品分别生产6个、3个,才能使A 、B 两种资源的利用价值达到最大为78个货币单位。
(2分) 3. 对于 (1)、(2)、(3)分别赋予三个目标优先因子P 1、P 2、P 3。
(1)建立模型(7分) 目标规划模型为:,,,641081220152)(min 21332122211121213322211≥=-++=-++=-+-≤++++=+-+-+-+--+-+i i d d x x d d x x dd x x d d x x x x d P d d P d P Z(2)把目标函数转化为标准形式:(4分),,,641081220152)(min 213321222111213213322211≥=-++=-++=-+-=+++++=+-+-+-+--+-+i i d d x x d d x x d d x x d d x x x x x d P d d P d P Z(3)取---3213,,,d d d x 为初始基变量,列出出事单纯形表如下:(4分)4.(1)画出决策树(10分)(2) 计算期望效益值。
计量地理学 期末作业2013.6

计量地理学期末考试题(11级地理教育1、2、3班)1.以下是甘肃省20个气象台站某年份的降水量和蒸发量数据。
试求:20个台站年降水量和蒸发量的平均值、方差、标准方差。
(要求:结果需要列表表示)2、设有12个地区的4个工业部门,各部门的工业总产值所占百分比列于下表。
试作出各工业部门的空间罗伦兹曲线。
要求:图中要有对角线,即最终结果有五条线,图例中各工业部门应以字母表示。
最终需将计算过程以excel形式提交,打印的作业中只需拷入图。
表2 统计表(%)3、为了规划某地区的商业网点,需要对其商品零售额进行预测。
现将统计资料列于下表,如果今后几年影响该地区零售额诸因素无多大变化,试预测2002年商品零售额。
要求:在spss中试用一元线性回归方法建立回归模型,进行效果检验(各个检验方面要进行分析,将结果分析的表格拷到作业中,三部分分析内容【拟合优度R2,回归方程的方差分析p值,系数分析p值】,并列出方程),最后根据方程预测2002年商品零售额。
表3 年份与零售额统计表4、某地区近十年的粮食总产量(X)和农业总产值(Y)数据如下表:表4 粮食总产量与农业总产值(1)试计算该地区粮食总产量(X)与农业总产值(Y)之间的相关系数r(要求:按照以前练习时的要求,说明r值及显著性检验结果);(2)试建立该地区农业总产值(Y)与粮食总产量(X)之间的一元线性回归模型,并检验该回归模型是否显著(三部分分析内容拷入即可,不需要分析)。
(注:计算结果保留三位小数)。
5.某市的钢、铁产量与总运量如下表,试建立它们之间的回归模型,并进行显著性检验(α=0.01)。
当钢、铁生产量各为200万吨时,其总运量为多少?(多元线性回归分析,结果要求与一元线性回归分析相同,要求分析三部分检验内容)表5 钢、铁产量与总运量6.某山区水土流失面积(km2)与土壤的含氮量的数据见下表。
要求:(1)试画出二者之间的散点图并确定是什么样的相关形式(图拷入);(2)根据散点图选择合适的曲线模型进行拟合;(3)检验该模型的显著性,并预测当水土流失面积x=10(km2)时的土壤含氮量y(g/m2)。
计量地理期末试题及答案

计量地理期末试题及答案一、选择题(每题4分,共40分)1. 表示地震能量大小的物理量是:A. 地壳运动B. 震级C. 震源深度D. 地震波传播速度答案:B. 震级2. 以下哪个地震带不是世界上四大地震带之一?A. 太平洋地震带B. 印度洋地震带C. 地中海地震带D. 大西洋地震带答案:D. 大西洋地震带3. 以下哪个工具可以用于测量地震波的传播速度?A. 周期计B. 地震带C. 地震仪D. 地磁仪答案:C. 地震仪4. 在地理中,经度是用来表示:A. 地球的形状B. 地球的大小C. 地球的纬度D. 地球上某一点的位置答案:D. 地球上某一点的位置5. 以下哪个工具可以用来测量高度差?A. 放大镜B. 测距仪C. 望远镜D. 倾斜仪答案:D. 倾斜仪6. 对于地球上任意一点的纬度,以下哪个描述是正确的?A. 纬度可以大于90°B. 纬度的单位是度和分C. 纬度越大,离赤道越近D. 纬度是指东西方向的角度答案:C. 纬度越大,离赤道越近7. 以下哪种工具可以用来测量地面的垂直位移?A. GPSB. 倾角仪C. 遥感技术D. 雷达测距答案:B. 倾角仪8. 地理信息系统(GIS)是指利用计算机技术对地理数据进行采集、存储、管理、分析和呈现的一种工具。
以下哪个选项不是GIS的主要用途?A. 地图制作B. 空间分析C. 场地勘测D. 地理统计答案:C. 场地勘测9. 以下哪个工具可以用来测量地球上某一点的海拔高度?A. 测距仪B. 电子红外水平仪C. GPSD. 倾斜仪答案:C. GPS10. 以下哪个选项不是陆地测量常用的测量方法?A. 光电距离测量法B. GPS测量法C. 激光扫描测量法D. 遥感技术测量法答案:D. 遥感技术测量法二、填空题(每题4分,共40分)1. 地震烈度是以什么为基础的?答案:地震烈度是以地震对人类造成的破坏程度为基础的。
2. 中国地震台网中心是哪一年成立的?答案:中国地震台网中心于2001年成立。
9试卷

第页(共页)哈尔滨学院期末试卷课程名称:计量地理学(9)考试时间:120 分钟 考试方式:闭卷(卷面总分100分,占总成绩的 60 %)题号 一 二三四五六七 八总分题分 10 10 10 15101218 15核分人 得分复查人一、填空题(每空1分,共10分)1. 天气的表述为定性数据,温度的表述是__________数据。
2. 地理数据的变换方式有____________、开平方变换、取倒数变换、概率变换、模数变换和指数变换等。
3. 用直方图绘频数图时,用横坐标表示______________,左侧的纵坐标表示频数。
4. 回归平方和的自由度为_______________________。
5. 地理要素的空间分布类型有点状分布、线状分布、_____________、连续的区域分布。
6. 分布函数____________就成为概率密度函数。
7. 将实际的地区数据与标准分布进行比较,用以测度经济地理现象在空间分布的程度采用________________________。
8. 抽样以随机选择一点或一个方形为开始,然后按照原定计划选择其余样本,这种方法称为________________________。
9. 剩余标准差的公式____________________。
10. 实际曲面 = 剩余曲面 + _____________。
二、单项选择题(每小题1分,共10分) 1. 线性回归在0.01水平上显著的是 ( )A F 0.01≥F≥F 0.05B F≥F 0.01C F 0.05≥F≥F 0.10D F<F 0.10 2. 在单峰正偏态的分布上,下列叙述正确的( )A 算术平均数=中位数=众数B 算术平均数>众数>中位数C 算术平均数<中位数<众数D 算术平均数>中位数>众数 3. 如果R 值等于1,则点状地理事物是( )A 随机分布B 均等分布C 凝集分布D 线状分布 4. 变差系数是( )的比值A 方差与均值B 标准差与均值C 离差与均值D 离差平方和与均值 5. 关于卡方分布的性质论述正确的是:A n≥20,用标准正态分布进行变换;B n≥30,用标准正态分布进行变换C n≥40,用标准正态分布进行变换D n≥50,用标准正态分布进行变换 6. 非离散性度量值是( )A 离差;B 众数;C 方差;D 变差系数; 7. 区域法测定临近距离一般分成( )个区域。
计量地理试题答案

计量地理试题答案一、选择题1.地理问题研究的核心环节是()A 地理数据采集B 地理数据教学方法C 地理数据描述D 地理数据的处理答案:D 参考课本P26页2.在单峰负偏态的分布上,下列叙述正确的是()A 算数平均数=中位数=众数B 算数平均数<中位数<众数C 算数平均数> 众数>中位数D 算数平均数>中位数>众数答案:B 参考课本P33页3.下列哪个数据不是属性数据()A 人口数量B 村庄河流的分布C 国内生产总值D 土地面积答案:B 参考课本P20页4.偏相关系数的性质有①偏相关系数分布的范围在-1到1之间;②__________;③偏相关系数的绝对值必小于或最多等于由同一系列资料所求得的复相关系数。
A.偏相关系数的绝对值越大,表示其偏相关程度越大B.偏相关系数的绝对值越大,表示其偏相关程度越小C.偏相关系数的绝对值越小,表示其偏相关程度越大D.偏相关系数的绝对值越小,表示其偏相关程度越小答案:A 参考课本P57页5. 时间序列的组合成分包括长期趋势(T )、__________循环变动(C )和不规则变动(I )。
A季节变动 B.灰色模型C 马尔科夫 D.乘法模型答案:A参考课本P72-P73页6. 主成分分析是在()的基础上进行的。
A.回归分析B.时间序列分析C.相关分析D.系统聚类分析答案:C参考课本P95页7.在地理学中,主要对于“状态”的预测方法是() A.主成分分析法 B.马尔可夫预测法 C.灰色模型分析法 D.趋势面分析发答案:B 参考课本P108页8.建立在变异函数理论及结构分析基础之上的空间插值法是()A.RBF神经网络方法B.克里格插值法C.反距离权重倒数插值法D.三次样条函数插值法答案:B 参考课本P141页9. 下面哪一个不是AHP决策的基本步骤()A.明确问题B.建立层次结构模型C.分层计算特征值D.层次总排序答案:C参考课本227—230页10. 下列属于图G=(V,E)所必须包含的基本要素的是()A.边集 B. 子图 C. 关联边 D. 基础图答案:A 参考课本P57页11.下列不属于一个网络图的基础指标的是()A.连线数目B.结点数目C.网络中亚图数目D.回路数答案:D 参考课本P281页12.下列哪个数据不是属性数据()A 人口数量B 村庄河流的分布C 国内生产总值D 土地面积答案:B 参考课本P20页二、填空题1.锡尔系数,就说明分配差异越大;反之,锡尔系数,说明收入分配越均衡。
计量地理学期末复习题

填空:1.1967年计量地理学课本出现,作者是加里森。
2.计量地理学发展史上的学派:(1)依阿华的经济派(2)威斯康星的统计派(3)普林斯顿的社会物理学派3.历史上特别推崇计量地理学的人物:英国的乔莱哈格特美国帮吉德国克里斯泰勒4.历史上反对计量地理学的人物:英国的史密斯和奥格登5.地理发展历史:2000多年6.地理学历史发展中曾有的学派:(1)区域学派(2)人地关系学派(3)景观学派7.舍弗尔拉开了现代地理学发展史上的计量运动的帷幕8.层次分析法步骤:(1)明确问题(2)建立层次结构模型(3)构造判断矩阵(4)层次单排列(5)层次总排序(6)层次总排序的一致性检验9.非确定型决策问题方法:(1)乐观法(2)悲观法(3)折衷法(4)等可能性法(5)后悔值法10.风险形求值分析方法:(1)最大可能法(2)期望值决策法及其矩阵运算(3)树型决策法(4)灵敏度分析法(5)效用分析法11.趋势拟合方法:平滑法(移动平滑法、滑动平滑法、指数平滑法)、趋势线法(直线型、指数型、抛物线型)、自回归模型12.时间序列的组合成分:长期趋势、季节变动、循环变动、不规则变动时间序列的组合模型:加法模型、乘法模型名词解释1.最小二乘法:指通过最小误差的平方和寻找数据的最佳函数匹配的一种数学优化技术,利用最小二乘法可简便的计算未知的数据,并使得这些求得的数据与实际的数据之间误差的平方和最小。
2.洛伦兹曲线:将一国人口按收入由低到高排队,然后考虑收入最低的任意百分比人口所得到的收入百分比。
将这样的人口累计百分比和收入累计百分比的对应关系描绘在图形上,即得到洛伦兹曲线。
(使用累计频率曲线研究工业化的集中化程度)3.基尼系数:通过对人口和收入两组数据进行比较分析,然后将纵横坐标均以累计百分比表示,作出洛伦兹曲线,然后再计算集中化指数而得到的一个判断收入分配不平等程度的指标。
4.秩相关系数:又称等级相关系数,是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《计量地理学》期末试卷(A)2013——2014学年第一学期课程名称:_《计量地理学》学生姓名:___________________ 学号:___________________专业:___________________ 年级/班级:__________________课程性质:专业必修1.填空题(本题20分,请将答案直接写在答题纸上并注明题号)1.一般而言,地理数据具有以下几个方面的基本特征:____________,______,______,______。
(每空0.5分)2.描述地理数据一般水平的指标有______、______、______;描述地理数据分布的离散程度的指标有______、______、______、______、______;描述地理数据分布特征的参数有______、______。
(每空0.5分)3.什么是秩相关系数:_________________________。
(1.5分)4.多元线性回归模型中常数b0及偏回归系数b i的求解公式(请用矩阵形式表达)b=____________其中各矩阵的具体表达为:X= Y= b=______________,_______,________。
(每空0.5分)5. 线性规划问题的可行解:__________________(1分),最优解:______________________。
(1分)6.在目标规划模型中,除了决策变量外,还需引入正、负偏差变量,其中,正偏差变量表示____________,负偏差变量表示____________。
(每空0.5分)7.网络图中的三个基础指标为______,______,______,由它们产生的更为一般性的测度指标为______,______,______,______。
(每空0.5分)8.主成分分析的计算步骤______,______,______,______。
(每空0.5分)9.多元线性回归模型的显著性检验中,回归平方和U的自由度为______,剩余平方和的自由度为______。
(每空0.5分)2.聚类分析(20分)已知我国九大陆地农业区的七项指标分别为:人均耕地、劳均耕地、水田比重、复种指数、粮食亩产、人均粮食、稻谷占粮食比重。
现已给出了九个行政区之间的欧氏距离矩阵,试用最远距离法对其进行聚类,要求写出每步的处理过程并画出聚类结果的谱系图。
(注:直接画出聚类结果谱系图的不得分)并进行计算结果的地理解释。
G 1——G 9分别为:东北区、内蒙古及长城沿线、黄淮海区、黄土高原区、长江中下游区、西南区、华南区、甘新区、青藏区G 1 G 2G 3G 4G 5G 6G 7G 8G 9G 1 0.00 G 2 0.09 0.00 G 3 0.22 0.21 0.00 G 4 0.16 0.12 0.09 0.00 G 5 0.52 0.57 0.47 0.52 0.00 G 6 0.35 0.39 0.27 0.32 0.21 0.00 G 7 0.50 0.54 0.44 0.49 0.05 0.17 0.00 G 8 0.10 0.08 0.15 0.08 0.51 0.32 0.48 0.00 G 90.190.150.080.040.510.310.480.100.003.树型决策法(20分)某企业为扩大某产品的生产,拟建设新厂,据市场预测产品销路好的概率为0.7,销路差的概率为0.3,有三种方案可供企业选择:方案1,新建大厂,需投资300万元。
据初步估计,销路好时,每年可获利100万元;销路差时,每年亏损20万元,服务期为10年。
方案2,新建小厂,需投资140万元。
销路好时,每年可获利40万元;销路差时,每年仍可获利30万元。
服务期为10年。
方案3,先建小厂,3年后销路好时再扩建,需追加投资200万元,服务期为7年,估计每年获利95万元。
试用树状图来描述各种方案在不同自然状态下的收益,据此计算每种方案的期望收益值并选择方案。
4.地统计方法(20分)(1)你了解地统计(Geostatistic )方法吗?近20年以来,该方法已被广泛地应用于地理学、生态学、环境学研究之中。
根据你自己的文献积累,简要说明统计方法可以应用在哪些具体问题的研究(不必展开论述)? (2)变异函数的四个基本参数分别是什么?常用的变异函数有哪些理论模型?以下是何种理论模型?该模型的基本参数分别是什么?⎪⎪⎩⎪⎪⎨⎧>+≤<-+==ah cc a h a h a h c c h h 0330)1(0)223(00)( γ5.随机型决策分析(20分)什么是随机型决策问题,①它可以进一步分为哪几类问题?②各类问题有什么异同点?③对各类问题分别有什么决策方法,并说明各决策方法的基本原理。
《计量地理学》期末试卷(A )参考答案2013——2014学年第一学期1.填空题(本题20分)1.一般而言,地理数据具有以下几个方面的基本特征: 数量化、形式化、逻辑化,不确定性,多种时空尺度, 多维性。
(每空0.5分)2.描述地理数据一般水平的指标有 平均值 、 中位数 、 众数 ;描述地理数据分布的离散程度的指标有 极差 、 离差 、 离差平方和 、 方差与标准差 、 变异系数 ;描述地理数据分布特征的参数有 标准偏度系数 、 标准峰度系数 。
(每空0.5分)3.什么是秩相关系数: 是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量 。
(1.5分)4.多元线性回归模型中常数b 0及偏回归系数b i 的求解公式(请用矩阵形式表达)b= A -1B=(X TX)-1X TY , 其中各矩阵的具体表达为:, , 。
(每空0.5分) 5. 线性规划问题的可行解:在线性规划问题中,满足约束条件的一组变量x=(x 1,x 2,…,x n )T为可行解(1分),最优解:使目标函数取最大(或最小)值的可行解称为最优解。
(1分) 6.在目标规划模型中,除了决策变量外,还需引入正、负偏差变量,其中,正偏差变量表示决策值超过目标值的部分 ,负偏差变量表示 决策值未达到目标值的部分(每空0.5分) 7.网络图中的三个基础指标为连线(边或弧)数目(m ),节点(顶点)数目(n ),网络中互不连接的亚图数目(p ),由它们产生的更为一般性的测度指标为β指数=m/n ,回路数k=m-n+p ,α指数=(m-n+p )/(2n-5p ),γ指数=m/{3(n-2p )}(每空0.5分)8.主成分分析的计算步骤:①计算相关系数矩阵 ,②计算特征值与特征向量 ,③计算主成分贡献率及累计贡献率 ,④计算主成分载荷。
(每空0.5分)9.多元线性回归模型的显著性检验中,回归平方和U 的自由度为自变量的个数k ,剩余平方和的自由度为n-k-1,n 为样本个数(每空0.5分)2.聚类分析(20分)①聚类第一步,在9×9阶距离矩阵中,非对角元素中最小者是d 94=0.04,故首先将第4区与第9⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡=kn n n k k x x x x x x x x x x x x X 2132313222121k 211111.11⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=n y y y Y 21⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡=n b b b b b 210区并为一类,记为G 10,即G 10={G 4,G 9}。
按照公式),(},max {q p k d d d qk pk rk ≠=式分别计算G 1,G 2,G 3,G 5,G 6,G 7,G 8与G 10之间的距离,得到一个新的8×8阶距离矩阵:G 1 G 2 G 3 G 5G 6G 7 G 8 G 10 G 1 0.00 0.09 0.22 0.52 0.35 0.50 0.10 0.19 G 2 0.09 0.00 0.21 0.57 0.39 0.54 0.08 0.15 G 3 0.22 0.21 0.00 0.47 0.27 0.44 0.15 0.09 G 5 0.52 0.57 0.47 0.00 0.21 0.05 0.51 0.52 G 6 0.35 0.39 0.27 0.21 0.00 0.17 0.32 0.32 G 7 0.50 0.54 0.44 0.05 0.17 0.00 0.48 0.49 G 8 0.10 0.08 0.15 0.51 0.32 0.48 0.00 0.10 G 100.190.150.090.52 0.320.490.100.00第二步,在第一步所得到的8×8阶距离矩阵中,非对角线元素中最小者为d 57=0.05,故将G 5与G 7归并为一类,记为G 11,即G 11={G 5,G 7}。
按照公式(3.4.11)式分别计算G 1,G 2,G 3,G 6,G 8,G 10与G 11之间的距离,得到一个新的7×7阶距离矩阵如下:G 1 G 2 G 3G 6G 8 G 10G 11G 1 0.00 0.09 0.22 0.35 0.10 0.19 0.52 G 2 0.09 0.00 0.21 0.39 0.08 0.15 0.57 G 3 0.22 0.21 0.00 0.27 0.15 0.09 0.47 G 6 0.35 0.39 0.27 0.00 0.32 0.32 0.21 G 8 0.10 0.08 0.15 0.32 0.00 0.10 0.51 G 10 0.19 0.15 0.09 0.32 0.10 0.00 0.52 G 110.520.570.470.210.510.52 0.00第三步,在第二步中所得到的7×7阶距离矩阵中,非对角线元素中最小者为d 28=0.08,故将G 2与G 8归并为一类,记为G 12,即G 12={G 2,G 8}。
再按照公式(3.4.11)式分别计算G 1,G 3,G 6,G 10,G 11与G 12之间的距离,得到一个新的6×6阶距离矩阵如下:G 1 G 3G 6G 10G 11G 12G 1 0.00 0.22 0.35 0.19 0.52 0.10 G 3 0.22 0.00 0.27 0.09 0.47 0.21 G 6 0.35 0.27 0.00 0.32 0.21 0.39 G 10 0.19 0.09 0.32 0.00 0.52 0.15 G 11 0.52 0.47 0.21 0.52 0.00 0.57 G 120.100.210.390.15 0.57 0.00第四步,在第三步中所得的6×6阶距离矩阵中,非对角元素中最小者为d 3,10=0.09,故将G 3与G 10归并为一类,记为G 13,即G 13={G 3,G 10}={G 3,(G 4,G 9)}。