应用统计学 利用spss进行居民消费结构变化的分析

应用统计学 利用spss进行居民消费结构变化的分析
应用统计学 利用spss进行居民消费结构变化的分析

关于某市近20年居民消费结构变动的分析

本文的目的是分析居民随着年份的增加,消费结构发生的变化,通过收集的数据。利用spss软件进行因子分析,得出结论,为产业政策的制订和宏观经济的调控提供参考。

引言:

消费结构是指在一定的社会经济条件下,人们在消费过程中各种不同内容、不同形式的消费在消费总量中所占的比重以及它们之间的关系。按1993年国家统计局对生活消费品类别的划分方法,把居民生活消费品分为八个大类,即食品、衣着、居住、家庭设备用品及服务、医疗保健、交通通信、文化教育娱乐用品及服务、其他商品及服务。消费结构的变动不仅是经济领域内的重要问题,而且也关系到整个国民经济的发展,合理的消费结构及消费结构的升级和优化不仅反映了消费层次和质量的提高,也为建立合理的产业结构和产品结构提供了重要依据。

一数据的理解及处理

本文采用的数据来自于网络(见附录),其中主要包含食品、衣着、居住、家庭设备用品及服务、医疗保健、交通通信、文化教育娱乐用品及服务、其他商品及服务8个指标,这些指标之间存在着不同程度而相关性如果单独分析这些指标,无法分析居民消费结构的特点,因此采用因子分析法,将这八个指标综合为几个少数因子,通过这些公共因子来反映居民消费结构的变化情况。且各数具比较完整,无异常数据因此直接处理。

我们先通过图形来观察各项消费的平均值支出所占居民消费的比重,由图像可以看出食品所占消费比重最大,文化教育娱乐用品及服务及居住次之,其它相差不大而其他商品及服务最小。

通过图形二我们可以看到各消费随着年份的增加的变化,可以得出以下结论

(1)虽然在2002年左右食品消费所占比例发生一定程度的震荡但保持一直下降的趋势。

(2)文教娱乐及服务消费随着年份增加而不断上升。

(3)居住消费支出保持较大幅度的震荡变化上升下降总体趋势不是太明显。

(4)其它消费支出变化趋势较相近,且震荡幅度不大。

图一 图二

三因子分析法步骤及结果分析

1相关性分析

图三

先进相关性分析,其步骤是,选择‘分析’菜单中‘相关’的‘双变量’,并将影响因素选入变量列表。通过观察图三我们可以看到很多变量之间都存在或强或弱的相关关系,所以可以对变量进行因子分析。

2 KMO及Bartlett 的检验

选择‘分析’中‘降维’的‘因子分析’,并在‘描述’子对话框中选KMO 和Bartlett球形度检验

图四

图四中我们可以看到,KMO 小于0.7,但是因为数据来源有限,本论文只是表现统计方法的使用,所以仍然继续进行分析。

3描述性统计表

从图五我们可以看到各费支出的描述统计量,比如均值标准差,这为后续的因子分析提供一个直观的分析结果,从图中可以看到,食品支出消费比重最大,其均值为39.68%其次是文教娱乐及服务和居住支出消费。

4 因子共同度

图六是因子分析的共同度。显示了所有变量的共同数据。第二列是因子分析初始解下的变量共同度。它表明对原有8个变量如果采用主成分析法提取所有的8个特征值,那么原有的所有变量的方差都可以被解释,变量的共同性均为1。

事实上因子个数小于元变量的个数才是因子分析的目的,所以不可能提取所有特征根于是第三列给出了提取条件提取特征根时的共同度,可以看到所有变量的绝大部分信息可被因子解释,这些变量信息丢失较少,因此本次因子提取的总图五 图六

体效果较为理想。

5 因子分析的总方差解释

图七所示是因子分析的总方差解释,是相关系数矩阵的特征值,方差贡献率及累计方差贡献率的统计结果,第一组数据项(从第二道第四列)描述了初始因子解的情况,可以看出第一个因子的特征根值为4.341,解释了原有8个变量总方差的54.264%前三个因子的累计贡献率为88.059%并且只有他们的取值大于1,说明前三个公因子基本包含了全部变量的主要信息,因此选前3个因子为主因子即可。同时提取平方和载入和旋转平方和载入数据组列出了因子提取后和旋转后的因子方差解释情况,从中可以看出他们都支持3个公共因子。

6 因子碎石图

图七 图八

图八所示为因子分析的碎石图,横坐标为因子数目,纵坐标为特征根,可以看到第一个因子的特征值为很高,对解释原有变量的贡献最大,第三个因子以后的特征根都很小,对解释原有的变量都很小,因此就提取前三个因子。

7旋转前因子载荷矩阵

图九旋转前因子载荷矩阵,它是因子分析的核心内容,通过载荷系数大小可以分析不同公共因子所反映的主要指标的区别,从结果可以看到大部分因子解释性较好,但是仍有少部分因子因子解释性能力较差,比如食品指标,在三个因子的载荷系数区别不大,因此接着因子旋转法使得因子载荷系数向0和1两极分化,使大的载荷更大,小的载荷更小,这样结果更具解释性。

8旋转后的因子载荷矩阵

图九

图十

图十现实实施旋转后的因子载荷矩阵,可以看到,第一主因子在交通通讯,文教娱乐及服务医疗保健,居住等指标上有较大的载荷系数,说明第一个公因子综合反映这几个方面的变动情况可以将其命名为第一基本消费因子。

从载荷系数绝对值大小表明自1993年以来,该市居民消费结构中变化最大的依次为交通和通讯0.975文教娱乐及服务0.973医疗保健0.952食品为-0.893,其中交通和通讯0.975文教娱乐及服务0.973医疗保健0.952为上的载荷系数为正值。表明在1993~2012年间居民在交通和通讯,文教娱乐及服务,医疗保健上的消费为递增的,而在食品上的消费为递减的,这与前文分析还有实际是相符的。

第二个主因子在衣着,家庭设备用品及服务,居住指标上系数较大,可以将其命名为第二基本消费因子,衣着0.737家庭设备用品及服务为0.644居住为-0.632说明居民在衣着,家庭设备用品及服务为消费时增加的在居住上是递减的,这与实际情况也是相符的,随着收入的增加人们对衣着的要求也是多样化发展,对家庭电器需求变大,同时越来越高的房价对居民来说无法承担,居住消费呈现出下降。

而第三个主因子在杂项商品及服务上系数最大,可以将其命名为第三基本消费因子,系数为0.919表明市民生活内容日益丰富。

9因子得分系数

图十一

图十一采用回归法估计因子的得分系数,根据表中的内容可以写出以下因子得分函数。

因子8123456710.2130.1490.1170.2190.2230.2290.0420.027F x x x x x x x x =-+-++++- 因子8123456720.0630.5490.5170.0100.0190.0750.3780.181F x x x x x x x x =-+---++- 因子8

123456730.1230.0830.2250.0250.0540.0670.4020.727F x x x x x x x x =--++--+ 10因子变动趋势图

不仅如此原数据还给出了FAC_1,FAC_2,FAC_3三个变量,它表示3个因子在不同年份的得分值,为了进一步揭示因子变动的情况绘制了图十二所示的因子变动趋势图。

从图十二可以看出在第一公因子在1993~2000年期间一直比较稳定,但进入21世纪以后虽然在2002年出现下降,但其后一直保持上升并在2007年达到最大值,2008年出现明显的下降之后又保持了稳定的上升。这主要是因为该市在进入21世纪之前经济发展不是太强劲,随着中国加入世贸组织,该市经济出现较快发展,人们的第一类消费开始逐渐增加,但由于2008年经济危机的发生,使该市受到了一定的冲击,第一公因子出现明显的下降,但随着国家刺激经济的发展,该市经济出现复苏,第一公因子又开始保持稳定上升。

第二公因子得分的起伏波动主要由居住,衣着比重有升有降的波动引起的,根本原因是国家执行住房改革的力度密切相关,但由于住房改革政策的推行相对图十二

于其他的改革政策比较缓慢。所以居民对住房消费存在一定的不确定性,这就造成第二因子的波动。

第三因子一直波动不已,说明市民在杂项上的的消费仍有很大的空间。

四结论

总的来看,该市居民生活已逐步提高,迈向富裕。居民消费从过去的单一型向享受型、发展型消费品等多层次需求的消费结构方向发展。

在消费结构上,食品、衣着、家庭设备及服务和的支出比例下降,而居住、教育文化娱乐服务、医疗保健和交通通信这四项消费项目支出比例增加,说明城镇居民的消费层次己经提高,消费的重心逐渐发生改变。但经济发展需进一步深化,因为食品消费支出还占很大一部分。当然还有一部分缺陷比如KMO小于0.7,但是因为数据来源有限,但本论文只是表现统计方法的使用,所以仍然继续进行分析。

应用统计学试题及答案解析

北京工业大学经济与管理学院2007-2008年度 第一学期期末 应用统计学 主考教师 专业: 学号: 姓名: 成绩: 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一.单选题(每题2分,共20分) 1. 在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2. 一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分 比为 A. –5% B. –4.76% C. –33.3% D. 3.85%

6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位 B. 时间每增加一个单位,产品成本平均下降1.75个单位 C. 产品成本每变动一个单位,平均需要1.75年时间 D. 时间每减少一个单位,产品成本平均下降1.75个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公 斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x =70件,σ=5.6件 乙车间: x =90件, σ=6.3件 哪个车间日加工零件的离散程度较大: A 甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间

《应用统计学》期末考试试题++a+)+卷

一、单项选择题(每题 2分,共30分) △ 1.在编制等距数列时,如果全距等于56,组数为6,为统计运算方便,组距取( B )。 A 、9.3 B 、9 C 、6 D 、10 2.某商业局对其所属商店的销售计划完成百分比采用如下分组, 请指出哪项是正确的( C )。 A 、80—89% 90—99% 100—109% 110%以上 B 、80%以下 80.1—90% 90.1—100% 100.1—110% C 、90%以下 90—100% 100—110% 110%以上 D 、85%以下 85—95% 95—105% 105—115% 3.以下是根据8位销售员一个月销售某产品的数量制作的茎叶图 3 02 6785 5654 则销售的中位数为( C ) 。 A. 5 B. 45 C. 56.5 D. 7.5 4.按使用寿命分组的产品损坏率一般表现为( D )分布。 A 、钟型 B 、对称 C 、J 型 D 、U 型 5.某11位举重运动员体重分别为:101斤、102斤、103斤、108 斤、102斤、105斤、102斤、110斤、105斤、102斤,据此计 算平均数,结果满足( D )。 A 、算术平均数=中位数=众数 B 、众数>中位数>算术平均数 C 、中位数>算术平均数>众数 D 、算术平均数>中位数>众数

6.甲数列的标准差为7.07,平均数为70,乙数列的标准差为3.41, 平均数为7,则( D )。 A 、甲数列平均数代表性高; B 、乙数列平均数代表性高; C 、两数列的平均数代表性相同; D 、甲数列离散程度大; 7.某银行想知道平均每户活期存款余额和估计其总量,根据存折 账号的顺序,每50本存折抽出一本登记其余额。这样的抽样组 织形式是( C ) A 、类型抽样 B 、整群抽样 C 、机械抽样 D 、纯随机抽样 8.在方差分析中,检验统计量F 是( B )。 A 、组间平方和除以组内平方和 B 、组间均方和除以组内均方 C 、组间平方和除以总平方和 D 、组内均方和除以组间均方 9. 回归方程中,若回归系数为正,则( A )。 A 、表明现象正相关 B 、表明现象负相关 C 、表明相关程度很弱 D 、不能说明相关的方向和程度 △10.已知某工厂甲产品产量和生产成本有直线关系,在这条直 线上,当产量为1000时,其生产成本为30000元,其中不随产量 变化的成本为6000元,则成本总额对产量的回归方程是( A ) A 、x y 246000?+= B 、x y 24.06?+= C 、x y 624000?+= D 、x y 600024?+= 11.速度和环比发展速度的关系是( A )。 A 、两个相邻时期的定基发展速度之商等于相应的环比发展速度 B 、两个相邻时期的定基发展速度之差等于相应的环比发展速度

统计学期末考试试题(含答案)..

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量 A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是填报 单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错) 5、区间估计就是直接用样本统计量代表总体参数。(错) 6、在假设检验中,方差已知的正态总体均值的检验要计算Z统计量。(错)

应用统计学期末考试试题A卷

一 、单项选择题(每题2分,共30分) △1.在编制等距数列时,如果全距等于56,组数为6,为统计运算方便,组距取( B )。 A 、 B 、9 C 、6 D 、10 2.某商业局对其所属商店的销售计划完成百分比采用如下分组,请指出哪项是正确的 ( C )。 A 、80—89% 90—99% 100—109% 110%以上 B 、80%以下 —90% —100% —110% C 、90%以下 90—100% 100—110% 110%以上 D 、85%以下 85—95% 95—105% 105—115% 3.以下是根据8位销售员一个月销售某产品的数量制作的茎叶图 3 02 6785 5654 则销售的中位数为( C )。 A. 5 B. 45 C. D. 4.按使用寿命分组的产品损坏率一般表现为( D )分布。 A 、钟型 B 、对称 C 、J 型 D 、U 型 5.某11位举重运动员体重分别为:101斤、102斤、103斤、108斤、102斤、105斤、 102斤、110斤、105斤、102斤,据此计算平均数,结果满足( D )。 A 、算术平均数=中位数=众数 B 、众数>中位数>算术平均数 C 、中位数>算术平均数>众数 D 、算术平均数>中位数>众数 6.甲数列的标准差为,平均数为70,乙数列的标准差为,平均数为7,则( D )。 A 、甲数列平均数代表性高; B 、乙数列平均数代表性高; C 、两数列的平均数代表性相同; D 、甲数列离散程度大; 7.某银行想知道平均每户活期存款余额和估计其总量,根据存折账号的顺序,每50本 存折抽出一本登记其余额。这样的抽样组织形式是( C ) A 、类型抽样 B 、整群抽样 C 、机械抽样 D 、纯随机抽样 8.在方差分析中,检验统计量F 是( B )。 A 、组间平方和除以组内平方和 B 、组间均方和除以组内均方 C 、组间平方和除以总平方和 D 、组内均方和除以组间均方 9. 回归方程中,若回归系数为正,则( A )。 A 、表明现象正相关 B 、表明现象负相关

《spss统计软件》练习题库及答案

华中师范大学网络教育学院 《SPSS统计软件》练习题库及答案(本科) 一、选择题(选择类) (A)1、在数据中插入变量的操作要用到的菜单是: A Insert Variable; B Insert Case; C Go to Case; D Weight Cases (C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是: A Sort Cases; B Select Cases; C Compute; D Categorize Variables (C)3、Transpose菜单的功能是: A 对数据进行分类汇总; B 对数据进行加权处理; C 对数据进行行列转置; D 按某变量分割数据 (A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=0.043,说明: A. 按照0.05显著性水平,拒绝H0,说明三种城市的平均身高有差别; B. 三种城市身高没有差别的可能性是0.043; C. 三种城市身高有差别的可能性是0.043; D. 说明城市不是身高的一个影响因素 (B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是:A 家庭主妇和女大学生对同种商品喜好的差异; B 服用某种药物前后病情的改变情况; C 服用药物和没有服用药物的病人身体状况的差异; D性别和年龄对雇员薪水的影响 二、填空题(填空类) 6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。 7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡方检验的菜单是_ Crosstabs __。 8、One-Samples T Test过程用于进行样本所在总体均数___与__已知总体均数_的比较。 三、名词解释(问答类) 9、Repeated Measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 10、Chi-Square test:卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。 四、简答题(问答类) 11、用SPSS对数据进行分析的基本流程是什么? 答:(1)、将数据输入SPSS,并保存; (2)、进行必要的预分析(分布图、均数标准差等的描述等),以确定应采用的检验方法; (3)、按题目要求进行统计分析; (4)、保存和导出分析结果。 12、对数据进行方差分析时,Univariate菜单和Multivariate菜单最大的区别是什么? 答:当因变量只有一个时,使用Univariate菜单,当因变量不止一个时,使用Multivariate菜单。 13、简述SPSS打开其它格式数据的几种方法? 答:(1)、直接打开:选择菜单File==>Open==>Data或直接单击快捷工具栏上的打开按钮; (2)、使用数据库查询打开:选择菜单File==>Open Database==>New Query,根据向导打开数据; (3)、使用文本向导读入文本文件:选择菜单File==>Read Text Data

《应用统计学》期末考试试题及答案(第一套)

《应用统计学》期末考试试题(第一套) 参考答案及评分细则 一、单项选择题(在备选答案中只有一个是正确的,将其选出并把它的英文标号写在题后括号内。不答题或者答错题既不得分,也不倒扣分。每题1分,共10分) 1、某城市工业企业未安装设备普查,总体单位是( B)。 A.工业企业全部未安装设备B.工业企业每一台未安装设备 C.每个工业企业的未安装设备D.每一个工业企业 2、属于数量指标的是( A )。 A.粮食总产量 B.粮食平均亩产量 C.人均粮食生产量 D.人均粮食消费量 3、某市工业企业2006年生产经营成果年报呈报时间规定在2007年1月31日, 则调查期限为( B )。 A.一日B.一个月C.一年D.一年零一个月 4、某管理局对其所属企业的生产计划完成百分比采用如下分组,请指出下列哪项 是正确的( C ) A.80-89%B.80%以下C.90%以下D.85%以下 90-99%80.1-90%90-100% 85-95% 100-109% 90.1-100% 100-110% 95-105% 110%以上 100.1-110%110%以上 105-115% 5、某企业2005年职工平均工资为5200元,标准差为110元,2006年职工平均 工资幅长了40%,标准差增大到150元,职工平均工资的相对变异( B )A.增大 B.减小C.不变D.不能比较6、权数对算术平均数的影响作用,实质上取决于( A ) A.作为权数的各组单位数占总体单位数比重的大小 B.各组标志值占总体标志总量比重的大小 C.标志值本身的大小 D.标志值数量的多少 7、已知各期环比增长速度为2%、5%、8%和7%,则相应的定基增长速度的计算方 法为( A )

《应用统计学》期末考试试题及答案(第二套)

《应用统计学》期末考试试题(第二套) 参考答案及评分细则 一、单项选择题(在备选答案中只有一个是正确的,将其选出并把它的英文标号写在题后括号内。不答题或者答错题既不得分,也不倒扣分。每题1分,共10分) 1、指标是说明总体特征的,标志是说明总体单位特征的,所以( B) A、标志和指标之间的关系是固定不变的 B、标志和指标之间的关系是可以变化的 C、标志和指标都是可以用数值表示的 D、只有指标才可以用数值表示 2、属于质量指标的是( B )。 A、货物周转量 B、单位面积产量 C、年末人口数 D、工业增加值 3、所选择单位的标志总量占全部总体标志总量的绝大比例,这些单位就是( C )。 A、调查单位 B、代表性单位 C、重点单位 D、典型单位 4、划分连续变量的组限时,相邻的组限必须( A ) A、重叠 B、相近 C、不等 D、间断 5、宏发公司2004年计划规定利润应比2003年增长10%,实际执行的结果比2003年增长了12%,则其计划完成程度为( D )。 A、 83% B、 120% C、 98.2% D、 101.8% 6、甲班学生平均成绩80分,标准差8.8分,乙班学生平均成绩70分,标准差 8.4分,因此( A ) A、甲班学生平均成绩代表性好一些 B、乙班学生平均成绩代表性好一些 C、无法比较哪个班学生平均成绩代表性好 D、两个班学生平均成绩代表性一样 7、若各年环比增长速度保持不变,则各年增长量( A ) A、逐年增加 B、逐年减少 C、保持不变 D、无法做结论

8、在物价上涨后,同样多的人民币少购买商品2%,则物价指数为( B ) A 、90.00% B 、102.04% C 、90.91% D 、109.18% 9、在其它条件不变的情况下,提高估计的概率保证程度,其估计的精确程度(B ) A 、随之扩大 B 、随之缩小 C 、保持不变 D 、无法确定 10、下列回归方程中,肯定错误的是( C ) A 、88.0,32?=+=r x y B 、88.0,32?=+-=r x y C 、88.0,32?-=+-=r x y D 、88.0,32?-=-=r x y 二、多项选择题(在备选答案中有二个以上是正确的,将它们全选出并把它们的标号写在题后括号内,每题所有答案选择正确的得分;不答、错答、漏答均不得分。每题2分,共10分) 1、哪些属于离散变量( ABC )。 A 、某企业职工总人数 B 、某行业职工总人数 C 、全国城镇居民家庭总户数 D 、旅客周转量 2、在以下什么条件下,加权算术平均数等于简单算术平均数?( AD ) A 、各组次数相等 B 、各组变量值不等 C 、变量数列为组距数列 D 、各组次数占总次数的比重相等 3、下列指标中属于时点指标的有( ABD ) A 、企业数 B 、在册职工人数 C 、某种商品的销售量 D 、某地区2006年末人口数 4、计算平均发展速度可采用的公式有( ABD )。 A 、n n a a x 0 = B 、n x x π= C 、n x x ∑= D 、n R x = 5、指数的作用是( ABD )。 A 、综合反映复杂现象总体数量上的变动情况 B 、分析现象总体变动中受各个因素变动的影响 C 、现象总体各单位变量分布的集中趋势 D 、利用指数数列分析现象的发展趋势 三、判断题(请判断每题的表述是否正确,将判断结果写在题后括号内,正确填“√”,错误填“×”。不答题或者答错题既不得分,也不倒扣分每小题1分,共10分)

应用统计学期末试卷答案

一、填空题(每空1分,共10分) 1、依据统计数据的收集方法不同,可将其分为【观测数据】数据和【实验数据】数据。 2、收集的属于不同时间上的数据称为【时间序列】数据。 3、设总体X 的方差为1,从总体中随机取容量为100的样本,得样本均值=5,则总体均值的置信水平为99%的置信区间[4.742 ,5.258] (Z 0.005=2.58) 4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP 年度化增长率为【21%】 5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 1080,中位数为1080。 6、判定系数的取值范围是 [0,1] 。 7、设总体X ~) ,(2 σμN ,x 为样本均值,S 为样本标准差。当σ未知,且为小样本时,则n s x μ-服从自由度为n-1的___t__分布。 8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有 16 个。 二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号内。每小题1分,共14分) 3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31. 则最大艇速的均值的无偏估计值为 ( 2 ) ①、32.5 ②、33 ③、39.6 4、某地区粮食作物产量年平均发展速度:1998~2000年三年平均为1.03,2001~2002年两年平均为1.05,试确定1998~2002五年的年平均 发展速度 ( 3 5、若两个变量的平均水平接近,平均差越大的变量,其( 2 ) ①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高 6、对正态总体均值进行区间估计时,其它条件不变,置信水平α-1越小,则置信上限与置信下限的差( 2 ) ②、越小 7、若某总体次数分布呈轻微左偏分布,则成立的有 ( 2 ) ①、x > e M >o M ②、x o M >e M 8、方差分析中的原假设是关于所研究因素 ( 2 ) ①、各水平总体方差是否相等 ②、各水平的理论均值是否相等 ③、同一水平内部数量差异是否相等 9、某年某地区甲乙两类职工的月平均收入分别为1060元和3350元,标准差分别为230元和680元,则职工月平均收入的离散程度 ( 1 ) ①、甲类较大 ②、乙类较大 ③、两类相同 10、某企业2004年与2003年相比,各种产品产量增长了8%,总生产费用增长了 15%,则该企业2004年单位成本指数为 ( 3 ) ①、187.5% ②、7% ③、106.48% 11、季节指数刻画了时间序列在一个年度内各月或季的典型季节特征。在乘法模型中,季节指数是以其平均数等于什么为条件而构成的? ( 1 ) ①、100% ②、400% ③、1200% 12、周末超市的营业额常常会大大高于平日数额,这种波动属于 ( 2 ) ①、长期趋势②、季节变动③、循环变动 13、下列情况下,适合用算术平均法计算平均数的数据是 ( 2 )①、不同顾客所需的皮鞋尺码②、一群人的身高③、一群人的学历 14、在试验中,两个事件有一个发生时,另一个就不发生,称这两个事件为 ( 3 )①、独立事件 ②、相容事件 ③、互斥事件 三、多项选择题(在下列备选答案中,有一个以上正确答案,请将其全部选出并把顺序号填入括号内。共7题,每题2分。) 3、以下数据的收集方法属于询问调查的是: ( 23 ) ①、抽样调查 ② 访问调查 ③ 电话调查 4、测定数值型数据的离散程度,依据研究目的及资料的不同,可用的指标有 ( 12 ) ①、标准差 ②、离散系数 ③、几何平均数 5、估计量的评价标准包括: ( 123 ) ①、无偏性 ②、有效性 ③、一致性 6、如果两个变量之间有一定的相关性,则以下结论中正确的是 ( 123 ) ①、回归系数b 的绝对值大于零 ②、判定系数2R 大于零 ③、相关系数r 的绝对值123大于0.3 7、常用的加权综合指数包括: ( 13 ) ①、拉氏指数 ②、物质生活质量指数 ③、帕氏指数 四、判断题:(判断命题的正误。对的,在题干前的括号内打√号;错的,在题干前的括号内打×号。共10题,每题1分。) ( N )1、茎叶图主要用于顺序型数据的显示。 ( Y )2、四分位数不受数据极端值的影响。 ( Y )3、在设计调查问卷的回答项目时,封闭性问题的答案往往是选择回答型,所以设计出的答案一定要穷尽和互斥。

SPSS统计分析最全中英文对照表

SPSS 专业技术词汇、短语的中英文对照索引% of cases 各类别所占百分比 1-tailed单尾的 1Independent Samples 两个独立样本的检验 2 Related Samples 两个相关样本检验 2-tailed双尾的 3-D (=dimensional) 三维-->三维散点图 A Above 高于 Absolute 绝对的-->绝对值 Add 加,添加 Add Cases 合并个案 Add cases from...从……加个案 Add Variables 合并变量 Add variables from... 从……加变量 Adj.(=adjusted)standardized 调整后的标准化残差 Aggregate 汇总-->分类汇总 Aggregate Data 对数据进行分类汇总 Aggregate Function 汇总函数 Aggregate Variable需要分类汇总的变量 Agreement协议 Align 对齐-->对齐方式 Alignment 对齐-->对齐方式 All 全部,所有的 All cases所有个案 All categories equal 所有类别相等 All other values所有其他值 All requested variables entered 所要求变量全部引入 Alphabetic 按字母顺序的-->按字母顺序列表 Alternative 另外的,备选的 Analysis by groups is off 分组分析未开启 Analyze 分析-->统计分析 Analyze all cases, do not create groups 分析全部个案,不建立分组 Annotation 注释 ANOVA Table ANOVA表 ANOVA table and eta (对分组变量)进行单因素方差分析并计算其η值 Apply 应用 Apply Data Dictionary 应用数据字典 Apply Dictionary 应用数据字典 Approximately 大约 Approximately X% of all cases从所有个案中随机选择约X%的个案

(完整版)《应用统计学》期末考试试题+(+A+)+卷

一、单项选择题(每题2分,共30分) △ 1.在编制等距数列时,如果全距等于56,组数为6,为统计 运算方便,组距取( B )。 A 、9.3 B 、9 C 、6 D 、10 2.某商业局对其所属商店的销售计划完成百分比采用如下分组, 请指出哪项是正确的( C )。 A 、80—89% 90—99% 100—109% 110%以上 B 、80%以下 80.1—90% 90.1—100% 100.1—110% C 、90%以下 90—100% 100—110% 110%以上 D 、85%以下 85—95% 95—105% 105—115% 3.以下是根据8位销售员一个月销售某产品的数量制作的茎叶图 3 02 6785 5654 则销售的中位数为( C ) 。 A. 5 B. 45 C. 56.5 D. 7.5 4.按使用寿命分组的产品损坏率一般表现为( D )分布。 A 、钟型 B 、对称 C 、J 型 D 、U 型 5.某11位举重运动员体重分别为:101斤、102斤、103斤、108 斤、102斤、105斤、102斤、110斤、105斤、102斤,据此计 算平均数,结果满足( D )。 A 、算术平均数=中位数=众数 B 、众数>中位数>算术平均数 C 、中位数>算术平均数>众数 D 、算术平均数>中位数>众数 6.甲数列的标准差为7.07,平均数为70,乙数列的标准差为3.41,

平均数为7,则( D )。 A 、甲数列平均数代表性高; B 、乙数列平均数代表性高; C 、两数列的平均数代表性相同; D 、甲数列离散程度大; 7.某银行想知道平均每户活期存款余额和估计其总量,根据存折 账号的顺序,每50本存折抽出一本登记其余额。这样的抽样组 织形式是( C ) A 、类型抽样 B 、整群抽样 C 、机械抽样 D 、纯随机抽样 8.在方差分析中,检验统计量F 是( B )。 A 、组间平方和除以组内平方和 B 、组间均方和除以组内均方 C 、组间平方和除以总平方和 D 、组内均方和除以组间均方 9. 回归方程中,若回归系数为正,则( A )。 A 、表明现象正相关 B 、表明现象负相关 C 、表明相关程度很弱 D 、不能说明相关的方向和程度 △10.已知某工厂甲产品产量和生产成本有直线关系,在这条直 线上,当产量为1000时,其生产成本为30000元,其中不随产量 变化的成本为6000元,则成本总额对产量的回归方程是( A ) A 、x y 246000?+= B 、x y 24.06?+= C 、x y 624000?+= D 、x y 600024?+= 11.速度和环比发展速度的关系是( A )。 A 、两个相邻时期的定基发展速度之商等于相应的环比发展速度 B 、两个相邻时期的定基发展速度之差等于相应的环比发展速度 C 、两个相邻时期的定基发展速度之和等于相应的环比发展速度 D 、两个相邻时期的定基发展速度之积等于相应的环比发展速度

《应用统计学-贾俊平》期末试卷及答案

《统计学》模拟试卷(一) 一、填空题(每空1分,共10分) 1、依据统计数据的收集方法不同,可将其分为【观测数据】数据和【实验数据】数据。 2、收集的属于不同时间上的数据称为【时间序列】数据。 3、设总体X 的方差为1,从总体中随机取容量为100的样本,得样本均值=5,则总体均值的置信水平为99%的置信区间[4.742 ,5.258] (Z 0.005=2.58) 4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP 年度化增长率为【21%】 5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 1080,中位数为1080。 6、判定系数的取值范围是 [0,1] 。 7、设总体X ~ ) ,(2 σμN , x 为样本均值,S 为样本标准差。当σ未知,且为小样本时,则n s x μ -服从自由度为n-1的___t__分布。 8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有 16 个。 二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号内。每小题1分,共14分) 3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31. 则最大艇速的均值的无偏估计值为 ( 2 ) ①、32.5 ②、33 ③、39.6 4、某地区粮食作物产量年平均发展速度:1998~2000年三年平均为1.03,2001~2002年两年平均为1.05,试确定1998~2002五年的年平均 发展速度 ( 3 5、若两个变量的平均水平接近,平均差越大的变量,其( 2 ) ①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高 6、对正态总体均值进行区间估计时,其它条件不变,置信水平α-1越小,则置信上限与置信下限的差( 2 ) ②、越小 7、若某总体次数分布呈轻微左偏分布,则成立的有 ( 2 ) ①、x > e M >o M ②、x o M >e M 8、方差分析中的原假设是关于所研究因素 ( 2 ) ①、各水平总体方差是否相等 ②、各水平的理论均值是否相等 ③、同一水平内部数量差异是否相等 9、某年某地区甲乙两类职工的月平均收入分别为1060元和3350元,标准差分别为230元和680元,则职工月平均收入的离散程度 ( 1 ) ①、甲类较大 ②、乙类较大 ③、两类相同 10、某企业2004年与2003年相比,各种产品产量增长了8%,总生产费用增长了 15%,则该企业2004年单位成本指数为 ( 3 ) ①、187.5% ②、7% ③、106.48% 11、季节指数刻画了时间序列在一个年度内各月或季的典型季节特征。在乘法模型中,季节指数是以其平均数等于什么为条件而构成的? ( 1 ) ①、100% ②、400% ③、1200% 12、周末超市的营业额常常会大大高于平日数额,这种波动属于 ( 2 ) ①、长期趋势②、季节变动③、循环变动 13、下列情况下,适合用算术平均法计算平均数的数据是 ( 2 )①、不同顾客所需的皮鞋尺码②、一群人的身高③、一群人的学历 14、在试验中,两个事件有一个发生时,另一个就不发生,称这两个事件为 ( 3 )①、独立事件 ②、相容事件 ③、互斥事件 三、多项选择题(在下列备选答案中,有一个以上正确答案,请将其全部选出并把顺序号填入括号内。共7题,每题2分。) 3、以下数据的收集方法属于询问调查的是: ( 23 ) ①、抽样调查 ② 访问调查 ③ 电话调查 4、测定数值型数据的离散程度,依据研究目的及资料的不同,可用的指标有 ( 12 ) ①、标准差 ②、离散系数 ③、几何平均数 5、估计量的评价标准包括: ( 123 ) ①、无偏性 ②、有效性 ③、一致性 6、如果两个变量之间有一定的相关性,则以下结论中正确的是 ( 123 ) ①、回归系数b 的绝对值大于零 ②、判定系数2 R 大于零 ③、相关系数r 的绝对值123大于0.3 7、常用的加权综合指数包括: ( 13 ) ①、拉氏指数 ②、物质生活质量指数 ③、帕氏指数 四、判断题:(判断命题的正误。对的,在题干前的括号内打√号;错的,在题干前的括号内打×号。共10题,每题1分。) ( N )1、茎叶图主要用于顺序型数据的显示。 ( Y )2、四分位数不受数据极端值的影响。

SPSS统计分析教程-多因素方差分析

SPSS统计分析教程-多因素方差分析 多因素方差分析是对一个变量是否受一个或多个因素或变量影响而进行的方差分析。SPSS 调用“Univariate”过程,检验不同水平组合之间因变量均数,由于受不同因素影响是否有差异的问题。在这个过程中可以分析每一个因素的作用,也可以分析因素之间的交互作用,以及分析协方差,以及各因素变量与协变量之间的交互作用。该过程要求因变量是从多元正态总体随机采样得来,且总体中各单元的方差相同。但也可以通过方差齐次性检验选择均值比较结果。因变量和协变量必须是数值型变量,协变量与因变量不彼此。因素变量是分类变量,可以是数值型也可以是长度不超过8 的字符型变量。固定因素变量(Fixed Factor)是反应处理的因素;随机因素是随机地从总体中抽取的因素。 [例子] 研究不同温度与不同湿度对粘虫发育历期的影响,得试验数据如表5-7。分析不同温度和湿度对粘虫发育历期的影响是否存在着显著性差异。 表5-7 不同温度与不同湿度粘虫发育历期表相对湿度(%) 温度℃ 重复 1 2 3 4 100 25 91.2 95.0 93.8 93.0 27 87.6 84.7 81.2 82.4 29 79.2 67.0 75.7 70.6 31 65.2 63.3 63.6 63.3 80 25 93.2 89.3 95.1 95.5 27 85.8 81.6 81.0 84.4 29 79.0 70.8 67.7 78.8 31 70.7 86.5 66.9 64.9 40 25 100.2 103.3 98.3 103.8 27 90.6 91.7 94.5 92.2 29 77.2 85.8 81.7 79.7 31 73.6 73.2 76.4 72.5 数据保存在“DATA5-2.SAV”文件中,变量格式如图 5-1。 1)准备分析数据在数据编辑窗口中输入数据。建立因变量历期“历期”变量,因素变量温度“A”,湿度为“B”变量,重复变量“重复”。然后输入对应的数值,如图5-6 所示。或者打开已存在的数据文件“DATA5-2.SAV”。 图5-6 数据输入格式 2)启动分析过程点击主菜单“Analyze”项,在下拉菜单中点击“General Linear Model”项,在右拉式菜单中点击“Univariate”项,系统打开单因变量多因素方差分析设置窗口如图5-7。 图5-7 多因素方差分析窗口 3)设置分析变量设置因变量: 在左边变量列表中选“历期”,用向右拉按钮选入到“Depend ent Variable:”框中。 设置因素变量: 在左边变量列表中选“a”和“b”变量,用向右拉按钮移到“Fixed Factor(s):”框中。可以选择多个因素变量。由于内存容量的限制,选择的因素水平组合数(单元数)应该尽量少。 设置随机因素变量: 在左边变量列表中选“重复”变量,用向右拉按钮移到“到Random Factor(s)”框中。可以选择多个随机变量。 设置协变量:如果需要去除某个变量对因素变量的影响,可将这个变量移到“Covariate(s)”框中。 设置权重变量:如果需要分析权重变量的影响,将权重变量移到“WLS Weight”框中。 4)选择分析模型在主对话框中单击“Model”按钮,打开“Univariate Model”对话框。见图5-8。 图5-8 “Univariate Model” 定义分析模型对话框在Specify Model 栏中,指定分析模型类型。

《医学统计学》期末模拟考试题(一)

《医学统计学》期末模拟考试题(一) 学号_________姓名_______班级________成绩_________ 一.填空题(每空0.5分,共15分) 1.科研结果的好坏取决于___________的好坏,研究设计是统计工作的基础和关键,决定着整个统计工作的成败。 2.概率是________________________________________________。小概率事件是指__________的随机事件。 3.实验设计四大原则为___________、_________、____________、______________。 4.实验设计三要素是指_______________、______________、_____________。 5.假设检验的基本思想是_________________和____________________。 6.随机抽样是指_____________________________________________。 7.Ⅱ类错误的意思是________________________________________________。 8.作两样本均数的比较时,如P>0.05,则应_________无效假设,结论为__________________。 9.变异系数用于_______________,或_______________________________资料间变异程度的比较。 10.均衡性原则是指_________________________________________________。 11.正态分布N(μ,σ2)中有两个参数:____________和____________。 12.标准化死亡比(SMR)是_______________________________________之比。

统计学期末考试试题(含答案)

1、一个统计总体( d ) A 、只能有一个标志 B 、只能有一个指标 C 、可以有多个标志 D 、可以有多个指标 2、调查某大学2000名学生学习情况,则总体单位是( d )c A 、2000名学生 B 、 2000名学生的学习成绩 C 、每一名学生 D 、 每一名学生的学习成绩 3、某地进行国有商业企业经营情况调查,则调查对象是( b )。 A 、该地所有商业企业 B 、该地所有国有商业企业 C 、该地每一国有商业企业 D 、该地每一商业企业 4、以下哪种调查的报告单位与调查单位是一致的( b )。c A 、工业普查 B 、工业设备调查 C 、职工调查 D 、未安装设备调查 5、某市进行工业企业生产设备普查,要求在7月1日至7月10日全部调查完毕,则这一时间规定是( b )。 A 、调查时间 B 、调查期限 C 、标准时间 D 、登记期限 6、某连续变量分为5组:第一组为40——50,第二组为50——60,第三组为60——70,第四组为70——80,第五组为80以上,则( c )b A 、50在第一组,70在第四组 B 、60在第三组,80在第五组 C 、70在第四组,80在第五组 D 、80在第四组,50在第二组 7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( a ) A 、简单算术平均法 B 、加权算术平均法 C 、加权调和平均法 D 、几何平均法 8、用水平法检查长期计划完成程度,应规定( )b A 、计划期初应达到的水平 B 、计划期末应达到的水平 C 、计划期中应达到的水平 D 、整个计划期应达到的水平 9、某地区有10万人,共有80个医院。平均每个医院要服务1250人,这个指标是( c )。b A 、平均指标 B 、强度相对指标 C 、总量指标 D 、发展水平指标 10、时间序列中,每个指标数值可以相加的是( b )。 A 、相对数时间序列 B 、时期数列 C 、间断时点数列 D 、平均数时间序列 11、根据时间序列用最小平方法配合二次曲线,所依据的样本资料的特点是( b )。 A 、时间序列中各期的逐期增长量大体相等 B 、各期的二级增长量大体相等 C 、各期的环比发展速度大体相等 D 、各期同比增长量的大体相 12、红星机械厂计划规定,今年甲产品的单位产品成本比去年降低4%,实际执行的结果降低了5%,则该产品单位成本降低计划完成程度的算式为( a )。c A 、%4%5 B 、%104% 105 C 、%96% 95 D 、%4%5 13、某企业报告期产量比基期产量增长了10%,生产费用增长了8%,则其产品单位成本降低了( a )。 A 、1.8% B 、2% C 、20% D 、18% 14、在不重复抽样中,抽样单位数从5%增加到25%,抽样平均误差( c )。 A 、增加39.7% B 、增加约3/5 C 、减少约3/5 D 、没有什么变化 15、若某总体次数分布呈左偏分布,则成立的有( )。b

SPSS统计分析方法及应用解析

SPSS统计分析方法及应用解析 第一章均值比较检验与方差分析 在经济社会问题的研究过程中,常常需要比较现象之间的一些指标有无显著差异,特别当考察的样本容量n比较大时,由随机变量的中心极限定理知,样本均值近似他服从正态分布、所以,均值的比较检验主要研究关于正态总体则均值有关的假设是否成立的问题。 本章主要内容: 1.单个总体均值的t检验(One-Sample T Test); 2.两个独立总样本均值的I检验(Independent- Samples T Test ); 3.两个有联系总体均值的t检验(Paired-Samples T Test );4.单因素方差分析(0ne-Way ANOVA); 5.双因素方差分析(General Linear Model→Univariate)。假设条件:研究的数据服从正态分布或近似地服从正态分布。在Aanlyze菜单中,均值比较检验可以从菜单Compare Means 和General Linear Model得出。 第一节单个总体均值的t检验(One-Sample T Test)

单个总体的t检验也称为单一样本的t检验,也就是检验单个变量的均值是否与假定的均值之间存在差异。将单个变量的样本均值与假定的常数相比较,通过检验得出预先的假设是否正确的结论。 第二节两个总体的t检验(Two-Samples T Test)一、两个独立样本的t检验(Independent -Samples T Test) Independent -Samples T Test是检验两个没有联系的总体样本均值间是否存在显著的差异,两个没有联系的总体样也称独立样本,如两个无联系的企业生产的同样产品之间的某项指标的均值的比较,不同地区的儿童身高、体重的比较等,都可以通过抽取样本检验两个总体的均值是否存在显著的差异。 二、两个有联系样本均值的比较(Paired-Samples T Test ) Paired-Samples T Test是检验两个有联系正态总体的均值是否存在显著的差异,又称配对样本的T检验。如检验某种药品使用的效果是否显苦,需要对使用者使用前后进行比较;再如对某种粮食进行品种改良,也需要比较改良前后粮食产量有无显著差异等。 第三节单因素方差分析(One-Way ANOVA)

相关文档
最新文档