数据分析与SPSS软件应用(微课版)-课后习题答案1-10章全书章节练习题答案

合集下载

2022年智慧树知到《SPSS应用》章节测试答案

2022年智慧树知到《SPSS应用》章节测试答案

2022年智慧树知到《SPSS应用》章节测试答案 1、问题:结果输出窗口保存的文件以什么为后缀( )选项:A:savB:spoC:spsD:rtf答案:2、问题:下面不属于SPSS的缺点是( )选项:A:与OFFICE等办公软件兼容性差B:非专业统计软件C:数据收集和数据清洗功能弱D:处理数据量级较低答案:3、问题:下面不属于SPSS的优点是( )选项:A:基本统计方法较全面B:易用性强C:编程能力强D:帮助功能强大答案:4、问题:IBM SPSS品牌中的计数功能产品是( )选项:A:SPSS ModelerB:SPSS StatisticC:SPSS AmosD:PASatistic】5、问题:SPSS中的统计辅导帮助功能以个案的形式讲解各模块的主要分析方法的基本操作和结果解释。

选项:A:对B:错答案:6、问题:SPSS可以同时打开多个结果输出窗口,并将输出结果同时输出在所有输出窗口中。

选项:A:对B:错答案:7、问题:SPSS的结果输出窗口中也有分析菜单,所以统计分析操作可以在输出窗口执行。

选项:A:对答案:8、问题:社会经济问题研究中常用采用的统计数据分析方法是严格设计支持下的统计方法。

选项:A:对B:错答案:第二章单元测试1、问题:SPSS数据变量类型不包括( )选项:A:数值型B:字符型C:日期型D:逻辑型答案:2、问题:同学们的考核等级变量属于什么计量尺度( )选项:A:定类尺度B:定距尺度C:定序尺度D:定比尺度3、问题:SPSS中定义变量尺度属性称为( )选项:A:变量值标签B:度量标准C:变量类型D:变量角色答案:4、问题:将E_CEL的_ls_文件录入SPSS的方式不包括( ) 选项:A:复制、粘贴B:直接打开C:数据库导入D:文本数据导入答案:5、问题:如。

《spss统计软件》练习题库及答案

《spss统计软件》练习题库及答案

华中师范大学网络教育学院《SPSS统计软件》练习题库及答案(本科)一、选择题(选择类)1、在数据中插入变量的操作要用到的菜单是:AInsertVariable; BInsertCase;CGotoCase; DWeightCases2、在原有变量上经过必定的计算产生新变量的操作所用到的菜单是:ASortCases ;BSelectCases ;CCompute ;DCategorizeVariables(C)3、Transpose菜单的功能是:对数据进行分类汇总;对数据进行加权办理;对数据进行队列转置;按某变量切割数据(A)4、用One-WayANOVA进行大、中、小城市16岁男性青年均匀身高的比较,结果给出sig.=,说明:A.依据明显性水平,拒绝H0,说明三种城市的均匀身高有差异;三种城市身高没有差其他可能性是;三种城市身高有差其他可能性是;说明城市不是身高的一个影响要素(B)5、下边的例子能够用Paired-SamplesTTest 过程进行剖析的是:A家庭主妇和女大学生对同种商品爱好的差异;服用某种药物前后病情的改变状况;服用药物和没有服用药物的病人身体状况的差异;D性别和年纪对雇员薪资的影响二、填空题(填空类)6、MergeFiles 菜单用于归并数据库有两种状况:假如两数据库变量同样,是_观察对象__的归并;假如不一样,则是_变量__的归并。

7、用于对计数资料和有序分类资料进行统计描绘和简单的统计推测,在剖析时能够产生二维或多维列联表,在统计推断时能进行卡方查验的菜单是_ Crosstabs __。

8、One-SamplesTTest 过程用于进行样本所在整体均数___与__已知整体均数_的比较。

三、名词解说(问答类)9、RepeatedMeasures:重复丈量的方差剖析,指的是一个因变量被重复丈量好几次,进而同一个个体的几次察看结果间存在有关,这样就不知足一般剖析的要求,需要用重复丈量的方差剖析模型来解决。

spss考试题库及答案

spss考试题库及答案

spss考试题库及答案一、单选题(每题2分,共10题)1. 在SPSS中,数据文件的扩展名是什么?A. .txtB. .csvC. .savD. .xls答案:C2. SPSS中,哪个命令用于描述性统计分析?A. DESCRIPTIVESB. FREQUENCIESC. CROSSTABSD. MEANS答案:A3. 在SPSS中,如何将变量的值从字符串类型转换为数值类型?A. COMPUTEB. RECODEC. TO NUMBERD. COMPUTE TO答案:B4. SPSS中,哪个命令用于执行相关性分析?A. CORRELATIONSB. REGRESSIONC. T-TESTD. ANOVA答案:A5. 在SPSS中,如何创建一个新的数据文件?A. FILE > NEW > DATAB. FILE > OPEN > DATAC. FILE > SAVE ASD. FILE > CLOSE答案:A6. SPSS中,哪个命令用于执行因子分析?A. FACTORB. CLUSTERC. DISCRIMINANTD. CANONICAL答案:A7. 在SPSS中,如何对数据进行排序?A. SORT CASESB. SORT VARIABLESC. SORT DATAD. SORT FILES答案:A8. SPSS中,哪个命令用于执行多元回归分析?A. REGRESSIONB. LINEARC. LOGISTICD. MULTIPLE答案:A9. 在SPSS中,如何将数据文件保存为Excel格式?A. FILE > SAVE AS > EXCELB. FILE > EXPORT > EXCELC. FILE > OPEN > EXCELD. FILE > PRINT > EXCEL答案:B10. SPSS中,哪个命令用于执行卡方检验?A. CROSSTABSB. T-TESTC. ANOVAD. MANOVA答案:A二、多选题(每题3分,共5题)1. 在SPSS中,以下哪些命令用于数据转换?A. RECODEB. COMPUTEC. AGGREGATED. SELECT IF答案:A, B, C2. SPSS中,以下哪些命令用于描述性统计分析?A. DESCRIPTIVESB. FREQUENCIESC. EXPLORED. DESCRIPTIVE答案:A, B, C3. 在SPSS中,以下哪些命令用于假设检验?A. T-TESTB. ANOVAC. CORRELATIONSD. CROSSTABS答案:A, B, D4. SPSS中,以下哪些命令用于数据的分类和聚类?A. CLUSTERB. DISCRIMINANTC. FACTORD. HIERARCHICAL答案:A, B, D5. 在SPSS中,以下哪些命令用于数据的图形表示?A. GRAPHB. CHARTC. PLOTD. SCATTERPLOT答案:A, B, C, D三、判断题(每题1分,共5题)1. 在SPSS中,可以通过“变量视图”来修改变量的属性。

统计学spss课后题答案

统计学spss课后题答案

实操训练答案目录第一章 (1)第二章 (2)第三章 (3)第四章 (4)第五章 (7)第六章 (10)第七章 (17)第八章 (21)第九章 (26)第十章 (31)第一章(一)思考题略(二)练习题1.(1)定类变量(2)定类变量(3)定序变量(4)数值型变量(5)数值型变量2. A3. B4. A B C D5. D A6. A B(三)操作题略1第二章(一)思考题略(二)练习题1. BD AC2. C3. D4. D5. A(三)操作题1. 见SPSS文件2.1.sav。

2. 略。

3. 略。

4. 略。

第三章1. 2011年人均国内生产总值(agdp2011),排在前五位的是天津、上海、北京、江苏、浙江;排在后五位的是广西、西藏、甘肃、云南、贵州。

. 2011年国内生产总值(gdp2011),在东部各省市里,排在第1位的是广东,排在最后1位的分别是海南;在中部各省市里,排在第1位的是河南,排在最后1位的分别是吉林;在西部各省市里,排在第1位的是四川,排在最后1位的分别是西藏。

2. 见SPSS文件3.2.sav。

3. 见SPSS文件3.3.sav。

4. A老师提供的管理学成绩见SPSS文件3.4-1.sav,B老师提供的经济学成绩见SPSS文件3.4-2.sav,合并后的文件见SPSS文件3.4.sav。

5. 见SPSS文件3.5.sav。

6. 见SPSS文件3.6.sav。

7. 见SPSS文件3.7.sav。

8. 见SPSS文件3.8.sav。

9. 两门课程都在80分以上的共4人,见SPSS文件3.5.sav。

10. 管理学成绩在80-89,经济学成绩在90分以上的只有1人,见SPSS文件3.6.sav。

第四章1. 由于变量品牌(brand)是定类变量,所以分别用众数和异众比来描述其集中趋势和离散趋势。

由分析结果可知,众数是B,异众比是(800-279)/800=65.1%。

统计量品牌N 有效800缺失0众数 2品牌频率百分比有效百分比累积百分比有效 A 164 20.5 20.5 20.5B 279 34.9 34.9 55.4C 110 13.8 13.8 69.1D 55 6.9 6.9 76.0E 192 24.0 24.0 100.0合计800 100.0 100.02.由于变量《统计学》这门课程难吗(v2.4)是定序变量,所以用众数,中位数,四分位数来描述其集中趋势,用四分位差来描述其离散趋势。

SPSS数据分析及量化研究_北京师范大学中国大学mooc课后章节答案期末考试题库2023年

SPSS数据分析及量化研究_北京师范大学中国大学mooc课后章节答案期末考试题库2023年

SPSS数据分析及量化研究_北京师范大学中国大学mooc课后章节答案期末考试题库2023年1.在SPSS中中,做横向合并数据文件时,两个数据文件都必须事先按关键变量值()进行排序。

答案:可升可降2.下列对缺失值的标记与处理,错误的是()。

答案:任意指定某数据以替代缺失值3.在多因素方差分析中,对于固定因子和随机因子的说法,正确的是()。

答案:人们可以把低测度的定序变量作为固定因子4.下列哪一项假定不属于方差分析中的假定()答案:各个总体的方差等于05.在因子分析中,通常认为公因子的特征根值应大于()。

答案:1##%_YZPRLFH_%##1.06.在多因素方差分析中,为了获得优质的模型,通常不采用全因子模型,而是需要研究者自主调试模型中的因子及其组合方式。

答案:正确7.能够使用独立样本t检验的数据集,都可以采用2独立样本的非参数检验算法来判断是否存在着显著性差异。

答案:正确8.对不满足正态分布的两独立样本,通常是通过分布形态或()来比较其差异性的。

答案:秩分9.多因素方差分析是用来研究两个及两个以上的控制变量是否能对观测变量产生()影响的。

答案:显著性10.在回归分析中,自变量的筛选与剔除是一个系统自动迭代的过程。

在下列状态中,尚不能结束迭代过程的情况是( )答案:找到了满足条件的可进入自变量11.在多元线性回归中,对自变量的筛选主要是基于针对各自变量做方差分析的( )答案:F值或检验概率Sig值12.在执行曲线回归时,通常可以先(),然后再执行回归过程。

答案:制作散点图,初步确定方程的类型13.对于相关性分析中的相关系数r,当r的绝对值小于( )时,则可认为两变量不相关。

答案:0.414.在执行多元线性回归分析的时候,()方法不可以评价回归方程的质量。

答案:某个自变量的Sig值大于0.0515.为了研究影响广告效果的众多因素中,哪些影响因素是主要因素时,可以采用( )的分析方法。

答案:回归分析16.利用线性回归分析算得回归方程式:y=80*x1-2.53*x2+57*x3,以下说法中一定错误的是( )。

《spss统计软件》练习题库及答案

《spss统计软件》练习题库及答案

《spss统计软件》练习题库及答案XXX《SPSS统计软件》练题库及答案(本科)一、选择题(选择类)(A)1、在数据中插入变量的操作要用到的菜单是:AInsert Variable;BInsert Case;CGo to Case;DWeight Cases(C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是:ASort Cases;BSelect Cases;CCompute;DCategorize Variables(C)3、Transpose菜单的功能是:A对数据进行分类汇总;B对数据进行加权处理;C对数据进行行列转置;D按某变量分割数据(A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=0.043,说明:A.按照0.05显著性水平,拒绝H,说明三种城市的平均身高有差别;B.三种城市身高没有差别的可能性是0.043;C.三种城市身高有差别的可能性是0.043;D.申明城市不是身高的一个影响身分(B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是:A家庭主妇和女大学生对同种商品喜好的差异;B 服用某种药物前后病情的改变情况;C服用药物和没有服用药物的病人身体状况的差异;D性别和年龄对雇员薪水的影响二、填空题(填空类)6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。

7、用于对计数资料和有序分类资料进行统计描绘和简单的统计揣度,在分析时能够产生二维或多维列联表,在统计揣度时能进行卡方检修的菜单是_Crosstabs__。

8、One-Samples T Test过程用于进行样本地点总体均数___与__已知总体均数_的比较。

3、名词解释(问答类)9、Repeated Measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。

《统计分析和SPSS的应用(第五版)》课后练习答案与解析(第9章)

《统计分析与SPSS的应用〔第五版〕》〔薛薇〕课后练习答案第9章SPSS的线性回归分析1、利用第2章第9题的数据,任意选择两门课程成绩作为解释变量和被解释变量,利用SPSS 提供的绘制散点图功能进行一元线性回归分析。

请绘制全部样本以与不同性别下两门课程成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。

选择fore和phy两门成绩体系散点图步骤:图形→旧对话框→散点图→简单散点图→定义→将fore导入Y轴,将phy导入X轴,将sex 导入设置标记→确定。

接下来在SPSS输出查看器中,双击上图,打开图表编辑在图表编辑器中,选择"元素"菜单→选择总计拟合线→选择线性→应用→再选择元素菜单→点击子组拟合线→选择线性→应用。

分析:如上图所示,通过散点图,被解释变量y<即:fore>与解释变量phy有一定的线性关系。

但回归直线的拟合效果都不是很好。

2、请说明线性回归分析与相关分析的关系是怎样的?相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。

相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。

只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。

如果在没有对变量之间是否相关以与相关方向和程度做出正确判断之前,就进行回归分析,很容易造成"虚假回归"。

与此同时,相关分析只研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到研究和分析的目的。

线性回归分析是相关性回归分析的一种,研究的是一个变量的增加或减少会不会引起另一个变量的增加或减少。

3、请说明为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验?检验其可信程度并找出哪些变量的影响显著、哪些不显著。

《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)

WORD 格式整理《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第 4 章 SPSS基本统计分析1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。

分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。

Statistics户口所在职业年龄地Valid282282282NMissing000户口所在地Frequency Percent Valid CumulativePercent Percent中心城市20070.970.970.9 Valid 边远郊区8229.129.1100.0Total282100.0100.0职业Frequency Percent Valid CumulativePercent Percent 国家机关248.58.58.5商业服务业5419.119.127.7文教卫生18 6.4 6.434.0公交建筑业15 5.3 5.339.4Valid 经营性公司18 6.4 6.445.7学校15 5.3 5.351.1一般农户3512.412.463.5种粮棉专业4 1.4 1.464.9户WORD 格式整理种果菜专业10 3.5 3.568.4户工商运专业3412.112.180.5户退役人员17 6.0 6.086.5金融机构3512.412.498.9现役军人3 1.1 1.1100.0Total282100.0100.0年龄Frequency Percent Valid CumulativePercent Percent20 岁以下4 1.4 1.4 1.420~35 岁14651.851.853.2 Valid 35~50 岁9132.332.385.550 岁以上4114.514.5100.0Total282100.0100.0分析:本次调查的有效样本为282 份。

回归分析SPSS习题答案.doc

回归分析习题1通常用来评价商业中心经营好坏的一个综合指标是单位面积的营业额,它是单位时间内(通常为一年)的营业额与经营面积的比值。

对单位面积营业额的影响因素的指标有单位小时车流量、日人流量、居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分。

这几个指标中车流量和人流量是通过同时对几个商业中心进行实地观测而得到的。

而居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分是通过随机采访顾客而得到的平(数据集wyzl4_2中存放了从某市随机抽取的20个商业中心有关指标均值数据。

的数据,利用该数据完成下列工作(1)研究变量间的相关程度。

(其余6个变量与“单位面积年营业额”间的相关程度,其余6个变量之间的相关程度);(2)由(1)的结论建立“单位面积年营业额”与和其线性相关程度最高的变量的一元线性回归方程;(3)采用逐步回归方法建立“单位面积年营业额”的预测公式。

2.我国从1982~2001年间的20年的财政收入(Y)和国内生产总值(X)的数据存放在数据集wyz4_4_7.中。

试分别采用指数回归、对数回归、幂函数回归和多项式回归给出回归方程,并选择最佳回归方程。

1. 解:(1)变量间的相关性分析利用SPSS 软件构造所有变量的散点图矩阵和相关矩阵,结果见图1和表1 从散点图矩阵直观可以看出Y “单位面积年营业额”与x2“日人流量 (万人) ”和x3“居民年消费额(万元) ”线性关系较密切。

x2“日人流量 (万人) ”与x6 “对商场商品丰富程度满意度” 线性关系较密切从表1得)3,(x y ρ=0.795**,)2,(x y ρ=0.790**,)6,(x y ρ=.0 .697**, 说明 Y “单位面积年营业额”与x3“居民年消费额(万元) ”,x2“日人流量 (万人) ”,x6 “对商场商品丰富程度满意度”及x5 “对商场设施满意度”在0 .01 水平(双侧)上显著相关线性关。

《统计分析与SPSS的应用》课后练习答案(第6章)

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第6章SPSS的方差分析1入户推销有五种方法。

某大公司想比较这五种方法有无显著的效果差异,设计了一项实验。

从应聘人员中尚无推销经验的人员中随机挑选一部分人,并随机地将他们分为五个组,第一组第二组第三组第四组第五组1)请利用单因素方差分析方法分析这五种推销方式是否存在显著差异。

2)绘制各组的均值对比图,并利用LSD方法进行多重比较检验。

(1)分析比较均值单因素ANOVA因变量:销售额;因子:组别销售额ANOVA平方和df 均方 F 显著性组之间 4 .000确定。

概率P-值接近于0,应拒绝原假设,认为 5种推销方法有显著差异。

(2)均值图:在上面步骤基础上,点 选项 均值图;事后多重比较 LSD」闿匡同直性咗圭; I 旦rDwn- =ar=)rthe]园Elrh M 苹坷價囲(hf吐忙值叫疥咐冊删■陈•喋曲 .);对展泮|4i 哄iy多重比较因变量:销售额(1)组别(J)组别 平均差(I-J)标准错误显著性95%置信区间下限值上限第一组第二组 *.048第三组.72857.653第四组.066组内 总计30 34-w 風獄I 怖 ------------可知,1和2、1和5、2和3, 2和4,2和5,3和5,4和5有显著差异。

2、从两个总体中分别抽取n i =7和和n 2 =6的两个独立随机样本,经计算得到下面的方差分析表。

请补充表中单元格的两个独立随机样本,经计算得到下面的方差分析表。

请补充表中单元格“ A”和单元格“ B”内的计算结果。

答:已知组内均方=组内偏差平方和/自由度,所以A=1仁F统计量=组间均方/组内均方所以B==3、为研究某种降血压药的适用特点,在五类具有不同临床特征的高血压患者中随机挑选了若干志愿者进行对比试验,并获得了服用该降压药后的血压变化数据。

现对该数据进行单因素方差分析,所得部分分析结果如下表所示。

InltiplR CoaparisansLS1)请根据表格数据说明以上分析是否满足方差分析的前提要求,为什么2)请填写表中空缺部分的数据结果,并说明该降压药对不同组患者的降压效果是否存在显著差异。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第1章统计分析与SPSS软件概述习题与思考题(一)填空题1.定性数据,定序数据,定距数据,定比数据2.主成分分析,因子分析,聚类分析,判别分析,对应分析等3.数据清理,数据转换,缺失数据插补,数据的合并汇总拆分4.完全窗口菜单运行方式,程序运行方式5.SPSS Base(二)选择BADAD(三)判断√√×√×(四)简答题1.目前常用的统计分析工具或软件有哪些?你使用过哪些?它们之间的区别在哪里?解:常用的统计分析工具有SPSS、SAS、STATA、Python等。

2.试检查自己的SPSS软件共有几个模块,其中包括了哪些基本功能,并思考平时的统计分析需要哪些模块才能满足需要。

解:SPSS软件共有11个模块,分别是SPSS Base、SPSS Advance、SPSS Categories、SPSS Complex Sample、SPSS Conjoint、SPSS Exact Test、SPSS Maps、SPSS Missing Value Analysis、SPSS Regression、SPSS Tables和SPSS Trends。

其中SPSS Base是必需的,SPSS的整体框架、基本数据的获取、数据准备和整理等基本功能都集中在这一模块上,其他模块必须在该模块的基础上才能工作。

3.阐述定性、定序、定距、定比数据,并各举1例。

解:定性变量又称为名义变量。

这是一种测量精度最低、最粗略的基于“质”因素的变量,它的取值只代表观测对象的不同类别,如“班级”。

定序变量又称为有序变量、顺序变量,它取值的大小能够表示观测对象的某种顺序关系(等级、方位或大小等),也是基于“质”因素的变量,如“满意度”。

定距变量又称为间隔变量,它的取值之间可以比较大小,可以用加减法计算出差异的大小,如“重量”。

定比变量又称为比率变量,它与定距变量意义相近,差别在于定距变量中的“0”值只表示某一取值,定比数据变量表示“没有”,如“年龄”。

4..sav,.spv,.sps分别是spss哪类文件的扩展名?解:“.sav”是SPSS的数据文件的扩展名,“.spv”是SPSS的结果输出文件扩展名,“.sps”是SPSS的程序文件扩展名。

5.简述统计分析基本流程。

任何一个数据分析项目,都要经过项目计划、数据获取与准备、概括性描述统计分析、探索性统计推断、统计模型精准分析和结果报告6个阶段。

(1)项目计划的内容包括确定研究问题和研究对象、样本抽取方法、样本量、数据搜集方式、数据分析方法和分析工具、项目预算等内容。

(2)按照项目计划搜集数据。

(3)概括性描述统计分析阶段是对数据进行的初步探讨,是通过参数估计输出相关统计量,并辅以统计表或统计图,从而对数据的集中趋势、离散趋势、分布特征等信息有详细的了解。

(4)探索性统计推断阶段,主要对数据进行深层次的分析尝试,通过探索分析、方差分析,相关分析等方法,对不同变量数据的内在联系进行探讨,为后续的精准模型分析奠定基础。

(5)统计模型精准分析阶段,选择最优的统计模型,寻求变量间数据信息的完美呈现和解释。

(6)统计报告阶段将整个数据分析项目的结果以合适的方式表达出来,从而使得决策者或者读者快速理解和掌握核心内容,并能据此做出科学决策。

第2章数据的获取与管理习题与思考题(一)填空题1.查找和替换2.拆入变量3.计算变量4.原始数据组织方式,频数数据组织方式5.指定加权变量(二)选择题DDCDC(三)判断×√√××(四)简答题1.试述“个案排序”和“个案排秩”两种排序操作的区别。

解:“个案排序”操作会改变原有样本的排列顺序。

“个案排秩”会在原有数据的基础上形成一个新的变量,用于存储样本的秩序号。

2.如何进行变量集的定义和使用?解:变量集的定义在“实用程序”菜单中的“定义变量集”命令。

变量集定义之后,在“实用程序”菜单中选择的“使用变量集”命令,在“选择要应用的变量集”框中选择想要使用的变量集。

3.简述数据排序在数据分析过程中的目的。

解:数据排序是数据整理的关键步骤,在很多的统计分析过程中,如数据文件的合并等,都需要先对原始数据按照一定的规则进行排序。

排序后的数据文件更便于进行相关的统计分析。

4.对于缺失值,如何利用SPSS进行科学替代?解:SPSS提供了5种缺失值的替代方式:序列平均值:用该变量的所有非缺失值的均数作替代。

临近点的平均值:用缺失值相邻点的非缺失值的均数作替代,取多少个相邻点可任意定义。

临近点的中间值:用缺失值相邻点的非缺失值的中位数作替代,取多少个相邻点可任意定义。

线性插值:用缺失值相邻两点的非缺失值的中点值作替代。

临近点的线性趋势:用线性拟合方式确定替代值。

5.在计算数据的加权平均数时,如何对变量进行加权?解:数据的加权在“数据”菜单中的“个案加权”命令,其中,“不对个案加权”项表示不作加权,是SPSS系统默认选项,也可用于取消加权操作;“个案加权依据”项表示选择一个变量作加权变量。

案例分析题1.根据下述调查问卷中的题目,完成变量的设置和编码。

“4.请问您的家庭月收入:a.3000以下b.3000~4999c.5000~6999d.7000~9999e.10000以上”2.请根据下列数据建立SPSS数据文件,并完成相关数据操作。

表2-2 数据(1)请采用多种方法根据体重指标值对样本进行排序(升序排列)。

升序排列方式1:方式2:(2)对“性别”变量设置变量值标签,使其对应0和1值。

3.现有自由格式的文本文件,其中包含4个样本,每个样本为一行,每个样本测度6个指标,如下所示,请将文本文件数据信息导入到SPSS软件中,并对数据文件进行保存。

23;45;3;46;65;1246;89;56;12;4;1355;1;23;61;41;2041;20;61;20;1;30第3章 描述统计分析及SPSS 实现习题与思考题 (一)填空题1.探索分析2.分析-描述统计-描述3.离散程度4.均值、中位数、众数5.备选选择项,答案(二)选择题CACBD(三)判断题××√√×(四)简答题1.探索性统计分析主要目的有哪些?解:探索分析的目的主要有三个:检查数据是否有错误;获得数据分布基本特征;对数据规律进行初步观察。

2.什么是峰度和偏度?解:偏度是描述某变量取值分布对称性的统计量。

具体的计算公式如下:3311()/1ni i Skewness x x SD n ==--∑这个统计量是与正态分布相比较的量,偏度为0表示其数据分布形态与正态分布偏度x 相同;偏度大于0表示正偏差数值较大,为正偏或右偏,即有一条长尾巴拖在右边;偏度小于0表示负偏差数值大,为负偏或左偏,有一条长尾拖在左边。

而偏度的绝对值数值越大。

峰度是描述某变量所有取值分布形态陡缓程度的统计量。

这个统计量是与正态分布相比较的量,峰度为0表示其数据分布与正态分布的陡缓程度相同;峰度大于0表示比正态分布高峰要更加陡峭,为尖顶峰;峰度小于0表示比正态分布的高峰要平坦,为平顶峰。

具体的计算公式如下:4411()/31ni i Kurtosis x x SD n ==---∑ 表示分布形态的偏斜程度越大。

3.简述SPSS 对数据进行统计分析刻画集中趋势以及离散程度的描述统计量。

解:对数据集中趋势刻画的描述统计量包括:均值、中位数、众数、总和等。

对数据离散趋势刻画的描述统计量包括:方差、标准差、极差、标准误等。

4.简述交叉列联表分析主要内容。

解:交叉列联表分析主要包括两部分的内容:第一是输出交叉分组下的频数分布状态表;二是分析交叉分类的两个变量之间是否具有独立性,并判断他们之间的相关性的大小。

5.对于多项选择问题,分解(编码方案)的方法主要有哪两种,请简要说明。

解:多项选择问题的编码方式有两种:一种是二分法,一种是多分法。

多选项二分法将每个可能的答案设置为一个SPSS 变量,变量的取值为0或1,0表示没选中,1表示选中。

多选项分类法首先估计多选项问题可能出现的答案个数。

比如,一个多选题,如果最多有3个答案,那么就设置3个SPSS 变量,分别用来存放3个可能的答案。

SPSS 变量的取值为备选答案的代码,常用数字1,2,3…表示不同的备选答案。

案例分析题1.某学校科研团队进行库区移民生存状态调查,经过抽样,抽取20名库区移民,对其生存状态进行调查,部分指标见表3-2.表3-2 库区移民生存状况调查部分指标请分析:数据状态:1.样本在性别与年龄上分布状态。

男性样本与女性样本的对比关系为12:8。

样本的平均年龄为47.05岁,峰度为-1.359,与正态分布相比较为平缓,偏度为-0.034,轻微的左偏。

2.受访样本的家庭年收入是否符合正态分布从正态性分布检验结果和Q-Q图可以看出,夏皮洛-威尔克检验接受了原假设,即数据符合正态分布特征,Q-Q图也基本呈现较为一致的特征。

柯尔莫戈洛夫-斯米诺夫呈轻微的拒绝原假设状态,可认为接受正态分布的假设。

3.不同性别的受访群体的食品烟酒消费支出方差是否相等。

不同性别受访者食品烟酒消费的方差是相等的,四种莱文检验的结果均接受原假设,即不同组别因变量的方差是相等的。

2.调查得到甲乙两班学生的上网状况,调查结果如表3-3所示,请根据下列数据分析班级与上网状况是否存在相关关系。

表3-3 甲乙两班上网状况采用交叉列联分析:卡方检验的结果接受原假设,即上网状态与班级之间是相互独立的。

3.先得到某超市9月份每一天的商品销售总额数据,如下表所示。

表3-4 超市商品销售总额(1)计算该超市日销售额的均值、中位数;(2)判断该超市日销售额数据的偏度和峰度状况。

应用基本描述统计分析方法:第4章参数检验与SPSS实现习题与思考题(一)填空题1. 总体均值和指定检验值之间不存在显著差异2.两独立样本组的均值比较,两配对样本组的均值比较3.拒绝4.T统计量D t5.两样本群的方差是否相等(二)选择题BDCBB(三)判断题√√×√√(四)简答题1.什么是配对样本?请举例解释。

解:常见的配对样本情况有4种:①同一研究对象分别给予两种不同处理的效果比较;②两配对对象分别给予两种不同处理的效果比较;③同一研究对象处理前后的效果比较;④两配对对象(一个接受处理,一个不接受处理)的效果比较。

①和②推断两种效果有无差别,③和④推断某种处理是否有效。

比如一组高血压患者在服药前和服药一段时间后对于舒张压和收缩压测量结果就形成了配对样本。

2.两独立样本群的均值比较分析的流程是怎样的?解:在具体的计算中需要通过两步来完成:第一,利用F检验判断两总体的方差是否相同;第二,根据第一步的结果,决定T统计量和自由度计算公式,进而对T检验的结论作出判断。

相关文档
最新文档