SPSS期末考试整理

合集下载

spss期末试题及答案

spss期末试题及答案

spss期末试题及答案一、选择题(每题2分,共20分)1. SPSS中,用于描述数据集中的变量分布情况的统计量是()。

A. 平均值B. 中位数C. 众数D. 标准差答案:ABC2. 在SPSS中,进行数据录入时,如果需要输入缺失值,应该使用以下哪个符号表示?()A. 0B. 9C. -D. *答案:C3. 以下哪个选项不是SPSS中的数据类型?()A. 数值型B. 字符串C. 逻辑型D. 图像型答案:D4. 在SPSS中,进行相关性分析时,通常使用哪种统计方法?()A. t检验B. 方差分析C. 卡方检验D. 皮尔逊相关系数答案:D5. SPSS中,用于创建数据文件的命令是()。

A. GET FILEB. SAVEC. OPEN DATAD. NEW DATA答案:A6. 在SPSS中,如果要对数据进行分组处理,应该使用以下哪个功能?()A. 分类汇总B. 数据筛选C. 数据排序D. 数据转换答案:A7. SPSS中,用于绘制数据分布直方图的命令是()。

A. GRAPHB. CHARTC. PLOTD. HISTOGRAM答案:B8. 在SPSS中,如果要进行回归分析,应该使用以下哪个菜单选项?()A. 分析B. 描述统计C. 预测D. 回归答案:D9. SPSS中,用于计算数据集中变量的方差的命令是()。

A. DESCRIPTIVESB. FREQUENCIESC. MEANSD. CORRELATIONS答案:A10. 在SPSS中,如果要对数据进行因子分析,应该使用以下哪个菜单选项?()A. 因子B. 聚类C. 多变量D. 描述统计答案:A二、填空题(每题3分,共15分)1. 在SPSS中,数据视图的窗口分为三个部分:________、变量视图和数据视图。

答案:数据结构视图2. SPSS中,用于计算数据集中变量的均值的命令是________。

答案:MEANS3. 在SPSS中,进行独立样本t检验的命令是________。

spss统计分析期末考试题及答案

spss统计分析期末考试题及答案

spss统计分析期末考试题及答案一、选择题(每题2分,共20分)1. 在SPSS中,数据视图和变量视图分别对应于:A. 变量列表和数据表B. 数据表和变量列表C. 数据集和变量集D. 变量集和数据集答案:B2. SPSS中用于描述数据分布特征的统计量不包括:A. 平均值B. 中位数C. 众数D. 方差答案:D3. 在SPSS中进行独立样本T检验时,需要满足的假设条件不包括:A. 独立性B. 正态性C. 方差齐性D. 线性答案:D4. 下列哪个选项不是SPSS中的数据类型?A. 数值型B. 字符串型C. 日期型D. 图片型答案:D5. 在SPSS中,进行相关分析时,通常使用的统计方法是:A. 回归分析B. 方差分析C. 卡方检验D. 皮尔逊相关系数答案:D6. SPSS中,用于创建新变量的命令是:A. COMPUTEB. DESCRIPTIVESC. T-TESTD. FREQUENCIES答案:A7. 在SPSS中,执行因子分析时,通常使用的方法是:A. 主成分分析B. 聚类分析C. 回归分析D. 判别分析答案:A8. SPSS中,用于检验两个分类变量之间关系的统计方法是:A. 相关分析B. 回归分析C. 卡方检验D. 方差分析答案:C9. 在SPSS中,进行多变量回归分析时,需要满足的假设条件不包括:A. 线性关系B. 误差项独立C. 误差项同方差性D. 变量之间独立答案:D10. SPSS中,用于创建数据集的命令是:A. GET FILEB. SAVEC. OPEN DATAD. NEW答案:D二、简答题(每题10分,共40分)1. 简述SPSS中数据清洗的常用步骤。

答案:数据清洗的常用步骤包括:数据导入、数据预览、缺失值处理、异常值检测、数据转换和数据编码。

2. 解释SPSS中因子分析的目的和基本步骤。

答案:因子分析的目的是将多个变量简化为几个不相关的因子,以揭示变量之间的内在关系。

基本步骤包括:确定因子数量、提取因子、旋转因子和因子得分计算。

大学spss期末复习资料整理-含部分公式

大学spss期末复习资料整理-含部分公式

第一章1.SPSS是软件英文名称的首字母缩写,其最初为Statistical Package for the Social Sciences的缩写,即“社会科学统计软件包”。

2.SPSS系统运行管理方式(SPSS的几种基本运行方式)有:(1)完全窗口菜单运行方式(2)程序运行管理方式(3)混合运行管理方式3.SPSS的界面提供的五个窗口:数据编辑窗口、结果管理窗口、结果编辑窗口、语法编辑窗口、脚本窗口。

第二章1.SPSS的文件类型:语法文件(*.sps)、数据文件(*.sav)、结果输出文件(*.spv)。

2.SPSS数据编辑器的每一行数据称为一个个案(Case),每一个数据代表个体的属性,即变量(Variable)。

3.SPSS变量名的命名规则:1)必须以英文字母开头,其他部分可以含有字母、数字、下划线(即“-”);2)变量名尽量避免和SPSS已有的关键字重复,例如sum、compute、anova等;3)SPSS13及以后版本支持变量名最长为64Byte,即变量名最长为64个英文字符,或者32个中文字符;4)SPSS变量名不区分大小写,即SPSS认为Name、name、nAme这三个变量名没有区别。

4.变量度量类型:定量(个数、高度、温度等)、定序(“十分重要”、“重要”、“一般”、“不重要”)、定类(名字、地址、等)。

5.列和宽度的区别:变量宽度:对字符型变量,该数值决定了你能输入的字符串的长度;列:设定该变量数据视图中列的宽度。

8.数据文件的合并包括:纵向合并和横向合并(合并个案和合并变量),合并变量包括一对一合并和一对多合并。

9.SPSS用“(*)”表示变量来自于当前活动数据文件中的变量,而用“(+)”表示将要和当前数据文件进行合并的数据文件中的变量。

10.在合并数据文件之前,所有需要合并的数据文件必须预先按照关键变量进行升序排列。

否则,合并文件程序将失败。

11.(选择题)一对一合并变量时,两个文件都要提供个案;一对多合并时,活动的和非活动的文件都可以作为关键字。

spss期末复习总结

spss期末复习总结

复习总结社会学的理论就是解释现象背后的原因,寻找因变量背后的自变量,因果关系意味着:1共变关系2前后关系自变量在前、因变量在后3自变量与因变量之间是虚无关系第一章 详析模型一、前置变量1、早期的调查表明,教育层次越高的人越容易投票给共和党,从该调查我们可以得出一条假说:受过良好教育的人在政治上比较保守。

但是,后来的调查表明,有个强有力的前置变量影响到了教育水平和投票行为,它就是父母的财富。

也就是说,父母的财富对孩子的政治倾向有先行的影响。

2、结婚年数越多→发病率越高年龄越大→结婚年数越多→发病率越高 3、住房拥挤→夫妻冲突住房拥挤→家庭经济收入水平→夫妻冲突 火灾、火势大小二、中介变量强调过程是y x → ? 还是y w x →→?职业地位是受收入影响的,收入又是受教育水平影响的 1、教育水平高→子女数量少教育水平高→重男轻女观念弱→子女数量少2、考虑一下教育和社会地位之间的关系,这两个变量有正相关关系。

但是,每个人都认识教育程度不高但是社会地位很高的人。

其原因可能是有另外一个变量渗入了:事业成功。

要了解事业成功是如何介入到教育与地位之间的,想想你认识的那些教育程度低但是由于事业成功而地位“不错”的人。

教育有助于地位提高。

不过事业成功会介入到教育和常规的社会地位中。

三、内含变量 y x →y x x x x →→⎪⎭⎪⎬⎫321而实际是y x →1 例子1 涂尔干提出整合影响自杀率,整合又是包括夫妻关系和子女关系的,但归根结底是整合中的子女关系影响的自杀率、子女关系导致的低自杀率, 例子2 社会地位低导致精神病患者⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧⎪⎩⎪⎨⎧⎪⎩⎪⎨⎧→⎪⎭⎪⎬⎫权利、收入、教育、自致、种族、性别、出生、先赋、受歧视、低教育水平、贫穷2123211321 例子3、当引入自变量中的某一内含变量之后,使原关系更加具体化,证明因变量主要是由这一内含变量引起的。

这在社科研究中是经常遇到的情况。

比如,我们想象抽烟和肺癌之间可能有关系,其实不是抽烟和肺癌,抽烟当中某个具体因素是引起肺癌的更重要的原因,这说明因变量主要是这个内含变量引起的。

spss期末复习题汇总

spss期末复习题汇总

1、.Els指Excel格式2、根据xx变量生成新变量BB:51页(第3章课后习题)3、生成新变量xx,当原变量取不同区间值是,分别取值a、b、c、d等:52页(转换-重新编码为不同变量-旧值新值输出变量为字符串打钩)(第3章课后习题)4、根据xx分组计算xx的秩次:60页(第3章课后习题)5、排序个案63页、拆分文件65页(分割文件)、选择个案65页、加权个案67页、分类汇总68页、数据文件的重置与转换(长形变宽形、宽形变长形70页)、多个数据文件的合并(数据文件的纵向拼接、数据文件的横向合并75页)、标识重复个案85页、标识异常个案87页6、根据xx对xx进行均数汇总:70页(第4章课本例题)7、对xx、xx、xx三个变量进行统计描述,并计算出95%个体参考值范围:125页(第7章课本例题)8、分月份对xx进行统计描述,以详细了解其分布情况:128页(第7章课本例题)9、对总指数进行Bootstrap估计:132页(第7章课本例题)10、使用描述过程,对xx、xx等进行标准正态变换,对变换后的变量尽心统计描述:134页(分析——描述统计——描述——将标准化得分另存为变量打钩)(第7章课后习题)11、使用交叉步过程进行描述:138页(分析——描述统计——交叉表)12、数据的图形展示:直方图与茎叶图(171页)、箱图(183页)、饼图(186页)、条图和误差图(188页)、线图、面积图、点图与垂线图(197页)、散点图(200页)、P-P图和Q-Q图(206页)、控制图和Pareto图(208页)高低图、ROC曲线(212页)13、探索消费者信心指数随背景资料的变化规律:对月份、城市的影响进行分析(218页)、对性别和职业的影响进行分析(220页)、对婚姻状况的影响进行分析(221页)、对年龄的分析进行分析(222页)、对家庭收入的影响进行分析(223页)14、根据CCSS sample.sav数据,分析受访者的年龄分布情况,尝试分城市/合并描述。

SPSS期末重点整理

SPSS期末重点整理

t检验:一般是用于检验两组观测值的均值之间差异是否显著的统计分析方法。

单样本t检验:用于检验样本均值与总体均值或某个已知值之间的差异的显著性。

如果总体均值已知,那么样本均值与总体均值之间的差异显著性检验就属于单样本的t检验。

独立样本t检验:独立样本指的是样本之间彼此独立,没有任何关联。

两个独立样本的t检验用于检验两个不相关样本在相同变量上的观测值均值之间差异的显著性。

要求①正态性,各个样本均来自于正态分布的总体;②方差齐性,各个样本所在的总体的方差相等;③独立性,两组数据之间是相互独立的,不能够相互影响。

配对样本t检验:配对样本(或相关样本)指两个样本的数据之间彼此有关联。

配对样本t 检验用于检验两个相关样本的均值或一个样本,两次测量结果的均值之间差异的显著性。

方差分析:是一种通过分析样本数据的各项变异来源,以检验三个或三个以上样本平均数是否具有显著性差异的一种统计方法。

单因素方差分析:用于检验一个因素变量的不同水平是否给一个(或几个相互独立的)因变量造成了显著的差异或变化。

多重比较:进行了全方差分析之后,当自变量有3个或3个以上水平时,还有要对每两个组之间均值的差异进行比较,这称作事后组间均值的“多重比较”。

多因素方差分析:是检验两个或两个以上因素变量(自变量)的不同水平是否给一个(或几个相互独立的)因变量造成了显著的差异或变化的分析方法。

主效应和“交互作用”效应:主效应考察的是在忽略其他因素的情况下一个自变量对观察变量的影响,即这一个因素变量的不同水平分组下的观测值的均值之间的差异是否显著。

当一个自变量的单独效应随另一个自变量的水平的不同而不同时,则这两个自变量对因变量的影响存在交互作用。

协变量方差分析:是在进行方差分析时将那些除了要考察的自变量之外的、很难控制的、且对因变量产生显著影响的无关变量作为“协变量”,在分析自变量对因变量的影响时,消除协变量对因变量的影响,从而使分析的结果更准确。

spss期末复习总结

1-1、SPSS运行方式:菜单操作方式、程序运行方式、Include运行方式、Production Facility 方式。

1-2、Spss界面窗口:数据编辑窗口、结果管理窗口、结果编辑窗口、语法编辑窗口、脚本窗口。

1-3、在数据预处理中应用最广泛的是计算变量。

1-4、Spss基本模块不能直接实现的功能:统计分析、数据计划、数据收集。

1-6、spss不能直接打开*.html文件。

2-1、spss数据文件格式:每一行的数据成为一个记录;每一列为一个变量。

2-2、Spss数据编辑器界面为数据视图界面和变量视图界面(定义数据集的数据字典)。

2-3、变量名命名准则:必须以英文字母开口,其他部分可以含有字母、数字、下划线;变量名尽量避免和spss已有的关键字重复(sum、compute、anova);变量名最长为64个英文字符或者32个中文字符;spss变量名不区分大小写。

2-4、变量的度量类型不是固定不变的,可以分局分析过程来改变变量的度量类型。

2-5、spss中字符型数据值区分大小写;字符型数据可以设置值标签。

2-6、对于数据的处理缺省值默认为”.”,字符串默认为空,若空字符串有意义,需在变量是同对缺省值进行定义。

2-7、spss只读入数据(excel)。

2-8、添加变量合并文件:一对一合并,一对多合并;合并相同个案数,不同属性的数据文件,为添加变量;合并数据之前,需按关键变量进行排序,合并的诗句恩见必须是.sav或已经在spss中打开的文件,并确保两个文件中需要合并的变量名称不同。

3-1、可视化分段方法:直接输入分割点;根据条件自动生成分割点。

3-2、填补缺失数据方法:序列均值、临近点均值、临近点的中位数、线性插值法、点处线性趋势。

3-3、在做统计分析之前一般要做数据效验,如果是录入错误则重新录入;若数据确实错误,则可将这些数据设置成缺失值。

3-4、“标记异常个案”过程基于个案偏离聚类组中心的大小来判断异常个案,一般用于探索性数据分析步骤中。

spss期末复习总结

spss期末复习总结复习总结社会学的理论就是解释现象背后的原因,寻找因变量背后的自变量,因果关系意味着:1共变关系2前后关系自变量在前、因变量在后3自变量与因变量之间是虚无关系第一章详析模型一、前置变量1、早期的调查表明,教育层次越高的人越容易投票给共和党,从该调查我们可以得出一条假说:受过良好教育的人在政治上比较保守。

但是,后来的调查表明,有个强有力的前置变量影响到了教育水平和投票行为,它就是父母的财富。

也就是说,父母的财富对孩子的政治倾向有先行的影响。

2、结婚年数越多→发病率越高年龄越大→结婚年数越多→发病率越高 3、住房拥挤→夫妻冲突住房拥挤→家庭经济收入水平→夫妻冲突火灾、火势大小二、中介变量强调过程是y x → ?还是y w x →→?职业地位是受收入影响的,收入又是受教育水平影响的1、教育水平高→子女数量少教育水平高→重男轻女观念弱→子女数量少2、考虑一下教育和社会地位之间的关系,这两个变量有正相关关系。

但是,每个人都认识教育程度不高但是社会地位很高的人。

其原因可能是有另外一个变量渗入了:事业成功。

要了解事业成功是如何介入到教育与地位之间的,想想你认识的那些教育程度低但是由于事业成功而地位“不错”的人。

教育有助于地位提高。

不过事业成功会介入到教育和常规的社会地位中。

三、内含变量y x →y x x x x →→??321而实际是y x →1 例子1 涂尔干提出整合影响自杀率,整合又是包括夫妻关系和子女关系的,但归根结底是整合中的子女关系影响的自杀率、子女关系导致的低自杀率,例子2 社会地位低导致精神病患者→权利、收入、教育、自致、种族、性别、出生、先赋、受歧视、低教育水平、贫穷2123211321 例子3、当引入自变量中的某一内含变量之后,使原关系更加具体化,证明因变量主要是由这一内含变量引起的。

这在社科研究中是经常遇到的情况。

比如,我们想象抽烟和肺癌之间可能有关系,其实不是抽烟和肺癌,抽烟当中某个具体因素是引起肺癌的更重要的原因,这说明因变量主要是这个内含变量引起的。

spss的期末考试题及答案

spss的期末考试题及答案一、选择题(每题2分,共20分)1. SPSS是一款由哪个公司开发的统计分析软件?A. IBMB. MicrosoftC. AdobeD. Oracle答案:A2. 在SPSS中,数据文件的扩展名通常是什么?A. .txtB. .csvC. .savD. .xls答案:C3. SPSS中“Variable View”是用来做什么的?A. 编辑数据B. 定义变量属性C. 运行统计分析D. 制作图表答案:B4. 在SPSS中,以下哪个命令用于描述性统计分析?FREQUENCEDESCRIPTIVESCORRELATIONST-TEST答案:DESCRIPTIVES5. 以下哪种数据类型在SPSS中不能被识别?A. NumericB. StringC. DateD. Image答案:D6. SPSS中“Syntax Editor”的主要作用是什么?A. 编辑数据B. 编写和执行命令C. 制作图表D. 定义变量属性答案:B7. 在SPSS中,进行假设检验时,以下哪个选项不是t检验的类型?A. One-Sample T TestB. Paired Samples T TestC. Independent Samples T TestD. Chi-Square Test答案:D8. SPSS中“Data Entry”窗口是用于什么?A. 录入数据B. 编辑数据C. 定义变量属性D. 运行统计分析答案:A9. 在SPSS中,"Analyze"菜单下包含哪些主要功能?A. 数据录入B. 统计分析C. 图表制作D. 变量定义答案:B10. SPSS中,以下哪个命令用于执行回归分析?A. DESCRIPTIVESB. CORRELATIONSC. REGRESSIOND. T-TEST答案:C二、填空题(每空2分,共20分)1. SPSS是一款_________的统计分析软件,广泛应用于社会科学、健康研究等领域。

SPSS分析期末考试及答案

《经济数据分析与SPSS软件应用》期末综合作业学号:姓名:专业:班级:注意事项:1、请在规定的位置书写学号、姓名、专业、班级信息。

2、结合SPSS软件,呈现计量软件操作关键结果,写出必要的操作步骤,每题答案写在相应题目后面,规范回答问题。

3、规范格式:宋体五号字;(软件结果为默认即可);单倍行间距;排版整齐,不留空行。

综合作业题目(一、二题每题20分,三、四题每题30分,共100分)一、某医药研究所考察一种药品对男性和女性的治疗效果是否有显著差异,调查了10名男性服用者及7名女性服用者,对他们服药后的各项指标进行综合评分,服用的效果越好,分值就越高,每人所得的总分见“1(综合效果).sav”,试根据表中的数据检验这种药品对男性和女性的治疗效果是否存在显著差异。

答:群組統計資料性别N 平均數標準偏差標準錯誤平均值综合得分男10 105.40 34.394 10.876女7 109.57 23.143 8.747从检验结果看,两样本数据的方差没有显著差异,假设检验的P值大于显著性水平0.05,所以说这种药品对男性和女性的治疗效果并无显著差异。

二、为了考察火柴销售量的影响因素,选择煤气户数、卷烟销量、蚊香销量、打火石销量作为影响因素,得数据“2(多元回归).sav”。

试求:(1)火柴销售量与煤气户数的偏相关系数;(2)考察火柴销售量与各影响因素之间的相关关系,建立火柴销售量对于相关因素煤气户数、卷烟销量、蚊香销量、打火石销量的线性回归模型,通过对模型的分析,找出合适的线性回归方程。

答:从上表结果分析,排除显著性大于0.05的蚊香销量,对剩下的煤气户数、卷烟销量、打火石销量进行逐步分析。

打火石销量(百万粒)-.243 .017 -.465 -14.689 .000 .999 1.0013 (常數)17.420 .394 44.243 .000卷烟销量(万箱).254 .019 .698 13.228 .000 .185 5.417打火石销量(百万粒)-.243 .012 -.465 -20.526 .000 .999 1.001煤气户数(万户).049 .014 .185 3.516 .005 .185 5.415a. 應變數\: 火柴销量(万件)由逐步分析得到上表,可以建立y=17.420+0.254X1+0.049X2−0.243X4的线性回归方程。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

●一。

变量的赋值
1.乘方(**),例如二的三次方:2**3
2.不同规则的赋值:转换→计算变量(如果),每一个规则的赋值都要重新进行此步骤(但注意每一遍的变量名都不变,并且他都会问你要不要替换成新的变量,你选是就行了)
3.不同规则的赋值:(1)转换→重新编码为不同变量:输入变量,输出变量,要点击“变化量”才可保存输出变量→新值和旧值:值(直接选取取值)、范围(最大到最小的范围,包含端点值),点击“添加”成功保存新值和旧值→所有不同取值规则都完成后点击继续、确定,则在变量视图多出一个新变量(2)若不想包含端点值,可以采取小数的方式变换,eg. 899.9(小数位比该变量属性的小数位多一位就行了)
(3)这种要先把BMI按照男女分开,然后再分组的,可以在对话框中点击“如果”选项进行设置,并且要分别对男女进行上述操作(一共做两遍)。

二。

离散化
1可视离散化:转换→可视分箱,分割点:所以想生成几组,就定义几个分割点;填写第一个分割点的时候就必须填写最小值;一定要选中上端点排除。

三。

排序
1.转换→自动重新编码:不分组,从头到尾排序
2.转换→个案排秩(1)多层次数据:基于A变量对B变量进行排序。

(例如,基于职称对收入进行排序,就是不同职称各自组内排工资的高低)(2)设置秩1;绑定值
四。

时间序列:转换→变动值
五。

查找与计数:转换→对个案内的值计数(查找“基本工资800-900女职工”,生成新变量,满足这个条件的标为1,不符合这个标准的标为0,男职工标为缺失。

范围:包含上限下限)
●六。

数据→个案排序:把变量顺序完全按照你想要的标准排序,所有的变量顺序都会改变
七。

拆分文件:要分男女进行数据统计:数据→拆分文件→比较组/按组输出,分组依据。

不分男女进行数据统计:数据→拆分文件→分析所有个案
八。

选择个案(例如只选择三年级的变量进行分析):数据→选择个案→如果条件满足:如果;随机个案样本;基于时间或个案范围;使用过滤变量(例如要把身高为缺失值和值为0的剔除)→输出:过滤(不符合条件的数据会画上“/”,原始数据并未删除);将选定个案复制到新数据集(形成一个新的SPSS数据文件,原始数据并未删除);删除未选定的个案(删除原始数据,不建议使用)→之后在分析的时候就只会分析三年级的变量。

不想只分析三年及,记得重新做这一步。

九。

加权个案:数据→加权个案(例。

100分的有5人)。

不想加权了,记得重新做这一步。

十。

分类汇总(1)例如算不同年级的人的身高的均值、方差…(只能计算函数)(2)数据→汇总,分界变量(分类标准变量),变量摘要(计算变量),函数:选择计算变量函数,变量名称与标签:定义新生成变量的名称与标签
●十一。

长宽数据的转换
1.长数据变宽数据:索引变量消失变成score的尾缀
(1)数据→重组(重构)→个案重组为变量,标识变量,索引变量,电脑会自动帮你选出是xx xx要重构(不同疗程值不同的变量)。

选完上述这些之后就一直点下一步&完成&立即重构&确定即可
(2)注意:当有多个变量需要重构时要自己决定“新变量组的顺序”。

(A1A2B1B2;A1B1A2B2)
2.宽数据变长数据:score的尾缀消失变成索引变量
(1)数据→重组(重构)→变量重组为个案,个案组标识:使用选定变量,固定变量(手动选择,电脑不会自动帮你选出了),要转置的变量即值不固定的要重构的变量(手动选择,电脑不会自动帮你选出了)。

选完上述这些之后就一直点击下一步&完成&立即重构数据&确定就行了
(2)当有多个变量需要重构时,这块的操作要特别注意:○1首先在“变量组数目”中选择“多个”○2然后在“选择变量”里要对于不同的“目标变量”分别定义“要转置的变量”(在本题中,即对于kidid目标变量定义一遍要转置的变量;对于age目标变量在定义一遍要转置的变量。

其中,这两个要转置的变量必须是完全不同的)。

但只需要定义一次“个案组标识”&“固定变量”(固定变量是相对于kidid & age都固定的那些变量;而不是说在对kidid进行转置的时候,age就是固定变量了;因此,固定变量只用定义一次且固定变量可以为空)。

并且,你要特别注意,“个案组标识”里选择的变量& n个“要转置的变量”里选择的变量&“固定变量”里选择的变量都必须是完全不相同的。

十九。

数据的合并
1.纵向合并:数据→合并文件→添加个案
2.(2)横向变量:数据→合并文件→添加变量(排除的变量:两个数据集中的相同变量.关键变量:两个数据集都有的变量,关键变量与后边的变量一对一
●十二。

偏态系数:SK=0,分布对称;SK>0,右偏(右侧长尾);SK<0,左偏(左侧长尾);SK的绝对值越
大,说明偏斜的程度越大
峰度系数:K=0,标准正态分布;K>O尖峰; K<0,平峰
十三。

统计表格的制作:分析→表→设定表。

统计图形的制作:图形→图表构建程序
●十四。

假设检验(无操作)——原理:原假设(想推翻),备择假设(想支持),单侧与双侧检验,=永远
在原假设上。

a弃真错误,b取伪错误。

a显著性水平(0.05)。

计算统计量,找出临界值,将统计量与临界值比较落在拒绝域则拒绝 /P值(P-value、渐进显著性、Sig.),P<a则拒绝原假设。

注意:所有的检验都是用样本数据检验总体。

十五。

卡方检验(列联分析)1.会计算期望頻数 2.提出假设:拟合优度检验(一致性检验):H0-全相等,H1-不全相等。

独立性检验:H0-独立,H1-不独立
3.SPSS进行独立性检验:分析-描述统计-交叉表,变量列表中选择行、列变量,【统计量】选择卡方,【单元格】选择是否显示行、列、总百分比,观察频数和期望频数→输出得结论
十六。

T检验
1.单样本T检验(总体均值是几):(1)H0:总体中孩子的身高平均是148cm ,H1:总体中孩子的身高平均不是148cm (2)分析→比较均值→单样本t检验,选择检验的变量和检验值,选项:设定均值差值的置信区间→输出得结论
2.独立样本T检验(两个总体均数的比较):(1)H0:男女身高均值相同,H1:男女身高均值不同
(2)分析→比较均值→独立样本t检验,选择检验变量和分组变量(需定义,eg.男女),选项:设定均值差值的置信区间→输出得结论
3.配对样本T检验(两个总体均数的比较,检验某一因素是否造成了同一批人的两次结果的差异):(1)H0:两次结果没有差异,H1:两次结果存在差异(2)分析→比较均值→配对样本t检验,选择配对的变量,选项:设定均值差值的置信区间
十七。

方差分析(自变量对因变量有没有影响)
1.原理:总误差=处理误差/组间误差(自变量造成)+随机误差/组内误差(抽样造成)
2.单因素方差分析(1)H0:u1=u2=u3(自变量对因变量没影响),H1:u1 u2 u3不全相等(自变量对因变量有影响)(2)分析→比较均值→单因素ANOVA,输入因变量(连续型变量),因子即自变量(分组变量),选项:进行方差齐性检验→输出得结论
十八。

回归分析
1.样本的相关系数r:|r|=1为完全相关(r=1完全正相关。

r =-1完全负正相关),r = 0不存在线性相关关系相关,-1<r<0为负相关,0<r<1为正相关,|r|越趋于1表示关系越密切,|r|越趋于0表示关系越不密切
2.相关系数r的显著性检验(检验两个变量之间是否存在线性相关关系)
(1)提出假设:H0不相关;H1相关(2)分析→相关→双变量,将待分析变量放入变量列表→输出得结论(看显著性双侧)
3.一元线性回归
回归模型:y=b0+b1x+e(e是误差项)。

回归方程:E(y)=B0+B1x,B0 是回归直线在 y 轴上的截距,是当x=0时y的期望值;B1是直线的斜率称为回归系数,表示当x每变动一个单位,y变动B1单位。

估计的回归方程:带∧号的,最小二乘法。

判定系数R:反映回归直线的拟合程度,R→1,说明回归方程拟合的越好;R→0,说明回归方程拟合的越差
4.多元线性回归
(1)回归方程E(y)=B0+B1x1+B2X2 (2)分析→回归→线性,因变量:连续变量,自变量:连续变量直接放入模型/分类变量需要转化为虚拟变量放入
(3)结果:方程的Sig.(ANOVA里的):整体方程的线性关系是否显著。

调整后的R 2 :方程的解释能力。

系数的Sig.(系数表里的):各因素对因变量的影响是否显著。

方程:见系数表
(4)生成虚拟变量:n个原变量生成n-1个虚拟变量,“重新编码为不同变量”。

相关文档
最新文档