SPSS操作与数值变量统计描述

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

正态分布
有一类特殊的连续型随机变量,具有正 态分布(normal distribution)的分布特点 例如:106名儿童的身高和体重值 总体和样本、参数和统计量的概念 正态分布两个重要参数:均数、标准差 正态分布曲线的形状由这两个参数决定 查表可知正态曲线下任意区间所围面积 SPSS提供正态概率函数,可免于查表
数据加权练习
新建一个数据文件 在数据窗口里输入数据,包括6个1,6 个2,6个3共18个数。如何快速完成? Data -> Weight cases -> weight by f 用描述性统计菜单下的freq命令验证 23名病人,其中12名病人用A药治疗, 有效7名,无效5名;另外11名用B药治 疗,有效3名,无效8名。如何建立文件
SPSS常用窗口介绍
数据编辑窗口 Data Editor,类似Excel 表格形式,每一行代表一个个体(case) 每一列代表该个体的一个属性。 语法编辑窗口 Syntax Editor,将窗口操 作以文本形式记录,便于调试和重复。 结果浏览窗口 Output Viewer,可编辑 和导出为word或html等格式。 对应扩展名为SAV, SPS, SPO的文件
身高资料是对称(正态)分布的
身身 (Banded)
Frequency 1 5 4 14 21 20 16 15 6 3 1 106 Percent .9 4.7 3.8 13.2 19.8 18.9 15.1 14.2 5.7 2.8 .9 100.0 Valid Percent .9 4.7 3.8 13.2 19.8 18.9 15.1 14.2 5.7 2.8 .9 100.0 Cumulative Percent .9 5.7 9.4 22.6 42.5 61.3 76.4 90.6 96.2 99.1 100.0
常用集中离散趋势指标公式
对称分布资料 集中趋势 X =
− −
∑X
n
,离散趋势s =
( X − X )2 ∑ n −1
偏态分布资料 集中趋势M = P50,离散趋势Q = P75 − P25
SFra Baidu bibliotekSS操作
对身高、肺活量列频数表、绘制直方图 由于身高是对称(正态)分布的,所以选 择均数、标准差来进行描述 而肺活量是偏态分布的,所以选中位数 和四分位间距进行统计描述 还可作箱式图、茎叶图和正态Q-Q图 在explore命令里定义性别为因素factor 可以对身高等指标分性别描述
数据输入实例
某地区学龄儿童的体检表 学号:40025 姓名:李婷婷 年级: 1 性别:男 女√ 出生日期:04年3月31日 体检结果 身高120.0cm
体重19.5kg 肺活量883ml
变量清单
变量名 中文含义 类型 xh xm nj xb csrq sg tj fhl 学号 姓名 年级 性别 身高 体重 肺活量 数值 字符 数值 字符 数值 数值 数值 宽度 F8.0 A8 F8.0 A1 F8.1 F8.1 F8.0 m=男 f=女 厘米 千克 毫升 Date10 mm/dd/yyyy 备注
出生日期 日期
练习
将体检表输入SPSS,并在指定文件夹 保存 (SAV) 另存为excel97格式的文件(XLS),删除 姓名变量 用SPSS读取XLS文件。读之前要注意 关闭EXCEL窗口 如在点击“打开”或“确定”前 选”Paste”,操作过程用程序记录,点 之前不运行 打开文本数据文件(体检表.dat)
Valid
<105.0 105.0 - 107.9 108.0 - 110.9 111.0 - 113.9 114.0 - 116.9 117.0 - 119.9 120.0 - 122.9 123.0 - 125.9 126.0 - 128.9 129.0 - 131.9 132.0+ Total
Data菜单
定义变量属性 复制数据属性 定义日期 插入变量√ 插入变量√ 插入个案√ 插入个案√ 跳至.. 跳至 排序√ 排序√ 转置 重构 合并文件√ 合并文件√ 数据汇总 发现重复数据 正交设计 分割文件 选择观测√ 选择观测√ 加权√ 加权√
Transform菜单
计算√ 计算 重编码√ 重编码 可视化分组√ 可视化分组 计数 数据编秩 自动编码
作业
对全部学生的体重指标编频数表,选择适合的 统计指标进行描述。 分性别对体重进行描述,编写统计表 从理论上说大部分(95%)的学生的体重在什 么范围内?为什么? 应如何估计这些学生肺活量的95%参考值范围? (注意:要写公式,表格要符合统计学要求)
关于考试
开卷上机考试 两个小时的考试时间,不允许延长 只能带入一本课本,可以带入课件。不 能带入u盘,目的是让大家专心答题, 不要把大部分时间花在翻书找答案上 基本上每次课会布置一些小作业,上交 后用于计算平时成绩,和考试成绩汇总 在一起,构成大家的最后成绩。
Data菜单练习
打开体检表.sav 练习插入(删除)cases或者variables 先对性别排升序,再对身高排降序 按照 性别 = ‘男’ & 身高>120的条件选择观 测 (注意不要在中文输入状态下敲单引号) 分性别保存数据文件 打开男生数据,追加女生数据 (注意进行了删除添加操作后,要另存..)
106名学生身高(cm)的频数表
身高组段 102~ 105~ … 132~135 合计 频数 1 5 … 1 106 频率(%) 0.9 4.7 … 0.9 100.0 累计频率(%) 0.9 5.7 … 100.0 —
106名学生身高(cm)的均数表
性别组段 男 女 例数数 1 5 均数 0.9 4.7 标准差 0.9 5.7
讨论
哪些变量命名方式是SPSS不接受的 Help -> Topics -> Data editor -> Variable view -> Variable names -> The following rules apply …
SPSS整理编辑功能
公卫学院流行病与统计学系 易伟宁 讲师 82801619 yiweining@163.com
SPSS作统计描述
公卫学院流行病与统计学系 易伟宁 讲师 82801619 yiweining@163.com
数值变量的统计描述
统计描述是用统计指标和统计图表描述 资料的数量特征。常见变量类型包括数 值和分类变量,相应采用不同统计方法 数值变量特点,有单位,连续取值 描述数值变量的集中趋势,用均数 mean、中位数median、几何均数G。 描述其离散趋势,用全距range、四分 位数间距Interquartile range、方差 variance、标准差standard deviation和 变异系数等指标。
Transform菜单练习
打开OneCase.sav,计算年龄 Compute产生新变量now,值为02/15/2012 用now减去生日得出年龄(秒),再换算为年 打开体检表.sav, 从学号里提取班级信息(compute, substr) 将字符型变量--性别变换为数值型的(record) 身高<120, 120~130, 130+的学生各有多少 对身高进行每3岁一组分组 (Visual Bander )
SPSS软件概述
公卫学院流行病与统计学系 易伟宁 讲师 82801619 yiweining@163.com
SPSS是什么?
美国SPSS公司 公司(www.spss.com)产品 美国 公司 产品 社会科学统计软件包(曾经 曾经) 社会科学统计软件包 曾经 Statistical Package for Social Sciences 统计产品和服务解决方案(现在的解释 现在的解释) 统计产品和服务解决方案 现在的解释 Statistical Product and Service Solutions 主要功能:专业的统计分析, 主要功能:专业的统计分析,强大的数 据管理, 据管理,一定的制表绘图功能
相关文档
最新文档