SAS建立数据集

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SAS数据集构成
(1) 描述部分
包含该数据集的一般信息,包括:数据集的
名字及其成员类型、数据集建立的日期和时间、
观测的数目、变量的数目以及数据集中每一个变
量的特征信息,包括:Name(变量名)、Type(
类型)、Length(长度)、Format(输出格式)、
Informat(输入格式)、Label(标签)。
打开KEYS 窗口后在F12的右边的空白区键入 OPTIONS,完毕之后退出KEYS窗口
二 显示管理系统命令
1显示管理系统命令的发布 有四种命令的发布方式都可达到相同结果。
① 在命令框中直接键入命令
② 按功能键
③ 使用下拉式菜单
④ 使用工具栏
例:打开OUTPUT窗口,相应地四种操作:
命令框中直接键入OUTPUT并回车 功能键F7 Window/Output 使用工具栏
保存程序: 在命令框中键入: FILE
“D:\SAS\程序名.SAS"
调入程序:
先光标定位到指定某行,再在命令框中键入: INCLUDE "D:\SAS\程序名.SAS"
三 SAS系统的几组重要命令 •1向SAS系统寻求帮助命令 •F1键提供信息相当于简明的SAS使用手册
四 运行SAS程序的步骤 1在PROGRAM EDITOR窗口中键入程序
图2-1
一个典型的SAS程序实例
2提交程序
① ② ③ ④ 有四种方法可以提交这段程序: 在命令框中直接键入命令SUBMIT 用鼠标选择菜单命令run / Submit 按功能键F3 用鼠标点击标准工具栏的第一个按钮
另外,还可以用菜单命令Locals / Submit top line来提交PROGRAM EDITOR程序 窗口中的某一条SAS语句,常用来测试这 条语句的执行结果。
SAS系统安装后初始的数据库有:
Maps
Sashelp 永久数据库 Sasuser Work
临时数据库
1.对永久SAS数据集的命名
例 创建一个数据集名为Class的永久数据集.
首先,确定Class的数据集在哪里存储,然后使 用LIBNAME语句来定义库标记; 若选择Study作为库标记,那么在DATA语句中 你应该这样命名SAS数据: LIBNAME 库名 目录名 libname study ‘d:\sas\mydir’;
数据部分 是由数据构成的矩形表
相当于 记录或行
相当于域 或字段 变量(Variable)
VAR1 VAR2 VAR3 VAR4 VAR5
观测1 1234 abcd 3456 abcd 5678 观测2 2345 bcde 4567 bcde 6789 观测3 3456 cdef 5678 cdef 7890
data
study.class;
• 在这次SAS会话后面的DATA步 或PROC步使用这个数据集时,
必须规定两级名字。如:
• proc print
data=study.class ;
• 如果你想在另一次SAS会话里 读这个class数据集,你必需再定 义一个库标记。
图3 创建永久性数据集STUDY.CLASS
数据呈现
SAS系统的支持技术
经过二十多年的发展,SAS系统现在是以下三种 技术的主要提供者:
数据仓库技术(Data Warehouse) 数据挖掘技术(Data Mining)
决策支持技术(Decision Support
System)
SAS系统的主要模块
SAS系统包含了众多的不同的模块,可完成不同 的任务,主要模块有: SAS/BASE(基础)——初步的统计分析; SAS/STAT(统计)——广泛的统计分析; SAS/QC(质量控制)——质量管理方面的专 门分析计算; SAS/OR(规划)——运筹决策方面的专门分析 计算; SAS/ETS(预测)——计量经济的时间序列方 面的专门分析计算; SAS/IML(距阵运算)——提供了交互矩阵语 言;
min() #计算最小值
中位数median(x)(奇数时取中间的;偶数时
则取中间两个的均值)
分位数:quantile(x)
知识点回顾——描述性统计
众数(频数) table(y) 多组数据的概括
summary() #计算均值和五数
aggregate() #分组描述函数
aggregate(数据框,指定分组变量,计算函数)
其中func指概率分布函数,n为生成数据的个数
,p1, p2, . . . 是分布的参数数值。
随机分布函数rfunc
密度函数dfunc
r:random
d:density


累计概率密度函数pfunc
分位数函数qfunc
p:probability
q:quantile
54
知识点回顾——描述性统计
永久的和临时的SAS数据集
SAS的存储方式有二种: 永久的SAS数据集 临时的SAS数据集
一个SAS数据集是临时地或者是永久地存在,
取决于该数据集所附属的SAS数据库是临时的
或永久的。
永久的和临时的SAS数据集
一般用LIBNAME语句把主机系统下某个目录与 库标记联系起来,并用这个库标记作为SAS数据 集名字的第一部分(或称第一级),这样规定的 SAS数据集是永久的; 如果只有第二部分(或称第二级)数据集的名字 或库标记为WORK时,这样规定的SAS数据集是 临时的。 永久库中的所有文件将被保留,但库标记仍然是 临时的。
data-set-name(数据集名字)──这是SAS数据集 的名字 membertype(成员类型)──SAS数据集名字的这 一部分用户使用时不必给出。SAS 数据文件的成 员类型是DATA;SAS 数据视窗的成员类型是 VIEW
SAS数据集的名字
例 PRINT过程用相同方法处理数据集aaa.abc, 而忽略它的形式: PROC PRINT DATA=aaa.abc 例中aaa.abc这个SAS数据集名字,aaa是库标记, abc是数据集名字,成员类型没有写出,应该是 DATA或VIEW中一个。
aggregate(state.x77,list(region=state.reg
ion),mean)
57
知识点回顾——描述性统计
按列联表中某个属性求和,即边际列表
描述部分 包含了一些关于数据属性的信息 数据部分包括数据值
SAS数据集形式
SAS系统中共有两种类型的数据集:
SAS 数据文件(SAS data files)
SAS 数据视窗(SAS data views)
SAS 数据文件不仅包括描述部分,而且包括数据 部分。 SAS 数据视窗只有描述部分,没有数据部分, 只包含了与其它数据文件或者其它软件数据的映 射关系,能使SAS的所有过程可访问到,实际上 并不包含SAS 数据视窗内的数据值。
2.对临时SAS数据集的命名
创建或读一个临时SAS数据集,只要规定单级 名字,即这个数据集名字。SAS系统自动地使 用WORK作为库标记。 每次结束SAS后WORK库标记中的所有文件将 被删除。 如,data class;
二.对SAS数据库的管理
创建数据库study:
libname Study ‘d:\sasdata\mydir’;
3查看LOG窗口的信息
4重新调出刚才提交的程序: 命令框中发布RECALL命令 5在OUTPUT窗口查看运行结果 6存储程序
SAS程序 文件的后 缀为 .SAS
SAS安装方法:
初始安装画面
Next继续
选择安装类型
选择安装路径
选择 安装“我的SAS文件”文件夹
选择 安装SAS临时文件的文件夹
SAS名字的命名规则: 1) 由英文字母、数字、下划线组成; 2) 第一个字符必须是字母或下划线; 3) 不区分大、小写字母。
SAS数据集的名字
SAS数据集名字包括三个部分,格式如下:
Libref.data-set-name.membertype
Libref(库标记)──这是SAS数据库的逻辑名字
• 它运用统计分析、时间序列分析、运筹决策等 科学方法进行质量管理、财务管理、生产优化、 风险管理、市场调查和预测等等业务,并可将 各种数据以灵活多样的各种报表、图形和三维 透视的形式直观地表现出来。
SAS系统简介
SAS系统是大型集成应用软件系统,具有完 备的以下四大功能: 数据访问 数据管理 数据分析
summary()#计算单租数据的均值和五数 fivenum()#计算五数
IQR()#计算四分位极差
mean(x) #样本均值
var(x) #样本方差
sd(x)#标准差
55
知识点回顾——描述性统计
colMeans(y) # 每列均值
rowMeans(y) # 每行均值
max() #计算最大值
SAS系统的主要模块
SAS/FSP(数据处理交互式菜单系统) SAS/AF(面向对象编程的应用开发工具) 另外SAS系统还将许多常用的统计方法分别集成 为两个模块LAB和INSIGHT,供用户利用图形 界面和菜单直接对数据进行统计分析.
显示管理系统 命令框
一 显示管理系统窗口 1显示管理系统(Display Manager)三 个主要窗口: PROGRAM EDITOR窗口:提供一个编写 SAS程序的文本编缉器 LOG窗口: 显示有关程序运行的信息 OUTPUT窗口:显示程序运算结果的输出
确认 开始安装
继续安装、49%时安装出错,选no
安装继续
要求注册、更新,选no
结束安装
替换文件
update
update
更新选择
继续
OK,大功告成!
第二章
建立SAS系统的数据集
第一节 SAS数据集和数据库
一.SAS数据集的结构
SAS数据集(Data sets)是一种关系型结构,包括 描述部分和数据部分
删除库标记:
libname Study clear ;
2.查看SAS数据库及其内容
操作步骤如下:
在命令框中键入LIB或LIBNAME
双击打开文件
发布END命令退出当前窗口或用MOUSE单击 一下窗口右上角的关闭窗口按钮。
知识点回顾——R语言中的概率
分布函数的形式rfunc(n,p1,p2,...)
SAS系统的主要模块
SAS/GRAPH(图形)——提供了许多产生图形
过程并支持众多图形设备; SAS/ACCESS(外部数据库接口)——提供了 与大多数流行数据库管理系统的方便接口并自身 也能进行数据管理; SAS/ASSIST(面向任务的通用菜单驱动界
面)——方便用户以菜单方式进行操作;
2显示管理系统命令框常用命令
类 型 命 令 BYE CLEAR [window-name] END FILE "filename" HELP INCLUDE "filename" KEYS 显示管理命令 LIBNAME LOG NUMS OPTIONS OUTPUT PROGRAM RECALL SUBMIT 描 述 退出SAS 清除指定的窗口中的内容 退出当前窗口 存储到指定文件 帮助 引入指定文件 进入KEYS窗口 确认SAS数据库的内容 进入LOG窗口 打开和关闭文本编辑器的数字区 进入OPTIONS窗口 进入OUTPUT窗口 进入PROGRAM EDITOR窗口 调出上次执行的程序 提交一段程序
2 显示管理系统的常用窗口
KEYS
LIBNAME
查看及改变功能键的设置
查看已经存在的SAS数据库
DIR
查看某个SAS数据库的内容
如 dir sasuser
VAR
OPTIONS
查看SAS数据集的有关信息
查看及改变SAS的系统设置
例:自定义F12功能键为OPTIONS命令
数据分析与统计软件
李芳凤 Email:fangfly2003@163.com 公共邮箱:tongjixhwenku.baidu.com163.com 密码:xhtongji
SAS系统简介
• 美国软件研究所(SAS Institute Inc.)经多 年的研制于1976年推出。
• SAS系统广泛应用于金融、医疗卫生、生产、 运输、通信、政府、科研和教育等领域。
相关文档
最新文档