SAS统计软件过程步通用语句

合集下载

第04章 SAS过程步与过程步语句

第4章SAS过程步与过程步语句摘要：本章讲授过程步一般形式，SAS过程步的常用语句，程序设计中通用的SAS语句，学习过程步常用有关语句功能及其用法。

为后面统计分析过程的调用作好准备。

SAS过程步用来调用系统提供的标准常用过程或统计分析过程，对指定的SAS 数据集进行处理，并将分析结果显示输出到OUTPUT窗口。

一个过程步是一个功能程序模块，调用不同的过程可实现用不同方法对数据进行分析。

§4.1 SAS过程步的一般形式通常，SAS过程步的一般形式为：PROC 过程名选择项;[其他相关过程步语句;]RUN;说明：1．PROC表示一个过程的开始；“过程名”可以是后面各章节将要介绍的常用过程名或统计过程名。

不同的过程有不同的专用SAS名，而且各有一些可供选择的选择项（参数），对于同一过程，给定不同的参数，输出不同的计算结果和不同表格形式。

2．选项：选择项一般以关键字为核心构成，常用下面三种形式：①关键字在过程中，一个关键字代表该过程的某一特性，若关键字作为选项出现，则过程处理数据或输出结果时，这一特性予以考虑。

否则，忽略这一特性。

②关键字=值过程的某一特性可取不同的值，则指定该特性的书写格式为：特性关键字=特性值（数字或字符串）。

③关键字=SAS数据集有些过程需要特定的输入数据集，有些过程可以建立一些特殊的数据集。

过程指定特别输入输出数据集的选项书写格式为：关键字=数据集名该形式规定输入或输出的数据集，最常用的是DATA=数据集，指出本过程要处理的数据集名称，若缺省，则使用最新建立的数据集。

如“PROC PRINT DATA=new;”。

3．其他相关过程步语句：有VAR、ID、BY、CLASS、WEIGHT等过程步语句，将在下一节中讲述。

4．RUN的作用是通知系统开始执行本过程程序段，当一个程序文件中有几个过程时，它们可共用一个RUN语句。

5．常用的过程步名称及功能：SAS程序中涉及的过程多达数百种，实现统计功能时常用的过程也有数十种之多，现将最为常用的过程名称及其所能实现的功能列入下表（表4.1），以便各位提前热热身。

SAS统计软件全局通用语句

FOOTNOTE语句
FOOTNOTE语句在每一页的底部输出一些脚注行。最多可产生10个脚注行。
语句格式： FOOTNOTE<n><'text'|"text">;
其中： ▪ n紧跟在词FOOTNOTE后面(不能有空格)的数字，用来规定脚注的行号; ▪ text规定脚注行的内容。规定的脚注行内容将输出在所有过程的输出页上，但可以重新规定或取消。
Weight 50.5000000 150.0000000
--------------------------------------
例11.16 使用选项CANCEL。 proc means data=ResDat.idx000001; var clpr X; /*注意数据集中没有变量X */ run cancel;
SAS统计软件全局通用语句
❖ 全局通用语句是可以用在任何地方的SAS语句。这些语句既可以用在数据步（DATA步），也可以用在过程步(PROC步)，甚至还可以单独使用。
应用举例
例11.1 注释语句应用。 proc print data=ResDat.stk000002 (obs=10) noobs; /*输出前10个观测，不输出观测序号*/ var oppr hipr lopr clpr; title"股票行情"; run;
proc means data=ResDat.stk000002 ; *对数据集ResDat.stk000002使用means过程; var oppr hipr lopr clpr; /*输出变量oppr hipr lopr clpr的均值*/ run;
例11.2 标准SAS程序开头，记录SAS程序信息的注释形式。

常用sas语句总结

常用sas语句总结第一篇：常用sas语句总结Engine(引擎)是一种访问架构，SAS系统通过它迅速地对其它数据库管理系统中文件进行读入和写出。

1．LIBNAME语句1.1解读定义 SAS 逻辑库。

具体地说，它可以(1)向 SAS 标识 SAS 逻辑库(2)将引擎与逻辑库关联(3)让您指定逻辑库的选项(4)为逻辑库指定逻辑库引用名通俗得讲，LIBNAME语句把一个libref（库标记名）和一个目录联系起来，使用户可以在SAS语句中使用库标记来指示这个目录。

提交该程序时自动引用该 SAS 逻辑库 1.2 语句格式1、LIBNAME libref ；2、LIBNAME libref Clear;3、LIBNAME libref |_ All_ List;三种格式反映了LIBNAME语句的三种用法选项说明LibrefEngineSas-Data-LibraryAccess=Readonly|TempClear_All_List规定逻辑库规定引擎规定主机系统下一个有效的物理地址规定逻辑库为只读或可修改属性清除与库标记的联系列出所有逻辑库的属性在Log窗口列出逻辑库的属性。

2.length语句SAS变量的基本类型有两种：数值型和字符型。

数值型变量在数据集中的存贮一般使用8个字节。

SAS的字符型变量缺省的长度是8个英文字符，可以使用LENGTH语句指定变量长度，LENGTH语句一般应出现在定义变量的Input语句之前，格式为： LENGTH 字符型变量名 $长度例如：length name $20 ；3.input 语句3.1解读INPUT语句用于向系统表明如何读入每一条记录。

它的主要功能有：读入由语句指定的数据列；为相应的数据域定义变量名；确定变量的读入模式（共有四种模式：column模式，formatted模式，list 模式及named模式）。

input语句执行后，SAS将读取的数据暂时先保存在内存缓冲区，然后执行后面的语句，后面的语句可以对暂存在内存缓冲区中的变量值进行修改，到最后才将整条数据写入数据集，写入数据集的数据就不能在当前data步中再修改。

SAS过程步通用语句

• Proc print data=class1;run; Title “title for two procedure”; Proc means data=class1; Var weight; Run;
10. LABEL 语句
• 格式：label 变量＝‚标识‛
• 功能：给变量赋以标记，输出时代替变量名。
• 第四句是其它SAS语句，仅允许使用by语句。
• 最后是过程结束语句。 rank过程步和sort过程步一样，不产生任何输出信息，必须借助于print 过程步，才能看到新数据集的结果。
rank过程步和sort过程步的区别
rank过程步不改变所有变量的观察值的顺
序，而s过程名。
过程步名
SORT PRINT UNIVARIATE MEANS
功能
将指定的数据集按指定的变量排序将数据集中的数据列表输出对指定的数值变量进行统计描述对指定的数值变量进行统计描述
FREQ
TTEST ANNOVA
对指定的计数变量进行统计描述
对指定的变量做t 检验对指定的变量做方差分析
3. rank 过程步
将SAS数据集中指定的变量的值按从小到大的顺序附给一个序数，也称为秩次。产生的新变量称为是原变量对应的秩次变量。结构： proc rank data=SAS数据集名；
var SAS变量名；
ranks 新变量名；其它SAS语句； run；
3. rank 过程步
• proc rank 语句，表明要建立SAS变量的秩次变量。 • 第二句是var 语句，指明数据集中要被秩次转换的变量。 • 第三句是ranks语句，给出秩次转换后新的变量名。若该句缺省，则新变量名覆盖原变量名。

SAS过程步通用语句

RUN;
例6： FREQ语句
现有一批人，其中20岁女性10人，22岁女性23 人，21岁男性19人，21岁男性16人，求平均年龄。 • data a; input sex $ age number @@; cards; f 20 10 f 22 23 m 21 19 m 22 16 proc means; freq number; var age; run;
NOPAR1WAY
REG CORR GLM LOGISTIC PHREG
对指定的变量做非参检验
对指定的变量做回归分析对指定的变量做相关分析对指定的变量做方差、协方差分析对指定的变量做logistic回归分析对指定的变量做COX回归分析
三、用于SAS过程步中的通用语句
能够在SAS过程步中使用的语句。而非各个过程步的专用语句。 1 、 PROC 语句：表示过程步的开始及调用某一要使用的过程 2、VAR语句：定义被分析的变量 3、BY语句：按指定的变量值来分组处理数据集 4、CLASS语句：在分析中定义分类变量 5、SUM语句：对指定的变量求和，当然该变量必须是数值型变量。格式： sum SAS变量名；
过程步名过程步名功能功能sortsort将指定的数据集按指定的变量排序将指定的数据集按指定的变量排序printprint将数据集中的数据列表输出将数据集中的数据列表输出univariateunivariate对指定的数值变量进行统计描述对指定的数值变量进行统计描述meansmeans对指定的数值变量进行统计描述对指定的数值变量进行统计描述freqfreq对指定的计数变量进行统计描述对指定的计数变量进行统计描述ttestttest对指定的变量做对指定的变量做t检验检验annovaannova对指定的变量做方差分析对指定的变量做方差分析nopar1waynopar1way对指定的变量做非参对指定的变量做非参检验检验regreg对指定的变量做回归分析对指定的变量做回归分析corrcorr对指定的变量做相关分析对指定的变量做相关分析glmglm对指定的变量做方差协方差分析对指定的变量做方差协方差分析logisticlogistic对指定的变量做对指定的变量做logisticlogistic回归分析回归分析phregphreg对指定的变量做对指定的变量做coxcox回归分析回归分析能够在sas过程步中使用的语句

SAS统计软件过程步通用语句

M 10 Weight 10 108.9500000 22.7271864 83.0000000 150.0000000 Height 10 63.9100000 4.9379370 57.3000000 72.0000000
----------------------------------------------------------------------------------------------------------------
的输出变量名。
例10.15 应用举例。
proc means data=ResDat.class;
var height weight;
output out=out_m mean=h_m w_m ;
run; 例中，过程MEANS计算变量HEIGHT和 WEIGHT的均值统计量。关键词MEAN=规定输出数据集OUT_M中的变量为 H_M 和W_M。H_M和 W_M 分别表示变量 HEIGHT和 WEIGHT的均值。
例10.13 应用BY语句。 proc means data=ResDat.class; var weight height; by sex; output out=b mean=w_m h_m; ; run;
OUTPUT窗口输出： ----------------------------------------- Sex=F ----------------------------------------------------
-----------------------------------------------------------------------------------------
MODEL语句

SAS语句

sas有两种语句：数据步和过程步。

在sas中，通过数据步和过程步来使用sas语言的元素。

数据步：是一组语句组合：从外部文件中读取数据；将数据写入到外部文件中；读取sas数据文件和视图；创建sas数据文件和视图。

过程步：对sas数据集进行分析和产生报表。

例如：对数据集进行分析、画图、查询和打印等操作。

逻辑库：由一组sas文件组成。

sas软件系统的信息组织有两层，第一层是sas逻辑库，第二层是sas文件。

sas逻辑库是一个逻辑概念，本事并不是物理实体，它对应的实体是操作系统下一个文件夹或几个文件夹中的一组sas文件。

sas逻辑库是一组存储在同一目录下被同一引擎访问的文件，其他文件也可以存放在该目录下，但是只有能被sas识别的文件才能显示在逻辑库中。

建立sas逻辑库：用libname语句libname libref <engine>'sas-data-library'其中libref是逻辑库名，sas-data-library是逻辑库对应的物理地址，engine：引擎名称。

libname resdat 'D:\resdat';--创建逻辑库resdat，对应的物理文件夹为D:\resdatlibname a ('d:\resbd\','d:\resfin\');--多个文件夹创建一个sas逻辑库临时逻辑库；指它的内容只在启动sas时存在，退出sas时内容完全被删除。

系统默认的临时逻辑库为work，引用临时库中的文件时，可以不加库名work。

永久逻辑库：它的内容在sas关闭对话之后仍旧保留，直到再次修改或删除。

sas除了work 以外的逻辑库都是永久库。

引用永久逻辑库的文件时必须加上永久逻辑库名。

例如：sashelp.Abmfolder库引擎：是一组规定格式想逻辑库读写文件的内部命令。

每个sas逻辑库都对应一个库引擎。

sas逻辑库引擎是软件的一个元件用来组建sas与sas逻辑库之间的接口。

第04章_SAS过程步与过程步语句

4.1 SAS过程步的一般形式过程步的一般形式
其他相关过程步语句：其他相关过程步语句：有VAR、ID、BY、CLASS、WEIGHT等、、、、等过程步语句。过程步语句。 RUN语句： RUN语句：语句作用是通知系统开始执行本过程程序段，作用是通知系统开始执行本过程程序段，当一个程序文件中有几个过程时，当一个程序文件中有几个过程时，它们可共用一个RUN语句。语句。共用一个语句
4.2.6 WEIGHT语句语句
功能：在有些试验中的某一变量（功能：在有些试验中的某一变量（列）的值表示所在DATA student;的相关权重，该变量必须用观测（行） INPUT curr$ x1-x7 wgt; WEIGHT语句来说明。语句来说明。语句来说明 CARDS; 格式：WEIGHT75 60 76 73 77 68 78 0.15 格式： English 变量；说明：说明： Chinese 80 70 81 82 83 78 84 0.35
4.1 SAS过程步的一般形式过程步的一般形式
选项：以关键字为核心构成，常有三种形式：选项：以关键字为核心构成，常有三种形式：
①关键字在过程中，关键字代表该过程的某一特性，在过程中，关键字代表该过程的某一特性，若关键字作为选项出现，若关键字作为选项，这一特性予以考虑。否则，忽略这一特性。 ②关键字=值过程的某一特性可取不同的值，则指定关键字= 过程的某一特性可取不同的值，该特性的书写格式为：该特性的书写格式为：特性关键字= 数字或字符串）。特性关键字=特性值（数字或字符串）。关键字=SAS数据集有些过程需要特定的输入数据 ③关键字数据集有些过程可以建立一些特殊的数据集。集，有些过程可以建立一些特殊的数据集。过程指定特别输入输出数据集的选项书写格式为：特别输入输出数据集的选项书写格式为：关键字= 关键字=数据集名如: PROC PRINT DATA=new

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

OUTPUT窗口输出：
Sex Obs Variable N Mean Std Dev Minimum Maximum ---------------------------------------------------------------------------------------------------------F 9 Weight 9 90.1111111 19.3839137 50.5000000 112.5000000 Height 9 60.5888889 5.0183275 51.3000000 66.5000000
SAS统计软件过程步通用语句
过程步通用语句可以分为两类： ▪过程信息语句； ▪变量属性语句。
语句格式
PROC program <options>; 其中： ▪ program规定要运行SAS的过程; ▪ options规定过程的选项。
OPTIONS选项说明： ▪ 通用选项； ▪ 过程特定选项。
CLASS 语句
CLASS 语句规定分类变量，SAS过程对分类变量的不同值分别进行分析处理。
语句格式： CLASS /CLASSES variables; 其中：
variables规定分析数据集中的分类变量。
例10.12 应用CLASS语句。 proc means data=ResDat.class; var weight height; class sex; output out=a mean=w_m h_m; ; run;
WHERE 语句
WHERE 语句选择SAS数据集中的观测。
语句格式： WHERE where-expression; 用法和DATA步中的用法类似。
WHERE选项与其它选项的生效顺序： ▪ 选项FIRSTOBS=和OBS=； ▪ WHERE选项； ▪ 创建BY组。
例10.10 选择观测值。 proc print data=ResDat.class; where sex='M'; run; 例10.11 删除观测值。 proc print data=ResDat.class; where sex^='M'; run;
VAR语句
VAR语句规定要分析的变量名。
语句格式： VAR variables; 其中： variables规定要分析的变量。
例10.5 应用举例。 proc means data=ResDat.class; var weight height; run;
MEANS 过程
变量 N
均值
标准偏差最小值最大值
例10.3 求均值过程。 proc means data=ResDat.Idx000001 maxdec=3 css; var clpr; run; 例中，在OUTPUT窗口输出变量CLPR 的校正平方和(CSS)，输出结果保留3位小数。
例10.4 作图过程选项。 proc plot hpct=50 vpct=33; 例中，规定按横竖50:33的比例作图。
-----------------------------------------------------------------------------------------
MODEL语句
MODEL语句规定过程需要的统计模型。
语句格式： MODEL dependents=indepndenteffects/<options>; 其中： ❖ dependents规定模型中的因变量； ❖ indepndenteffects规定模型中的自变量; ❖ options不同过程的特定选项。
ID语句
ID语句规定用于识别观测的变量。
语句格式： ID variables; 其中： variables规定用于识别观测的变量。
例10.8 规定替代观测序号的变量。 proc print data=ResDat.class; id name; run; 例中，打印列表输出数据集CLASS时，用变量NAME的值来识别观测。
M 10 Weight 10 108.9500000 22.7271864 83.0000000 150.0000000 Height 10 63.9100000 4.9379370 57.3000000 72.0000000
----------------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------
Weight 19 100.0263158 22.7739335 50.5000000 150.0000000
Height 19 62.3368421 5.1270752 51.3000000 72.0000000
通用选项：
Keyword
规定过程要求的关键词
Keyword=Value
规定关词的值
Keyword=SAS-Data-Set 规定输入或输出的SAS数据集
应用举例
例10.2 打印列表过程。 proc print data=ResDat.Idx000001 (obs=10); run; 例中，在OUTPUT窗口打印输出ResDat.Idx000001的前10观测。
例10.9 规定数据集转置后的观测值识别变量。 proc transpose data=ResDat.class out=a let; id name; run;
proc transpose data=ResDat.class out=a let; id sex; run; 运用上述程序段，查看输出结果。
例10.6 模型设定。 model y=x1-x5; model y1 y2=a b c d; 例10.7 回归分析过程模型设定。 proc reg data=ResDat.class ; model height=weight/ dw spec; output out=out1 r=r p=p l95=l u95=u; run;