SAS学习(初识)
sas入门讲义

第一课SAS软件的基本概念一.What is SAS?SAS - Statistics analysis system✧它是一个组合软件系统,由多个功能模块组合而成;✧其基本部分是 BASE SAS模块;✧BASE SAS 模块是 SAS 系统的核心:承担着主要的数据管理任务,管理用户使用环境,进行用户语言的处理,调用其他 SAS 模块和产品。
✧具有灵活的功能扩展接口和强大的功能模块:SAS/STAT(统计分析模块)SAS/GRAPH(绘图模块)SAS/QC(质量控制模块)SAS/ETS(经济计量学和时间序列分析模块)SAS/OR(运筹学模块)SAS/IML(交互式矩阵程序设计语言模块)SAS/FSP(快速数据处理的交互式菜单系统模块)SAS/AF(交互式全屏幕软件应用系统模块)我们的主要学习内容✧SAS/Base✧SAS/Stat✧SAS/Graph二.SAS 窗口系统Editor 窗口:编程窗口Log 窗口:显示程序运行过程Output 窗口:显示运行结果Explorer 窗口:用于管理 SAS 文件。
它可以◆查看SAS 文件◆产生外部文件的快捷路径◆产生新的SAS 文件◆打开SAS 文件看其内容◆移动,复制和删除文件◆打开相关的窗口,例如新的library 窗口Results 窗口:三.Base SAS 的内容●SAS language●SAS procedures●Macro facility●Data step debugger●Output delivery system四.SAS语言的基本要素✧data set options - SAS数据集选项✧SAS system options - SAS系统选项✧formats and informats - 输出格式和输入格式✧functions✧Statements - SAS语句五.SAS数据的结构SAS 数据由行和列组成。
一行成为一个观测值(observation), 一列成为一个变量(variable)。
SAS入门到精通第1章

SAS 统计分析与应用 从入门到精通 三、SAS文件管理
2、SAS数据集
数据集的命名遵循一般SAS名称的命名规则,即:
必须由英文字母或下划线开始; 只能由数字、字母和下划线构成; 长度可以是1至32个字符。
SAS 统计分析与应用 从入门到精通 三、SAS文件管理
3、SAS逻辑库
SAS逻辑库是一个逻辑概念,没有物理实体。SAS逻辑库就是一 组SAS文件集合,SAS系统用它来进行文件管理,而这些文件在 Windows系统下可能属于同一个文件夹,也可能属于不同的文件夹。
SAS数据集是SAS系统专有的数据文件,直接面向SAS分析过程 和应用程序。
SAS提供了很多工具,使得用户可以方便地实现外部数据文件与 SAS数据集之间的转化。
SAS 统计分析与应用 从入门到精通 三、SAS文件管理
2、SAS数据集
SAS数据集是由SAS系统建立、维护和管理的一种数据文件,是 SAS分析过程和应用程序的直接数据对象。 利用表编辑器(Viewtable)可以直接建立SAS数据集,方法是: 选择菜单栏中的“工具”|“表编辑器”命令; 当SAS资源管理器窗口的内容为SAS数据集时,选择菜单栏 中“文件”|“新建”命令,在新弹出的对话框中选择“表”, 单击确定。 利用表编辑器可以打开、浏览和编辑一个已经存在的SAS数据集, 方法是: 双击SAS数据集,即可自动用表编辑器打开数据集; 选择菜单栏中的“工具”|“表编辑器”命令可以打开表编辑 器,然后再执行“文件”|“打开”命令选择要打开的数据集。
临时逻辑库是指它的内容只在本次SAS启动时存在,退出SAS时 内容则被全部删除。每次启动SAS时,系统都会建立一个名为Work的 SAS逻辑库,它是一个临时逻辑库。在引用Work中的SAS文件时,可 省略逻辑库名。 永久逻辑库是指其内容在退出SAS后仍被保留,除非被用户删除。
一、sas入门

一、sas入门实验一:SAS入门一、认识sas系统窗口。
二、SAS程序样例:1-1.sas三、建立逻辑库1、用菜单方式建立逻辑库mysas,子目录为D: /sas20122、用程序方式建立逻辑库mysas:1-2.sas四、根据下表建立数据集stua:1、用Viewtable表建立数据集mysas.stua。
2、编写程序建立数据集mysas.stua:Libname mysas “D: /sas2012”;Data stua;INPUT NAME $1-12 SEX $ AGE HIGHT WEIGHT;datalines;ZHANG HONG F 18 176 75 85 86WANG XING M 19 163 55 80 73LI NING F 17 169 70 90 93Run;3、用导入Excel表格的方法,利用菜单方式,建立数据集mysas. stua。
(1)在D盘下,建立一个excel文件stua。
(2)按照菜单的导入向导,建立数据集mysas.stua。
(3)保存导入Excel文件,建立数据集的程序,以便下面用。
4、用导入Excel表格的方法,利用程序方式,建立数据集stua。
PROC IMPORT OUT= STUADATAFILE= "D:stua.xls"DBMS=EXCEL2000 REPLACE;SHEET=“1";GETNAMES=YES;RUN;五、导出SAS数据集,变成EXCEL文件。
操作上一题的数据集mysas.stua,导出变成EXCEL文件。
(1)菜单方式(2)程序方式六、一些小程序:1、排序:1-3.sas 、1-3-1.sas2、理解数据集的导入程序、导出程序。
excel数据导入程序数据集文件导出程序3、更改变量名。
1-4.sas4、增加变量。
1-5.sas5、保留或删除变量。
1-6.sas6、筛选记录。
1-7.sas七、纵向合并和横向合并1、建立逻辑库mysas,子目录为D: /sas20032、用Viewtable表在逻辑库mysas中,建立数据集a、b、c、d。
学习使用SAS进行数据分析的基础教程

学习使用SAS进行数据分析的基础教程一、SAS介绍与安装SAS(全称Statistical Analysis System,统计分析系统)是一种非常强大的数据分析软件。
它提供了丰富的统计分析、数据挖掘和数据管理功能。
在学习使用SAS之前,首先需要下载并安装SAS软件。
在安装过程中,需要根据操作系统选择相应的版本,并按照安装向导进行操作。
安装完成后,可以通过启动菜单找到SAS软件并打开它。
二、SAS基本语法与数据集1. SAS语法基础SAS语法是一种类似于编程语言的语法。
在SAS中,每一个语句都以分号作为结尾。
常用的SAS语句包括DATA、PROC和RUN。
DATA语句用于创建数据集,PROC语句用于执行数据分析过程,RUN语句用于执行SAS语句的运行。
2. SAS数据集SAS数据集是SAS中最重要的数据组织形式。
它可以包含多个数据变量,并且每个变量可以拥有不同的数据类型,如字符型、数值型、日期型等。
通过DATA语句可以创建一个新的SAS数据集,并通过INPUT语句指定每个变量的属性。
使用SET语句可以将现有的数据集读入到SAS数据集中,以供后续分析使用。
三、SAS数据清洗与变换1. 数据清洗数据清洗是数据分析的第一步,其目的是去除数据中的错误或无效信息,保证数据质量。
在SAS中,可以使用IF和WHERE语句来筛选出符合条件的数据观测值,并使用DELETE和KEEP语句删除或保留特定的变量。
2. 数据变换数据变换是对原始数据进行转换,以满足具体的分析需求。
在SAS中,常用的数据变换操作包括缺失值处理、变量重编码、数据排序和数据合并等。
可以使用IF、ELSE和DO语句进行逻辑判断和循环操作,通过FORMAT语句对数据进行格式化。
四、SAS统计分析1. 描述统计分析描述统计分析是对数据的基本特征进行分析,包括均值、标准差、中位数、分位数和频数等。
在SAS中,可以使用PROC MEANS进行基本统计分析,使用PROC FREQ进行频数分析。
很全的sas基础知识(一)

很全的sas基础知识(一)5.1SAS表达式简介1.SAS常数表达式(1)数值常数如: 1.23、-5、0.5E-10。
(2)字符常数如: name1='TOME'、name2='MARY'、name3='JOHN'。
(3)日期(d)、时间(t)、日时(dt)常数如: d1='01JAN80'd、t1='9:25:19't、dt1='18JAN80:9:27:05'dt。
(4)16进制常数(略)2.SAS运算符(1)前缀算符与后缀算符前缀算符, 即正号或负号; 如: +Y; -25; -COS(30); +(X*Y); 后缀算符,即两个运算对象之间的运算符号, 如: 1+9; 4-2; 6<8。
(2)只含一个运算符的简单表达式(Ⅰ组)和含有多于一个运算符的复合表达式(Ⅱ组)Ⅰ组, 如: A+B; C-D; E*F; G/H; Ⅱ组, 如: 1-EXP(N/(N-1));100-LOG(N*(N+1));(3)操作运算的顺序求一个复合表达式的值时, 其操作运算的顺序和优先级遵从如下的规则(见表5.1): 表5.1SAS的运算符及其在运算顺序上的优先级━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━优先级组别运算符号等价表示运算符号含义之说明━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━第0 组()括号第 1 组**+-乘方, 正数, 负数^><<>NOT MIN MAX逻辑非, 最小, 最大第 2 组*/乘, 除第 3 组+-加, 减第 4 组‖或||字串连接第 5 组<<=LT LE小于, 小于等于=^=EQ NE等于, 不等于>=>GE GT大于等于, 大于IN等于一列元数中的某一个第 6 组&AND逻辑与第7 组|或|OR逻辑或━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━各组的计算顺序分别为: 第0组由内向外;其他各组均自左至右。
SAS学习(一):SAS基础

SAS学习(⼀):SAS基础1.类似SAS的统计程序还有:SPSS BMDP SYSTAT2.SAS界⾯主要有三个部分:程序编辑窗⼝(program editor),Log窗⼝(显⽰提交程序的主要语句及执⾏情况等)和输出窗⼝(output)3.提交执⾏程序可按功能键F3或者点击“Locals”,单击“submit”,或者单击⼯具栏中的运⾏图标(⼩⼈跑)4.程序运⾏后,标记窗⼝语句消失,如果log窗⼝显⽰有错,要先激活编辑窗⼝。
可直接按F4,也可以点击“Locals”,单击“recall text”.5.如果不关闭SAS,log窗⼝和结果输出窗⼝将会按先后保留历次执⾏的信息和输出结果。
为了⽅便阅读,要养成清理log窗⼝和输出窗⼝的习惯。
可先激活窗⼝,点击主菜单的“edit”,单击其中的“clear text”。
激活这两个窗⼝很简单:⿏标移⾄窗⼝单击左键;或单击当前窗⼝菜单栏中的“globals”或者“windows”,在其中选择相应的窗⼝。
6.SAS 系统是按每个观测向量逐⾏处理数据。
7.SAS中所说的变量相当于SQL中的字段名,观测向量相当于⾏。
8.SAS语句全部以分号(;)结尾,罪常见的语句错误时遗漏分号。
9.变量名的命名规则:以字母或者下划线(_)开头,最长不超过32个字符(数字字母下划线),不能使⽤空格和特殊字符(逗号冒号等)。
10.数字数据最好右对齐11.最好将结束的分号放在最后⼀⾏语句的下⽅12.使⽤缩进可以达到良好的视觉效果。
13.如果不指定烂位数,input数据时,缺失值⽤英⽂的点号(.)号代替14.SAS程序由SAS语句组成,定义数据和创建SAS数据集的语句群成为DATA步骤;需要实现定义指定的语句成为proc步骤。
15.如果多个proc语句,建议每个之后都加run;这是标准的格式,虽然只最后⼀个run;也可以。
⼀个简单的计算平均值的例⼦:数据集:上⾯的数据集有5个变量(被试编号性别测试1 测试2 作业等级),6个观测值(被试),现在我们来计算两次测试的平均值。
SAS入门经典超级强大-图文

SAS入门经典超级强大-图文方差分析一、熟悉聚类过程相关理论,能够根据SAS过程对观测数据进行方差分析。
方差分析的作用:检验各因素的不同水平及水平不同组合对目标值的影响——均值(向量)是否有显著差异,以及各因素、各水平间差异的具体情况(多重比较)。
相关假设:①不同因素、不同水平、不同观测间相互独立;一般因实际问题相关背景而有所保证②数据服从(多元)正态分布;正态性检验—procunivariate…normal;③不同组之间(协)方差(阵)相同;方差齐性检验—单因素hovtet=bartlett|levene|bf|obrien二、SAS中的方差分析过程。
①平衡数据的方差分析——ANOVA过程1)单因素方差分析;2)两因素方差分析;3)某三因素方差分析;procanova;cla变量表;model因变量=自变量列表;mean效应;计算所列的效应对应因变量的均值,其选项可作各种检验,如duncanrun;quit;proc…data=数据集manova按多变量方式删除那些因变量含有缺失项的观测outtat定义一个输出数据集,其中包含平方和、F统计量等modelY=ABCY=ABCA某B交互效应Y1Y2=AB多元方差分析mean效应aplpha=0.05指定多重比较的检验水平,0.05、0.01、0.10等多重极差检验]Duncan|SNK|Regwq|[Tukey|Scheffee|Bon...②非平衡数据的方差分析——GLM过程procglm;Cla变量;model因变量=自变量列表;mean效应;计算所列的效应对应因变量的均值,其选项可作各种检验,如duncanrun;quit;data=数据集manova按多变量方式删除那些因变量含有缺失项的观测outtat定义一个输出数据集,其中包含平方和、F统计量等alpha=0.05指定各种可信区间的致信水平modelY=ABCY=ABCA某B交互效应Y1Y2=AB多元方差分析aplpha=0.05int要求GLM把截距作为一个效应进行处理,并显示与其有关的假设检验结果noint如果截距项在模型中不显著,此选项可将截距项删除三、例子1.研究4种布料对某种化学原料的吸附作用,每种布料各作5次试验,数据如下:试分析4种布料对此化学原料的吸附作用有无显著差别。
SAS教程之1

第1章SAS初阶§1.1 初识SAS1.1.1 启动用如下方法可以进入S AS系统的窗口运行环境:在Windows环境中,从开始菜单的程序文件夹中找到S A S系统文件夹,从中启动SAS系统。
或者生成S A S.E XE的快捷方式C巴S AS.EXE用鼠标右键拖到桌面),双击SAS.EX E启动。
1.1.2 SAS AW S(SAS应用工作空间)图1.1SASAWS启动后,出现如图1.1的S A S运行界面,术语称为―SAS工作空间C S A S Ap pli c a- tionW orkS pac e)‖。
这是S AS V8.1的界面。
它象其它W i ndo ws应用程序一样, 在一个主窗口内, 包含若干个子窗口,并有菜单条、工具栏、状态栏等。
§1.1 初识SAS 2SAS有三个最重要的子窗口:程序窗口C PR O G RAMEDITOR)、运行记录窗口C LOG)、输出窗口C OUTPU T)。
程序窗口的使用类似于Windows中的记事本程序,可以在其中编辑文本文件, 主要是编辑S A S程序。
S A S V8.1的程序编辑功能有所增强,现在可以用不同颜色显示不同的S A S程序部分,可以自动缩进排列程序文本,可以折叠一段程序。
程序可以直接在窗口中键入,插入新行用回车,插入点光标C闪动的竖线)可以用光标键C上下左右箭头、Home、En d)移动或用鼠标单击到某一处。
按住S h if t再按光标键可以加亮显示一块文本,然后用复制、剪切、粘贴命令C Ed i t菜单中的Cut、Cop y、P aste,或工具栏图标)可以复制或移动加亮显示的文本。
这些编辑操作可以参考W in dows系统中记事本、Word等的用法。
运行记录窗口记录程序的运行情况,运行是成功还是出错,运行所用时间,如果出错,错在什么地方。
运行记录窗口中以红色显示的是错误信息。
输出窗口显示S A S程序的文本型输出C图形输出单独有一个GRAPHIC S窗口)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SAS 初识(学习笔记)1自顶向下的设计,自底向上的运行2 SAS程序由一个数据步data work.filenam ; ....... run;若干执行步proc print ....... run;proc KEYword ...... run;可归纳为DATA步和PROC步两个部分。
DATA步生产、整理数据报表编写,文件管理、信息检索等都在DATA中完成。
PROC步分析数据管理数据、生成报告和图表及对数据排序等在PROC中完成。
3 SAS语句通常以SAS关键字开头,以分号(;)结束4 SAS数据集是一个由SAS创建并且处理的文件,是一个包含数据值的特殊结构性文件。
数据必须以SAS数据集的形式存在才能用SAS程序和一些DA TA步语句处理。
SAS数据集由描述信息部分,包括一般信息和变量信息用contents 过程浏览proc contents DATA=SAS-data-set ;run;数据值部分是由字符或数字数据值组成的表格。
用PRINT过程浏览proc print DA TA=SAS-data-set;run;数据部分是一个由字符和/或数字数据值组成的矩形表格。
变量名称是描述部分的一部分,而不属于数据部分。
5 SAS逻辑厍是SAS文件的集合。
就是一个目录。
在使用中要通过一个引用名来识别。
SAS逻辑库分临时库和永久库,名为的work是临时库,由SAS 自动创建,随着SAS会话的结束,其中的数据文件将被删除;永久库则会保存下来。
当我们在磁盘上创建了一个文件目录并将使其做为SAS永久库时,需要使用LIBNAME语句分配一个逻辑库引用名libname x_name‘s:\workshop’;由此SAS建立了逻辑库(引用)名与操作系统上的文件目录的物理位置建立了连接。
当SAS会话结束后,逻揖库引用名与文件的物理位置之间的走接就会切断。
数据集是逻辑库中的一个SAS文件,在物理上是逻辑库对应的那个目录中的一个文件。
表达为一个两级文件libref.filename如果libref被省略则默认为work。
6 用DATA语句创建临时或永久数据集SET 语句读取数据文件或数据集WHERE语句选择观测DORP 或KEEP语句选择变量。
对SAS数据集加工的一般格式:DATA output–SAS-data-set(生成数据集名);SET input–SAS-data-set (读入数据集名);数据加工语;RUN;7 DATA步数据处理的一般原理:step1,建立PDVPDV(program data vector)程序数据向量,是SAS暂时存放数据的地方。
当SET打开数据的时候,SAS将数据集中读入PDV中。
PDV还包括根据DATA步中其它语句产生的新变量,以及两个系统变量_N_和_Error_step2,SET语句读入输入数据集的描述部分step3,在PDV中加入变量①加入输入数据集的全部变;②加入DATA步中产生的新变量。
step4,创建(目标)生成数据集的描述部分此时数据集为空,沒有记录(数据),数据的产生在DATA 步执行阶段。
step5,DATA步执行①PDV中变量初始化为缺失②将输入数据集中的第一条记录读入PDV,并根据赋值语句计算PDV中新变量的值③将PDV中的数据写入 在编译阶段创建好的生成数据集中,形成第一条记录④将输入数据集的第二条记录写入PDV,覆盖原有的内容,_N_的值置为2,覆盖过程中赋值语句将计算新变量,新变量在每次开始循环的时刻,被置为缺失⑤将PDV中数据写入生成数据集中,形成生成数据集中的第二条记录。
重复读入写出的过程,直到遇到读入数据集结束标志(EDF)。
需要注意的几点:i ,系统变量_N_和_Error_ 不能写入生成数据集,但赋值语句可以使用。
ii,可以对读入PDV的变量或记录进行限制,但在不同的阶段进行限制,运行效率是不同的iii,当数据是从外部导入数据集时,则是先将外部数据读入输入缓冲区(Input buffer,然后由缓冲区写入PDV。
每次循环开始时,PDV中的变量值被置为缺失,然后从缓冲读入原始数据。
图1 DATA步工作流程8 有关变量和记录限制的效率从一个SAS数据集中可以选择变量,并进行加工,进而生成新的数据集,其中需要保留的变量用keep variable-list;表示。
需要删除的用drop variable-list; 表示。
variable-list 是指定需要保留或删除的变量列表。
从DATA的工作流程看,一是从读入到写入PDV之前进行控制,另一个是从PDV写入新数据集时进行控制,再有就是在整理数据过程中进行控制(见图2)。
图2 不同阶段的变量选择控制对于观测的约束同变量选择的一样,也在三个阶段进行控制,只是控制的方法更丰富了,一是在数据写入PDV之前,用SET input–SAS-data-set (where=(表达式));此时效率最高;二是此时还可以选择用WHERE语句进行操作,WHERE语句表达式非常丰富,简洁有效;三是在数据从PDV写到新数据集,用DATA output–SAS-data-set (where=(表达式);四是在数据读入PDV后,还可以使用IF语句将满足条件的删除(不写入生成数据集),如: IF (表达式)THEN DELELTE ; 切记此时是对PDV中已存在的数据进行操作。
关于IF语句还有两个方便之处①可以使用内部变量_N_,②表达式中的字符变量可以自动转变为数值变量自行比较。
SET语句中还有一组选项(FIRSTOBS=和OBS=),其作用是从哪一条记录开始读入PDV,到哪一条结束。
9 关于变量的属性前面说到SAS数据集的描述部分时,曾指出在这里还存储了有关变量的名称、类型和变量长度等变量属性。
事实上还有标签(LABEL)和格式(FORMAT)两个属性也是存储在描述部分中的,当添加了这些属性后,在展示报告时标签将改变变量名称的外观。
格式会改变变量值的外观。
LABEL语句的一般形式:LABEL variable= 'label'variable= 'label'variable= 'label';应注意的是:①一个标签最多有256个字符;②在单个LABEL语句中可为任意数量的变量定义标签;③在DATA步中使用LABEL语句,通过将标签储存在这个SAS数据集的描述部分,使标签和变量永久关联。
FORMAT语句的一般形式:FORMAT variable(s) format;应注意的是:①格式是SAS用于写出数据的一个指令;②在一个DATA 步中使用FORMAT 语句,通过将格式储存在SAS数据集的描述部分中,使格式和变量永久关联。
Format格式非常的丰富,有如下:<$>format<w>.<d>$ 表示一个字符格式format 给SAS 格式或用户定义的格式命名w 指定总的格式宽度包含小数位数和特殊字符. 是一个必要的分隔符d 指定数值格式中的小数点的位数。
格式说明格式说明$w. 写入标准字符数据w.d 写入标准数值数据COMMAw.d 写入数值带有一个每隔三位数分隔的逗号和一个分隔小数的点COMMAXw.d 写入数值带有一个每隔三位数分割的点和一个分隔小数的逗号写入数值左端是一个美元符号,并带有一个每隔三位数分隔的DOLLARw.d逗号和一个分隔小数的点写入数值左端是一个欧元符号(),带有一个每隔三位数EUROXw.d分隔的点和一个分隔小数的逗号SAS的日期格式格式储存值显示值MMDDYY6. 0 010160MMDDYY8. 0 01/01/60MMDDYY10 01/01/19600.DDMMYY6. 365 311260DDMMYY8. 365 31/12/60DDMMYY1365 31/12/19600.DATE7. -1 31DEC59DATE9. -1 31DEC19590 January 1, 1960WORDDATE.0 Friday,January 1, 1960WEEKDATE.MONYY7. 0 JAN1960YEAR4. 0 196010 关于where 语句的丰富表达式where-表达式是由一系列运算符和操作数组成的用来选择观测的条件表达式。
其中运算数包含常量和变量。
运算符包含算术运算符,比较算符和逻辑算符。
运算数中①常量运算数是固定值;②字符值必须包含在引号中并且区分大小写。
特别应注意的是①数值不用引号;②一个变量运算数必须是来自输入数据集的一个变量。
比较运算符可比较一变量和一个值,或一个变量和另一个变量。
具体如下表:符号算符说明= EQ 等于^= ¬= ~=NE 不等于> GT 大于< LT 小于>= GE 大于或等于<= LE 小于或等于IN 在列表中算数运算符表示要进行算数计算。
具体有:符号说明** 幂* 乘法/ 除法+ 加法- 减法逻辑运算符合并或修改表达式。
符号算符说明& AND 与| OR 或^ ¬ ~NOT 非特殊WHERE运算符是只能用于where表达式中的运算符。
符号算符说明BETWEEN-AND 一个范围内IS NULL 缺失值IS MISSING 缺失值?CONTAINS 包含字符串>= LIKE 字符串匹配具体解释如下:用BETWEEN-AND运算符选择变量值落入一个值域内的观测。
IS NULL和IS MISSING 运算符选择变量值是缺失的观测。
这里需要注意的是①运算符可用于字符型变量和数值型变量;②将NOT 逻辑运算符和IS NULL或IS MISSING 合并,可选择非缺失值。
CONTAINS (?)运算符选择包含指定的子字符串的观测。
需要说明的是①变量值中的子字符串的位置不重要。
②当你做比较时,运算符区分大小写。
LIKE运算符通过比较字符值和特定模式来选择观测。
使用中有两个可用于定义模式的特殊字符:一个是百分号(%)代替任意数量的字符;另一个是下划线(_) 代替一个字符。
具体应用中①可以指定连续下划线;②百分号和下划线可在同一个模式中使用;③运算符区分大小写。
需要特别注意的是一个转义字符是表明转义字符后面的字符将采用原来的意义。
对于LIKE运算符,一个转义字符表明在变量值中搜索%和_字符的文本实例,而不是运行特殊字符的函数。
为了指定一个转义字符,在模式匹配的表达式中包含该字符,然后关键词ESCAPE之后是转义字符表达式。
当你包含转义字符,模式匹配表达式必须在引号中,不能包含列名称。
转义字符表达式是对单个字符计算的表达式。
运算数必须是字符或字符串文本。
如果它是单个字符,必须在引号中。