SAS基本操作

生物统计学II实验课件

(基础性实验)

实验一SAS软件的特点、功能及其程序的编写

一.实验目的和要求:

了解SAS软件的功能、特点等相关内容和基本操作方法,使学生能对SAS软件取得初步了解,熟悉SAS系统的启动方法,掌握常用的显示管理系统命令及其功能,能较熟练地使用系统命令或使用下拉菜单的方法进行操作。了解SAS程序的基本结构,掌握对数据步提供的数据,建立SAS数据集;利用适当的过程语句编写过程步,建立用户与SAS系统之间的联系,为完成对试验资料的统计分析工作奠定基础。

二.实验主要内容:

1. SAS概况

SAS是统计分析系统(Statistical Analysis System)的缩写。该系统系20世纪60年代末由美国北卡罗来纳州立大学统计系两位教授开发,最初以统计分析和线性统计模型为主,自1976年问世以来,至今已开发成为功能强大齐全、使用灵活方便的集成应用软件系统。它包括30多个工具模块,每个模块皆由可执行文件组成,被称之为SAS过程。它将统计分析方法定义为计算过程,分析时可直接调用,具有完备的数据访问、管理、分析、呈现功能,成为国际通用的具有权威性的数据处理与统计分析标准软件。

本实验介绍SAS统计分析功能的相关内容及在微机上的具体使用方法,使同学们能对SAS取得一些肤浅的了解,能通过简单的调用程序过程来完成各种复杂、庞大的统计分析,并可使用SAS语句编制程序来完成特定的计算,从而能使用SAS软件处理《试验统计方法》教材中的各种统计方法。

2. SAS统计软件的特点

SAS统计软件是一个模块化的集成软件系统。基本部分是Base SAS软件,此外还有用于统计分析的SAS/STA T软件;用于高级绘图的SAS/GRAPH软件;用于矩阵运算的SAS/IML 软件;用于运筹学和线性规划的SAS/OR软件;用于经济预测和时间序列分析的SAS/ETS 软件等。

SAS统计软件的最大特点是把数据管理和数据分析融为一体。具体地说有以下几方面的特点:

2.1灵活方便、功能齐全

SAS的宗旨是为所有需要进行数据处理、数据分析的非计算机人员提供一种易学易用,完整可靠的软件系统。

1.操用方便:用户把要解决的问题用SAS语言表达出来,组成SAS程序,提交SAS 系统即可。执行的情况和输出结果都在屏幕上显示出来。例如进行回归计算时使用以下简单的SAS程序:

Proc reg data = A;

model y =x1—x10;

run;

用户即可在显示管理系统下进行。

2.灵活:SAS系统提供很多语句及选项供用户灵活地使用某种统计方法。如上例中加上以下选项可进行逐步回归:

model y =x1—x10/selection=stepwise;

加上以下语句可以画出y 对x1的散布图;

plot y×x1=‘*’;

3.功能齐全:SAS系统提供的二十多个模块可供用户根据实际需要灵活地选择

使用。

2.2编程能力强、简洁易学

SAS语言是SAS系统的基础,是用户与系统对话的工具。该语言的特点是用户不必告诉SAS“怎样做”,只需告诉它你要“做什么”就行了。如上例中用简单的几个语言告诉SAS 你将对数据集A中的数据建立y与x1至x10的多元线性回归模型。

2.3处理与分析任意组合

SAS程序的结构由两个基本步骤任意组合而成。DA TA步用于对数据的加工处理;PROC 步用于分析数据和编写报告。

2.4适用性强、应用面广

SAS系统适用于初学者或有经验的用户;能满足从事行政、管理、分析、编辑等部门人员对信息需求的用户。SAS系统可用来解决自然科学和社会科学各个领域的各种问题。3. SAS系统的启动

启动Window98(2000)之后,可直接单击开始菜单“程序”项,将光标移到“The SAS System 程序项处,再在屏幕上显示的子菜单中选择并双击“The SAS System for Windows V6.12或(V8.2)”,即可启动SAS软件。

4. SAS 9.0界面简介

图 1.1 SAS 8.2 AWS主窗口界面

4.1 显示管理系统的三个主要窗口

SAS软件启动后在屏幕上出现的是显示管理系统(display manager),有三个主要窗口。

其中编辑(PGM)和日志(LOG)两个窗口在启动后可直接看到,若在屏幕左上角的命令框中键入OUTPUT命令,则屏幕上会显示出输出(OUTPUT)窗口。

1.编辑PGM(Editor):程序编辑窗口,其主要功能是输入SAS程序和数据。

2.日志LOG:运行记载窗口,其主要功能是显示执行程序过程中的有关信息。

3.输出OUTPUT:结果输出窗口,其主要功能是显示程序执行结果。

4.2 SAS A WS窗口主菜单简介

SAS AWS窗口中第二行主菜单有八条。但各主菜单及其子菜单的内容会随光标所在的窗口不同而异。以下仅以光标在PGM窗口时对各主菜单的内容作一简介。

1.文件管理菜单,可实现文件的保存、输出、转换等功能。

2.文本编辑窗口,可实现文本的复制、查找字符串等功能。

3.查看菜单:窗口属性菜单,可调用或击活一些常用窗口。

4.工具菜单:各种编辑菜单,右击活多种编辑器。

5.运行菜单: 命令程序运行

6.解决方案菜单:实施一般SAS操作的菜单。

7.窗口菜单:控制窗口菜单。

8.帮助菜单:SAS的求助菜单。

5. 三个非编程视窗简介

5.1 SAS/ASSIST视窗

在SAS画面上,单击解决方案菜单(Soultions)菜单弹出一个下拉菜单,选中ASSIST,便可进入SAS/ASSIST视窗。也可在SAS A WS窗口的命令盒内键入ASSIST,单击左端对钩框或按回车键均可进入SAS/ASSIST视窗。

图1.2 SAS/ASSIST的Primary Menu视窗

在SAS/ASSIST的Primary Menu视窗中有12个图标作为子窗口入口处,其基本功能如下:

1.Tutorial:指导菜单(原理、指南、设置功能按键等)

2.Data Mgmt:数据管理(编辑或浏览数据、输入和输出数据、创建数据集等)

3.Report Writing:报表书写

4.Graphics:各种图形

5.Data Analysis:数据分析

6.Planning Tools:规划工具

7.EIS:高级管理人员信息系统

8.Remote Connect:远程连接,提供信息交流功能

9.Results:结果管理

10.Setup:设置

11.Index:索引

12.Exit:退出SAS/ASSIST,返回SAS主画面

5.2 SAS/INSIGHT视窗

在SAS画面上单击解决方案菜单(Soultions)菜单,弹出一个下拉菜单,选中Analysis 中的Interactive Data Analysis,便可进入SAS/INSIGHT视窗。也可在SAS A WS窗口的命令盒内键入INSIGHT,单击左端对钩框或按回车键均可进入SAS/INSIGHT视窗。SAS/INSIGHT视窗中File、Edit、Analyze、Tables、Graphs、Curves、Help主菜单分别具有相应的内容

图1.3 SAS/ INSIGHT视窗

5.3 SAS/LAB视窗

SAS/LAB视窗提供导入式的统计分析工具,为需做统计分析而又不十分了解统计学知识的人员进行统计学分析与绘制统计图的工作。

在SAS画面上单击解决方案菜单(Soultions)菜单,弹出一个下拉菜单,选中Analysis 中的Guided Data Analysis,便可进入SAS/LAB视窗。也可在SAS A WS窗口的命令盒内键入LAB,单击左端对钩框或按回车键均可进入SAS/LAB视窗。SAS/LAB视窗中File、Locals、Journal、Help主菜单分别具有相应的内容

图1.4 SAS/LAB视窗

6 SAS程序的编写

6.1SAS程序的基本结构

SAS程序由SAS数据步(DATA Step)和过程步(Proc Step)组成。数据步是用DA TA 语句开始的一组SAS语句,其作用为输入数据并建立SAS数据集。SAS数据集的后缀名一律为‘.sd2’,并不出现在程序中。SAS系统只能分析SAS数据集的数据。SAS数据步中的input和cards语句是数据步中的专用语句。其中input语句用来生成变量,cards语句用来指明数据输入的开始。

过程步是用PROC语句开始的一组或几组SAS语句,其作用是激活SAS程序对已形成的SAS数据集通过过程步中的语句进行统计分析、打印等处理。

SAS程序中的字符串或数字之间均以空格隔开,并以‘;’结束一物理行。以下是一个简单的SAS程序。

DATA case;

INPUT x y z ;

CARDS ;

10 15 11

13 18 19

16 24 20

;

PROC means;

VAR x y z ;

RUN;

SAS 系统 08:49 Sunday, October 3, 1999 1

MEANS 过程

变量 N 均值标准偏差最小值最大值

-------------------------------------------------------------------------

x 3 13.0000000 3.0000000 10.0000000 16.0000000

y 3 19.0000000 4.5825757 15.0000000 24.0000000

z 3 16.6666667 4.9328829 11.0000000 20.0000000

-------------------------------------------------------------------------以上从‘DA TA’到独占一行的分号的‘;’结束,为SAS数据步;从‘PROC’到‘RUN’结束,为SAS过程步。CASE为产生临时SAS数据集的名字,‘INPUT’语句产生3个变量名,即X、Y和Z;‘CARDS’表明其后是X、Y和Z的具体取值,‘PROC’为SAS过程步的开始,其后的MEANS是希望计算X、Y和Z三变量的平均数。‘V AR’语句指明对变量X、Y和Z进行分析。‘RUN’语句表明SAS过程步的结束。

SAS语句书写格式有很大的宽容度,可从一行的任意位置开始,同行可写几个语句,同语句也可写成几行,每条语句均以分号“;”结束,即各语句间必须以分号“;”隔开。字母可大写,或小写,或大、小混合用。

也可以在原始变量的基础上产生新变量,例如要计算三个变量的和(m)及其平均值(n)的平均值、标准差等则有:

DATA case;

INPUT x y z ;m=(x+y+z);n=(x+y+z)/3;

CARDS ;

10 15 11

13 18 19

16 24 20

;

PROC means;

VAR m n;

RUN;

SAS 系统 07:53 Sunday, February 11, 2001 1

MEANS 过程

变量 N 均值标准偏差最小值最大值

-------------------------------------------------------------------------

m 3 48.6666667 12.0554275 36.0000000 60.0000000

n 3 16.2222222 4.0184758 12.0000000 20.0000000

-------------------------------------------------------------------------

在SAS8.0以后的高级版本中,不同的语句的颜色是不一样的,其中的数据一定是黄色。

6.2.在SAS系统的PGM(编辑器)窗口中创建SAS数据集

除在SAS系统的PGM(编辑器)窗口中创建SAS数据集外,也可以由外部数据文件转换为SAS数据集和创建永久SAS数据集(参考教材)。

在SAS系统的PGM(编辑器)窗口中直接将input和cards语句与数据创建成数据集。当数据较少时,用这种方法创建SAS数据集是较好的。现将表1.1两水稻品种的产量结构资料创建SAS数据集,取名li,数据集如下:

表1.1 两水稻品种的产量结构表

品种每亩穗数(万)

X1

每穗粒数(粒)

X2

千粒重(g)

X3

产量(kg)

Y

A 20.5 102 26.2 547.8

A 21.0 98 26.4 543.3

A 20.3 110 26.1 582.8

A 20.6 104 26.0 557.0

A 20.8 102 26.0 551.6

B 26.7 82 25.2 551.7

B 27.0 80 25.3 546.5

B 26.8 85 25.0 569.5

B 26.4 86 25.0 567.6

INPUT name $ X1 X2 X3 Y;

CARDS;

A 20.5 102 26.2 547.8

A 21.0 98 26.4 543.3

A 20.3 110 26.1 582.8

A 20.6 104 26.0 557.0

A 20.8 102 26.0 551.6

B 26.7 82 25.2 551.7

B 27.0 80 25.3 546.5

B 26.8 85 25.0 569.5

B 26.4 86 25.0 567.6

B 26.5 85 25.0 563.1

第一句DA TA trial;要求创建一个名为li.sd2的SAS数据集(.sd2为扩展名),数据集将被放在当前目录\SASWORK中.。

第二句INPUT name $X1 X2X3Y;要求创建的SAS数据集中生成name、X1、、、X2、X3和Y五个变量,name变量后的‘$’表示该变量为字符型变量。

第三句CARDS ;表明数据行的开始,下面即为输入数据,数据之间用一个或几个空格分开,至分号‘;’为结束,其分号必须另起一行单独写,表明数据行的结束,不能写在最后一行数据的后面。

6.3 SAS过程步

用户一旦创建了SAS数据集,即可使用SAS系统提供的SAS过程进行各种分析和处理,并打印计算结果。

SAS过程是以PROC语句为开头的一组或几组SAS语句。每一个过程语句实际上是一个已经编好的一组程序名,执行该语句即执行了这一组程序。当用户要处理不同类型的问题时,需编制不同的过程步,而过程步中的各语句具其特定的含义。

现将用已创建的SAS数据集(表1两水稻品种的产量结构资料)来编制SAS过程步,切换到SAS系统的PGM窗口中直接编写。

DATA li;

INPUT name $ X1 X2 X3 Y;

CARDS;

A 20.5 102 26.2 547.8

A 21.0 98 26.4 543.3

A 20.3 110 26.1 582.8

A 20.6 104 26.0 557.0

A 20.8 102 26.0 551.6

B 26.7 82 25.2 551.7

B 27.0 80 25.3 546.5

B 26.8 85 25.0 569.5

B 26.4 86 25.0 567.6

B 26.5 85 25.0 563.1

;

PROC means;

RUN;

以上PROC means;语句为指定计算基本统计数,包括平均数、标准差、最小值和最大值。RUN;语句为指出过程步结束。

将上述程序提交给SAS分析处理(按显示管理系统屏幕右上方的跑步小人),运行结果后在OUTPUT窗口显示如下结果(8.2英文版运行的结果):

The SAS System

The MEANS Procedure

Variable N Mean Std Dev Minimum Maximum

X1 10 23.6600000 3.1924216 20.3000000 27.0000000

X2 10 93.4000000 10.8648260 80.0000000 110.0000000

X3 10 25.6200000 0.5672546 25.0000000 26.4000000

Y 10 558.0900000 12.4695585 543.3000000 582.8000000

(加by name;可以计算各品种的统计数,下面为在9.0中文版运行的结果)

DATA li;

INPUT name $ X1 X2 X3 Y;

CARDS;

A 20.5 102 26.2 547.8

A 21.0 98 26.4 543.3

A 20.3 110 26.1 582.8

A 20.6 104 26.0 557.0

A 20.8 102 26.0 551.6

B 26.7 82 25.2 551.7

B 27.0 80 25.3 546.5

B 26.8 85 25.0 569.5

B 26.4 86 25.0 567.6

B 26.5 85 25.0 563.1

;

PROC means; by name;

RUN;

SAS 系统 21:24 Wednesday, April 28, 1999 1

name=A MEANS 过程

变量 N 均值标准偏差最小值最大值

X1 5 20.6400000 0.2701851 20.3000000 21.0000000 X2 5 103.2000000 4.3817805 98.0000000 110.0000000 X3 5 26.1400000 0.1673320 26.0000000 26.4000000 Y 5 556.5000000 15.5393050 543.3000000 582.8000000 name=B

变量 N 均值标准偏差最小值最大值

X1 5 26.6800000 0.2387467 26.4000000 27.0000000 X2 5 83.6000000 2.5099801 80.0000000 86.0000000 X3 5 25.1000000 0.1414214 25.0000000 25.3000000 Y 5 559.6800000 10.1025739 546.5000000 569.5000000

6.4常用的SAS过程

常用的过程语句如下:

三.实验操作练习实验报告:

根据以上实验主要内容上机操作训练,熟悉SAS系统的启动方法,掌握常用的显示管理系统命令及其功能,能较熟练地使用系统命令或使用下拉菜单的方法进行操作。了解SAS 程序的基本结构,掌握对数据步提供的数据,利用适当的过程语句编写过程步,建立用户与SAS系统之间的联系,为完成对试验资料的统计分析工作奠定基础。

1.显示管理系统的三个主要窗口是什么?它们分别有那些主要功能?

2. SAS程序的基本结构由那两部分组成?其作用分别是什么?

3.根据表1.1两水稻品种的产量结构资料,按每亩穗粒数性状在编辑器窗口建一个SAS数据集,在过程步中利用PROC means; by name;;RUN;分别计算两个品种三个变量的平均数等基本数量特征。(程序和结果都要写在实验报告上)。

相关主题
相关文档
最新文档