SAS 测试题

SAS 测试题
SAS 测试题

《数据分析与SAS》能力测试

测试编号20130119001

以下各题都有一个最佳答案,请做出选择并填写答题卡,不答或答错均不得分

1 一个完整的SAS程序通常包括________和________。

A 数据步——函数部

B 数据步——过程步

C 定义步——函数步

D 定义步——过程步

2 在SAS中建立逻辑库实质上是建立逻辑名和________的对应关系

A 磁盘上的目录

B 磁盘上的数据文件

C SAS数据集

D Excel文件

3 与CARDS语句等价的是________语句

A DATA

B END

C FORMAT

D DATALINES

4 在SAS中,如果不经________语句特别设置,字符串变量的缺省长度最大为________

A LENGTH 16

B VAR 8

C LENGTH 8

D DEFIN

E 16

5 解读下语句的意义

INPUT (name score1-score5) ($10. 5*4.);

是_________

A 变量name长度为10,score1到score5这五个变量长度为4

B 变量name长度为10,score1到score5这五个变量长度为5

C 所有变量长度均为10,初值为20

D 所有变量长度均为20,初值为10

6 以下小程序的运行后,数据集ONE里的数据是:有变量A的两行观测值,分别是________和________ DATA ONE;

INPUT @'size=' A $3.;

DATALINES;

Li Li F19size=343454

Wang Da Zhi M 20size=123456

PROC PRINT;

RUN;

A Li Wang

B siz siz

C =34 =12

D 343 123

7 SAS在读取外部文件数据时,用________指出要读的文件名和物理路径

A INFILE

B INPUT

C OUTPUT

D FILE

8 以下INPUT语句说明每个观测值包含________个数据行

INPUT a / b #3 @52 c #2;

A 1

B 2

C 3

D 无法确定

9 对于格式修饰符“&”,当它引导读取某个变量时,下面的________不是结束读取的条件

A 遇到连续的两个空格

B 输入行结束

C 达到该变量的定义长度

D 遇到@

【10-13题根据以下程序】

data a;

z=0;

input x @@;

retain y 8;

s+x;

y=y+x;

z=z+x;

cards;

2 2

3 3

4 4

5 12 23 12 29 35

;

proc print;

run;

10 上述程序运行完毕后,产生________个观测行

A 1

B 8

C 9

D 不能确定

11 上述程序运行完毕后,在最后一个观测行,z的值是________

A 35

B 223

C 215

D 以上答案均不对

12 上述程序运行完毕后,在最后一个观测行,s的值是________

A 35

B 223

C 215

D 以上答案均不对

13 上述程序运行完毕后,在最后一个观测行,y的值是________

A 35

B 223

C 215

D 以上答案均不对

14 在SORT过程中,使用________语句指出排序变量

A by

B class

C var

D with

15 TABULATE过程产生以下输出图表

可以推断,相关的TABLE语句是________

A table a,b*c

B table a b*c

C table a*b*c

D table a b c

16 不符合正态分布的样本,适合使用________作假设检验

A t检验

B F检验

C 秩统计量检验

D u检验

17 在SAS中使用________过程可以完成Wilcoxon秩和检验

A NPAR1WAY

B TTEST

C MEANS

D UNIVARIATE

18 典型相关分析是通过把两组变量各自通过线性组合产生典型变量,使到这对典型变量之间具有________

A 最大的置信水平值

B 最小的相关系数值

C 最大的相关系数值D最小的置信水平值

19 在CANCORR过程中,要进行分析的两组变量分别通过_______和________语句指出

A var with

B var by

C by with

D var class

20 利用REG过程进行回归模型计算,下面model语句中的________是正确的模型写法

A model y~x

B model y=x1+x2

C model y=x-0

D model y=x1 x2

【21-22题基于下图】在回归分析的结果中,经常可以见到对回归系数的t检验,例如

21 如果在上图中,关于Intercept的Pr值大于0.05的阈值,则暗示我们________

A 应该采用logistic回归而不是线性回归

B 采用过原点的线性回归模型

C 根本不能使用回归模型

D 选取的变量有问题,应考虑剔除某些变量

22 变量age系数的Pr值为0.032,这项检验的假设是________

A 变量age的系数为0

B 变量age的系数不为0

C 变量age的数据呈指数分布

D 变量age和因变量的相关系数为0

23 使用STEPWISE过程进行多元回归的变量自动选择,缺省使用________

A 前进法选择自变量

B 后退法剔除自变量

C 逐步回归法双向筛选自变量

D 没有缺省值,必须手工指定

24 某过程运行部分结果信息如下

这个过程是________

A LOGISTIC

B LOGIT

C NLIN

D NPAR1WAY

25 通常在很多过程中都可以使用BY或CLASS语句来指定分组变量产生分组,这两个语句的区别是________

A BY要求数据事先排好序,CLASS则不要求

B CLASS要求数据事先排好序,BY则不要求

C BY只对离散型变量有效,而CLASS则对所有变量均有效

D 没有区别

26 单因素方差分析的前提是样本呈________

A 均匀分布

B 泊松分布

C 两点分布

D 正态分布

【27-29题基于以下使用ANOVA过程进行方差分析的结果截图】

27 以上分析结果显示,此为________因素方差分析

A 单

B 双

C 三

D 四

28 分析结果表明,在因素________的各水平有显著差异

A a

B b

C c

D d

29 SNK Grouping列显示________

A 特定因素各水平的差异情况,同一组的水平间差异不显著,不同组的水平间差异显著

B 特定因素各水平的差异情况,同一组的水平间差异显著,不同组的水平间差异不显著

C 特定因素的水平数

D 特定水平的因素数

30 在使用DISCRIM过程进行判别分析的输出结果中(下图)

最下面的四个F检验用于检查________

A 学习集的分组是否具有显著的差异性

B 测试集的分组是否具有显著的差异性

C 学习集是否符合正态分布

D 测试集是否符合正态分布

31 STEPDISC过程的用途是________

A 在多元线性回归中进行变量选择

B 在多元非线性回归中进行变量选择

C 在聚类分析中进行变量选择

D 在判别分析中进行变量选择

32 下列程序段

PROC DISCRIM DATA=ep.out TESTDATA=test TESTOUT=out2;

VAR water indole;

CLASS illness;

表明,要读入的测试集是________

A ep.out

B test

C out2

D illness

33 ________过程支持使用凝聚的层次聚类法(系统聚类法)进行聚类

A STEPWISE

B FASTCLUS

C ANOVA

D CLUSTER

34 在系统聚类分析结果的解读中,________指标值不能用于决定分类的个数

A PSF

B PST2

C CCC

D FREQ

35 在CLUSTER过程中,可以用________选项指定计算类间距离的方法

A VAR

B ID

C METHO

D D FREQ

常用工具软件试题部分答案

0831班《常用工具软件》期末考试试题 学号:姓名: 一、单项选择题(1分×15,共15分) 1、关于获取一些常用工具软件的途径不合法的是(D) A免费赠送B盗版光盘C购买D共享软件 2、当你的计算机感染病毒时,应该(C) A立即更换新的硬盘B立即更换新的内存储器C立即进行病毒的查杀D立即关闭电源 3、下列哪些工具软件不能用来查杀病毒的是(D) A金山毒霸B KV3000 C瑞星杀毒D完美卸载 4、利用EasyRecovery Pro不可以修复的是(A) A磁盘诊断B文件恢复C邮件修复D分区修复 5、任何文件的保存都必须提供的三要素是(B) A主文件名、保存位置、文件长度B主文件名、保存位置、保存类型 C保存时间、主文件名、保存类型D保存时间、主文件名、保存位置 6、360杀毒系统升级的目的是(B ) A.重新安装B更新病毒库C.查杀病毒D.卸载软件 7、利用优化大师不能清理的是(C ) A ActiveX B注册表C 系统日志D 冗余DLL 8、优化大师不可以使用设置向导优化的是(B ) A磁盘缓存B系统安全C文件系统D网络系统 9、下列哪个应用程序不能用来优化系统( A) 1

A.Ghost B.超级兔子 C. Wopti D.恶意软件清理 10、下列属于恢复系统镜像的是(C ) A.PartitionMagic B. Registry Medic 11、杀毒软件可以查杀(C) A任何病毒B任何未知病毒C已知病毒和部分未知病毒D只有恶意的病毒12、使用360杀毒防护级别设置,可以通过(D )来设置。 A白名单设置B常规设置C 病毒扫描设置D实时防护设置 13、开列哪种文件格式是不能染病毒(C ) A .COMB.DOCC. WA V D.EXE 14、下列不属于360杀毒的优点的是(C ) A.免费软件 B.扫描速度快 C.识别率高 D.占用资源少 15、使用防火墙软件可以将(A )降到最低 A.黑客攻击 B.木马感染 C.广告弹出 D.恶意卸载 二、填空题(0.5分×50,共25分) 1、主流磁盘主要包括_ATA___、__SATA_、_SCSI_和_SAS_四种技术规格。 2、常见的文件系统有__FAT/FAT32__、_NTFS__和___UDF_。 计算机病毒的主要特征有_传播性、隐蔽性、感染性、潜伏性、可激发性、表现性和破坏性。 3、计算机病毒按其产生的后果可分为良性后果__和_恶性后果_;按其寄生方式可分为_文件型__和_引导性__。 4、360杀毒的功能列表窗口包含了_______________、______________和_____________三个部分。 5、优化大师优化项目有_磁盘优化__、__桌面菜单__、__文件系统__、__网络

SAS上机练习题(全部,含参考答案)

重庆医科大学--卫生统计学统计软件包 SAS上机练习题(一) 1、SAS常用的窗口有哪三个?请在三个基本窗口之间切换并记住这些命令或功能键。 2、请在PGM窗口中输入如下几行程序,提交系统执行,并查看OUTPUT窗和LOG窗中内容,注意不同颜色的含义;并根据日志窗中的信息修改完善程序。 3、将第2题的程序、结果及日志保存到磁盘。 4、试根据如下例1的程序完成后面的问题: 表1 某班16名学生3门功课成绩表如下 问题: 1)建立数据集; 2)打印至少有1门功课不及格同学的信息;(提示,使用if语句) 参考程序: data a; input id sh wl bl; cards; 083 68 71 65 084 74 61 68

085 73 75 46 086 79 80 79 087 75 71 68 084 85 85 87 085 78 79 75 086 80 76 79 087 85 80 82 088 77 71 75 089 67 73 71 080 75 81 70 118 70 54 75 083 70 66 84 084 62 73 65 099 82 70 79 ; run; data b; set a; if sh<60 or wl<60 or bl<60then output; run; proc print data=b; var id sh wl bl;

run; 5、根据下列数据建立数据集 表2 销售数据 开始时间终止时间费用 2005/04/28 25MAY2009 $123,345,000 2005 09 18 05OCT2009 $33,234,500 2007/08/12 22SEP2009 $345,600 20040508 30JUN2009 $432,334,500 提示:(格式化输入;数据之间以空格分隔,数据对齐;注意格式后面的长度应以前一个位置结束开始计算,如果读入错误,可试着调整格式的宽度;显示日期需要使用输出格式) 开始时间,输入格式yymmdd10. 终止时间,输入格式date10. 费用,输入格式dollar12. 参考程序: data a; input x1 yymmdd10. x2 date10. x3 dollar13.; cards; 2005/04/28 25MAY2009 $123,345,000 2005 09 18 05OCT2009 $33,234,500 2007/08/12 22SEP2009 $345,600

网络存储试题及答案..

1、下列典型行业应用对存储的需求,正确的是( C ) A.WEB应用不包括对数据库的访问 B.WEB应用是大数据块的读取居多 C.邮件系统的数据特点介于数据库和普通文件二者之间,邮件用户等信息属于数据库操作,但是每个用户的邮件又是按照文件组织的 D.视频点播系统要求比较高的IOPS,但对存储带宽的稳定性要求不高 2、对于存储系统性能调优说法正确的是:( C ) A. 必须在线业务下进行调优 B. 存储系统的调优可以与主机单独进行,应为两者性能互不影响 C. 存储系统的性能调优属于系统性调优,需要了解客户IO模型、业务大小、服务器资 源利用和存储侧资源利用综合分析,对于存储侧重点关注RAID级别,分条深度, LUN映射给主机的分布情况等 D. 以上都不正确 3、不具备扩展性的存储架构有( A ) A. DAS B. NAS C. SAN D. IP SAN 4、DAS代表的意思是( D )direct access s A. 两个异步的存储 B. 数据归档软件 C. 连接一个可选的存储 D. 直连存储 5、哪种应用更适合采用大缓存块?( A ) A. 视频流媒体 B. 数据库 C. 文件系统 D. 数据仓库 6、衡量一个系统可靠性常见时间指标有哪些?( CD ) A. 可靠度 B. 有效率 C. 平均失效时间 D. 平均无故障时间 7、主机访问存储的主要模式包括( ABC ) A. NAS B. SAN C. DAS D. NFS 8、群集技术适用于以下场合:( ABCD ) A. 大规模计算如基因数据的分析、气象预报、石油勘探需要极高的计算性 B. 应用规模的发展使单个服务器难以承担负载 C. 不断增长的需求需要硬件有灵活的可扩展性 D. 关键性的业务需要可靠的容错机制 9、常见数据访问的级别有( AD ) A.文件级(file level) B.异构级(NFS level) C.通用级(UFS level) D.块级(block level) 10、常用的存储设备介质包括( ABC ) A. 硬盘 B. 磁带 C. 光盘 D. 软盘 11、常用的存储设备包括( ABCD) A. 磁盘阵列 B. 磁带机 C. 磁带库 D. 虚拟磁带库 12、存储网络的类别包括( ABC ) A. DAS B. NAS C. SAN D. Ethernet 13、常用数据备份方式包括( ACD ) A. D2D B. D2T2D C. D2D2T D. D2T 14、为了解决同位(为)检查码技术的缺陷而产生的一种内存纠错技术是( D ) A. Chipkill B. 热插拔 C. S.M.A.R.T D. Advanced ECC Memory 15、以下不是智能网卡的主要特点是( D ) A. 节能降耗 B. 降低TCO C. 数据更安全 D. 可作为主机总线适配器HBA使用

SAS base 考试必备 70真题(附答案)

1.The following SAS program is submitted: data WORK.TOTAL; set WORK.SALARY; by Department Gender; if First.<_insert_code_> then Payroll=0; Payroll+Wagerate; if Last.<_insert_code_>; run; The SAS data set WORK.SALARY is currently ordered by Gender within Department. Which inserted code will accumulate subtotals for each Gender within Department? A. Gender B. Department C. Gender Department D. Department Gender Answer: A ------------------------------------- 2.Given the following raw data records in TEXTFILE.TXT: ----|----10---|----20---|----30 John,FEB,13,25,14,27,Final John,MAR,26,17,29,11,23,Current Tina,FEB,15,18,12,13,Final Tina,MAR,29,14,19,27,20,Current The following output is desired: Obs Name Month Status Week1 Week2 Week3 Week4 Week5 1 John FEB Final $13 $25 $14 $27 . 2 John MAR Current $26 $17 $29 $11 $23 3 Tina FEB Final $15 $18 $12 $13 . 4 Tina MAR Current $29 $14 $19 $27 $20 Which SAS program correctly produces the desired output? A. data WORK.NUMBERS; length Name $ 4 Month $ 3 Status $ 7; infile 'TEXTFILE.TXT' dsd;

SAS练习题及程序答案

1.随机取组有无重复试验的两种本题是无重复 DATA PGM15G; DO A=1TO4; /*A为窝别*/ DO B=1TO3; /*B为雌激素剂量*/ INPUT X @@; /*X为子宫重量*/ OUTPUT; END; END; CARDS; 106 116 145 42 68 115 70 111 133 42 63 87 ; RUN; ods html; /*将结果输出成网页格式,SAS9.0以后版本可用*/ PROC GLM DATA=PGM15G; CLASS A B; MODEL X=A B / SS3; MEANS A B; /*给出因素A、B各水平下的均值和标准差*/ MEANS B / SNK; /*对因素B(即剂量)各水平下的均值进行两两比较*/ RUN; ODS HTML CLOSE; 2.2*3析因设计两因素完全随机统计方法 2*3析因设计 tiff =f的开方DATA aaa; DO zs=125,200; DO repeat=1TO2; /*每种试验条件下有2次独立重复试验*/ do js=0.015,0.030,0.045; INPUT cl @@; OUTPUT; END; END; END; CARDS; 2.70 2.45 2.60 2.78 2.49 2.72 2.83 2.85 2.86 2.86 2.80 2.87 ; run;

PROC GLM; CLASS zs js; MODEL cl=zs js zs*js / SS3; MEANS zs*js; LSMEANS zs*js / TDIFF PDIFF; /*对 zs和js各水平组合而成的试验条件进行均数进行两两比较*/ RUN; ODS HTML CLOSE; 练习一:2*2横断面研究列链表方法:卡方矫正卡方 FISHER DATA PGM19A; DO A=1TO2; DO B=1TO2; INPUT F @@; OUTPUT; END; END; CARDS; 2 26 8 21 ; run; PROC FREQ; WEIGHT F; TABLES A*B / CHISQ; RUN; 样本大小 = 57 练习二:对裂列连表结果变量换和不换三部曲 1横断面研究 P《0.05 R DATA PGM19B; DO A=1TO2; DO B=1TO2; INPUT F @@; OUTPUT; END; END; CARDS; 40 3414 1 19252 ; run; ods html;

sas 试题

综合练习二 表1 钢材消费量和国民收入的统计数据。 编号国民收入 (亿万)钢材消费 量(万 吨) 编号国民收入 (亿万) 钢材消费 量(万 吨) 1910549915551025 28514291019171316 39425381120511539 410976981221111561 512849721322861785 615029881423111762 713948071520031960 813037381624351902 将国民收入数据作如下的变换:国民收入+你学号的后1位,例如,你 学号的后1位为2,则编号为1的观测值:国民收入=910+2=912,其余编号的 观测值依此类推,钢材消耗量数据不变。 一、数据集的建立 1.若用NO代表编号,X代表国民收入,Y代表钢材消费量。在D盘根目录 下建立一个名为aa的逻辑库,在数据集aa中建立TEST数据集,将下面的 程序完善: LIBNAME AA ‘ _____’; DATA ___ ____; INPUT no x _____; x= ____ _____; CARDS; 1 910 549 2 851 429 3 942 5 128 4 972 6 1502 988 7 1394 807 9 155 5 1025 10 1917 131 6 11 2051 1539 13 2286 1785 14 2311 1762 15 2003 1960 ; _____;

二、基本统计分析 1. “国民收入”数据的均值为____________,标准差为_____________,中位数为 ____ ,极差为 ____ ,该数据的分布为 (正态/非正态)。 2. “钢材消费量”数据的变异系数为________, “钢材消费 量”数据中有75%的值小于 ____ ,该数据的分布为 (正态/非正态)。 三、相关分析和回归分析 1.用SAS对数据集test中的变量进行相关分析,得到变量X与y的相关系数为: ________ ,检验概率为:________ ,你的结论是:两变量的相关关系为: ________。 2.设Y为因变量,X为自变量,作线性回归分析,回归方程中截距为: ________,截距的检验概率为:________ ,因此,截距项________(应该/不应该)保留。 3.最终得到的回归方程为:________________

SAS认证考试(官方练习题集和校正答案)

1. A raw data file is listed below. The following program is submitted using this file as input: data work.family; infile 'file- specification'; run; Which INPUT statement correctly reads the values for the variable Birthdate as SAS date values? a.input relation $ first_name $ birthdate date9.; b.input relation $ first_name $ birthdate mmddyy8.; c.input relation $ first_name $ birthdate : date9.; d.input relation $ first_name $ birthdate : mmddyy8.; Correct answer: d An informat is used to translate the calendar date to a SAS date value. The date values are in the form of two-digit values for month-day-year, so the MMDDYY8. informat must be used. When using an informat with list input, the colon-format modifier is required to correctly associate the informat with the

SAS统计软件试题

SAS统计软件试题2008 一、SAS的逻辑库可分为永久库和临时库两种,请编写一段程序直接建立临时库中的下例 数据集,并按升序排序。(10分) 数据名tong:20 13 20 16 23 19 19 16 答:data tong; input x@@; cards; 20 13 20 16 23 19 19 16 ; proc sort; by descending x; run; 二、请编写一段程序把数据2并列合并到数据1之后。(20分) 数据1: LiuWei M 21 175 65 A ZhouLan F 20 160 46 O DengXue F 22 158 45 B ZhuJun M 23 177 68 O HuangXiaoming M 19 173 65 O 数据2: ChenQiong F 19 155 45 A ZhaoFeng M 22 179 66 B ZhangBin M 22 173 64 O WeiLin F 20 162 46 A ShiQiang M 21 180 70 B 答:data shuju1; input name $ sex $ age hight weight type $; cards; LiuWei M 21 175 65 A ZhouLan F 20 160 46 O DengXue F 22 158 45 B ZhuJun M 23 177 68 O HuangXiaoming M 19 173 65 O ; data shuju2; input name $ sex $ age hight weight type $; cards; ChenQiong F 19 155 45 A

SAS试卷模板及解答

统计分析系统SAS试卷及解析 班级:学号姓名 一、数据集的建立(20分) 在D盘创建一个以你的学号为名的文件夹,将分析上述数据的数据集以你姓名的汉语拼音为名存入你的文件夹。 二、正态性检验(20分,每空2分) 对上述数据,用INSIGHT软件进行正态性检验。 1.从SAS主窗口进入INSIGHT软件环境,依次应选择的菜单是: Solutions/Analysis/Interactive Data Analysis。 2.在INSIGHT主窗口中,选择作正态性检验,依次应选择的菜单是: Analyze/Distribution(Y) 。 3.对“每人月平均销售额”数据进行正态性检验,得到的Shapiro-Wilk检验统计量的P值为 0.7022 ,标准差为 2211.0832 ,极差为 7000 ,该数据的分布为正态(正态/非正态)。 4.对“利润”数据进行正态性检验,得到中位数为 11.35,变异系数为46.3469 ,“利润”数据中有25%的值小于 6.6,利润数据的分布为正态(正态/非正态)。 三、绘图(20分,每空4分)

在分析家中绘制上述图,相关的选项为:Point symbol: SQUARE,Connect lines: connect points with straight lines, line style: Solid, Number of minor horizontal tick marks: 1, Number of minor vertical tick marks: 0。 解析:①依次点击菜单”Solutions/Analysis/Analyst”进入分析家环境;②在分析家中打开数据集;③依次点击菜单”Graphs/Scatter Plots/ 2 dimensions”,在系统弹出的对话框中, 作如下设置:

2015年SAS初赛测试卷

Sas数据分析大赛试题 1、Data步、宏和绘图 [背景介绍] 以下是某公司销售信息,全部数据如下: [题目要求] 1)使用Data步计算两个新变量,dif1是当年销售额和上一年销售额的差值,dif2是当年利润和上一年利润的差值。使用数组与DO循环完成这个操作,分别计算不会得分。只计算东部地区 2)编写宏%report(type= ,var=)完成如下功能: a.type有两个取值,分别是year和market,当type=year时则需要做反映时间序列的图,作线形图,当type=market时,做反映地区比较的图,作条形图,。 b.var有两个取值,分别是sale和profit,以输入的变量为指标作图。

2、PROC SQL过程和转置试题 [背景介绍] 该数据取自银行系统的贷款表和交易流水表,字段说明如下:贷款表(Loans): 每条记录代表某个账户的上的一条贷款信息,条数:682 交易表(Trans): 每条记录代表每个账户上的一条交易,条数:1056320

两张表的连接关系如下: [题目要求] 根据上文提供的材料,获取每个贷款账号贷款发放前的帐户余额(即贷款前最后一次交易的帐户余额),如果贷款前最后有交易的一天有多笔交易,则取帐户余额的均值。表的效果如下: 使用一条SQL语句得到完全一致的结果和展示效果,需要给变量加标签。 说明: 1)展现的变量分别是loan_id(来自贷款loan表的loan_id),date(来自贷款loan 表的date),tran_date(来自交易trans表的date),amount(来自贷款loan表的amount),avg_balance(来自交易trans表的balance); 2)每笔贷款有一条记录,没有贷款则没有记录 3)使用到了Proc SQL步的表的横向连接、汇总函数和非关联子查询。

金融数据库——SAS数据处理应用题

SAS数据处理应用题_2005 以下练习题选自《SAS数据处理综合练习》,解决这些题目原则上需要学完《SAS编程技术与金融数据》前18章内容。 1. 创建一包含10000个变量(X1-X10000),100个观测值的SAS数据集。分别用DATA 步,DA TA步数组语句和IML过程实现。 2. 创建包含日期变量DA TE的SAS数据集,日期值从1900年1月1日到2000年1月1日。 3. 多种方法创建包含变量X的10000个观测值的SAS数据集。 4. 利用随机数函数RANUNI对某数据集设计返回抽样方案? 5. 利用随机数函数RANUNI对某数据集设计不返回抽样方案? 6. 数据集A中日期变量DATE包含有缺失值,创建包含日期变量DATE的数据集B,并填充开始到结束日之间的所有日期值。 7. 创建组标识变量GROUP,将数据集A中的观测等分为10组,观测值不能整除10时,前余数组各多加一个观测值。 8. 数据集A有一个变量n,5个观测值1,2,3,4,5。数据A1由下面程序2产生,同样有一个变量n,5个观测值1,2,3,4,5。试分析下面两段程序中,PUT语句在Log窗口输出结果的差异,为什么? 程序1:Data a; Set a; Put n=; Run; 程序2: data a1; do n=1 to 5; output; end; put n=; run; 9. 假设数据集A中的变量logdate为如下形式的字符格式:1998-12-2 1999-8-6 1999-8-10 将其转换为日期格式变量date。 如果字符格式的数据为: 19981202 19990806

SAS上机练习题(全部_含参考问题详解)

医科大学--卫生统计学统计软件包 SAS上机练习题(一) 1、SAS常用的窗口有哪三个?请在三个基本窗口之间切换并记住这些命令或功能键。 2、请在PGM窗口中输入如下几行程序,提交系统执行,并查看OUTPUT窗和LOG窗中容,注意不同颜色的含义;并根据日志窗中的信息修改完善程序。 3、将第2题的程序、结果及日志保存到磁盘。 4、试根据如下例1的程序完成后面的问题: 表1 某班16名学生3门功课成绩表如下 问题: 1)建立数据集; 2)打印至少有1门功课不及格同学的信息;(提示,使用if语句) 参考程序: data a; input id sh wl bl; cards; 083 68 71 65 084 74 61 68 085 73 75 46 086 79 80 79 087 75 71 68 084 85 85 87 085 78 79 75 086 80 76 79

087 85 80 82 088 77 71 75 089 67 73 71 080 75 81 70 118 70 54 75 083 70 66 84 084 62 73 65 099 82 70 79 ; run; data b; set a; if sh<60 or wl<60 or bl<60then output; run; proc print data=b; var id sh wl bl; run; 5、根据下列数据建立数据集 表2 销售数据 开始时间终止时间费用 2005/04/28 25MAY2009 $123,345,000 2005 09 18 05OCT2009 $33,234,500 2007/08/12 22SEP2009 $345,600 20040508 30JUN2009 $432,334,500 提示:(格式化输入;数据之间以空格分隔,数据对齐;注意格式后面的长度应以前一个位置结束开始计算,如果读入错误,可试着调整格式的宽度;显示日期需要使用输出格式) 开始时间,输入格式yymmdd10. 终止时间,输入格式date10. 费用,输入格式dollar12. 参考程序:

SAS期末试题及答案解析

5月31日上机作业: 《统计分析系统SAS》模拟练习,结果不用上传 保险公司为了解车险投保人对保险公司工作的满意程度Y和投保人的年龄X1、事故的严重程度X2 将数据作变换:将X2与Y数据上加上你学号的后1位,如学号的最后一位数据为2,则第1位报险人的X2=51+2,Y=48+2,其余数据依此类推。 一、数据集的建立 1. 简述建立数据集时,SAS逻辑库的作用 2. 若在D盘根目录建立了一个名字为“AA”的逻辑库,,上述数据集名字为temp,在windows 环境下数据集全名为_ ,SAS环境下,数据集名字的完整表示为_ 。 二、基本统计分析 1.INSIGHT中,得到变量X2的均值为_ ,标准差为_ ,变异系数为_ _,方差为为__ 2.变量Y的的均值为_ ,标准差为_ ,变异系数为_ _,方差为为_ _。 三、正态性检验 对数据进行正态性检验,以0.1为显著性水平进行检验,得到的结果中,变量为正态分布,为非正态分布;变量Y的中位数为,数据中有25%的值小于。

四、相关分析 1.变量X1和Y的相关系数为R= ,X2和Y的相关系数R=,X3和Y的相关系数R =,X2和X3的相关系数R= 。 2. 写出用相关系数说明问题时,要注意的几点,至少写出3点。(答案供参考) 答:1)相关系数很强并不表示变量间一定有因果关系,也可能是两个变量同时受第三个变量的影响而使他们有很强的相关; 2)相关系数是说明线性联系程度的。相关系数接近于0的变量间可能存在非线性联系(可能是曲线关系); 3)有时个别极端数据可能影响相关系数; 4)强相关并不表示一定存在因果关系; 5)弱相关并不表示变量间不存在关系。 五、假设检验 1.简述假设检验的基本思想。在假设检验中,P值的含义是什么?(答案供参考) 答:首先给定一个原假设H0,H0是关于总体参数的表述,与此同时存在一个与H0相对立的备择假设H1,H0与H1有且仅有一个成立;经过一次抽样,若发生了小概率事件(通常把概率小于0.05的事件称为小概率事件),可以依据“小概率事件在一次实验中几乎不可能发生”的理由,怀疑原假设不真,作出拒绝原假设H0,接受H1的决定;反之,若小概率事件没有发生,就没有理由拒绝H0,从而应作出拒绝H1的决定。 2、将上述数据,按年龄分为两组,40岁及以下的报险人为一组,40岁以上的报险人为一组,用假设检验分析方法,分析两组不同年龄的报险人,对保险公司工作的满意度有无差别。结果显示t统计量的p值= ,说明组不同年龄的报险人,对保险公司工作的满意度是(相同/不同)的。如果对数据保留一位小数,40岁以下的报险人对保险公司工作的平均满意度为,40岁及以上的报险人对保险公司工作的平均满意度为。 六、回归分析(答案供参考)31 1.进入SAS/INSIGHT环境下,进行回归拟合,选择y为因变量,选择X1-X3为自变量,不将截距选入模型中,单击确定,在0.05的显著性水平下检验,构建模型:Y=a*X1+b*X2+c*X3,得到的回归方程为:

最新-学年度第二学期统计分析软件SAS考试试卷(A)(答案)

暨 南 大 学 考 试 试 卷 一、填空题(共10空,每空2分,共20分) 1. 一个完整的SAS 程序由二部分组成: _数据 __步与_ 过程 __步. 2. 多元统计分析中的判别分析与聚类分析的本质区别是: _类别是否已知,若已知,则为判别分析;否则为聚类分析 _. 3. 进行数值资料的描述统计描述的两个基本SAS 过程是: _MEANS _过程与__ _UNIVARIATE _过程. 4. 把多个SAS 数据集进行横向合并、纵向合并所用的语句分别是_MERGE _ 语句、__SET _语句. 5. 进行分类资料的统计分析的两个基本SAS 过程是: _ LOGISTIC __过程与_ FREQ __过程. 6. 进行数值资料的方差分析的两个基本SAS 过程是: _ ANOVA __过程与_ GLM __过程.

7. 在SAS 中,可用于进行相关分析的过程常用的有:简单线性相关及等级相关的_ CORR _过程与典型相关的_ CANCORR _过程. 8. 秩和检验的SAS 过程中最常用的有二种:一是用于配对设计数值变量资料符号秩和验的 UNIVARIATE _过程,另一是用于成组设计两样本比较及多个样本比较的秩和检验的 _ NPAR1WAY _过程. 9. GLM 过程可用于:进行(1)非均衡设计资料的 方差分析 _、(2)协方差分析及建立(3)_ 多项式 _回归. 10. 在SAS 中,可用于进行数值资料回归分析的过程常用的有:一元及多元线性回归的 REG _过程与非线性回归的_ NLIN _过程. (一) SAS 数据集E3是对20名25∽34岁的健康妇女进行体检取得的,现需要建立由头肌皮褶厚度(1X ,cm),大腿围(2X ,cm)及中臂围(3X ,cm)预测身体脂肪(Y ,cm)分布的方程. 运行SAS 某些过程,有以下SAS 运行结果: The REG Procedure Model: M1 Dependent Variable: y Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 3 396.98461 132.32820 21.52 <.0001

2014年SAS考试试题(B卷)

广西科技大学2013 —2014学年第2学期课程考核试题 考核课程统计软件2(SAS)(B卷)考核班级统计111、112、113班学生数114 印数120 考核方式开卷考核时间120 分钟 本试卷共五道大题,每题20分,满分为100分。答案必须填写到答题纸上,写在其它地方无效。 一、在文本文件faculty.txt中,有某公司的职工信息,包括职工的编号、姓名、性别、职称、年龄共5个变量。 编号姓名性别职称年龄 060101 Zhouli M P 50 060102 Liping F AP 47 060103 Wangfang F L 28 060104 Yuhong F AP 40 060201 Liulijun M L 30 060202 Leiming M AP 32 070111 Yuke F AP 48 070112 Liuling M L 37 070211 Zhulin M P 44 070212 Liqin F AP 32 070113 Wangfang F L 25 070114 Fangjin M L 26 要求:(1)建立SAS数据集exam1; (2)把这些职工按照职称,把数据集exam1拆分为三个数据集,其中exam1_P包含职称为P的职工信息,exam1_AP包含职称为AP的职工信息,exam1_L包含职称为L的职工信息。并分别计算出不同职称的员工的平均年龄。(要求:写出SAS程序) 二、某职业病防治所对30 名矿工分别测定血清铜蓝蛋白含量(μmol/L),资料如下。 疾病分期测定结果(血清铜蓝蛋白含量) 0 期8.0 10.0 5.8 6.3 5.4 8.5 5.6 6.4 5.5 7.2 5.6 I 期8.5 4.3 11.0 9.0 6.7 9.0 10.5 7.7 7.7 II 期11.3 7.0 9.5 8.5 9.6 10.8 9.0 12.6 13.9 6.5 要求:(1)根据上面的数据建立SAS 数据集exam2;

SAS认证考试样题(50题)

SAS 中文论坛网站https://www.360docs.net/doc/ab17950713.html, 1.A raw data file is listed below. 1---+----10---+----20---+--- son Frank 01/31/89 daughter June 12-25-87 brother Samuel 01/17/51 The following program is submitted using this file as input: data work.family; infile 'file-specification'; run; Which INPUT statement correctly reads the values for the variable Birthdate as SAS date values? a. i nput relation $ first_name $ birthdate date9.; b. i nput relation $ first_name $ birthdate mmddyy8.; c. i nput relation $ first_name $ birthdate : date9.; d. i nput relation $ first_name $ birthdate : mmddyy8.; Correct answer: d An informat is used to translate the calendar date to a SAS date value. The date values are in the form of two-digit values for month-day-year, so the MMDDYY8. informat must be used. When using an informat with list input, the colon-format modifier is required to correctly associate the informat with the variable name. You can learn about ? informats in Reading Date and Time Values ? the colon-format modifier in Reading Free-Format Data . 2.A raw data file is listed below. 1---+----10---+----20---+--- Jose,47,210 Sue,,108 The following SAS program is submitted using the raw data file above as input: data employeestats; input name $ age weight; run; The following output is desired: name age weight Jose 47 210 Sue . 108 Which of the following INFILE statements completes the program and accesses the data correctly? a. infile 'file-specification ' pad; b. infile 'file-specification ' dsd;

sas考题

1.正态性检验会写代码,读懂输出 Proc univariate data=数据集名normal;run; Pr < W 0.3072〉0.05落在接受域,接受原假设,原假设为服从正态分布。 2.聚类分析干啥用有哪些检验,输出看,原假设是啥样。Cluster过程样本聚类q聚类 分几类合适 写代码,由输出判断分几类,说明理由,看例子。快速聚类不看 method=average|ward|centroid|single|complete|median|flexible|mcquitty(分别指类平均法,ward 法,重心法,最短距离法,最长距离法,中间距离法,可变法,可变类平均法) proc cluster data=consume method=average std(为消除聚类变量不同量纲对聚类分析的影响,可在cluster过程中用选项‘std’将原始数据标准化为零均值,单位方差然后cluster过程从标准化数据入手进行聚类分析)rsquare(输出r方和半偏r方统计量,R^2值越大越好,说明k个类区分得越开,对聚类分析问题来说就是聚类效果越好。半偏R^2的值是上一步r方与该步r方值的差值,半偏r方统计量可以用来衡量一次并类效果,若某步半偏r方值较大,说明本次并类效果不好,应当考虑是否聚类过程该到上一步停止。仅对average,centriod 法有效)pseudo(输出伪F和伪t方统计量,伪F统计量值越大,表示n个样本为k个类的分类效果越好,伪t方统计量值较大,本次并类效果不好,应考虑是否聚类过程到上一步停止。仅对average,centriod,ward法有效) outtree=ocons1生成一个输出数据集,储存cluster过程的聚类历史,可被tree过程调用 p=8(指定cluster history显示的分类数); var x1-x3; id area; run; proc tree data=ocons horizontal(要求tree过程画水平的谱系聚类图,缺省画竖直聚类图)ncl=99(指定最终分类数为99)out=resulta vaxis=axis1 maxheight=99(指定坐标轴最大值) page=1; axis1label=(angle=-90rotate=90); copy x1-x3; run; data consume; input class$ group$ x1-x6; cards; Beijing 北京190.33 43.77 9.73 60.54 49.01 9.04 tianjin 天津135.20 36.40 10.47 44.16 36.49 3.94 hebei 河北95.21 22.83 9.30 22.44 22.81 2.80 shanxi 山西104.78 25.11 6.40 9.89 18.17 3.25 neimeng 内蒙128.41 27.63 8.94 12.58 23.99 3.27 laoning 辽宁145.68 32.83 17.79 27.29 39.09 3.47 jilin 吉林159.37 33.38 18.37 11.81 25.29 5.22 heilong 黑龙江116.22 29.57 13.24 13.76 21.75 6.04 shangha 上海221.11 38.64 12.53 115.65 50.82 5.89 jiangsu 江苏144.98 29.12 11.67 42.60 27.30 5.74 zejiang 浙江169.92 32.75 12.72 47.12 34.35 5.00 anhui 安徽153.11 23.09 15.62 23.54 18.18 6.39 fujian 福建144.92 21.26 16.96 19.52 21.75 6.73

SAS BASE 123试题+答案详解

QUESTION 1 In the following SAS program, the input data files are sorted by the NAMES variable: libnametemp 'SAS-data-library'; data temp.sales; merge temp.sales work.receipt; by names; run; Which one of the following results occurs when this program is submitted? A. The program executes successfully and a temporary SAS data set is created. B. The program executes successfully and a permanent SAS data set is created. C. The program fails execution because the same SAS data set is referenced for both read and write operations. D. The program fails execution because the SAS data sets on the MERGE statement are in two different libraries. Answer: B QUESTION 2 When the following SAS program is submitted, the data set SASDATA.PRDSALES contains 5000 observations: libnamesastemp 'SAS-data-library'; options obs = 500; proc print data = sasdata.prdsales (firsttobs = 100); run; options obs = max; proc means data = sasdata.prdsales (firsttobs = 500); run; How many observations are processed by each procedure? A. 400 for PROC PRINT 4500 for PROC MEANS B. 401 for PROC PRINT 4501 for PROC MEANS C. 401 for PROC PRINT 4500 for PROC MEANS D. 500 for PROC PRINT 5000 for PROC MEANS Answer: B QUESTION 3 The following SAS program is submitted:

相关主题
相关文档
最新文档