SAS数据分析实验报告

SAS数据分析实验报告
SAS数据分析实验报告

数理与土木工程学院实验报告课程名称:《统计软件SPSS、SAS及实践》

实验结果

(包括程序代码、程序结果分析)第一题:

①读取数据,并创建一个SAS数据集,命名为transaction;

data transaction;

infile cards dlm=",";

input Account_ID Revenue Segment N_var1 C_var1 Date Location Code Amount;

cards;

10001,5,G1,., ,2014-10-23,CHINA,APP_001,100

10002,6,G1,., ,2014-10-23,CHINA,APP_002,110

10003,.,G1,., ,2014-10-23,CHINA,APP_003,50

10004,10,G2,., ,2014-10-23,CHINA,APP_004,90

10005,15,G2,., ,2014-10-23,CHINA,CAN_005,12

10006,13,G2,., ,2014-10-23,CHINA,MAN_006,10000

10007,.,G2,., ,2014-10-23,CHINA,APP_007,10

10008,20,G3,., ,2014-10-23,CHINA,APP_008,100

10009,25,G3,., ,2014-10-23,CHINA,APP_009,200

10010,.,G3,., ,2014-10-23, ,REJ_010,100000

10010,.,G3,., ,2014-10-23, ,REJ_010,100000

10010,.,G4,., ,2014-10-23, ,REJ_010,100000

10010,.,G5,., ,2014-10-23, ,REJ_010,100000

10003,7,G1,., ,2014-10-24,CHINA,MAN_003,50000

10004,9,G2,., ,2014-10-24,CHINA,APP_004,90

10006,6,G2,., ,2014-10-24,CHINA,MAN_006,1000

10007,.,G2,., ,2014-10-24,CHINA,APP_007,10

10008,8,G3,., ,2014-10-24,CHINA,APP_008,100

10009,9,G3,., ,2014-10-24,CHINA,APP_009,200

10010,.,G3,., ,2014-10-24,CHINA,APP_010,100

10010,10,G4,., ,2014-10-24,CHINA,APP_011,101

10010,20,G5,., ,2014-10-24,CHINA,APP_012,102

;

run;

proc transpose data=transaction out=a;

var _all_;

run;

②基于数据集transaction,将变量“Revenue”中的缺失数据用其均值代替;

data a;

set a;

array s(*) aa1-aa2;

n=n(of s(*));

mean=mean(of s(*));

sum=sum( of s(*));

do i=1to dim(s);

if s(i)=.then s(i)=mean;

end;

run;

proc print;

run;

③基于②,将取值全部缺失的变量删除。

data a;

set a;

array aa aa1-aa2;

do over aa;

if col=.then delete;

run;

proc transpose data=a out=transaction(drop=_name_); var aa1-aa2;

run;

proc print;

run;

第二题:

a) 建立一个数据集合读入数据,变量为length,width和 height;

data b;

cards;

32 18 12

16 15 24

48 12 32

15 30 45

20 30 36

;

run;

proc print data=b;

run;

b) 使用 set 语句,利用a)的数据集建立一个新数据集,它包括a)的所有数据,并建立三个新变量:每个

箱子的体积(volume),制造费用(cost),以及每立方米体积的造价y(公式为:y=cost/volume)。

data c;

set b;

volume=length*width*height;

cost=*4*length*width*+*2*length*heigth*+*2*heigth*width*;

y=cost/volume;

run;

proc print data=c;

run;

c) 使用b)建立的数据集建立一个新数据集,只包括其中的volume 和 cost 变量。

data d;

set c(keep=volume cost);

run;

proc print data=d;

run;

第三题:

a) 对车的标志(brand)的频数画竖直条形图。

libname mydata 'D:\data';

proc print data=;

run;

data e;

set ;

run;

proc gchart;

vbar brand;

run;

b) 画里程数(miles)和价格(price)的散点图,价格在竖轴上。

data f;

set (keep=miles price);

proc gplot;

plot price*miles;

symbol v=star cv=green;

run;

c) 自学means 过程(见SAS 过程文件夹),计算变量里程数(miles)和价格(price)的描述统计量。

data g; set f;

proc means data =g ; run ;

第四题:

试分析:该地区单身人士的收入与住房面积之间是否相关如果线性相关,确定一元线性回归方程,并做显著性检验。

data danshen; input area income@@; cards ; x y 35 600 34 1300 37 1300 38 1110 29 900 34 800 28 700 21 1119 22 400 50 1700 32 1200 32 1100 23 500 35 650 23 735 38 1300 23 800 41 1270 30 905 29 900 24 600 41 1500 49 1500 38 1300 21 800 27 800 30 350 29 650 39 1200 52 840 54 1847 33 910 47 1200 34 500 35 900 46 1600 28 750 35 1270 32 780

46 900 44 1166 36 660 21 744 31 1124 47 1042 43 1063 57 336 56 1600 70 500 28 1400 46 1600 24 800 36 1400 32 2000 29 1600 21 800 21 900 21 650 30 700 44 680 42 575 42 816 35 317 60 1890 40 950 27 800 78 1170 36 930 32 4500 30 1000 40 500 33 600 46 190038 1300 21 1100 33 1000 60 1100 33 600 51 2629 45 1500 52 626 70 900 60 1926 50 400 40 1280 70 1000 56 1100 22 480 40 900 45 1800 56 3000 48 1100 50 660 43 720

;

proc corr pearson outp=pearsoncorr;

var area income;

run;

以下两个模型进行检验。运行下列程序,得到运行结果。

data danshen1;

set danshen;

proc gplot;

plot income*area;

run;

由散点图可以看到,图中的点主要集中在收入1000-2000之间,与住房面积基本无线性关系,建立模型进行检验。

模型一(有截距项一元线性回归方程):

proc reg graphics;

model income=area;

model income=area/noint r clm cli;

run;

根据运行的结果,从表中可以得到一元线性回归方程为:

Y=+

从表可以看到,模型的拟合效果很差,R2=,表明单身人士的收入变化%可由住房面积的变化来解释。表中,从方程整体的F检验上看,F检验的P值为小于显著性水平,说明方程整体上通过了

F检验,说明在显著性水平下是显著的;从表中,在T检验中,截距项的P值为远小于,而X的系数P值为也远小于,都通过了T检验,说明在显著性水平下是显著的。

模型二(无截距项一元线性回归方程):

参数估计值

变量自由度

参数

估计值

标准

误差 t 值 Pr > |t|

area 1 <.0001

残差和

残差平方和

预测残差 SS (PRESS)

SAS软件运用实验指导书

数据分析 实验指导书 理学院实验中心数学专业实验室编写

实验一SAS系统的使用 【实验类型】(验证性) 【实验学时】2学时 【实验目的】使学生了解SAS系统,熟练掌握SAS数据集的建立及一些必要的SAS语句。 【实验内容】 1. 启动SAS系统,熟悉各个菜单的内容;在编辑窗口、日志窗口、输出窗口之间切换。 2. 建立数据集 表1 Name Sex Math Chinese English Alice f908591 Tom m958784 Jenny f939083 Mike m808580 Fred m848589 Kate f978382 Alex m929091 Cook m757876 Bennie f827984 Hellen f857484 Wincelet f908287 Butt m778179 Geoge m868582 Tod m898484 Chris f898487 Janet f866587 1)通过编辑程序将表1读入数据集sasuser.score; 2)将下面记事本中的数据读入SAS数据集,变量名为code name scale share price: 000096 广聚能源8500 0.059 1000 13.27 000099 中信海直6000 0.028 2000 14.2 000150 ST麦科特12600 -0.003 1500 7.12 000151 中成股份10500 0.026 1300 10.08 000153 新力药业2500 0.056 2000 22.75

3)将下面Excel表格中的数据导入SAS数据集work.gnp; name x1 x2 x3 x4 x5 x6 北京190.33 43.77 7.93 60.54 49.01 90.4 天津135.2 36.4 10.47 44.16 36.49 3.94 河北95.21 22.83 9.3 22.44 22.81 2.8 山西104.78 25.11 6.46 9.89 18.17 3.25 内蒙古128.41 27.63 8.94 12.58 23.99 3.27 辽宁145.68 32.83 17.79 27.29 39.09 3.47 吉林159.37 33.38 18.37 11.81 25.29 5.22 黑龙江116.22 29.57 13.24 13.76 21.75 6.04 上海221.11 38.64 12.53 115.65 50.82 5.89 江苏144.98 29.12 11.67 42.6 27.3 5.74 浙江169.92 32.75 21.72 47.12 34.35 5 安徽153.11 23.09 15.62 23.54 18.18 6.39 福建144.92 21.26 16.96 19.52 21.75 6.73 江西140.54 21.59 17.64 19.19 15.97 4.94 山东115.84 30.76 12.2 33.1 33.77 3.85 河南101.18 23.26 8.46 20.2 20.5 4.3 湖北140.64 28.26 12.35 18.53 20.95 6.23 湖南164.02 24.74 13.63 22.2 18.06 6.04 广东182.55 20.52 18.32 42.4 36.97 11.68 广西139.08 18.47 14.68 13.41 20.66 3.85 四川137.8 20.74 11.07 17.74 16.49 4.39 贵州121.67 21.53 12.58 14.49 12.18 4.57 云南124.27 19.81 8.89 14.22 15.53 3.03 陕西106.02 20.56 10.94 10.11 18 3.29 甘肃95.65 16.82 5.7 6.03 12.36 4.49 青海107.12 16.45 8.98 5.4 8.78 5.93 宁夏113.74 24.11 6.46 9.61 22.92 2.53 新疆123.24 38 13.72 4.64 17.77 5.75 4)使用VIEWTABLE格式新建数据集earn,输入如表所示数据Year earn 1981 125000 1982 136000 1983 122350 1984 65200 1985 844600 1986 255000 1987 265000 1988 280000 1989 136000

SAS区间估计与假设检验实验报告

2014——2015学年第 1 学期 合肥学院数理系 实验报告 课程名称:统计软件选讲 实验项目:区间估计与假设检验 实验类别:综合性□设计性□验证性□√ 专业班级: 12级信息与计算科学 姓名:马坤鹏学号: 1207011017 实验地点:数理系数学模型实验室 实验时间: 2014.9.24 指导教师:段宝彬成绩:

一、实验目的 掌握使用SAS对总体参数进行区间估计与假设检验方法。 二、实验内容 1、用INSIGHT对总体参数进行区间估计与假设检验 2、用“分析家”对总体参数进行区间估计与假设检验 3、编程对总体参数进行区间估计与假设检验 三、实验步骤或源程序 1、生成来自标准正态总体的10000个随机数: (1) 求总体的平均值和方差的置信水平为90%的置信区间; (2) 改变随机数的个数,观察并总结样本均值、样本方差的变化以及总体均值和方差的置信区间的变化规律。 2、从某大学总数为500名学生的“数学”课程的考试成绩中,随机地抽取60名学生的考试成绩如表5-6(lx5-2.xls)所示: 表5-6 学生成绩 (1) 分别求500名学生平均成绩的置信水平为98%、90%和85%的置信区间,并观察置信水平与置信区间的关系。 (2) 分别求500名学生成绩的标准差的置信水平为98%和85%的置信区间。 3、装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效率更高。劳动效率可以用平均装配时间反映。现从不同的装配方法中各抽取12件产品,记录下各自的装配时间如表5-7(lx5-3.xls)所示: 表5-7 装配时间(单位:分钟) 设两总体为正态总体,且方差相同。问两种方法的装配时间有无显著不同(α = 0.05)?data my.five1; input m n$@@; cards; 31 m 34 m 29 m 32 m 35 m 38 m 34 m 30 m 29 m 32 m 31 m 26 m 26 n 24 n 28 n 29 n 30 n 29 n 32 n 26 n 31 n 29 n 32 n 28 n ; proc ttest h0 = 0alpha = 0.05data= my.five1; var m; class n; run;

《SAS数据分析范例》(SAS数据集)

《SAS数据分析范例》数据集 目录 表1 sas.bd1 (3) 表2 sas.bd3 (4) 表3 sas.bd4 (5) 表4 sas.belts (6) 表5 sas.c1d2 (7) 表6 sas.c7d31 (8) 表7 sas.dead0 (9) 表8 sas.dqgy (10) 表9 sas.dqjyjf (11) 表10 sas.dqnlmy3 (12) 表11 sas.dqnlmy (13) 表12 sas.dqrjsr (14) 表13 sas.dqrk (15) 表14 sas.gjxuexiao0 (16) 表15 sas.gnsczzgc (17) 表16 sas.gnsczzs (18) 表17 sas.gr08n01 (19) 表18 sas.iris (20) 表19 sas.jmcxck0 (21) 表20 sas.jmjt052 (22) 表21 sas.jmjt053 (23) 表22 sas.jmjt054 (24) 表23 sas.jmjt055 (25) 表24 sas.jmxfsps (26) 表25 sas.jmxfspzs0 (27) 表26 sas.jmxfzss (28) 表27 sas.jmxfzst (29) 表28 sas.kscj2 (30) 表29 sas.modeclu4 (31) 表30 sas.ms8d1 (32) 表31 sas.nlmyzzs (33) 表32 sas.plates (34) 表33 sas.poverty (35) 表34 sas.rjnycpcl0 (36) 表35 sas.rjsrs (37) 表36 sas.sanmao (38) 表37 sas.sczz1 (39) 表38 sas.sczz06s (40) 表39 sas.sczz (41) 表40 sas.sczzgc1 (42)

完整word版数据分析实验报告分析解析

实验课程:数据分析 信息与计算科学 业: 专 级: 班 号:学 姓名: 中北大学理学院.

实验一 SAS系统的使用 【实验目的】 了解SAS系统,熟练掌握SAS数据集的建立及一些必要的SAS语句。 【实验内容】 1. 将SCORE数据集的内容复制到一个临时数据集test。 SCORE数据集 English Math Sex Chinese Name 91 90 f 85 Alice 95 Tom m 87 84 93 90 Jenny f 83 80 85 80 Mike m 84 85 89 m Fred 97 83 f 82 Kate 92 Alex 90 m 91 75 Cook m 78 76 82 f Bennie 79 84 85 Hellen f 74 84 90 82 Wincelet f 87 77 Butt m 81 79 86 85 Geoge m 82 89 Tod m 84 84 89 Chris f 84 87 86 65 f 87 Janet math的高低拆分到3个不同的数据集:SCORE2.将数据集中的记录按照math大于等于90的到good数据集,math在80到89之间的到normal数据集,math 在80以下的到bad数据集。 3.将3题中得到的good,normal,bad数据集合并。 【实验所使用的仪器设备与软件平台】SAS 【实验方法与步骤】 1: DATA SCORE; INPUT NAME $ Sex $ Math Chinese English; CARDS; 2

91 85 Alice f 90 84 Tom m 95 87 83 f 93 90 Jenny 80 80 85 Mike m 89 85 m Fred 84 82 83 Kate f 97 91 Alex m 92 90 76 Cook m 78 75 84 82 79 f Bennie 84 74 Hellen f 85 87 82 Wincelet f 90 79 Butt m 77 81 82 m 86 85 Geoge 84 89 84 Tod m 87 84 f Chris 89 87 Janet f 86 65 ; ; Run PROC PRINT DATA=SCORE; DATA test; SET SCORE; :2 good normal bad; DATA SCORE; SET; SELECT) output good; 90when(math>=) output normal; 80when(math>=&math<90) output bad; when(math<80; end; Run=good; DATA PRINT PROC=normal; DATA PRINT PROC=bad; DATA PRINT PROC :3 All; DATA good normal bad; SET=All; DATA PROC PRINT;Run 3 【实验结果】 结果一:

SAS编程基础

实验2 SAS编程基础 SAS语言和其它计算机语言一样,也有其专有的词汇(即关键字)和语法。关键字、名字、特殊字符和运算符等按照语法规则排列组成SAS语句,一个SAS程序由若干数据步、过程步组合而成,而每一个程序步通常由若干语句构成。SAS程序是在Editor窗口中进行编辑,提交运行后可以在Log窗口中显示有关信息和提示,在Output窗口显示运行的结果。 2.1 实验目的 通过实验了解SAS编程的基本概念,掌握SAS编程的基本方法,掌握SAS数据步对数据集的管理和对数据的预处理。 2.2 实验内容 一、建立逻辑库与数据集,包括逻辑库的建立、直接输入数据建立数据集与读取外部数据文件建立数据集。 二、数据文件的编辑与整理,包括数据集的横向合并与纵向合并、数据集内容的复制、变量的增加与筛选、数据集的拆分和数据的排序。 2.3 实验指导 一、建立逻辑库与数据集 1.建立逻辑库 【实验2-1】编程建立逻辑库。 (1) 首先在D盘创建一个文件夹,如D:\SAS_SHYAN\SAS数据集。 (2) 建立逻辑库mylib,编辑并运行下面程序语句即可。 libname mylib "D:\sas_shiyan\sas数据集"; 2.直接输入数据建立数据集 【实验2-2】将表2-1(sy2_2.xls)中的数据直接输入建立数据集sy2_2,并将其存入逻辑库mylib中。 表2-1 职工工资 编号 姓名 性别工作日期 职称 部门基本工资工龄工资奖金扣款 实发工资 1420 0 3003 王以平男1992-8-1 助工生产620300500

3004 林红女1993-8-1 助工供销620280500 200 12003005 吕兴良男1982-1-30 工程师技术1100500500 100 20003006 司马宇男1971-2-17 工人生产520720500 0 17403007 张学武男1967-10-9 工人保卫520800500 200 16203008 冯玉霞女1987-8-1 工程师生产1100400500 250 17503009 赵大强男1968-5-10 工人财务520780500 0 18003010 王萍 女 1987-8-1 工程师 技术 1100 400 500 100 1900 代码如下: data mylib.sy2_2; length gzrq $ 10; input bh $ xm $ xb $ gzrq $ zc $ bm $ jbgz glgz jj kk sfgz; label bh='编号' xm='姓名' xb='性别' gzrq='工作日期' zc='职称' bm='部门' jbgz='基本工资' glgz='工龄工资' jj='奖金' kk='扣款' sfgz='实发工资'; cards; 3003 王以平 男 1992-8-1 助工 生产620 300 500 0 1420 3004 林红 女 1993-8-1 助工 供销620 280 500 200 1200 3005 吕兴良 男 1982-1-30 工程师 技术 1100 500 500 100 2000 3006 司马宇 男 1971-2-17 工人 生产520 720 500 0 1740 3007 张学武 男 1967-10-9 工人 保卫520 800 500 200 1620 3008 冯玉霞 女 1987-8-1 工程师 生产1100 400 500 250 1750 3009 赵大强 男 1968-5-10 工人 财务520 780 500 0 1800 3010 王萍 女 1987-8-1 工程师 技术 1100 400 500 100 1900 ; RUN; 运行完成后,在逻辑库mylib 中双击数据集名sy2_2,可以查看结果如图2-1所示: 图2-1 数据集mylib.sy2_2 说明: (1) SAS 变量的基本类型有两种:数值型和字符型。数值型变量在数据集中的存贮一般使用8个字节。SAS 的字符型变量缺省的长度是8个英文字符,可以使用LENGTH 语句指定变量长度,LENGTH 语句一般应出现在定义变量的Input 语句之前,格式为: LENGTH 字符型变量名 $ 长度; 如: LENGTH gzrq $ 10; (2) 语句:

SAS数据的描述性统计分析答案

实验一数据的描述性统计分析 一、选择题 1、以下( B )语句对变量进行分组,在使用前需按分组变量进行排序? 以下( C )语句可对变量进行分类,在使用前不必按分类变量进行排序? 用( A )语句可以选择输入数据集的一个行子集来进行分析? (A)WHERE语句(B)BY语句(C)CLASS语句(D)FREQ语句2、排序过程步中必须用什么语句对变量进行排序?( A ) (A)BY语句(B)CLASS语句(C)WHERE语句 3、如果要对数据集中的数据进行正态性检验,需要使用哪个过程?( B )(A)MEANS (B)UNIV ARIATE (C)FREQ 4、用UNIV ARIATE过程进行数据分析,要求此过程输出茎叶图、正态概率图等,应在语句中加上什么选项?(plot ) 5、用UNIV ARIATE过程进行数据分析,在输出结果中哪个统计量是对样本均值 为零的T检验的概率值?( A ) (A)T: Mean (B)Prob>|S| (C)Sgn Rank (D)Prob>|T| 二、假设某校100名女生的血清总蛋白含量(g/L)服从均值为75,标准差为3的正态分布,试产生样本数据,并利用SAS软件解决下面问题: 1、计算样本均值、方差、标准差、极差、四分位极差、变异系数、偏度、峰度; 2、画出直方图(垂直条形图); 3、画出茎叶图、盒形图和正态概率图; 4、试进行正态性检验。 Data N; DO i=1to100; x=75+3*normal(12345); output; end; proc print; run; proc univariate data=N; var x; run; proc gchart data=N; block x; run; proc univariate data=N plot; var x;

时间序列分析,sas各种模型,作业神器

实验一分析太阳黑子数序列 一、实验目的:了解时间序列分析的基本步骤,熟悉SAS/ETS软件使用方法。 二、实验内容:分析太阳黑子数序列。 三、实验要求:了解时间序列分析的基本步骤,注意各种语句的输出结果。 四、实验时间:2小时。 五、实验软件:SAS系统。 六、实验步骤 1、开机进入SAS系统。 2、创建名为exp1的SAS数据集,即在窗中输入下列语句: 3、保存此步骤中的程序,供以后分析使用(只需按工具条上的保存按钮然后填写完提问 后就可以把这段程序保存下来即可)。 4、绘数据与时间的关系图,初步识别序列,输入下列程序: ods html; ods listing close; 5、run;提交程序,在graph窗口中观察序列,可以看出此序列是均值平稳序列。

6、识别模型,输入如下程序。 7、提交程序,观察输出结果。初步识别序列为AR(2)模型。 8、估计和诊断。输入如下程序: 9、提交程序,观察输出结果。假设通过了白噪声检验,且模型合理,则进行预测。 10、进行预测,输入如下程序: 11、提交程序,观察输出结果。

12、退出SAS系统,关闭计算机。总程序: data exp1; infile "D:\"; input a1 @@;

year=intnx('year','1jan1742'd,_n_-1); format year year4.; ; proc print;run; ods html; ods listing close; proc gplot data=exp1 ; symbol i=spline v=dot h=1 cv=red ci=green w=1; plot a1*year/autovref lvref=2 cframe=yellow cvref=black ; title "太阳黑子数序列"; run; proc arima data=exp1; identify var=a1 nlag=24 minic p=(0:5) q=(0:5); estimate p=3; forecast lead=6 interval=year id=year out=out; run; proc print data=out; run; 选取拟合模型的规则: 1.模型显著有效(残差检验为白噪声)

抑郁(SDS)焦虑自评量表(SAS)_实验报告

一、实验目的 通过实验了解受试抑郁的主观感受、轻重程度及其在治疗中的变化,掌握个别施测的使用方法。掌握抑郁自评量表的原理、实施、记分与结果解释方法。 二、实验材料 大学生心理测验系统 三、实验步骤 3.1 进入大学生心理测验系统后再点击进入人格特点测评项目。 3.2 点击测试项目名称即抑郁自评量表(SDS),进入抑郁自评量表界面。 3.3输入被试信息,确定后桌面弹出测验指导与窗口,认真阅读指导语: ①在这个问卷测试当中有20个问题,请你依次回答这些问题,答案选项包括“没有或很少时间”、“少部分时间”、“相当多时间”和“绝大部分或全部时间”四个选项,每一测题只能选择一个答案; ②该问卷测试评定的是最近一周的实际感觉; ③本测验不计时间,但应凭自己的直觉反应进行作答,不要迟疑不决,拖延时间; ④有些题目你可能从未思考过,或者感到不太容易回答。对于这样的题目,同样要求你做出一种倾向性的选择。 确定阅读完毕后开始测试。 3.4按照出现题目的先后顺序作答,直至答题完毕。 四、实验结果 4.1 受试信息 姓名:XXX 性别:女年龄:20 文化程度:本科测验耗时:00:00:43 4.2 受试结果 总粗分65 标准总分81.25 参考诊断:有(重度)抑郁症状 重点提示: 抑郁精神性,因子得分:6 抑郁躯体障碍,因子得分:27 抑郁精神运动性障碍,因子得分:6 抑郁心理障碍,因子得分:26 五、实验结果分析 该测试结果提示受试有重度抑郁的倾向,主要表现为: 情绪非常低落,感觉毫无生气,没有愉快的感觉,经常产生无助感或者绝望感,自怨自责。经常有活着太累,想解脱、出现消极的念头,还常哭泣或者整日愁眉苦脸,话语明显少,活动也少,兴趣缺乏,睡眠障碍明显,入睡困难或者早醒,性欲功能 基本没有。 六、讨论或思考 SDS为短程量表,操作方便,容易掌握,能有效地反映抑郁状态的有关症状及其严重程度和变化。SDS的评分不受年龄、性别、经济状况等因素影响,目前在国外已被广泛应用。

SAS数据分析与统计

一、数据集的建立 1.导入Excel数据表的步骤如下: 1) 在SAS应用工作空间中,选择菜单“文件”→“导入数据”,打开导 入向导“Import Wizard”第一步:选择导入类型(Select import type)。 2) 在第二步的“Select file”对话框中,单击“Browse”按钮,在 “打开”对话框中选择所需要的Excel文件,返回。然后,单击“Option” 按钮,选择所需的工作表。(注意Excel文件要是2003的!!) 3) 在第三步的“Select library and member”对话框中,选择导入数据集所存放的逻辑库以及数据集的名称。 4 ) 在第四步的“Create SAS Statements”对话框中,可以选择将系统生成的程序代码存放的位置,完成导入过程。 2.用INSIGHT创建数据集 1)启动SAS INSIGHT模块,在“SAS INSIGHT:Open”对话框的”逻辑库“列表框中,选定库逻辑名 2)单击“新建”按钮,在行列交汇处的数据区输入数据值 (注意列名型变量和区间型变量,这在后面方差分析相关性分析等都要注意!!) 3)数据集的保存: ?“文件”→“保存”→“数据”; ?选择保存的逻辑库名,并输入数据集名; ?单击“确定”按钮。即可保存新建的数据集。 3.用VIEWTABLE窗口建立数据集 1)打开VIEWTABLE窗口 2)单击表头顶端单元格,输入变量名 3)在变量名下方单元格中输入数据

4)变量类型的定义:右击变量名/column attributes… 4.用编程方法建立数据集 DATA 语句; /*DATA步的开始,给出数据集名*/ Input 语句;/*描述输入的数据,给出变量名及数据类型和格式等*/ (用于DATA步的其它语句) Cards; /*数据行的开始*/ [数据行] ; /*数据块的结束*/ RUN; /*提交并执行*/ 例子:data=数据集名字; input name$ phone room height; ($符号代表该列为列名型,就是这一列是文字!! 比如名字,性别,科目等等) cards; rebeccah 424 112 (中间是数据集,中间每一行末尾不要加逗号,但是carol 450 112 数据集最后要加一个分号!!) louise 409 110 gina 474 110 mimi 410 106 alice 411 106 brenda 414 106 brenda 414 105 david 438 141 betty 464 141 holly 466 140 ; proc print data=; (这一过程步是打印出数据集,可要可不要!) run;

数据分析SAS报告

90-08年人民消费能力分析 一、问题提出 改革开放以来中国经济飞速发展,GDP连续超过德国、日本,现以成为世界上第二大经济体,人民生活水平不断提高,但受金融危机的影响,近几年来物价持续上涨,本月CPI创历史新高,人民的消费能力是否随着GDP的增加而增加呢?本文以中国经济年鉴中的“人民消费支出构成”的数据为依据利用统计软件SAS 进行了相关分析。数据如下 食品衣着居住家庭设备用品及服务交通通讯文教娱乐用品及服务医疗保健其他商品及服务 1990 58.8000 7.7700 17.3400 5.2900 1.4400 5.3700 3.2500 0.7400 1995 58.6200 6.8500 13.9100 5.2300 2.5800 7.8100 3.2400 1.7600 2000 49.1300 5.7500 15.4700 4.5200 5.5800 11.1800 5.2400 3.1400 2005 45.4800 5.8100 14.4900 4.3600 9.5900 11.5600 6.5800 2.1300 2007 43.0800 6.0000 17.8000 4.6300 10.1900 9.4800 6.5200 2.3000 2008 43.6700 5.7900 18.5400 4.7500 9.8400 8.5900 6.7200 2.0900 二、问题分析 1、通过对消费种类进行主成分分析判断人民的消费情况。 2、对主成分标准化后在分析各年的消费能力排名。 三、解决问题 3.1 SAS程序: data examp4_4; input id x1-x8; cards; 1990 58.8000 7.7700 17.3400 5.2900 1.4400 5.3700 3.2500 0.7400 1995 58.6200 6.8500 13.9100 5.2300 2.5800 7.8100 3.2400 1.7600 2000 49.1300 5.7500 15.4700 4.5200 5.5800 11.1800 5.2400 3.1400 2005 45.4800 5.8100 14.4900 4.3600 9.5900 11.5600 6.5800 2.1300 2007 43.0800 6.0000 17.8000 4.6300 10.1900 9.4800 6.5200 2.3000 2008 43.6700 5.7900 18.5400 4.7500 9.8400 8.5900 6.7200 2.0900 ; run; proc corr cov nosimple data=examp4_4; var x1-x8; run; proc princomp data=examp4_4 out=bb; var x1-x8; run; data score1; /*以下程序是对各年按第一主成分得分进行排名并打印结果*/ set bb; keep id prin1;

多元统计分析实验报告,计算协方差矩阵,相关矩阵,SAS

院系:数学与统计学学院 专业:__统计学 年级:2009 级 课程名称:统计分析 ____ 学号:____________ 姓名:_________________ 指导教师:____________ 2012年4月28日 (一)实验名称 1. 编程计算样本协方差矩阵和相关系数矩阵;

2. 多元方差分析MANOVA。 (二)实验目的 1. 学习编制sas程序计算样本协方差矩阵和相关系数矩阵; 2. 对数据进行多元方差分析。 (三)实验数据 第一题: 第二题:

(四)实验内容 1. 打开SAS软件并导入数据; 2. 编制程序计算样本协方差矩阵和相关系数矩阵; 3. 编制sas程序对数据进行多元方差分析; 4. 根据实验结果解决问题,并撰写实验报告; (五)实验体会(结论、评价与建议等) 第一题: 程序如下: proc corr data=sasuser.sha n cov; proc corr data=sasuser.sha n no simple cov; with x3 x4; partial x1 x2; run; 结果如下: (1)协方差矩阵 $AS亲坯 曲;15 Friday, Apr: I SB,沙DO COUR过程 x4 目由度=30 Xi x2x3x4x5X? -10.I9B4944-0.45E2GJ5I.3347097-G.1193E48-£0.e75?GS

-ID. 188494669,36&Q3?9-7.22IO&OS1J5692043I5.49ee^91S.Oa97SM -8.45S2645■7,221050829.S78&S46-6.372E47I-15.3084183-21.7352376-11.5674785 1.3841097 1.G5S2M7t.3726171IJ24?17B 4.e093011 4.4C12473 2.B747CM -G. I1S3S49 1.GS92043-is.soul aa 4.B09B01I68.7978495劣』S670971S.57ai1B3 -IH.05l6l?a15.43S6569-J1.73S2376孔耶124TB27.0387097105.103225&S7.3505S7E: -2D K5752??319-11337204-1L55M7S52r9747?3i19,573118337.3S0&87E33.3SQ6452 (2) 相关系数矩阵 Pearson相关系数” N =引 当HO: Rho=0 时.Prob > |r| Xi Xi xl 1.QQ000 x2 -C.23954 0.2061 x3 -0,30459 0.0957 x4 0.18975 Q.3092 x5 '0.14157 0.4475 x6 -0.83787 0.0630 -0.49292 0.0150 x2-0.23354 1.00000-0.162750.143510.022700.181520.24438 x20.20C10.31:1?0.441?0.90350.32640.1761 x3-0.30459-0.16275 1.00000-0.06219-0.34641-0.^797-0.23674 x30.095?0.381?<.00010.0563o.oses0 JS97 x40.1S8760.14351-0.86219L000000.400540,313650.22610 x40.30920.4412<.0001 D.02EG Q.085S0.2213 x5-0J 41570.02270-0.946410.40054 1.000000.317370.26750 x50.4J750.90350.0G68Q.025&0.08130 + 1620 x6-0.33?e?0.1S162-0.397970.813650.31787LOOOOO0.82976 x60.0S300.32840.02660.08580.0813C0001辺-0.432920.24938-0.288740.22810 D.267600.92976 1.00000 x70,01500J7610.19970.22130JG20<.0001 第二题: 程序如下: proc anova data=sasuser.hua ng; class kind; model x1-x4=k ind; manova h=k ind; run; 结果如下: (1)分组水平信息 The ANNA Procedure Cla^s Level Informat ion Class Level?Values kind 3 123 Number of observatIons CO (2) x1、x2、x3、x4的方差分析

SAS系统和数据分析三维图形

第二十二课三维图形 SAS系统除了可以绘制二维平面图形外,还可以绘制三维立体图形。使用PROC G3D过程能对在PLOT或SCATTER语句中指定的变量值绘制三维图形。PROC G3D过程产生的三维图形分为两种:三维曲面图和三维散布图。三维曲面图是通过在PLOT语句中指定三个图形变量来产生,三维散布图是在SCATTER语句中必需指定三个图形变量才能产生,同样还可以对三维散布图进行大小、形状、颜色的修改。 一、PROC G3D过程说明 PROC G3D过程产生三维高分辨率立体图形,一般由下列语句控制: Proc G3D DATA=数据集; PLOT Y*X=Z ; SCATTER Y*X=Z ; TITLE n‘字符串’; FOOTNOTE n‘字符串’; By 变量列表; Run ; 在PROC G3D过程中至少要有一条PLOT或SCATTER语句,如果两条语句同时存在,将在一页中产生一个三维曲面图,下一页中产生一个三维散布图。语句中的Y*X=Z指定三个图形变量X、Y、Z,三维空间中的图形点由三个变量的值共同决定,X和Y为水平变量,Z 为垂直变量。PLOT语句是将X、Y、Z三个变量值确定的空间图形点相互连成曲面,而SCA TTER语句是将X、Y、Z三个变量值确定的空间图形点用符号表示或画出图形点向XY 平面的垂直线(采用NEEDLE选项)。一个PROC G3D过程中可以有多条SCA TTER语句。 1.PLOT语句的选项 用在PLOT语句中的选项按功能可以分为三类:外观选项、轴选项和描述性选项。主要选项如下: ●ROTATE=角度列表——指定三维图形Z轴的一个或多个旋转角度,缺省值为70 度。如果有多个旋转角度,将画出对应多个不同旋转角度的三维图形。 ●TILT=角度列表——指定三维图形Y轴的一个或多个倾斜角度,缺省值为70度。 如果有多个倾斜角度,将画出对应多个不同倾斜角度的三维图形。 ●GRID——在所有坐标轴的每一个刻度线上画出网格线。 ●SIDE——在三维曲面图形中画出侧面墙。 ●XTICKNUM=n YTICKNUM=n ZTICKNUM=n——指定X、Y、Z坐标轴上的刻 度线数目n,缺省值为4。

SAS实训报告心得

通过这次的课程设计,让我对SAS有了进一步的的了解,在设计过程中,虽然有的例题已经做过了,但还是会遇到些问题,一个不显眼的小字符错了,程序就会一遍遍的报错,而且错误容易被忽视,修改时不容易发现。所以我们平常思考问题做事情都要认真严谨,思考全面。 实训不仅可以巩固我们以前所学过的知识,而且学到了很多在书本上所没有学到过的知识。这周不仅对数据集的创建,时间序列的平稳性分析和纯随机性检验有了更深刻的认识,而且更能在小细节中多上心。实践出真知,平常所学的理论只有通过实践,自己动手才能真正感觉到知识的乐趣。实训不仅能培养我们独立思考的能力,动手操作能力,在其他方面的我们的能力也能有所提高。 学习最怕的就是缺少兴趣,有了兴趣和好奇心,做什么事都不会感到累。“知之者不如好之者,好之者不如乐之者。”这句话为我们揭示了一个怎样才能取得好的学习效果的秘诀,那就是对学习的热爱。不同的人在同样的学习环境下学习效果不一样,自身的素质固然是一个方面,更加重要的还在于学习者对学习内容的态度或感觉。正所谓“兴趣是最好的老师”,当你对一门科目产生了兴趣之后,自然会学得比别人好。所以,无论以后学习什么,都要带着愉悦的心情去学习。 实际操作过程中我找出自身存在的不足,对今后的会计学习有了一个更为明确的方向和目标。虽说一周的时间很短,但其中的每一天都使我收获很大、受益匪浅,它不但极大地加深了我对一些知识的理解,从而真正做到了理论联系实际;更让我学到了很多之前在课堂上所根本没法学到的东西,这对于我的学业,乃至我以后人生的影响无疑都是极其深远的。 我希望以后能够有更多的这种实训的机会,这一周感觉过的很充实,我也真正的融入到了学习当中去,别无他思,一切都还不错,感觉非常好。我达到了我自己的预期目标和要求,受益匪浅。

抑郁(SDS)焦虑自评量表(SAS)_实验报告

抑郁自评量表(SDS)实验报告 一、实验目的 通过实验了解受试抑郁的主观感受、轻重程度及其在治疗中的变化,掌握个别施测的使用方法。掌握抑郁自评量表的原理、实施、记分与结果解释方法。 二、实验材料 大学生心理测验系统 三、实验步骤 3.1 进入大学生心理测验系统后再点击进入人格特点测评项目。 3.2 点击测试项目名称即抑郁自评量表(SDS),进入抑郁自评量表界面。 3.3 输入被试信息,确定后桌面弹出测验指导与窗口,认真阅读指导语: ①在这个问卷测试当中有20个问题,请你依次回答这些问题,答案选项包括“没有或很少时间”、“少部分时间”、“相当多时间”和“绝大部分或全部时间”四个选项,每一测题只能选择一个答案; ②该问卷测试评定的是最近一周的实际感觉; ③本测验不计时间,但应凭自己的直觉反应进行作答,不要迟疑不决,拖延时间; ④有些题目你可能从未思考过,或者感到不太容易回答。对于这样的题目,同样要求你做出一种倾向性的选择。 确定阅读完毕后开始测试。 3.4 按照出现题目的先后顺序作答,直至答题完毕。 四、实验结果 4.1 受试信息 姓名:XXX性别:女年龄: 2 0 文化程度:本科测验耗时:00:00:43 4.2 受试结果 总粗分65 标准总分81.25 参考诊断:有(重度)抑郁症状 重点提示: 抑郁精神性,因子得分:6 抑郁躯体障碍,因子得分:27 抑郁精神运动性障碍,因子得分:6 抑郁心理障碍,因子得分:26 五、实验结果分析 该测试结果提示受试有重度抑郁的倾向,主要表现为: 情绪非常低落,感觉毫无生气,没有愉快的感觉,经常产生无助感或者绝望感,自怨自责。经常有活着太累,想解脱、出现消极的念头,还常哭泣或者整日愁眉苦脸,话语明显少,活动也少,兴趣缺乏,睡眠障碍明显,入睡困难或者早醒,性欲功能基本没有。 六、讨论或思考

SAS系统和数据分析PROC TRANSPOSE转置数据集

第十三课PROC TRANSPOSE转置数据 集 一、转置数据集的概念 在对数据库的操作中,有时需要把数据库的行和列进行交换,也可称转置。SAS系统中TRANSPOSE过程能完成对SAS数据集的转置,即把观测(行)变为变量(列),变量变为观测。该过程从读入的一个数据集中创建一个新的数据集。新数据集中包含三类变量: ●一是由输入数据集中的观测转置后创建的新变量,又称转置变量,如_NAME_、 COL1、COL2、COL3…… ●二是从输入数据集中拷贝过来的变量,使用COPY语句定义这个变量,新数据集 中COPY过来的变量与输入数据集中的变量具有相同的名字和值 ●三是为了识别新数据集中每条观测的来源用ID语句定义的变量值作为新数据集创 建的新变量 二、使用PROC TRANSPOSE过程转置数据集 1.用于TRANSPOSE过程的常用语句 Proc Transpose <选项列表> ; Var变量列表; Id变量; Copy变量列表; Run ; 2.转置CLASS数据集 例如,在CLASS数据集中有变量NAME、TEST1、TEST2和TEST3,是按每个学生各课程成绩作为一条观测来组织的,现在我们要创建一个按每门课程各个学生的考试成绩作为一条观测的新数据集NEWCLASS。程序如下: Proc Transpose Data=CLASS Out=NEWCLASS ; Var TEST1 TEST2 TEST3 ; Run ; 转置生成的新数据集NEWCLASS的结果如图13.1所示。

图13.1 由CLASS转置生成的新数据集NEWCLASS 3.设定新数据集中的转置变量名 新数据集中的转置变量名是可以由用户自己设定的。 ●通过PROC TRANSPOSE语句的选项NAME=COURSE,修改了省缺的新变量名 _NAME_为COURSE ●还可以通过选项PREFIX=NO,修改了省缺的新变量名COL1、COL2、COL3、 COL4、COL5为NO1、NO2、NO3、NO4、NO5 ●如果新变量名COL1、COL2、COL3、COL4、COL5想用输入数据集CLASS中 NAME变量中的对应值来替代,使用ID命令定义NAME即可。这样命名新变量的优点是通过新变量名就可以很容易地识别原数据集中的观察行 修改程序如下: Proc Transpose Data=CLASS Out=NEWCLASS Name=COURSE ; Var TEST1 TEST2 TEST3 ; Id Name ; Run ; 转置生成的新数据集NEWCLASS的结果如图13.2所示。

实验报告七-SAS典型相关分析

实验报告 实验项目名称典型相关分析 所属课程名称统计分析及SAS实现实验类型验证性实验 实验日期2016-12-11 班级数学与应用数学 学号 姓名 成绩

【实验方案设计】 一.理解典型相关分析的概念及步骤; 二.掌握典型相关分析的方法; 三.用INSIGHT、“分析家”计算统计量和编程实现实际问题中的典型相关分析; 【实验过程】(实验步骤、记录、数据、分析) 【练习7-1】对某高中一年级男生38人进行体力测试及运动能力测试,如表所示,试对两组指标作典型相关分析。

34 47 55 113 40 71.4 19 64 7.6 410 29 7 331 35 49 74 120 53 54.5 22 59 6.9 500 33 21 342 36 44 52 110 37 54.9 14 57 7.5 400 29 2 421 37 52 66 130 47 45.9 14 45 6.8 505 28 11 355 38 48 68 100 45 53.6 23 70 7.2 522 28 9 352 其中,体力测试指标为:X 1-------反复横向跳(次),X 2 -------纵跳(cm), X 3------背力(kg),X4------捏力(kg),X 5 -----台阶测试(指数),X 6 ------ 定向体前屈(cm),X 7 -------俯卧上提后仰(cm)。 运动能力测试的指标为y 1-50m跑(s),y 2 -跳远(cm),y 3 -投球(m),y 4 引体 向上(次),y 5 -耐力跑(s)。 【解答】 利用INSIGHT模块进行典型相关分析: 结果: 表7.1 Univariate Statistics Variable N Mean Std Dev Minimum Maximum y1 38 7.1316 0.3354 6.6000 8.0000 y2 38 441.8421 43.2138 362.0000 522.0000 y3 38 27.8158 2.7495 21.0000 33.0000 y4 38 7.5263 3.8326 2.0000 21.0000

相关文档
最新文档