统计分析SAS练习

合集下载

第十二章有序分类资料的统计分析的SAS实现

第十二章有序分类资料的统计分析的SAS实现

第十二章有序分类资料的统计分析的SAS实现例12-2某研究欲观察人参的镇静作用,选取32只同批次的小白鼠,将其中20只随机分配到人参组:以5%人参浸液对其做腹腔注射,12只分配到对照组:以等量蒸馏水对其做同样注射。

实验结果如表12-2所示。

能否说明人参有镇静作用?表12-2 人参镇静作用的实验结果镇静等级人参组对照组- 4 11± 1 0+ 2 1++ 1 0+++ 12 0SAS分析程序SAS软件输出结果SAS 软件输出结果解释本例考虑的是两个样本的单项有序资料,因此采用Cochran-Mantel-Haenszel Statistics(Based on Rank Scores) 中第二行的结果(Row Mean Scores Differ),检验统计量为215.1909Z (即:2统计量),p值=0.0001,因此按α=0.05水准拒绝0H ,差别有统计学意义。

需要注意的是对于单向有序资料,有序变量必须作为列变量,在tables r*c 中“*”的后面,即变量 c 的位置。

虽然借助CMH 2χ检验方法,但取评分为秩,此时CMH 2χ检验与与教材中采用Wilcoxon 秩和检验均是正确的,所以上述方法的结果与结论与教材的结果与结论都是正好相同一致。

教材中的说明教材中采用Wilcoxon 秩和检验,在05.0=α的水平上,拒绝0H ,接受H 1,认为两总体之间的差别有统计学意义,可以认为人参组和对照组镇静等级的差别有统计学意义,人参有镇静作用。

例12-3 试根据表12-4的资料,检验针刺不同穴位的镇痛效果有无差别?表12-4 针刺不同穴位的镇痛效果穴位 镇痛效果 + ++ +++ ++++合谷38 44 12 24 足三里 53 29 28 16 扶突4723 1933SAS分析程序SAS软件输出结果SAS软件输出结果解释本例考虑的是多个样本单向有序资料,与例12-2类似,采用Cochran-Mantel-Haenszel Statistics中第二行的结果(Row Mean ScoresDiffer),检验统计量为2 2.4143Z(即:2统计量),p值=0.2990,因此按α=0.05 H,差别没有统计学意义。

第4章 SPSS基本统计分析(课后练习参考)

第4章 SPSS基本统计分析(课后练习参考)

第4章 SPSS基本统计分析(课后练习参考)1、利用习题二第6题数据,采用SPSS数据筛选功能将数据分成两份文件。

其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000之间的调查数据;第二份数据文件是按照简单随机抽样所选取的70%的样本数据。

第一份文件:选取数据数据——选择个案——如果条件满足——存款>=1000&存款<5000&常住地=沿海或中心繁华城市。

第二份文件:选取数据数据——选择个案——随机个案样本——输入70。

2、利用习题二第6题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。

排序数据——排序个案——把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。

3、利用习题二第4题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。

计算转换——对个案内的值计数输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。

4、利用习题二第4题的完整数据,计算每个学生课程的平均分以及标准差。

同时,计算男生和女生各科成绩的平均分。

方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。

分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。

先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。

方法二:利用变量计算,转换——计算变量分别输入目标变量名称及标签——均值用函数mean完成平均分的计算,标准差用函数SD完成标准差的计算。

数据——分类汇总——性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)——确定5、利用习题二第6题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。

根据存款金额排序,观察其最大值与最小值,算出组数和组距。

统计学SAS简单复习

统计学SAS简单复习

一、两组独立资料的比较1、正态性检验DATA t2;INPUT x g @@;CARDS;10.2 1 8.9 1 10.1 1 9.2 1 -0.8 1 10.6 1 6.5 1 11.2 1 9.3 1 8.0 1 10.7 1 9.5 1 12.7 1 14.4 1 11.9 15.0 26.7 2 -1.4 2 4.0 27.1 2 -0.6 2 2.8 2 4.3 2 3.7 2 5.8 2 4.6 2 6.0 2 4.1 2 5.1 2 4.7 2;proc univariate normal;class g;var x;run;2、t检验或者秩和检验a)两组均符合正态分布,采用t检验DATA t2;INPUT x g @@;CARDS;10.2 1 8.9 1 10.1 1 9.2 1 -0.8 1 10.6 1 6.5 1 11.2 1 9.3 1 8.0 1 10.7 1 9.5 1 12.7 1 14.4 1 11.9 15.0 26.7 2 -1.4 2 4.0 27.1 2 -0.6 2 2.8 2 4.3 2 3.7 2 5.8 2 4.6 2 6.0 2 4.1 2 5.1 2 4.7 2;proc ttest;class g;var x;run;方差齐,则选择pooled t检验结果,如果方差不齐,则选择Satterthwaite t检验结果b)两组不符合正态分布,采用非参数秩和检验data a;input x g@@;cards;32.5 1 35.5 1 40.5 1 40.5 1 49.0 1 22.5 2 49.5 1 51.5 1 16 226 2 28.5 2 32.5 2 38.0 2 40.5 2;proc univariate normal plot;class g;var x;proc npar1way;class g;var x;run;二、多组资料的比较1、正态性检验DATA a;INPUT x g;CARDS;332.96 1 297.64 1 312.57 1 295.47 1 284.25 1 307.97 1 292.12 1 244.61 1 261.46 1 286.46 1 322.49 1 282.42 1 253.21 2 235.87 2 269.30 2 258.90 2 254.39 2 200.87 2 227.79 2 237.05 2 216.85 2 238.03 2 238.19 2 243.49 2 232.55 3 217.71 3 216.15 3 220.72 3 219.46 3 247.47 3 280.75 3 196.01 3 208.24 3 198.41 3 240.35 3 219.56 3 ;proc univariate normal;class g;var x;run;1)多组资料均符合正态分布,采用方差分析DATA a;INPUT x g@@;CARDS;332.96 1 297.64 1 312.57 1 295.47 1 284.25 1 307.97 1 292.12 1 244.61 1 261.46 1 286.46 1 322.49 1 282.42 1 253.21 2 235.87 2 269.30 2 258.90 2 254.39 2 200.87 2 227.79 2 237.05 2 216.85 2 238.03 2 238.19 2 243.49 2 232.55 3 217.71 3 216.15 3 220.72 3 219.46 3 247.47 3 280.75 3 196.01 3 208.24 3 198.41 3 240.35 3 219.56 3 ;proc glm;class g;model x=g;means g/hovtest=bartlett;run;lsmeans g/tdiff adjust=bon; (两两比较)2)多组资料不符合正太分布,采用多组秩和检验data a;input x g @@;cards;3 14 1 7 1 8 1 8 16 2 9 2 10 2 12 2 13 22 3 3 3 5 3 7 3 8 3;proc npar1way wilcoxon;class g;var x;run;三、配对资料的分析data a;input x1 x2@@;d=x2-x1;cards;10.5 8.8 21.6 18.8 14.9 13.5 30.2 27.6 8.4 9.1 7.7 7.0 16.4 14.719.5 17.2 127 155 18.7 16.3 9.5 9.5;proc univariate normal;var d;run;如果符合正态分布,则选择t检验结果,如果不符合正态分布,则选择符号秩检验结果。

学习使用SAS进行数据分析的基础教程

学习使用SAS进行数据分析的基础教程

学习使用SAS进行数据分析的基础教程一、SAS介绍与安装SAS(全称Statistical Analysis System,统计分析系统)是一种非常强大的数据分析软件。

它提供了丰富的统计分析、数据挖掘和数据管理功能。

在学习使用SAS之前,首先需要下载并安装SAS软件。

在安装过程中,需要根据操作系统选择相应的版本,并按照安装向导进行操作。

安装完成后,可以通过启动菜单找到SAS软件并打开它。

二、SAS基本语法与数据集1. SAS语法基础SAS语法是一种类似于编程语言的语法。

在SAS中,每一个语句都以分号作为结尾。

常用的SAS语句包括DATA、PROC和RUN。

DATA语句用于创建数据集,PROC语句用于执行数据分析过程,RUN语句用于执行SAS语句的运行。

2. SAS数据集SAS数据集是SAS中最重要的数据组织形式。

它可以包含多个数据变量,并且每个变量可以拥有不同的数据类型,如字符型、数值型、日期型等。

通过DATA语句可以创建一个新的SAS数据集,并通过INPUT语句指定每个变量的属性。

使用SET语句可以将现有的数据集读入到SAS数据集中,以供后续分析使用。

三、SAS数据清洗与变换1. 数据清洗数据清洗是数据分析的第一步,其目的是去除数据中的错误或无效信息,保证数据质量。

在SAS中,可以使用IF和WHERE语句来筛选出符合条件的数据观测值,并使用DELETE和KEEP语句删除或保留特定的变量。

2. 数据变换数据变换是对原始数据进行转换,以满足具体的分析需求。

在SAS中,常用的数据变换操作包括缺失值处理、变量重编码、数据排序和数据合并等。

可以使用IF、ELSE和DO语句进行逻辑判断和循环操作,通过FORMAT语句对数据进行格式化。

四、SAS统计分析1. 描述统计分析描述统计分析是对数据的基本特征进行分析,包括均值、标准差、中位数、分位数和频数等。

在SAS中,可以使用PROC MEANS进行基本统计分析,使用PROC FREQ进行频数分析。

统计软件练习

统计软件练习

测试一 1. 要在sasuser库内建立aa数据集,其中有x和y变量,三行观测;完成任务的SAS程序如下:(用小写字母填空) data [a1]; [a2] x y[a3]; [a4]; 11 22 33 44 55 66 run;

2. 将成绩score小于60分的纪录放在a1数据集中,60分以上放数据集a2中。完成任务的SAS程序如下:(注意:小写字母填空,关键词间只用1个空格分隔!) data a1 a2; input id[a1]; [a2] score<60 [a3]; else [a4]; cards; 001 68 002 56 003 77 004 50 run;

3. d盘中的文本文件dat.txt中存放着学生的姓名(不超4个汉字)、生日(如77/09/12)信息,每行一条学生记录,字段间空格分隔;将其读入SAS数据集aa并计算年龄age。完成任务的SAS程序如下:(用小写字母填空) data aa; [a1] 'd:\dat.txt'; [a2] name[a3] birthday [a4]; age=intck("[a5]",birthday,date()); run; 4. 有一批身高height、体重weight数据存放在"D:\dat.txt"中,文件的第一行开始就按”身高、空格、体重“的次序连续排放多组数据;试用R语言完成将其读入为数据框对象df。完成任务的R程序如下:

lst=[a1] df=[a2] 5. 在文件"d:\dat.txt"中,从第一行开始到最后一行,每行是一个人的姓名name(占1~4列)和年龄age(占5~6列)。 试用R语言将其读入数据框df(内有变量name、age)。完成上述任务的R程序如下:

(df=read.[a1]("[a2]",widths=[a3],[a4]=c("name","age")))

测试二 1. students数据框中有学号(id)、姓名(name)、性别(sex)三变量,score数据框内有学号(id)、课程码(code)、成绩(num)三变量。 试合并生成匹配的学号、姓名、课程号、成绩四变量数据框ss。完成上述任务的R程序如下:

SPSS统计分析软件综合练习

SPSS统计分析软件综合练习

《SPSS统计分析软件》综合练习一、2010年某公司员工的性别、工作岗位、年收入如表1所示:表1 某公司员工年收入序号性别工作岗位年收入(元)1 男普通员工283502 女普通员工262503 女经理540004 女普通员工348005 女普通员工315006 男管理人员243007 男管理人员309008 男普通员工267009 男经理4395010 男普通员工2670011 男经理6925012 男管理人员3195013 男管理人员2625014 女普通员工1710015 男经理5212516 男普通员工33900比较不同性别的员工的年收入是否存在显著差异。

二、应用第一题的数据资料,试分析:1.不同工作岗位员工的年收入是否存在显著差异?(假设总收入服从正态分布,显著性水平为0.05)。

2. 运用线性多项式方法,判断经理与普通员工的年收入是否存在显著差异?3. 不同工作岗位员工的年收入进行多重检验。

如果方差齐次,请用LSD方法;如果方差非齐,请用Tambane’s T2方法,检验不同工作岗位员工所对应的年收入存在显著差异?三、2010年某省15个地区的家庭月平均收入与月平均食品支出数据文件如表2,请分析下列问题:(30分)1.用二元变量相关性分析方法,判断家庭月平均食品支出与月平均收入是否存在显著性相关2.检验回归方程的拟合效果如何?3. 检验回归方程的回归效果如何?α=0.054.用家庭月平均收入为自变量,月平均食品支出为因变量,求回归方程,并解释回归系数的意义。

5.当家庭月平均收入达到7000元,估计月平均食品支出的值,并求95%置信区间下限和上限。

地区月平均食品支出(元/月)家庭月平均收入(元)1 600 32002 772 45003 1300 50004 650 33295 1400 53006 800 43007 500 25008 550 28009 1800 600010 1500 530011 850 480012 750 420013 600 3500。

sas例题

正态性检验Data t;/*正态性检验*/INPUT x @@;CARDS;63 106 112 88 150 104 8875 78 140 167 155 122 12899 130 113 45 133 133 124187 101 87 70;PROC UNIVARIATE NORMAL PLOT DATA=t;VAR x;QQPLOT x/NORMAL(MU=111SIGMA=34);RUN;单样本t检验data a;input x@@;cards;20.99 20.41 20.10 20.00 20.91 22.60 20.99 20.41 20.00 23.00 22.00 ;proc univariate mu0=20.70;/*调用univariate过程进行单样本的t检验,与总体均数20.70比较*/var x;run;proc ttest h0=20.70;/*调用ttest过程进行单样本的t检验*/var x;run;配对设计资料t检验P104 例7-3DATA t; /*p104 例7-3*/INPUT no x1 x2 @@;d=x2-x1;CARDS;1 0.94 0.922 1.02 1.013 1.14 1.114 1.23 1.225 1.31 1.326 1.41 1.427 1.53 1.518 1.61 1.619 1.72 1.7210 1.81 1.8211 1.93 1.9312 2.02 2.04;/*调用means过程进行配对t检验,得到样本含量、均数、标准差、标准误、t值及P值*/ PROC MEANS N MEAN STD STDERR T PRT DATA=t;VAR d;TITLE'paired-comparisons t test';RUN;proc univariate normal data=t;/*做正态性检验*/var d;run;proc ttest;/*调用ttest过程进行配对t检验,和用means过程的结果一致*/paired x1*x2;run;两独立样本t检验P121 #5DATA GT;INPUT G X1 X2 @@;/*X1、X2分别为治疗前和治疗后的数据,G为分组变量,G=1表示A 组,G=2表示B组*/X=X1-X2;;/*X为治疗前后的差值*/CARDS;1 1183.03 983.08 1 822.52 469.34 1 1294.00 704.39 1 852.50 979.66 1 568.89 1040.331 532.12 895.93 1 896.36 612.27 1 530.46 616.70 1 808.22 870.14 1 375.44 1245.541 1055.26 1753.67 1 614.55 1850.56 1 450.22 538.452 992.85 236.66 2 767.33 293.00 2 645.85 166.77 2 709.54 204.81 2 995.41 127.272 1043.40 186.63 2 1022.76 200.80 2 486.27 151.47 2 694.28 254.49 2 871.44 178.092 973.73 147.19 2 1063.76 111.22;proc univariate normal;/*调用univariate过程进行正态性检验*/class G;/*定义分组变量为G*/var X;/*分析变量为*/PROC TTEST;/*调用t检验过程*/CLASS G; /*指定分组变量*/VAR X; /*指定分析变量*/RUN;P106 例7-4DATA t2;/*p106例7-4*/INPUT x g @@;CARDS;10.2 1 8.9 1 10.1 1 9.2 1 -0.8 1 10.6 1 6.5 1 11.2 1 9.3 1 8.0 1 10.71 9.5 1 12.7 1 14.4 1 11.9 15.0 26.7 2 -1.4 2 4.0 27.1 2 -0.6 2 2.8 2 4.3 2 3.7 2 5.8 2 4.6 2 6.0 2 4.1 2 5.1 2 4.7 2;PROC UNIVARIATE NORMAL DATA=T2;CLASS g;VAR x;run;PROC TTEST DATA=t2;CLASS g;VAR x;RUN;完全随机设计资料的方差分析P123 例8-1DATA ce8_1;/*p123例8-1*/INPUT x grp@@;CARDS;332.96 1 297.64 1 312.57 1 295.47 1 284.25 1 307.97 1292.12 1 244.61 1 261.46 1 286.46 1 322.49 1 282.42 1253.21 2 235.87 2 269.30 2 258.90 2 254.39 2 200.87 2227.79 2 237.05 2 216.85 2 238.03 2 238.19 2 243.49 2232.55 3 217.71 3 216.15 3 220.72 3 219.46 3 247.47 3280.75 3 196.01 3 208.24 3 198.41 3 240.35 3 219.56 3;PROC UNIVARIATE NORMAL;VAR X;BY GRP;RUN;PROC GLM;/*调用GLM过程进行方差分析*/CLASS grp; /*定义进入模型的分类变量*/MODEL x=grp;/*构造统计分析模型,以x为结果变量,grp为自变量*/MEANS grp/SNK BON SIDAK HOVTEST=LEVENE(TYPE=ABS) HOVTEST=BARTLETT; /*给出grp各组的均数,并用SNK,Bonferroni,Sidak三种方法进行两两比较;同时用离均差的绝对值进行Levene方差齐性检验和方差齐性的Bartlett检验。

统计软件SAS教案(第3章复习第4,17章学习指导)

统计软件SAS教案(第3章复习第4,17章提要)第3章复习,第4章学习指导1.第3章练习习题3-2data test; /*复制数据集xiti3_5到临时逻辑库中*/set ww.xiti3_5;run;data test2; /*更新数据集test为test2*/input id name$ price number cost;cards;10321 . 85 . .17882 . . 385 .;run;data test;modify test test3;by id;run;proc sort data=test; /*数据集test按id 排序后修改为数据集test3*/by id;run;proc transpose data=test out=result; /*转置数据集test*/var price number cost;id id; /*含义如何?*/run;proc print data=result; run;2.第3章复习数据集的的操作、导入、到出与存储课堂练习试对已知数据example13_1(excel文件)进行如下操作:a)建立SAS数据集example13_1;b)分别按变量和观察(城市)拆分,成4个数据集;c)对其中一个数据集作添加和删除、添加变量和观察练习;d)分别作按变量和按观察拼接数据集练习。

3.第4、17章要点第4章描述性统计分析Means过程univariate过程掌握基本格式、语句的作用及可选项目,例题4.1-2第17章图形绘制gplot过程绘制散点图、线图,例题171-2gchart过程绘制条形图、饼图,例题173-4盒形图(箱线图)、茎叶图、QQ图 univariate过程,例题17 6-8 图形编辑例题17.9利用图形界面操作绘图4.课后练习P318 第17章习题:1,4-7 P100 第4章习题:15.思考1)何为QQ图?SAS支持非正态分布的QQ图吗?2)何为茎叶图?在SAS中可以自定义茎叶吗?3)何为直方图?与条形图有何区别?SAS支持自定义直方图的组数、组距吗?4)如何利用随机函数生成制定分布的数据集?其中的种子含义如何?应如何设置?5)何为星图?如何绘制?。

SAS上机练习题(习题部分)

重庆医科大学卫生统计学统计软件包SAS上机实习题重庆医科大学卫生统计学教研室彭斌编写2010年12月卫生统计学统计软件包上机实习题SAS上机练习题(一)1、SAS常用的窗口有哪三个?请在三个基本窗口之间切换并记住这些命令或功能键。

2、请在PGM窗口中输入如下几行程序,提交系统执行,并查看OUTPUT窗和LOG窗中内容,注意不同颜色的含义;并根据日志窗中的信息修改完善程序。

3、将第2题的程序、结果及日志保存到磁盘。

4、试根据某班12名学生3门功课成绩表完成后面的问题:问题:1)建立数据集;2)打印至少有1门功课不及格同学的信息;(提示,使用if语句)5、(选做)根据下列数据建立数据集表2 销售数据开始时间终止时间费用2005/04/28 25MAY2009 $123,345,0002005 09 18 05OCT2009 $33,234,50020040508 30JUN2009 $432,334,500提示:(格式化输入;数据之间以空格分隔,数据对齐;注意格式后面的长度应以前一个位置结束开始计算,如果读入错误,可试着调整格式的宽度;显示日期需要使用输出格式)开始时间,输入格式yymmdd10.终止时间,输入格式date10.费用,输入格式dollar12.例如:input x1 yymmdd10. X2 date10. X3 dollar12.6、手机号码一编码规则一般是:YYY-XXXX-ZZZZ,其YYY为号段;XXXX一般为所在地区编码;ZZZZ 为对应的个人识别编号。

下面有一组电话号码(来源于网络,末位以X替换),请用程序完成下列要求:(1)分别列出属于联通、移动、电信的号码;(2)分别提取地区编号及个人识别编号。

(提示:列输入方式或者字符串操作substr()函数)说明:移动:134-139、150、151、152、157、158、159、188联通:130、131、132、155、156电信:133、153、180、1897、下表是某班学生几门功课的成绩,其中形势课是考查课,其它均为考试课。

实验报告3—— SAS描述统计分析

实验报告实验项目名称SAS描述统计分析所属课程名称现代统计软件实验类型验证性实验实验日期2014-10-28班级学号姓名成绩实验报告说明1.实验项目名称:要用最简练的语言反映实验的内容。

要求与实验指导书中相一致。

2.实验类型:一般需说明是验证型实验还是设计型实验,是创新型实验还是综合型实验。

3.实验目的与要求:目的要明确,要抓住重点,符合实验指导书中的要求。

4.实验原理:简要说明本实验项目所涉及的理论知识。

5.实验环境:实验用的软硬件环境(配置)。

6.实验方案设计(思路、步骤和方法等):这是实验报告极其重要的内容。

概括整个实验过程。

对于操作型实验,要写明依据何种原理、操作方法进行实验,要写明需要经过哪几个步骤来实现其操作。

对于设计型和综合型实验,在上述内容基础上还应该画出流程图、设计思路和设计方法,再配以相应的文字说明。

对于创新型实验,还应注明其创新点、特色。

7.实验过程(实验中涉及的记录、数据、分析):写明上述实验方案的具体实施,包括实验过程中的记录、数据和相应的分析(原程序、程序运行结果、结果分析解释)。

8.结论(结果):即根据实验过程中所见到的现象和测得的数据,做出结论。

9.小结:对本次实验的心得体会、思考和建议。

10.指导教师评语及成绩:指导教师依据学生的实际报告内容,用简练语言给出本次实验报告的评价和价值。

注意:∙每次实验开始时,交上一次的实验报告。

∙实验报告文档命名规则:“实验序号”+“_”+ “班级”+“_”+“学号”+“姓名”+“_”+ “.doc”例如:管信11班的张军同学学号为:2011312299 本次实验为第2次实验即:实验二、SAS编程基础;则实验报告文件名应为:实验二_管信11 _2011312299_张军.doc 。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第七章 t检验 单样本t检测,用means、 univariate data temp; input x@@; y=x-20.7; cards; 20.99 20.41 20.10 20.00 20.91 22.60 20.99 20.42 20.90 22.99 23.12 20.89 ; proc means mean stderr t probt; var y; run;

data temp; input x@@; y=x-20.7; cards; 20.99 20.41 20.10 20.00 20.91 22.60 20.99 20.42 20.90 22.99 23.12 20.89 ; proc univariate normal; var y; run; 无原始数据的单样本t检验: data temp; input u0 u1 s n; t=(u1-u0)/(s/sqrt(n)); v=n-1; p=probt(t,v); cards; 72 74.2 6.5 25 ; proc print; run;

配对的t检测:有两个对比的检测 有ttest means univariate data temp; input id a b; cards; 1 2.41 2.80 2 2.90 3.04 3 2.75 1.88 4 2.23 3.43 5 3.67 3.81 6 4.49 4.00 7 5.16 4.44 8 5.45 5.41 9 2.06 1.24 10 1.64 1.83 11 1.06 1.45 12 0.77 0.92 ; proc ttest; paired a*b; run;

data temp; input id a b; y=a-b; cards; 1 2.41 2.80 2 2.90 3.04 3 2.75 1.88 4 2.23 3.43 5 3.67 3.81 6 4.49 4.00 7 5.16 4.44 8 5.45 5.41 9 2.06 1.24 10 1.64 1.83 11 1.06 1.45 12 0.77 0.92 ; proc univariate normal; var y; run; 正态性检测:w p ,t=0.162 pr=0.87>0.05,接受H0; data temp; input id a b; y=a-b; cards; 1 2.41 2.80 2 2.90 3.04 3 2.75 1.88 4 2.23 3.43 5 3.67 3.81 6 4.49 4.00 7 5.16 4.44 8 5.45 5.41 9 2.06 1.24 10 1.64 1.83 11 1.06 1.45 12 0.77 0.92 ; proc means mean stderr t probt; var y; run; data temp; input d s n; t=d/(s/sqrt(n)); v=n-1; p=probt(t,v); cards; 0.625 0.78 8 ; proc print; run;

独立样本t检测 data temp; input group x@@; cards; 1 134 1 146 1 104 1 119 1 124 1 161 1 107 1 83 1 113 1 129 1 97 1 123 2 70 2 118 2 101 2 85 2 107 2 132 2 94 proc ttest; class group; var x; run;

data temp; input x1 x2 n1 n2 s1 s2; sc=sqrt((1/n1+1/n2)*((n1-1)*s1**2+(n2-1)*s2**2)/(n1+n2-2)); t=(x2-x1)/sc; v=n1+n2-2; p=probt(t,v); cards; 20.95 21.79 20 20 5.89 3.43 ; proc print; run;

第九章 直线回归和相关 data exam9_1; input x1 x2 @@; cards; 1.21 3.90 1.30 4.50 1.39 4.20 1.42 4.83 1.47 4.16 1.56 4.93 1.68 4.32 1.72 4.99 1.98 4.70 2.10 5.20 ; proc gplot; /*拓扑图*/ plot x2*x1='*'; /*图*/ run; proc corr; var x1 x2; run;

相关性 相关系数为:0.68073。 p为0.0303 data exm9_2; input x y@@; cards; 79 45 80 30 91 16 90 24 70 28 87 25 92 14 ; proc corr spearman; var x y; run; 直线回归 data exm9_3; input x y@@; cards; 25.5 9.2 19.5 7.8 24.0 9.4 20.5 8.6 25.0 9.0 22.0 8.8 21.5 9.0 23.5 9.4 26.5 9.7 23.5 9.4 26.5 9.7 23.5 8.8 22.0 8.5 20.0 8.2 28.0 9.9 ; proc reg; model y=x/r clm; /*针对每一条的观测的输出*/ run;

多元线性回归 data temp; input x1 x2 x3 y; cards; 51.3 73.6 36.4 2.99 48.9 83.9 34.0 3.11 42.8 78.3 31.0 1.91 55.0 77.1 31.0 2.63 45.3 81.7 30.0 2.86 45.3 74.8 32.0 1.91 51.4 73.7 36.5 2.98 53.8 79.4 37.0 3.28 49.0 72.6 30.1 2.52 53.9 79.5 37.1 3.27 ; proc reg; model y=x1 x2 x3/tol vif collin selection=stepwise r; run;

偏相关与复相关 data exm10_2; input x1 x2 x3 x4 y; cards; 7 26 6 60 78.5 1 29 15 52 74.3 ; proc corr; var x1 x2 x3 x4 y; run; proc corr nosimple; var x1 y; partial x2 x3 x4; run; proc corr nosimple; var x2 y; partial x1 x3 x4; run; proc corr nosimple; var x3 y; partial x2 x1 x4; run; proc corr nosimple; var x4 y; partial x2 x3 x1; run; proc corr nosimple; var x1 x2 x3 y; partial x4; run;

data exm10_2; input x1 x2 x3 x4 y; cards; 7 26 6 60 78.5 1 29 15 52 74.3 11 56 8 20 104.3 11 31 8 47 87.6 7 52 6 33 95.9 ; proc corr; var x1 x2 x3 x4 y; run; proc corr nosimple; var x1 y; partial x2 x3 x4; run; proc corr nosimple; var x2 y; partial x1 x3 x4; run; proc corr nosimple; var x3 y; partial x2 x1 x4; run; proc corr nosimple; var x4 y; partial x2 x3 x1; run; proc corr nosimple; var x1 x2 x3 y; partial x4; run;

第十四章 非参数检验 data exm10_2; input x1 x2 x3 x4 y; cards; 7 26 6 60 78.5 1 29 15 52 74.3

相关文档
最新文档