SAS练习题及程序答案
1.随机取组有无重复试验的两种本题是无重复
DATA PGM15G;
DO A=1TO4; /*A为窝别*/
DO B=1TO3; /*B为雌激素剂量*/
INPUT X @@; /*X为子宫重量*/
OUTPUT;
END;
END;
CARDS;
106 116 145
42 68 115
70 111 133
42 63 87
;
RUN;
ods html; /*将结果输出成网页格式,SAS9.0以后版本可用*/ PROC GLM DATA=PGM15G;
CLASS A B;
MODEL X=A B / SS3;
MEANS A B; /*给出因素A、B各水平下的均值和标准差*/
MEANS B / SNK; /*对因素B(即剂量)各水平下的均值进行两两比较*/ RUN;
ODS HTML CLOSE;
2.2*3析因设计两因素完全随机统计方法2*3析因设计tiff =f的开方
DATA aaa;
DO zs=125,200;
DO repeat=1TO2; /*每种试验条件下有2次独立重复试验*/
do js=0.015,0.030,0.045;
INPUT cl @@;
OUTPUT;
END;
END;
END;
CARDS;
2.70 2.45 2.60
2.78 2.49 2.72
2.83 2.85 2.86
2.86 2.80 2.87
;
run;
PROC GLM;
CLASS zs js;
MODEL cl=zs js zs*js / SS3;
MEANS zs*js;
LSMEANS zs*js / TDIFF PDIFF; /*对 zs和js各水平组合而成的试验条件进行均数进行两两比较*/
RUN;
ODS HTML CLOSE;
练习一:2*2横断面研究列链表方法:卡方矫正卡方FISHER
DATA PGM19A;
DO A=1TO2;
DO B=1TO2;
INPUT F @@;
OUTPUT;
END;
END;
CARDS;
2 26
8 21
;
run;
PROC FREQ;
WEIGHT F;
TABLES A*B / CHISQ;
RUN;
样本大小= 57
练习二:对裂列连表结果变量换和不换三部曲1横断面研究P《0.05 R
DATA PGM19B;
DO A=1TO2;
DO B=1TO2;
INPUT F @@;
OUTPUT;
END;
END;
CARDS;
40 3414
1 19252
;
run;
ods html;
PROC FREQ;
WEIGHT F;
TABLES A*B / CHISQ cmh;
RUN;
ods html close;
样本大小= 57
练习三:病例对照2*2 病例组中有何没有那个基因是正常的3.8倍,则有可能导致痴呆要做前瞻性研究用对裂
DATA PGM20;
DO A=1TO2;
DO B=1TO2;
INPUT F @@;
OUTPUT;
END;
END;
CARDS;
240 60
360 340
;
run;
ods html;
PROC FREQ;
WEIGHT F;
TABLES A*B / CHISQ cmh;
RUN;
ods html close;
总样本大小= 1000
练习四:配对设计隐含金标准2*2 MC卡方检验34和0在总体上(B+C《40 用矫正卡方)是否相等则可得甲培养基优于乙培养基一般都用矫正因卡方为近似计算
DATA PGM19F;
INPUT b c;
chi=(ABS(b-c)-1)**2/(b+c);
p=1-PROBCHI(chi,1);求概率 1减掉从左侧积分到卡方的值
chi=ROUND(chi, 0.001);
IF p>0.0001THEN p=ROUND(p,0.0001);
FILE PRINT;
PUT(打印在输出床口) #2 @10'Chisq' @30'P value'(#表示行)
#4 @10 chi @30 p;
CARDS;
34 0
;
run;
ods html close;
练习五:双向有序R*C列连表用KPA data aaa;
do a=1to3;
do b=1to3;
input f @@;
output;
end;
end;
cards;
58 2 3
1 4
2 7
8 9 17
;
run;
ods html;
*简单kappa检验;
proc freq data=aaa;
weight f;(频数)
tables a*b;
test kappa;
run;
*加权kappa检验;
proc freq;
weight f;
tables a*b;
test wtkap;
run;
SAS
FREQ 过程
a *
b 表的统计量
对称性检验指总体上主对角线的上三角数相加是否与下三角三个数相加对称性检验与KPA 检验是否一致是否一个可以代替另一个检验Pe理论观察一致率独立假设性基础上计算的相互独立
总体的KPA是否为0 KPA大于0两种方法的一致性有统计学意义小于0 不一致性有统计学意义
置信区间不包括0 拒绝H0 但要看专业要求达到多少才可以观测一致率达到多少才可以代替
样本大小= 147
FREQ 过程
a *
b 表的统计量
对加权的KPA检验与简单的(利用对角线上的数据分析)加权还要利用对角线以外的数据分析
样本大小= 147
练习六:双向无序R*C 列连表用卡方理论频数小于5没有超过五分之一,一般用卡方实在不行用FISHER检验超过用KPA两种血型都是按小中大排列相互不影响独立的接受H0 不一致行与列变量相互不影响
DATA PGM20A;
DO A=1TO4;
DO B=1TO3;
INPUT F @@;
OUTPUT;
END;
END;
CARDS;
431 490 902
388 410 800
495 587 950
137 179 325
;
run;
ods html;
PROC FREQ;
WEIGHT F;
TABLES A*B / CHISQ;*exact;
RUN;
ods html close;
样本大小= 6094
练习七:单向有序R*C 秩和检验
*方法1;(单因素非参数 HO三个药物疗效相同 H1不完全相等)
DATA PGM20C;
DO A=1TO4;
DO B=1TO3;
INPUT F @@;
OUTPUT;
END;
END;
CARDS;
15 4 1
49 9 15
31 50 45
5 22 24
;
run;
ods html;
PROC NPAR1WAY WILCOXON;
FREQ F;
CLASS B;
VAR A;
RUN;
*方法2;(FIQ CHIM)
proc freq data=PGM20C;
weight f;
tables b*a/cmh scores=rank;
run;
ods html close;
总样本大小= 270
练习八:双向有序属性不同R*C 4种目的4种方法SPEARMAN秩相关分析
DATA PGM20E;
DO A=1TO3;
DO B=1TO3;
INPUT F @@;
OUTPUT;
END;
END;
CARDS;
215 131 148
67 101 128
44 63 132
;
run;
ods html;
PROC CORR SPEARMAN;
VAR A B;
FREQ F;
RUN;
ods html close;
统计分析与SAS实现第1次上机实习题
一、定量资料上机实习题
要求:
(1)先判断定量资料所对应的实验设计类型;
(2)假定资料满足参数检验的前提条件,请选用相应设计的定量资料的方差分析,并用SAS软件实现统计计算;
(3)摘录主要计算结果并合理解释,给出统计学结论和专业结论。
【练习1】取4窝不同种系未成年的大白鼠,每窝3只,随机分配到三个实验组中,分别注射不同剂量雌激素,经过一定时间后处死大白鼠测子宫重量,资料见表1。问剂量和窝
别的各自水平下子宫重量之间的差别有无统计学意义?若剂量间差别有统计学意义,请作两两比较。
表1 未成年大白鼠注射不同剂量雌激素后的子宫重量
子宫重量(g)
窝别
剂量(μg/100g):0.2 0.4 0.8 合计
1 106 116 145 367
2 42 68 115 225
3 70 111 133 314
4 42 63 87 192
合计260 358 480 1098
【SAS程序】:程序1
【练习2】一位工程师研究由钻头压力产生的冲力。考察了A(钻孔速度)和B(进料速度),两因素分别取2与3水平,各水平组合下均做了两次独立重复实验,资料见表2。假定资料满足参数检验的前提条件,且两因素对观测结果的影响地位平等,已知冲力越小越好,试作分析,尽可能给出较为明确的统计和专业结论。
表2 在钻孔速度和进料速度取不同水平的条件下冲力的测定结果钻孔冲力(单位)
速度进料速度:0.015 0.030 0.045
125 2.70 2.45 2.60
2.78 2.49 2.72
200 2.83 2.85 2.86
2.86 2.80 2.87
【SAS程序】:程序2.
二、定性资料上机实习题
要求:
(1)若题目中未给出表格,请列出标准的列联表,并对其命名;
(2)若题目中已列出不规范的表格,先修改,然后对其命名;
(3)根据分析目的或自己提出分析目的、资料的前提条件选用相应的统计分析方法,并用SAS软件实现计算;
(4)将主要计算结果摘录出来,给出统计学和专业结论。
【练习1】某卫生防疫站对屠宰场及肉食零售点的猪肉,检查其表层沙门氏菌带菌情况,结果如下表。试比较屠宰场与肉食零售点猪肉表层沙门氏菌的带菌率之间差别有无统计学意义?
表1 屠宰场及肉食零售点猪肉表层沙门氏菌抽检结果
采样地点检查数阳性数值带菌率(%)
屠宰场28 2 7.14
【SAS 程序】:练习1
【练习2】有人对某部门22707名雇员中,普查了HBsAg,其中3454名阳性,19253名为阴性。从1975年起,追踪了3年,发现在阳性组有40名患了肝癌,阴性组仅一名患肝癌。试选用合适的方法对资料进行全面分析。
【SAS 程序】:练习2
【练习3】APOE-4等位基因与老年痴呆性的关联研究:以600名晚发及散发老年痴呆患者和400名正常对照为研究对象,分析APOE-4等位基因与老年痴呆性的关系。
表4 APOE-4等位基因与老年痴呆性病例对照关联研究
AGT 等位基因
例数
合计 病例组 对照组
APOE-4 240 60 300 非APOE-4
360 340 700 合计
【SAS 程序】:练习3
【练习4】请分析下表资料。已从专业上认定培养的阳性结果就是“真阳性”,而不会出现假阳性。
甲培养基 培养结果
例数
乙培养基结果:
+ - 合计 + 36 34 70 - 0 135 135 合计
36
169
205
配对设计2×2列联表资料总体率差异性检验统计量的计算公式 若b +c ≥40时
若b +c <40时
【SAS 程序】:练习4
()()c a c c a a odd ++=//)(11比数()()d b d d b b odd ++=//)(22比数d
b c a odd odd OR //21=
=1
)(2
2=+-=νχc b c b 1)1(2
2
=+--=νχc
b c b
【练习5】请分析下表资料。
表6 两法检查室壁收缩运动的符合情况
━━━━━━━━━━━━━━━━━━━
对比法测冠心病人数
定的结果核素法∶正常减弱异常
───────────────────
正常 58 2 3
减弱 1 42 7
异常 8 9 17
───────────────
合计 67 53 27
━━━━━━━━━━━━━━━━━━━
【SAS程序】:练习5
简单kappa检验和加权kappa检验这两种方法都是用来检验两种评价方法是否具有一致性的方法。其主要的区别是两种方法计算的公式不一样,更具体地说是对两个变量的打分不一样,简单kappa检验主要是利用对角线上的信息,加权kappa检验除了利用对角线上的数据外,还将对角线外的数据进行加权打分,将对角线外的信息也充分利用。所以在选择方法时应根据专业知识,如果两个变量取值的界线比较明确,如“+”“++”“+++”等,这时可以选用简单的kappa检验,如果两个变量的取值不十分明确,人为的因素较多时,就可选用加权kappa检验。
【练习6】请分析下表资料。
表5 某地6094人按2种血型系统划分的结果
━━━━━━━━━━━━━━━━━━━
ABO 人数
血型 MN血型:M N MN
───────────────────
O 431 490 902
A 388 410 800
B 495 587 950
AB 137 179 325
───────────────
合计 1451 1666 2977
━━━━━━━━━━━━━━━━━━━
【SAS程序】:练习6
?分析方法选择
不超过1/5的格子理论频数<5时,此类资料应采用
2
检验处理。
其他情形,可采用Fisher精确检验处理。
【练习7】请分析下表资料。
表7 3种药物疗效的观察结果
━━━━━━━━━━━━━━━━━━━
疗人数
效药物∶ A B C
───────────────────
治愈 15 4 1
显效 49 9 15
好转 31 50 45
无效 5 22 24
───────────────
合计 100 85 85
━━━━━━━━━━━━━━━━━━━【SAS程序】:练习7
【练习8】请分析下表资料。
表8 眼晶状体混浊度与年龄之关系
━━━━━━━━━━━━━━━━━━━
晶状体混眼数
浊程度年龄∶20~ 30~ 40~
───────────────────
+ 215 131 148
++ 67 101 128
+++ 44 63 132
───────────────
合计 326 295 408
━━━━━━━━━━━━━━━━━━━