医学统计学实验指导

医学统计学实验指导
医学统计学实验指导

医用统计方法练习

1、某医师研究用春雷素治疗小儿急性菌痢的疗效,实验组治疗患儿30例(4-5岁)都已用过氯霉素加痢特灵治疗无效,其中10例还曾用过OQPST(羟喹酞磺胺噻唑)加TMP 治疗无效;对照组用OQPST加TMP治疗患儿50例(4-5岁)。结果试验组治愈率83%,对照组治愈率80%。是否可以说明两组疗效近似?

2、指出下表不足之处,并进行修改。

两个治疗组对比

并发症

西药组中西结合组

例数

结果

例数

结果

良好死亡良好死亡

休克13 6 7 10 10 0

3、某医院传染科用侧柏叶注射合并化疗(简称合并组,34例)与单纯化疗(简称化疗组,34例)治疗肺结核的疗效比较如下表,指出下表绘制的缺点,并加以修正。

两组病例主要症状及体症恢复正常所需平均日数

症状体征例数组别

咳嗽吐痰潮热肺部湿罗音痰结核菌转阴

例平均差% 例平均差% 例平均差% 例平均差%

化疗34例

合并34例

4、用下表中资料绘成统计图

身高

(厘米)

122~126~130~134~138~142~146~150~154~158~合计人数 4 9 10 22 33 20 11 6 4 1 120

6、用下表所列资料绘图

传染病病死率(%)

白喉

流行性乙型脑炎流行性脑脊髓膜炎伤寒及副伤寒

痢疾

急性脊髓灰质炎10.9 18.0 11.0 2.7 1.2 3.4

7、根据下表所列资料绘成统计图

某地某年3~4岁儿童急性传染病构成

疾病病例数构成比(%)

猩红热麻疹百日咳白喉痢疾2920

2640

1450

530

470

36.5

33.0

18.1

6.6

5.8

合计8010 100.0

8、某医师检查了21名从事作业工人的血红蛋白量(g/100ml),资料如下表,试计算

均数及标准差。

14.8 14.7

15.4

14.4

13.7

13.7

14.1

15.4

14.4

16.4

15.3

12.5

14.2

17.0

14.8

14.4

14.9

14.4

12.8 15.6 15.9 9、某市110名健康男工人的血红蛋白(g/100ml)列于下表,将此资料编制频数表,

并计算均数,标准差及标准误。

11.8 14.9 13.8 15.6 14.8

13.3

14.5 14.5 14.6 12.3 14.0 14.8

16.5

14.8

14.9

13.5

12.7

13.4

14.1

12.1

14.3

13.9

15.8

16.0

13.9

13.5

14.6

13.8

14.3

15.0

14.3

14.0

14.0

16.3

11.9

16.8

14.8

15.8

15.5

12.8

15.2

13.0

14.0

12.5

13.8

17.4

16.0

13.8

13.7

13.4

14.7

12.5

14.1

14.7

14.7

15.6

13.7

12.0

13.8

15.3

13.8

13.7

14.7

15.0

13.0

12.9

13.4

15.2

15.1

15.0

14.2

13.9

14.2

14.4

12.8

14.1

14.9

14.0

15.4

10.1

13.2

15.5

13.1

11.9

13.1

14.2

12.6

14.2

15.2

14.0

14.6

15.3

11.4

14.8

13.9

16.2

15.0

15.1

15.4

13.2

12.2

13.5

14.0

14.7

13.5

13.1

13.8

10.7

14.9

15.1

10、调查某地107名正常人尿铅含量(毫克/升)结果列于下表,计算平均数(及第95百分位数)

尿铅含量(毫克/升)0~4~8~12~16~20~24~28~合计例数14 22 29 18 15 6 1 2 107

11、102名健康人的钩端螺旋体血凝抗体滴度分布如下表,试计算平均滴度。

抗体滴度1:100 1:200 1:400 1:800 1:1600 合计

人数7 19 34 29 13 102

12、有100个健康成年男子,用甲方法进行血钙值测定,得均数为10毫克/100毫升,标准差为2毫克/100毫升。

(1)根据此资料可否推测所有健康成年男子血钙值总体数可能的所在范围?

(2)现有一批成年男子血钙值为8毫克/100毫升,问此人的血钙值是否正常?

(3)另有120个健康成年男子,用乙方法进行血钙值测定,得均数为12毫克/100毫升,标准差为1.8毫克/100毫升。问甲、乙两方法均数差别有无显著性?

13、调查健康男性工人625人的血液红细胞,均数为475万/毫米3,标准差为50万/毫米3。如健康男性工人血液红细胞数呈正态分布。

(1)试求X+1.96S范围,并说明其意义;

(2)试求全体男性工人总体均数的95%可信区间。

14、某地1980年测定正常新生儿脑血脂(毫克/100毫升),结果如下表,试比较各项指标有无性别差异。

血脂

男女

人数均数标准差标准误人数均数标准差标准误

胆固醇甘油三脂378

375

71.4

37.6

21.6

22.5

1.1

1.2

373

367

79.3

38.8

24.0

25.8

1.2

1.3

?脂蛋白121 955.5 38.6 3.5 173 94.7 37.6 2.8

15、用雌鼠两组分别给以高蛋白或低蛋白饲料,实验期间自生后28天至84天止共计8周,观察各鼠所增体重,结果列于下表。问两组膳食对雌鼠增加体重有无不同。

饲料鼠数各鼠所增体重(克)

高蛋白12 134 146 104 119 124 161 107 83 113 129 97 123

低蛋白7 70 118 101 85 107 132 94

16、某医师治疗黑热病贫血病人7名,在治疗前后血红蛋白质如下,问治疗前后病人血

红蛋白的差别有无显著性?

病人编号

血红蛋白(g/100ml)

治疗前治疗后

1 2 3 4 5 6 7 36

45

65

55

42

60

65

45

65

70

65

51

60

63

17、某工厂保健站在“职工健康状况报告”中写到:“在946名工人中,慢性性病的有274人,其中女性219人,占80%,男性55人占20%,所以女工易患慢性病。”你认为是否正确?为什么?

18.审查以下表中的资料计算方法是否正确?

某医院各科病死率

科别患者数死亡数病死率

外科内科传染科1500

500

400

180

20

24

12.0

4.0

6.0

合计2400 224 7.3

19、在“锑剂短程疗法治疗血吸病15例死亡病例的临床分析”一文中,根据下表资料认为:“其中10—岁组死亡率最高,其次为20—岁组”,你是否同意?为什么?

20、某文章作者根据下表资料,说明沙眼20—岁组患病率最高,年龄大的反而患病率少。你同意吗?说明理由。

某医院门诊沙眼病人年龄构成比

年龄组沙眼人数构成比(%)

0- 10- 20- 30- 40- 50- 60- 47

198

330

198

128

80

38

4.6

19.3

32.1

19.3

12.4

7.8

3.7

70- 8 0.8

21、今有两个煤矿工人尘肺患病率资料如下表,是以标准化患病率进行比较,并作出结论。

工令(年)

甲矿乙矿

检查人数尘肺人数患病率检查人数尘肺人数患病率

6以下6—9 10以上14029

4285

2542

120

168

316

0.86

3.92

12.43

992

1905

1014

2

8

117

0.20

0.41

11.54

合计20856 604 2.9 3911 127 3.25

22、某地检查钩虫感染情况如下表,试问该地不同性别的人感染率有无差别?

性别检查人数阳性人数感染率(%)

男女200

150

60

20

30.0

13.3

合计350 80 22.9 23、某地疗法治疗乙型脑炎重症患者治愈率如下表,问两种疗法疗效有无差别?

分组病例数治愈数治愈率(%)

中西医结合组中医组100

200

50

70

50

35

24、某地对甲乙两零售点的猪肉,检查其表层沙门氏菌如下表,问两零售点带菌率的差别有无显著性?

采样地点采样例数阳性例数带菌率(%)

甲零售点28 2 7.14

乙零售点14 5 35.71

25、某市重污染区,一般市区和农村的出生婴儿的情况见下表,问3个地区出生的致畸率有无差别?

某市三个地区出生婴儿的致畸率比较

地区畸形数无畸形数合计致畸率(%)

重污染区一般市区农村114

444

67

3278

40103

8275

3392

40547

8342

33.61

10.95

8.03

合计625 51656 52281 11.95

26、根据下表资料,问我国南、北方鼻咽癌患者(按籍贯分)的病理学分类的构成比是否相同?

我国南北方鼻咽癌患者病理组织学分类构成

淋巴上皮癌未分化癌鳞癌其他合计

南方四省东北三省71

89

6

18

16

22

18

51

111

180

合计160 24 38 69 291

27、某医师用甲乙疗法治疗小儿单纯消化不良,治疗结果如下,问两种疗法的治愈率是否相同?

疗法痊愈率未全愈数合计治愈率(%)

甲乙26

36

7

2

33

38

78.79

94.74

合计62 9 71 87.32

28、某地区随机抽取30名糖尿病患者、IGT异常和正常人进行载脂蛋白(mg/dl)测定,结果见下表,问三种人的载脂蛋白有无差别?

糖尿病患者、IGT异常及正常人载脂蛋白测定结果

糖尿病IGT 正常人

85.7

105.2 109.5 96.0 115.2 95.3 110.0 100.0 125.6 111.0 106.5

96.0

124.5

105.1

76.4

95.3

110.0

95.2

99.0

120.0

144.0

117.0

110.0

109.0

103.0

123.0

127.0

121.0

159.0

115.0 附题

1 .根据1999 年某地某单位的体检资料,116 名正常成年女子的血清甘油三酯(mmol/L )测量结果见表1:

表1 某单位1999 年正常成年女子血清甘油三酯(mmol/L )测量结果

组段频数

0.6 ~ 1

0.7 ~ 3

0.8 ~9

0.9 ~13

1.0 ~19

1.1 ~25

1.2 ~18

1.3 ~13

1.4 ~9

1.5 ~ 5

1.6 ~1.7 1

合计116

问题1 :描述集中趋势应选择何指标?并计算。

问题2 :描述离散趋势应选择何指标?并计算。

问题3 :求该地正常成年女子血清甘油三酯的95% 参考值范围。

问题4 :试估计该地正常成年女子血清甘油三酯在0.8 mmol/L 以下者及 1.5 mmol/L 以下者各占正常女子总人数的百分比。

问题5 :该地90% 正常成年女子血清甘油三酯集中在哪个范围。

SPSS 程序

数据格式:1列116行,1个反应变量,变量名为“ 甘油三酯”。

程序:

FREQUENCIES

VARIABLES= 甘油三酯

/NTILES= 4

/PERCENTILES= 2.5 97.5

/STATISTICS=STDDEV SEMEAN MEAN SKEWNESS SESKEW KURTOSIS SEKURT

/HISTOGRAM NORMAL

/ORDER= ANALYSIS .

2. 某医生应用泼尼松、转移因子和胸腺肽治疗系统性红斑狼疮(SLE )患者14 人。治疗前后血清Sil-2R (U/ml )数据见表2:

表2治疗前后血清Sil-2R (U/ml )数据

No. 1 2 3 4 5 6 7

治疗前1410.37 893.54 1569.45 936.51 529.94 477.23 999.4

治疗后1353.57 876.88 1534.42 879.98 468.66 427.23 971.56 No. 8 9 10 11 12 13 14

治疗前474.85 873.04 252.61 1227.20 595.40 359.81 1097.99

治疗后446.67 825.06 175.30 1110.19 470.83 337.75 1022.31

问题1 :该医生对此数据应用两组独立样本的t 检验,结果为t =0.3737 ,自由度为26 ,P =0.7116 。于是,该医生的结论是治疗前后血清Sil-2R 的差异没有统计学意义。你是否同意这种分析结果?

问题2 :有人提议做配对资料的t 检验,如果治疗前后的差异有统计学意义就可以说明治疗有效。你是否同意这样做?

SPSS 程序

1、一本题为例做配对t 检验

数据格式:2列14行,2个反应变量,变量名为“ x1 ”和“ x2 ”。

程序:

T-TEST

PAIRS = x1 WITH x2 (PAIRED)

/CRITERIA = CI(.95)

/MISSING = ANALYSIS.

2、以本题为例做两样本均数比较的t 检验

数据格式:2 列28 行,1 个反应变量,变量名为“ x ”;1 个分组变量,变量名为“ group ”,有 2 个水平。

程序:

T-TEST

GROUPS = group(1 2)

/MISSING = ANALYSIS

/VARIABLES = x

/CRITERIA = CI(.95) .

3. 《脑积液磷酸己糖异构酶检测用于脑膜炎诊断的探讨》一文为比较三组患儿CST 中PHI 值是否不同,数据及分析结果见表3。

表3三组患儿CST 中PHI 值的比较

组别n t P

PM 15 407.0±294.7 5.34 <0.01

WM 、VE 14 15.0±13.1 6.47 <0.01

对照组23 7.0±4.8

问题1 :该资料采用的是何种统计分析方法?

问题2 :使用的统计分析方法是否正确?若不正确,可以采用何种正确的统计分析方法。

问题3 :采用该统计分析方法应满足什么条件?该资料是否满足?

SPSS 程序

本题做完全随机设计资料的方差分析

数据格式:2列52行,1个反应变量,变量名为“PHI 值”;1个分组变量,变量名为“ group ”,有3个水平。

程序:

ONEWAY

PHI 值BY group

/STATISTICS DESCRIPTIVES HOMOGENEITY

/PLOT MEANS

/MISSING ANALYSIS

/POSTHOC = SNK LSD ALPHA(.05).

4. 某研究者欲比较某药物与对照药的疗效,将类似病情的患者随机分成两组,分别接受该药物和对照药,结果见表 4 :

表 4 某药物治疗某病人疗效结果

疗效治疗组对照组合计

恶化 1 1 2

无变化 5 14 19

进步13 10 23

显著进步9 5 14

基本痊愈 2 0 2

合计30 30 60

对于该资料研究者作了列联表检验:

= 5.79 ,,,

在的检验水准上,不能认为某药物对治疗组与对照组的疗效不同。

问题1 :该资料的分析方法是否合适?为什么?

问题2 :应该如何分析该资料?

SPSS 程序

1、本题行列表资料的χ 2 检验

数据文件:“例13.sav”。

数据格式:3列8行。2个分类变量,“ 年份”和“ 医疗质量”;1个频数变量“ f ”。

程序:

WEIGHT

BY f .

CROSSTABS

/TABLES= 年份BY 医疗质量

/FORMAT= AVALUE TABLES

/STATISTIC=CHISQ

/CELLS= COUNT ROW

/COUNT ROUND CELL .

2、以本题为例做两组等级资料比较的秩和检验

数据格式:3列8行。1个分组变量“ 年份”,1个反应变量“ 医疗质量”,1个频数变量“ f ”。

程序:

WEIGHT

BY f .

NPAR TESTS

/M-W= 医疗质量BY 年份(1 2)

/MISSING ANALYSIS.

5.某地10 名一年级女大学生的胸围(cm )与肺活量(L )数据见表5所示。

表 5 10 名一年级女大学生的胸围(cm )与肺活量(L )学生编号1 2 3 4 5 6 7 8 9 10

胸围X 72.5 83.9 78.3 88.4 77.1 81.7 78.3 74.8 73.7 79.4

肺活Y 2.51 3.11 2.72 3.38 2.83 2.86 2.72 1.91 2.98 3.28

问题1 :按此资料绘制散点图?

问题2 :求直线回归方程并对回归系数作假设检验。

问题3 :求直线相关系数,相关系数的假设检验结果与直线回归系数会一致吗?为什么?

问题4 :试估计胸围为75cm 时的平均肺活量,计算其95 %的可信区间,并说明其含义。

问题5 :求胸围为75cm 时,某地一年级大学生肺活量的95 %的散布范围,并解释其含义。

SPSS 程序

以本题为例做直线相关回归分析(含散点图)。

数据格式:2列10行。1个自变量“ x ”,1个因变量“ y ”。

程序:

REGRESSION

/MISSING LISTWISE

/STATISTICS COEFF OUTS CI R ANOVA /CRITERIA=PIN(.05) POUT(.10)

/NOORIGIN

/DEPENDENT y

/METHOD=ENTER x .

GRAPH

/SCATTERPLOT(BIVAR)=x WITH y

/MISSING=LISTWISE .

医学统计学学时的次实验要求及习题

实验一定量资料的统计描述 实验目的及要求: (1)掌握定量资料统计描述的概念、公式、意义及应用条件。 (2)熟悉正态分布的概念和特点。 (3)了解:正态分布的应用及医学参考值的制定方法。 实验内容:《实验指导与练习》p6 4.某地120名12岁健康男孩身高(cm)资料如下表。计算x、S、CV及正常值范围。 表2-4某地12岁健康男孩身高数据 身高分组120~125~130~135~140~145~150~155 人数8 15 23 29 22 22 16 四、思考题 1.算术均数、几何均数、中位数应用条件是什么? 2.标准差、四分位数间距各自应用条件是什么? 3.简述正态分布的特点及应用? 实验二t、u检验与方差分析 实验目的及要求: (1)掌握:均数t检验和u检验适用条件及计算方法,方差分析的基本思想。 (2)熟悉:总体均数区间估计的概念、意义及计算方法。 (3)了解:方差齐性检验的概念。 实验内容:《实验指导与练习》p9-10 1.据下表问:中草药治疗后舒张压有否变化? 表3-1某医院用中草药治疗10名高血压病人的舒张压值 治疗前115 110 129 109 110 116 116 116 120 104 治疗后116 90 108 87 92 90 110 120 88 96 5.健康成年男子脉搏平均次数为72次/分。现调查25名某山区健康成年男子脉搏平均次数为74.2次/分,标准差为 6.5次/分。问:山区健康成年男子脉搏数与一般健康成年男子脉搏数有否不同? 10.调查18岁泰安市区及乡村男生各60名的身高数据(cm),市区平均身高170.6cm,标准差5.62cm;乡村的平均身高166.86cm,标准差为5.08cm, ①试比较泰安城乡之间男生身高有无显着差别? ②试估计泰安城区男生身高总体均数的95%及99%可信区间。 四、思考题 1.标准差与标准误的区别主要有哪几点? 2.参考值范围与可信区间的区别是什么? 3.简述假设检验的基本思想。

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

几则很有趣的医学统计学故事

几则很有趣的医学统计学故事 医学统计学是一门很奇妙的科学。要说它简单吧,其实也挺简单的,常见的统计方法也就十余种,在教科书上都能找到,只要熟练掌握了,虽不敢夸下海口说可以“以秋风扫落叶的气概横扫四海之内的杂志”,但足以轻车熟路地应付99%的科学研究。要说它复杂吧,也挺复杂的,毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。 很多同行在学习医学统计学时,都在抱怨自己很难走出“一学就会,一会就用,一用就错,一错就懵”的怪圈。究其原因,主要是部分同行学习医学统计学时都抱着一副“依葫芦画瓢”的态度,试图“套用统计学方法”来解决自己面临的问题,而不去仔细思考统计学方法的来龙去脉。本文拟谈几则与医学统计学相关的故事,希望能帮助大家从宏观上正确认识医学统计学这门科学。 1、两个指标诊断疾病的问题 路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。路人甲以A和B 的参考范围上限作为诊断界值,得出了A和B在该界值下对应的诊断敏感性和特异性。结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。 路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A和B的诊断价值。文章的结论到底是想说明A优秀还是B优秀呢?Reject! 这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。 稿件被退了,路人甲有些许郁闷。经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。路人甲很快绘制了ROC 曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A的,其理由就是因为B的曲线下面积大于A。 路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,B的曲线下面积高于A,但是导致这种差异的原因有两种,一种是抽样误差,一种是试验效应,即B确实是高于A的。你怎么能确定这不是抽样误差呢?在统计学上,要确定0.82是否高于0.80,就一定要经过统计学检验的。Reject! 这个故事说明:在医学科研中,没有经过统计学检验的结论多半是不科学的。

常用医学统计学方法汇总

选择合适的统计学方法 1 连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t 检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t 检验;(2)采用非参数检验,如Wilcoxon 检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t '检验;(2)采用非参数检验,如Wilcoxon 检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t 检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon 的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1 资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果 为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe 法,SNK 法等。 1.3.2 资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal -Wallis 法。如 果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni 法校正P 值,然后用成组的Wilcoxon 检验。 1.4 多组随机区组样本比较 1.4.1 资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD 检验,Bonferroni 法,tukey 法,Scheffe 法,SNK 法等。 1.4.2 资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman 检验法。如果 检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni 法校正P 值,然后用符号配对的Wilcoxon 检验。 **** 需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD 检验,Bonferroni 法,tukey 法,Scheffe 法,SNK 法等。** 绝不能对其中的两 组直接采用t检验,这样即使得出结果也未必正确**

医学统计学名词解释

1.统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学 2.医学统计学:是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。 3.变量:是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示 4.同质:是指事物的性质、影响条件或背景相同或相近。 5.变异:是指同质的个体之间的差异 6.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 7.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 8.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。 9.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。

10.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 11.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 12.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 13.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。 14.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。等级资料又称有序变量 15.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。16随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变

《医学统计学》复习题

医学统计学复习题 一、名词解释 1.总体:根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 2.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 4.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 5.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。 6.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O四种血型的人数等。 7.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序资料。如患者的治疗结果可分为治愈、好转、有效、无效、死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量。 8.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。 9.频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 10. 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 11.系统误差:是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 12.参数:指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统

重点医学统计学试题及答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数

C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数

统计学实验指导书(Excel)

《统计学》实验指导书 【试验目的】 通过实验教学,使学生验证并加深理解和巩固课堂教学内容,掌握常用统计分析方法在Excel、SPSS 的应用,理解和掌握统计分析方法的应用原理、基本条件、实现步骤、结果的内涵等问题。通过实验,使学生能够结合具体任务和条件对社会经济问题进行初步的调查研究,结合自己的专业,在定性分析基础上做好定量分析,提高学生的科研能力和解决实际问题的能力,以适应社会主义市场经济中各类问题的实证研究、科学决策和经济管理的需要。 【试验内容】 一、Excel中的统计分析功能 包括: 1、数据的整理与显示,包括数据的排序与筛选、数据透视表与分类汇总、制作频数分布表和绘制各种统计图。 2、计算描述统计量,选择适合的描述统计量反映统计数据的集中和离中趋势。 3、利用Excel进行推断统计。 4、利用Excel进行相关回归分析。 试验一:数据的整理与显示 (一)数据的筛选和排序 1、数据的筛选 在对统计数据进行整理时,首先需要进行审核,以保证数据的质量。对审核中发现的错误应尽可能予以纠正。如果对发现的错误无法纠正,或者有些数据不符合调查的要求而又无法弥补时,就要对数据进行筛选。 数据筛选有两方面内容:一是将某些不符合要求的数据或有明显错误的数据予以剔除;二是将符合某种特定条件的数据筛选出来,不符合特定条件的数据予以剔除。数据筛选可借助于计算机自动完成。 下面通过一个实例说明用Excel进行数据筛选的过程。 【例】下表是8名学生4门课程的考试成绩数据(单位:分)。试找出统计学成绩等于75分的学生,英语成绩最高的前三名学生,4门课程都高于70分的学生。 8名学生的考试成绩数据 首先,选择“工具”菜单,并选择“筛选”命令。如果要筛选出满足给定条件的数据,可使用自动筛选命令。如图所示。

医学统计学第版单选题

《医学统计学》单项选择题 摘自:马斌荣主编.医学统计学.第5版.北京:人民卫生出版社,2008 第一章医学统计中的基本概念 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 A.收缩压测量值 B.脉搏数 C.住院天数 D.病情程度 E.四种血型 4. 随机误差指的是 A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. 系统误差 C. 过失误差 D. 记录误差 E.仪器故障误差 答案: E E D E A 第二章集中趋势的统计描述 1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 B. 几何均数 P百分位数均数C. D. 95E. 频数分布 2. 算术均数与中位数相比,其特点是 A.不易受极端值的影响 B.能充分利用数据的信息 C.抽样误差较大 D.更适用于偏态分布资料 E.更适用于分布不明确资料 3. 一组原始数据呈正偏态分布,其数据的特点是 A. 数值离散度较小 B. 数值离散度较大 C. 数值分布偏向较大一侧 D. 数值分布偏向较小一侧 E. 数值分布不均匀 4. 将一组计量资料整理成频数表的主要目的是 便于计算 B. .化为计数资料A. C. 形象描述数据的特点 D. 为了能够更精确地检验

医学统计学重点

医学统计学重点 第一章绪论 1.基本概念: 总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。 样本:从总体中随机抽取部分个体的某个变量值的集合。 总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。 统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。 抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。 频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。 概率:频率所稳定的常数称为概率。 统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。 统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。 2.样本特点:足够的样本含量、可靠性、代表性。 3.资料类型: (1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。 (2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料) ①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由 各分组标志及其频数构成。包括二分类资料和多分类资料。 二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。 多分类:将观察对象按多种互斥的属性分类 ②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单 位的个数所得的资料。 4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。

医学统计学练习

1.假设检验在设计时应确定的是 A.总体参数B.检验统计量C.检验水准 D.P值E.以上均不是 2.如果t≥2,υ,,可以认为在检验水准α=处。 A.两个总体均数不同B.两个总体均数相同C.两个样本均数不同D.两个样本均数相同E.样本均数与总体均数相同 3. 计量资料配对t检验的无效假设(双侧检验)可写为。 A.μd=0 B.μd≠0 C.μ1=μ2 D.μ1≠μ2E.μ=μ0 4.两样本均数比较的t检验的适用条件是。 A.数值变量资料B.资料服从正态分布C.两总体方差相等 D.以上ABC都不对E.以上ABC都对 5.在比较两组资料的均数时,需要进行t/检验的情况是: A.两总体均数不等B.两总体均数相等C.两总体方差不等D.两总体方差相等E.以上都不是 6.有两个独立的随机样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度为。 A.n1+n2 B.n1+n2-1 C.n1+n2+1 D.n1+n2-2 E.n1+n2+2 7. 已知某地正常人某定量指标的总体均值μ0=5,今随机测得该地特殊人群中的30人该指标的数值。若用t检验推断该特殊人群该指标的总体均值μ与μ0之间是否有差别,则自由度为。 A.5 B.28 C.29 D.4 E.30 8. 两大样本均数比较,推断μ1=μ2是否成立,可用。 A.t检验B.u检验C.方差分析 D.ABC均可以E.χ2检验 9.关于假设检验,下列说法中正确的是 A.单侧检验优于双侧检验 B.采用配对t检验还是成组t检验由实验设计方法决定

C.检验结果若P值大于,则接受H0犯错误的可能性很小 D.用Z检验进行两样本总体均数比较时,要求方差齐性 E.由于配对t检验的效率高于成组t检验,因此最好都用配对t检验 10. 为研究新旧两种仪器测量血生化指标的差异,分别用这两台仪器测量同一批样品,则统计检验方法应用。 A.成组设计t检验B.成组设计u检验C.配对设计t检验 D.配对设计u检验E.配对设计χ2检验 11. 阅读文献时,当P=,按α=水准作出拒绝H0,接受H1的结论时,下列说法正确的是。A.应计算检验效能,以防止假“阴性”结果 B.应计算检验效能,检查样本含量是否足够 C.不必计算检验效能D.可能犯Ⅱ型错误 E.推断正确的概率为1-β 12.两样本均数假设检验的目的是判断 A. 两样本均数是否相等B. 两样本均数的差别有多大 C.两总体均数是否相等D. 两总体均数的差别有多大 E. 两总体均数与样本均数的差别有多大 13.若总例数相同,则成组资料的t检验与配对资料的t检验相比: A.成组t检验的效率高些B.配对t检验的效率高些 C.两者效率相等D.两者效率相差不大E.两者效率不可比 15. 两个总体均数比较的t的检验,计算得t>2,n1+n2-2时,可以认为。 A.反复随机抽样时,出现这种大小差异的可能性大于 B.这种差异由随机抽样误差所致的可能性小于 C.接受H0,但判断错误的可能性小于 D.拒绝H0,但犯第一类错误的概率小于 E.拒绝H0,但判断错误的概率未知 16. 为研究两种仪器测量血生化指标的差异,分别用这两台仪器测量同一批血样,则统计检验方法应用。 A.配对设计t检验B.成组设计u检验C.成组设计t检验 D.配对设计u检验E.配对设计χ2检验 17. 在两组资料的t检验中,结果为P<,差别有统计学意义,P愈小,则: 。

医学统计学 课后问题详解

1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。故参数检验依赖于特定的分布类型,比较的是总体参数 2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。适用围广,可适用于任何类型资料 参数检验 ?优点:资料信息利用充分;检验效能较高 ?缺点:对资料的要求高;适用围有限 2.非参数检验 ?优点:适用围广,可适用于任何类型的资料 ?缺点:检验效能低,易犯Ⅱ型错误 凡适合参数检验的资料,应首选参数检验 对于符合参数检验条件者,采用非参数检验,其 检验效能低,易犯Ⅱ型错误 第一章绪论 1.举例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。 当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。 第二章调查研究设计 1.调查研究主要特点是什么? 调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观

医学统计学公式整理 简洁版

集中趋势的描述 算术均数: 频数表资料(X0为各组段组中值) n fX f fX x O O ∑∑∑== 几何均数: n n X X X G ...21= 或 ) log ( log 1 n X G ∑-= 频数表资料: ? ?????=????????=∑∑∑--n X f f X f G log lg log log 11 中位数:(1)* 2 1 +=n X M (2) ) (21* 12*2++= n n X X M 百分位数 ?? ? ??-?+ =L X X f n X f i L P 100其中:L 为欲求的百分位 数所在组段的下限 , i 为该组段的组距 , n 为总频数 , X f 为 该组段的的频数 , L f 为该组段之前的累计频数 方差: 总体方差为:式(1); 样本方差为 式(2) (1) N X 2 2 )(μσ-∑= (2) 1)(2 2--∑= n X X S 标准差: 1)(2--∑= n X X S 或 1/)(22-∑-∑= n n X X S 频数表资料计算标准差的公式为 1/)(22-∑∑∑-∑= f f fx fx S 变异系数:当两组资料单位不同或均数相差较大时,对变异 大小进行比较,应计算变异系数 %100?= X S CV 常用的相对数指标 (一)率 (二)相对比(三)构成比 1.直接法标准化 N p N p i i ∑= ' ∑=i i p N N p )(' 2.间接法标准化 预期人数实际人数= SMR ∑=i i P n r SMR S M R P P ?=' 正态分布:密度函数: )2/()(2221)(σμπ σ--= X e X f 分布函数: 小于X 值的概率,即该点正态曲线下左侧面积 )()(x X P x F <= 特征:(1)关于x=μ对称。(2)在x=μ处取得该概率密度函数的最大值,在σμ±=x 处有拐点,表现为钟形曲线。(3)曲线下面积为1。(4)μ决定曲线在横轴上的位置,σ决定曲线的形状 。(5)曲线下面积分布有一定规律 标准正态分布:对任意一个服从正态分布的随机变量,作如下标准化变换 σ μ-= X u ,u 服从总体均数为0、总体标准 差为1的正态分布。 u 值左侧标准正态曲线下面积为标准正态分布函数,记作 )(u Φ 医学参考值的确定方法:(1)百分位法:双侧(P 25,P 975),单侧P 95以下或P 5以上,该法适用于任何分布型的资料。(2)正态分布法:若X 服从正态分布,双侧医学参考值范围为 S X 96.1± 样本均数标准误的估计值为 X s = t 分布的概念:小样本总体标准差未知时,服从自由度为n-1 的t 分布 X X X t s μ-= 总体均数可信区间的计算: 大样本或总体标准差已知:式(1); 小样本:式(2) (1)n S X ? ±96.1 (2)n S n t t ?±-)1(,05.0(前一个t 表示均数) 单样本t 检验: n S X t /0 μ-= 自由度为 n-1; 配对样本t 检验: 检验统计量: n S d t d /0-= 自由度为n-1(n 为对子数) 两样本t 检验:检验统计量: ) 11(2 12 1n n S X X t c +-= (错: Sc 的平方) 2 )()(2)1()1(21222211212 222112-+-+-= -+-+-= ∑∑n n X X X X n n S n S n S c 方差齐性检验:H 0:两总体方差齐,H 1:两总体方差不齐,α=0.1 检验统计量: (较小)(较大)2 2 2 1 S S F = 分子自由度为n 1-1,分母自由度为n 2-1 方差分析的基本思想: 1、总变异:总离均差平方和: 2() 1 T ij i j SS SS X X N νν=-==-∑∑总总= ∑∑-=N X X ij ij /)(22 ∑=N X C ij /)( 2 2. 组间变异:组间变异反映了处理因素的影响(如处理确实有作用),同时也包括了随机误差(含个体差异和测量误差)。 21() 1 B i i i SS SS n X X k νν-==-∑组间组间== = C n X i i ij -∑ ∑2 )( 3. 组内变异:组内变异仅反映随机误差(含个体差异和测量误差),故又称误差变异。 222()(1) W E ij i i i i j i SS SS SS X X n S N k νν===-=-==-∑∑∑组内组内 2()(1) W E ij i i i i j i SS SS SS X X n S N k νν===-=-==-∑∑∑组内组内 1(1)()N k N k ννν=-=-+-=+总组间组内 组间均方与组内均方比值一般地服从分子自由度为ν1,分母 自由度为ν2的F 分布 12 1 MS F k N k MS νννν= ==-==-组间 组间组内组内 , 二项分布的概率函数P (X ): X n X X n C X P --=)1()(ππ; )! (!!X n X n C X n -= 二项分布的均数和标准差:进行n 次独立重复试验,出现X 次阳性结果 X 的总体均数为πμn = 总体方差为)1(2ππσ-=n 总体标准差为)1(ππσ -=n 如果将阳性结果用频率表示 n X p = 率的总体均数 π μ=p 标准差 n p ) 1(ππσ-= n p p n p p S p )1(1 ) 1(-≈--= 又称率的标准误它反映率的抽样误差的大小。 单侧累积概率计算:出现阳性的次数至多为k 次的概率为 ∑∑ ==---==≤k X k X X n X X n X n X P k X P 0 0)1()! (!! )()(ππ 出现阳性的次数至少为k 次的概率 ∑∑ ==---==≥n k X n k X X n X X n X n X P k X P )1()! (!! )()(ππ 率的可信区间的估计 正态近似法:当)1(,p n np - 均大于等于5时 n p p p n p p P )1(96.1,)1(96.1-+-? - 样本率与总体率的比较: 检验假设H 0:π=π0,H 1:π≠π0 1 . 满足正态近似时,计算检验统计量 ) 1(000 πππ--= n n X Z 或 n p Z ) 1(000 πππ--= 2. 不满足正态近似时用直接概率计算法 两样本率的比较:H0:π1=π2,H1:π1≠π2, 检验统计量: ) 1 1)(1(| |2121n n p p p p Z c c +--= 2121n n X X p c ++= Poisson 分布的概率函数为 ! )(X e X P X λλ -= POISSON 分布的应用: 单侧累计概率计算:稀有事件发生次数至多为k 次的概率为 ∑∑==-==≤k X k X X X e X P k X P 0 ! )()(λλ 发生次数至少为k 次的概率为 )1(1)(-≤-=≥k X P k X P 总体均数的区间估计:正态近似法 95%总体均数的可信区间为X X X X 96.1,96.1+- 样本率和总体率的比较 正态近似法: 当满足正态近似条件时, 对检验假设 H0:λ=λ0,H1:λ≠λ0, 检验统计量为 λ λ-= X Z 两组独立样本资料的Z 检验 :当两总体均数都大于20时, 对检验假设H0:λ1=λ2, H1:λ1≠λ2,当两样本观测单

《医学统计学》学习指南

《医学统计学》课程 ——学习指南 第一章医学统计学概论 教学要求: 1.能够了解“医学统计学”的概念以及统计工作的一般步骤。 2.能够解释并举例说明医学统计学中所涉及的基本概念。 3.能够识别医学资料的类型。 教学重点、难点: 重点: 1.统计学中的几个基本概念。 2.医学研究中常见的资料类型。 难点: 1.小概率事件与小概率原理。 第二章计量资料的统计描述 教学要求: 1.能够了解频数分布表的编制方法及分布图的绘制,并以此描述资料的频数分布特征。 2.能够了解正态分布的概念、特征及应用,掌握标准正态分布的基本规律。 3.能够掌握各种平均数指标的计算,特点及其适用条件。 4.能够掌握各种离散趋势指标的计算,特点及其适用条件。 教学重点、难点: 重点: 1. 集中趋势与离散趋势指标的特点与适用范围。 2. 正态分布的基本概念和特征。 难点: 1. 95%参考值范围的计算。 第三章计数资料的统计描述 教学要求: 1.能够识别常用相对数指标的概念和计算方法,并能举例说明。 2.能够理解应用相对数的注意事项。 3.能够了解动态数列的作用和常用指标。

4.能够了解Simpson悖论的原理和标准化率的计算方法。 教学重点、难点: 重点: 1.常用相对数指标的类型与计算方法。 2.应用相对数指标的注意事项。 难点: 1.应用相对数指标的注意事项。 第四章统计表与统计图 教学要求: 1.了解统计表的基本结构和绘制的基本要求。 2.了解统计图的基本结构、绘制的基本要求。 3.能够选用正确的统计图描述数据资料。 4.能够运用统计软件绘制常用的统计图。 教学重点、难点: 重点: 1.错误统计表的修改。 2.常用统计图绘制及其图形选择。 难点: 1.统计图的正确选用。 第五章参数估计 教学要求: 1.掌握样本均数(率)抽样误差基本概念及计算。 2.掌握总体均数(率)置信区间的概念和估计方法。 3.了解t分布的分布特征和应用。 4.了解标准误和标准差的区别。 教学重点、难点: 重点: 1. 抽样误差的概念和计算。 2. 单个总体均数置信区间和两个总体均数差的置信区间的估计方法。难点: 1. 单个总体均数置信区间基于的理论分布。 2. 两个总体均数差的置信区间的估计方法的理论分布。

医学统计学公式总结

一 资料的描述性统计 (一)算术均数(mean) (1)简单算术平均值定义公式为(直接法): (2)利用频数表计算均数(加权法): (二)方差(即标准差的平方) (三)变异系数 二 参数估计与参考值范围 (一)均数的标准误 (二)样本率的标准误 (p 为样本率) (三)T 分布 (u 为总体均数) (四)总体均数的区间估计 (一般要求 计算95%或99%的可信区间) (五)总体率的区间估计 (六)参考值范围估计 双侧1-a 参考值范围: s u x a 2/± 单侧1-a 参考值范围: s u x a ->或s u x a +< (可信区间计算是用标准误,参考值范围计算用标准差,百分位数法大家自己看书) 三 T 检验与方差分析 (一)T 检验 (1)单样本T 检验 n x n x x x x x n ∑= ++++= 321∑∑= ++++++++=f fx f f f f x f x f x f x f x k k k 3213322111 )(2 2--= ∑n x x s 22 2()/1 x x n s n -= -∑∑%100?= x s CV n s s x = n p p s p ) 1(-=n s x t μ-=x x s t x s t x ναναμ,2/,2/+<<-p p s u p s u p 2/2/ααπ+<<-

检验假设: (假设样本来自均数为0 u 的正态总体) 统计量t 值的计算: (2)配对T 检验 检验假设: 统计量t 值的计算: (d 为两组数据 的差值,Sd 为差值的标准差) (3)两样本T 检验 检验假设: 统计量t 值的计算: 其中 两样本方差齐性检验 (即为两样本方差的比值) (二)单因素方差分析 SS MS F SS MS νν= = B B B W W W (1)完全随机设计资料的方差分析 这里 (T 即为该组数据之和) (2)随机单位组设计资料的方差分析 SS 总=SS 处理+SS 区组+SS 误差 V 总=V 处理+V 区组+V 误差 μμ=:H 1 ,/0 0-=-=-= n n s x s x t x νμμ0210==-μ μμ:H d d t s μ-== 1 -=n ν210μμ=:H 2 1)()(2121x x s x x t ----=μμ2 21-+=n n ν ? ??? ??+=-2121121n n s s C x x 2)()(112222112-+∑-∑+-=n n x x x x s C 2221s s F =111-=n ν1 2 2-=n ν组内组间总SS SS SS +=组内 组间总ννν+=2()/C x N =∑ij j T x = ∑

医学统计学绪论完整课件

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学绪论完整课件 医学统计学(( Medical Statistics))绪论(( Instruction )) 3 工作和生活中常见的统计学问题明天是否下雨?体育彩票能否中奖?( 概率论子女为什么象父母,其强度有多大?( 相关与回归归人口普查、疾病调查是如何进行的?( 调查设计,抽样如何判断药物的疗效?( 假设检验统计学是对令人困惑费解的数字问题做出设想的艺术。 4 统计是一种对客观现象数量方面进行的调查研究和分析; 是收集、整理、分析、推断、判断等认识活动的总称。 统计学(Statistics )的定义 A science dealing with the collection, analysis, interpretation, and presentation of masses of numerical data ( Webster International Dictionary ) The science and art of dealing with variation in data through collection, classification, and analysis in such a way as to obtain reliable results (A Dictionary of Epidemiology) 统计学:是关于数据收集、整理、表达、分析与推断的普遍原理和方法,是一门处理数据变异性的科学与艺术,其目的是求得可靠的结果。 统计学是工具学科,指导专业学科的学习和应用。 7 医学统计学是应用统计学基本原理 1 / 12

相关文档
最新文档