医学统计学样题及答案

1、某市1974年为了解该地居民发汞的基础水平，调查了留住该第一年以上，无明显肝、

肾疾病，无汞作业接触史的居民238人的发汞含量如下：

发汞值1.5～3.5～5.5～7.5～9.5～11.5～13.5～15.5～17.5～19.5～21.5（ mol/kg）: 人数20 66 60 48 18 16 6 1 0 3

（1）说明此频数分布的特征。

（2）选用何种指标描述其集中趋势和离散趋势？

（3）估计该地居民发汞值的95%参考值范围？

答：（1）偏态分布

（2）选用中位数描述集中趋势，四分位间距描述离散趋势

（3）

频数相对频数累积频数累积相对频数

1.5～20 0.08403361 20 0.084034 3.5～66 0.27731092 86 0.361345 5.5～60 0.25210084 146 0.613445 7.5～48 0.20168067 194 0.815126 9.5～18 0.07563025 212 0.890756 11.5～16 0.06722689 228 0.957983 13.5～ 6 0.02521008 234 0.983193 15.5～ 1 0.00420168 235 0.987395 17.5～0 0 235 0.987395 19.5～21.5 3 0.01260504 238 1 合计238

P2.5=1.5+(238×2.5%-0)×2/20=2.095

P97.5=13.5+(238×97.5%－228)×2/6=14.85

所以估计该地居民发汞值的95%参考值范围（2.095，14.85）

2、某市场出售一批番茄汁罐头，罐头内vc平均含量（mg/100g）是未知的。今从中抽取

16个罐头，经测定含量如下：

16，22，21，23，21，19，15，13，23，17，20，29，18，22，16，25

计算：（1）试问这批罐头内vc平均含量及95%区间估计？

（2）假如另一批罐头vc平均含量为22mg/100g，试问这两批罐头vc含量是否相同？

答：（1）样本平均值＝20 样本标准差＝4.115 16开方＝4

20－2.131×4.115/4=17.8

20＋2.131×4.115/4=22.192

(17.8, 22.192)

(2) 22∈(17.8, 22.192)

所以含量相同

3、某药厂为了解其生产的某药物（同一批）之有效成分含量是否符合国家规定的标准，随机抽取了该药10片，得其样本均数为103.0mg，标准差2.22mg，试估计该批药物有效成分的平均含量？

答：该批药物有效成分的平均含量的95%可信区间为：

（样本均值-1.96标准误，样本均值+1.96标准误）

即：（101.6，104.4）

4、为了观察寒冷对动物鸟中17-KS排出量的影响，实验安排了营养正常组的大白鼠在寒冷前与寒冷后分别测定尿中17-KS排出量，请问这个实验设计的模型是什麽？

答：这个实验设计的模型是配对设计资料的t检验

5、男性四组人群营养实验中胡罗卜素春、夏、秋、冬四季之比较

春夏秋冬 ∑X 13373.10 13313.00 11739.20 7063.00 N 137 179 135 123

x 97.61 74.37 86.96 57.42

∑X 2 1454669.21 1133189.22 1174964.10 481172.32 （1）试检验四季之间胡萝卜素存留量（毫克）有无显著差别？（2）如有显著差别，应如何确定？（一）

1. 假设和和确定检验水准

H0 ：四季之间胡萝卜素存留量的总体均数相等，μ1=μ2=μ3=μ4 H1 ：四季之间胡萝卜素存留量总体均数不全相等 α=0.05

检验统计量F 值

∑X ＝13373.10+13313.10+11739.20+7063.00＝45488.30 N ＝137+179+135+123＝574 ∑X2＝4243994.85

C=（∑X ）2/N=(45488.30)2

/574=3604852.68

∑

=-=-=

740.86050.33079.416)22

C x x x SS ij （总

＝4243994.85－3604852.68＝639142.17

ν总 = N-1 = 574-1=573

091

.4505.330107.18106.24100.25106.46)x (

)

(SS 2

2222

ij 2

=-+++=-=-=

∑

∑∑C n

x x n i

i 组间＝（13373.10）2

/137 ＋（13313.00）2

/179 ＋（11739.20）2

/135＋（7063.00）2

/123

－3604852.68＝117075.46

ν组间 = k-1 =4-1 =3

SS 组内=∑

-2

)(i ij

x x

=S 总- SS 组间 =639142.17-117075.46

=522066.71

ν组内= N-k =574-4=570

MS 组间 = SS 组间/ν组间 =117075.46/3=39025.15

MS 组内 = SS 组内/ν组内=522066.71/570=915.91

F= MS 组间/MS 组内=39025.15/915.91=42.61

方差分析结果表

变异来源SS νMS F P 总639142.17 573

组间117075.46 3 39025.15 42.61 <0.01

组内522066.71 570 915.91

3.确定P值和作出推断结论以ν1（ν组间）=3及ν2（ν组内）=570，查F界值表

得P<0.01，按 =0.05水准拒绝H0，接受H1，故可以认为四季之间胡萝卜素存留量（毫克）差别有统计学意义。

（二）

进行平均值之间的多重比较，未讲略

6、五只高血压狗口服萝芙木总碱（2-8mg/kg体重），其收缩压的变化如下：

试分析不同用药时间，动物间服药后收缩压的变化。

答：做随机区组方差分析：

Σj Y ij

917 692 864 2468

Y i平均182.4 138.4 172.8 164.53

Σj Y2ij

170270 97390 151944 419604

提出假设检验：

H0：τi=0; H1：τi≠0，至少有一个不等式成立。

H0：βj=0; H1：βj≠0，至少有一个不等式成立。

α=0.05。

SS总＝13535.73；v总＝14

SS处理＝5352.53；v处理＝2

SS区组＝7075.73；v区间＝4

SS误差＝1107.47；v误差＝8

由此，列方差分析表得

方差分析表

变异来源SS νMS F P

处理5352.53 2 2676.265 19.33246047 <0.01 区组7075.73 4 1768.9325 12.77818812 <0.01 误差1107.47 8 138.43375

总计13535.73 14

注：查表得F0.05（2，8）＝4.46，F0.01（2，8）＝8.65。F0.05（4，8）＝3.84，F0.01（4，8）＝7.01

统计学结论：

（1）处理因素在α=0.05水平上拒绝H0，接受H1。

（2）区组因素在α=0.05水平上拒绝H0，接受H1。

因此，不同用药时间，收缩压差别极显著；而不同的狗，收缩压差别也极显著

7、每组6只动物（羊）给某种激素再不同时间抽血，观察其血浆磷脂含量变化

对照给雌激素

合计

上午下午上午下午

8.53 39.14 17.53 32.00

20.53 26.20 21.07 23.80

14.00 31.33 20.80 28.87

10.80 45.80 20.07 25.06

40.20 29.33

27.52

说明：因原题目中数据不全，每组只按数据齐全的前4只进行计算；此外，原题目未说明希望分析的问题，故应用方差分析和t检验分析该问题。

1．方差分析

应用方差分析前，先做方差齐性检验：S112=20.414, S122=74.388, S212=2.607, S222=13.917。方差不齐，不能应用方差分析。

若此题方差齐，应用方差分析过程应为：

(1)给予雌激素的假设：

H0：τi=0; H1：τi≠0，至少有一个不等式成立。

α=0.05。

(2)测量时间的假设：

H0：βj=0; H1：βj≠0，至少有一个不等式成立。

α=0.05。

(3)交互作用的假设：

H0：(τβ)ij=0; H1：(τβ)ij≠0，至少对一种(ij)组合成立。

α=0.05。

SS总=10743.0815-385.532/16=1453.495

ν总=16-1=15

SS A=(196.332+189.202)/(2×4)- 385.532/16=3.177

νA=2-1=1

SS B=(133.332+252.202) /(2×4) - 385.532/16=883.130

νB=2-1=1

SS AB=(53.862+142.472+79.472+109.732)/4-(196.332+189.202)/(2×4)-(133.332+252.202)

/(2×4)+385.532/16= 212.7952

νAB=(2-1)×(2-1)=1

SS误差=SS总- SS A - SS B- SS AB =354.393

ν误差=ν总-νA-νB-νAB =12

方差分析表

变异来源SS νMS F P

A雌激素 3.177 1 3.1770.108（4.75）>0.05

B测量时间883.130 1 883.13029.903（4.75）<0.05

A*B交互212.7952 1 212.7957.205（4.75）<0.05 误差354.393 12 29.533

总计1453.495 15

统计学结论：

（1）接受H0：τi=0的无效假设;拒绝H1：τi≠0，至少有一个不等式成立。

（2）拒绝H0：βj=0的无效假设; 接受H1：βj≠0，至少有一个不等式成立。

（3）拒绝H0：(τβ)ij=0的无效假设; 接受H1：(τβ)ij≠0，至少对一种(ij)组合成立。

尚不能认为使用雌激素对该激素水平具有影响；下午该激素水平高于上午；雌激素的使用与测量时间之间存在交互作用。

2．t检验（给予雌激素是否使该种激素上下午波动幅度减小）

方差齐性检验：

F=Sd12/Sd22=6.82, 1=4-1=3, ν2=4-1=3。

F0.05, 方差齐。

H0：d1=d2; H1：d1>d2。

α=0.05。

Sc2=[(4-1)×177.17+(4-1)×25.98]/(4+4-2)= 101.575

t=(22.1525-7.5650)/[ 101.575×(1/4+1/4)]0.5=2.047

ν=4+4-2=6

t>1.943=t0.05(6)

拒绝H0：d1=d2的无效假设; 接受H1：d1>d2。

给予雌激素可以使该种激素上下午波动幅度减小

说明：若分析雌激素是否对该种激素上下午波动幅度有影响，H1：d1≠d2，则应为双侧检验，t<2.447= t0.05(6)，接受H0：d1=d2的无效假设; 拒绝H1：d1>d2，尚不能认为雌激素对该种激素上下午波动幅度有影响。

8、标准差和标准误有何区别和联系？

标准差是反映数据变异程度的指标，其大小受每一个观察值的影响，变异程度大，标准差也大.常用于描述对称分布，尤其是正态分布资料的离散程度。可以反映样本均数的代表性.

标准误是样本均数的标准差，反映了样本均数与总体均数之间的离散程度，即样本均数变异程度的指标，常用来表示抽样误差的大小。标准误大反映样本均数抽样误差大，其对总体均数的代表性差。标准误小，样本均数抽样误差就小，其对总体均数的代表性就好。

标准差随着样本量的增多，逐渐趋于稳定，如同地区、同年龄、同性别儿童的身高、体重的标准差，当样本含量达到约200以上时，基本趋于稳定。

标准误随着样本量的增多而减小，如均数的标准误，当标准差不变时，与样本量的平方根呈反比。

9、可信区间和参考值范围有何不同？

可信区间是从总体中作随机抽样，每个样本可以算出一个可信区间，如95%可信区间，意味着100次抽样， 95个可信区间包括总体均数（估计正确），只有5个可信区间不包括总体均数（估计错误）。

参考值范围是指同质总体中大多数个体变量值的分布范围。95%参考值范围指同质总体中95%的个体值分布在此范围内。它与标准差有关，各个体值变异越大，该范围越宽，分布也越分散。

10、假设检验和区间估计的异同之处有哪些？

同：两者都是对总体特征进行推断的方法。区间估计用以说明参数量的大小，如推断总体均数所在的范围，而假设经验用于推论质的差别，如推断总体均数是否不同。

异：可信区间不仅可回答假设检验的问题，而且可以比假设检验提供更多的信息，可信区间在解决假设检验问题基础上，还可获得是否有专业意义的信息。

11、假设检验时，一般当P<0.05则拒绝H0，理论依据是什么？

假设检验时，先提出无效假设H0，然后在假设成立的前提下看实际抽到的样本是否属小概率事件（如果当一个事件发生的概率很小时，那么在一次试验时这个事件时“不会发生的”，一旦发生了，称其为小概率事件。统计学中，将P<0.05称为小概率事件。）。若属小概率事件，则拒绝该假设；若不属于小概率事件，则不拒绝该假设。得出的结论是概率性的，不是绝对的肯定或者否定。犯一类错误（拒绝了正确的无效假设）的概率是α＝0.05。

12．第一类错误和第二类错误有何区别和联系？

①两类错误的区别：

②两类错误的联系：

在样本量固定的情况下，减小α 会引起β增大；减小β会引起 α 增大。若要同时减小 α 和β，只有增大样本含量。所以样本含量应尽可能大一些，同时正确的实验设计与严格规定实验操作方法，能够减少抽样误差，提高检验效果。

13．某地某年人口数58723人，脑卒中发病81人，脑卒中死亡45人，该地当年各种疾病死

亡372人，试问上述数字能计算多少个有意义的相对数？并说明都是些什么相对数？

能算出五个有意义的相对数：

强度相对数：该地当年的脑卒中发病率：（81/58723）*1000‰ = 1.38‰ 该地当年的脑卒中死亡率：（45/58723）*万分之万 = 万分之7.66 该地当年的脑卒中病死率：（45/81）*100% = 55.6% 该地当年的疾病总死亡率：（372/58723）*1000‰ = 6.33‰ 结构相对数：该地当年内脑卒中死亡人数占疾病总死亡人数的比例（构成比）：

（45/372）*100% = 12.1%

相对数有三类：率构成比相对比

1．率（rate ）：

某现象实际发生数于可能发生某现象的总数之比，用以反映某现象发生的频率或强度，又称为频率指标，具有概率意义。

计算公式为：依据习惯选定，或使得所计算得的率保留一到两位整数。

）

‰％（或单位总数

可能发生某现象的观察数

发生某现象的观察单位率＝

1000100?

常用的率包括发病率、患病率、死亡率、病死率等。（1）发病率：表示在观察期内，可能发

生某种疾病的一定人群中新发生该病的频率。某病发病率= ×K

在通常情况下，发病率的分母泛指一般平均人口数。

意义：发病率是反映某病在人群中发生频率大小的指标，常用于衡量疾病的发生，研究疾病发生的因果关系和评价预防措施的效果。

（2）患病率：表示在某时点检查时可能发生某病的一定人群中患有某病的频率。

其中某病病例数包括新病例和旧病例，凡患该病的一律统计在内。同一人不应同时成为同一疾病的两个病例。

意义：这一指标最适用于病程较长的疾病的统计研究，用于衡量疾病的存在，反映某病在一定人群中的流行规模或水平，估计医疗设施的需求量。（3）反映疾病防治效果的指标治愈率

有效率

某病病死率=

2. 构成比说明某事物内部各组成部分所占的比重或比例。常以百分数表示，计算公式为：

相对比，

比较两个指标时用以反映两个有关指标间数量上的比值，如A 指标是B 指标的若干倍，或A 指标是B 指标的百分之几，通常用倍数或分数表示。计算公式为：相对比＝

相互比较的两个指标可以是相同性质的指标，也可以是性质不同的指标；两变量可以为数值变量、分类变量，可以是绝对数、相对数、平均数等。不能以比代率

因为构成比说明的是事物内部各部分所占的比重或分布，不能说明某现象发生的强度和频率大小。只有频率指标：率才能说明事物的严重程度。（如真正答题时，自己最好举一个例子来说明，书34页）

20、下表为变性卵蛋白在38o C 与25o C 时之凝固百分数：

该时点受检人口数

数

检查时发现的某病病例某病患病率K

受治人数

治愈人数

治愈率K

受治人数

治疗有效人数

有效率%

100?观察期间内某病患者数

同期因该病死亡人数

％

位总数

同一事物内部的观察单数某组成部分的观察单位比＝100?％）（或乙指标

甲指标

100?的平均人口数

观察期内可能发生某病例数

同期内新发生某病的病

时间（分钟） 3 6 9 12 15 18

38o C 12 30 44 53 66 81.5

25o C 7.2 18.4 30 40 49 58

试求出两个时间推算凝固百分数之回归方程式，并检验两个回归系数间差别的显著性。

(by milanlan,老师说不要求第二问)

解：n=6,∑X i=63,X i=10.5,∑X i2=819

∑Y i1=286.5,Y i1=47.75,∑Y i12=16787.25,∑X i Y i1=3705

∑Y i2=202.6,Y i2=33.77,∑Y i22=8655.4,∑X i Y i2=2661

l xy1= ∑X i Y i1-(∑X i)(∑Y i1)/n=3705-63×286.5/6=696.75

l xy2= ∑X i Y i2-(∑X i)(∑Y i2)/n=2661-63×202.6/6=533.7

l xx=∑X i2-(∑X i)2/n=819-632/6=157.5

l yy1=∑Y i12-(∑Y i1)2/n=16787.25-286.52/6=3106.875

l yy2=∑Y i22-(∑Y i2)2/n=8655.4-202.62/6=1814.273

b1= l xy1/l xx=696.75/157.5=4.424, a1= Y i1-b1× X i=47.75-4.424×10.5=1.298

即38o C时Y=1.298+4.424X

b2= l xy2/l xx=3.389, a2=33.77-3.389×10.5=-1.8145

即25o C时Y=-1.8145+3.389X

21、.测定小鼠肾上腺中抗坏血酸含量时测半个腺和整个腺体所得数据如下：

半个371 592 464 519 470 528 580 420 563

整个381 627 485 546 500 546 595 569 595

解释：

这道题老师上课说了，用直线回归，因为如果以半个腺的抗坏血酸含量为自变量x，以整个腺的抗坏血酸含量为应变量Y，若能找到两者之间的线性关系则可以在以后的试验中由

半个腺的测量值来预测该测量值对应的整个腺的Y值。

计算：

1．画散点图，看两者之间是否存在直线关系。

表一

半个（x）371 592 464 519 470 528 580 420 563 整个（y）381 627 485 546 500 546 595 569 595 对应拟和直线图

表二，因为第八组数据离直线太远，故舍去。

半个（x）371 592 464 519 470 528 580 563 整个（y）381 627 485 546 500 546 595 595 对应拟和直线图

2．求出方程（计算回归系数b和截距a）。

注意因为从以上作图可知舍去了第八组数据，所以计算时也不予考虑。老师上课讲过异常值应该舍，但没有讲如何检验异常值。本人在北大时好像学过，但已经忘记，且觉得不必要，大家谁要是觉得必要，请看以前的统计书，如果有人会，请上传21题补丁，谢谢了！

半个（x）整个（y）

371 381

592 627

464 485

519 546

470 500

528 546

580 595

563 595

∑Xi＝4087 ∑Yi＝4275

X平均＝510.875 Y平均＝534.375

∑X i2 ＝2125815∑Y i2 ＝2327797

∑Xi*Yi＝2224322

因为公式比较繁，大家参照课本180页自己计算：

Lxy＝40331.375

Lxx＝37868.875

Lyy＝43343.875

b＝40331.375/37868.875＝1.065

a＝534.375－1.065*510.875＝－9.707

回归方程为：y＝－9.707＋1.065x（注意书上的写法，这里因为本人能力不能写出）。

3．对总体的回归系数β进行假设检验。

使用方差分析：

建立假设检验：H 0：β＝0，即半个腺和整个腺的抗坏血酸含量有关 H 1：β≠0，无关计算统计量F 值

回归分析 1 42954 42954 661.0495 <0.01 残差 6 389.871 64.97849 总计

7 43343.88

根据上表P 值，认为不能拒绝H 0

22、相关系数和回归系数的联系和区别？区别：

在资料要求上：回归要求因变量Y 服从正态分布；x 是可以精确测量和严格控制的变量，一般称为一型回归。相关要求两个变量x 、y 服从双变量正态分布。这种资料若进行回归分析称为II 型回归。

在应用上：说明两变量间依存变化的数量关系用回归，说明变量间的相关关系用相

关。

联系：

1、对同一组数据同时计算r 和b ，它们的正负号是一致的。r 为正号说明两变量间的相互关系是同向变化的。b 为正, 说明X 增（减）一个单位，Y 平均增（减）b 个单位。

2、 r 和 b 的假设检验是等价的，即对同一样本，两者的t 值相等。由于r 的假设检验可直接查表，而b 的假设检验计算较繁。故在实际应用中常以前法代替后法。

3、 r 与b 值可相互换算

4、用回归解释相关相关系数的平方r2 称为决定系数（coefficient of

YY YY

XX YY XX XX XY

YY XX XY l l r

b l l

b l l l l

l l l r ====

determination ）：

此式说明当SS 总不变时，回归平方和的大小取决于r2。回归平方和是由于引入了相关变量而使总平方和减小的部分。回归平方和越接近总平方和，则r2 越接近1，说明引入相关的效果越好。例如r=0.20, n=100 时，可按检验水准0.05拒绝H0, 接受H1 ，认为两变量有相关关系。但 r2 = (0.20)2 =0.04, 表示回归平方和在总平和中仅占4%，说明两变量间的相关关系实际意义不大。

23、剩余标准差的意义和用途？

SS Y 。X 为剩余标准差,是指将X 固定为某一确定值以后，Y 的标准差。Sy.x 越小，说明用回归方程所作的估计的误差越小。剩余标准差 Sy.x 可由下式求得：

式中Sy 为变量Y 的标准差，r 为相关系数，n 为样本例数。

它直接反映观察值y 对估计值的平均离差。就回归直线来说，其平均离差值愈小，则所有观察点平均地愈靠近回归线，即关系程度愈密切；而当其平均离差值愈大，则所有观察点平均地离回归线愈远，即关系愈不密切。可见这个指标是从另一侧反映关系密切程度的。它是以回归直线为中心反映各观察值与估计值平均数之间离差程度的大小，从另一方面看，也就是反映着估计值平均数的代表性的可靠程度。用途：回归系数的t 检验，u y 的区间估计，个体Y 值的容许区间

24、拟做动物实验，设实验和对照组的差别x 1-x 2=1.5克，标准差为2.5克，显著性水平

为0.05，实验的成功率为90%，试求出所需动物数？

)

1)(1(2

)?(22

.---=--=

∑n r n S n Y Y S y

x y 总回

SS SS l l l l l l r YY XX XY YY XX XY =

==/2

解：见书P343。本题属于两样本均数比较，所需样本量的计算公式是：

N1=N2=2×〔(tα/2+tβ)S/δ〕2

N1=N2=2×〔(1.96+1.282) ×2.5/1.5〕2=58.4,取整59。

实验组合对照组各需59只动物，总共需118只。

25、用中药治疗慢性肾炎的近控率为30%，现试验新药的疗效，要求新药的近控率达到50%，

才能推广使用，α=0.05，成功率为0.90，问每组需多少人？

解：见书P343。本题属于两组样本率比较，本题采用单侧检验（个人认为如此，大家说呢？），所以公式为：

N1=N2=0.5×〔(uα+uβ)/（sin-1√p1-sin-1√p2）〕2

N1=N2=0.5×〔(1.645+1.282)/（sin-1√0.3-sin-1√0.5）〕2=101.2，取整102。

旧药和新药各需102人。

26、欲了解某地菜农钩虫感染率是否高于粮农，估计两总体率约20%及10%，今指定α=0.05，β=0.10，问需查多少人？

两样本率的比较双侧检验：

p1=0.2，p2=0.1，双侧u0.05/2=1.96，单侧u0.1=1.282

按照p343公式26-2计算可得：

n1=n2=261.0

每组需要262例，两组共需524例。

27、几种基本的抽样方法的优缺点和适用场合是什么？

老师的ppt上提到的是单纯随机抽样、系统抽样和整群抽样

我查到的是四种：简单随机抽样、系统抽样、分层抽样和整群抽样（分层抽样很重要啊~老师应该是忘了讲吧）

（另注：这几种方法都属于概率抽样，另外还有非概率抽样，应该不会考）

概率抽样的原则：（随机性原则）

总体中的每一个样本被选中的概率相等。概率抽样之所以能够保证样本对总体的代表性，其原理就在于它能够很好的按总体内在结构中所蕴含的各种随机事件的概率来构成样本，使样本成为总体的缩影。

简单随机抽样：

按照等概率的原则，直接从含有N个元素的总体中抽取n个元素组成的样本（N>n）。（随机数表）

系统抽样（等距抽样或机械抽样）：

把总体的单位进行排序，再计算出抽样距离，然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。

K（抽样距离）=N（总体规模）/n（样本规模）

前提条件：总体中个体的排列对于研究的变量来说，应是随机的，即不存在某种与研究变量相关的规则分布。可以在调查允许的条件下，从不同的样本开始抽样，对比几次样本的特点。如果有明显差别，说明样本在总体中的分布承某种循环性规律，且这种循环和抽样距离重合。

分层抽样（类型抽样）：

先将总体中的所有单位按照某种特征或标志（性别、年龄等）划分成若干类型或层次，然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本，最后，将这些子样本合起来构成总体的样本。分层抽样是把异质性较强的总体分成一个个同质性较强的子总体，再抽取不同的子总体中的样本分别代表该子总体，所有的样本进而代表总体。

整群抽样：

抽样的单位不是单个的个体，而是成群的个体。它是从总体中随机抽取一些小的群体，然后由所抽出的若干个小群体内的所有元素构成调查的样本。对小群体的抽取可采用简单随机抽样、系统抽样和分层抽样的方法。

一般来说，类别相对较多、每一类中个体相对较少的做法效果较好。

#分层抽样与整群抽样的区别：

分层抽样要求各子群体之间的差异较大，而子群体内部差异较小；整群抽样要求各子群体之间的差异较小，而子群体内部的差异性很大。换句话说，分层抽样是用代表不同子群体的子样本来代表总体中的群体分布；整群抽样是用子群体代表总体，再通过子群体内部样本的分布来反映总体样本的分布。

28、实验为什么要设对照组？如何设对照组？

正确的设立对照，才能平衡非处理因素对实验结果的影响，从而把处理因素的效应充分显露出来，设立对照是控制各种混杂因素的基本措施。设立对照组的意义在于使实验组和对照组内的非处理因素的基本一致，即均衡可比。

设立对照时应使对照组与实验组的非实验因素均衡一致，也就是在设立对照时除给予处理单因素不同外，其他对实验效应应有影响的因素（即非处理因素）尽量均衡一致，才能显示“对照”的作用。即设立对照组应满足均衡性要求，做到：

1、组间除干预措施外，其他影响结果的非处理因素等尽可能相同。

2、对所研究疾病的易感度及发病机会相等。

3、检测和观察方法及诊断标准必须一致。

常用的实验对照有：

空白对照对照组不施加任何处理因素。

实验对照对照组不施加处理因素，但施加某种实验因素

标准对照不设立专门的对照组，而是用现有标准值或正常值做对照。

自身对照对照与实验在同一受试者身上进行，如用药前后作为对比。一般情况下还要求设立平行对照组。

相互对照这种对照不设立对照组，而是两个或几个试验组相互对照。

配对对照把研究对象条件相同的两个配成一对，分别给不同的处理因素，对比两者之间的不同效应。配对对照常用于动物实验，临床试验也可采用，但严格地说，很难找到相同或十分相似的对子。

29、有刊物报道, 某厂调查纺织女工子宫下垂者为132人, 其中115人为

站立工作者, 占87.12%; 坐着工作的有17人, 占12.88%。结论为“

站立工作是子宫下垂的患病因素”。问此项资料是否支持该项结论？

为什么？

不支持。因为题目中给的数据为构成比。分析时常见的错误是以构成比代替率来说明问题。构成比说明事物内部各部分所占的比重或分布，不能说明某现象发生的强度或频率大小。

30、要分析———的关系，不能用方差分析法。

A 母亲年龄与出生体重

B 籍贯与血红蛋白含量

C 性别与尿液比重

D 职业与血型

31、实验设计的基本原则是———。

A 收集、整理、分析

B 对照、重复、随机

C 设计、计算、重复

D 设计、随机、对照、

32、对两地某病发病情况进行调查资料对比分析时，可采用———。

A 两地某病的各自总发病率比较

B 两地某病的各年龄段发病率比较

C 两地某病的标化率比较

D 两地某病的发病率进行显著性检验。

33、显著性检验中，P〈0.05 表示———。

A 第一类错误的概率小于0.05

B 假阴性的概率小于0.05

C 第二类错误的概率小于0.05

D 以上都对

34、9例肝硬化患者治疗后存活天数分别为：128，215，79，243，784，65，49, 162，215．反

映本组资料的平均水平的取值应为162。（中位数）

35、变异系数适用于下列哪些场合：

A 反映几组具有不同量纲的计量资料的变异度大小

B 反映定量与定性资料的变异度大小

C 反映几组算术均值相差悬殊的计量资料的变异度大小

D 反映几组有缺失值数据的计量资料的变异度大小

36、人在进行数据处理时，误用了配对资料的t检验分析本属于成组设计的计量资料。在

通常情况下，这意味着：

A 增大了犯I类错误的机会

B 增大了犯II类错误的机会

C 增大了犯III类错误的机会

D 增大了犯IV类错误的机会

37、好的实验设计，能减少人力、物力，提高实验效率，还有助于消除和减少：

A 系统误差

B 随机误差

C 抽样误差

D 责任事故

38、试验设计中必须涉及的项目为要素，试验设计的要素有：

A 试验要素

B 试验单位

C 试验计划

D 试验效应

39、已知A药对某病有效，现发现一种增效剂B，可提高A药的疗效，想通过临床试验了解

A+B的疗效是否显著地优于单用A药的疗效，应选用：

A t检验

B X2检验

C 双侧检验

D 单侧检验

用均数和标准差可全面描述正态分布资料的特征。

40、用最小二乘法确定直线回归方程的原则是各观察点距直线的纵向距离的平方和最小。

41、研究某药物治疗糖尿病的疗效临床观察了200名糖尿病人的血糖情况，其研究总体是

糖尿病病人的血糖值。

42、某年某单位报告了果胶除铅的疗效观察，30名铅中毒工人住院治疗，治疗前测得尿铅的均数为0.116mg/l , 血铅的均数为0.181mg/dl ；用果胶20天后再测尿铅均数降为0.087mg/l , 血铅均数降为0.073mg/dl，说明果胶有较好的作用，你如何评价？

这道题主要的问题是没有设计对照。应该同时随机抽取若干个铅中毒的住院病人，与服用果胶的试验组构成对照，分别测量不服用果胶20天前后的血铅、尿铅的变化量；再用完全随机设计两总体的t检验进行显著性分析。

43、例已确诊为肠憩室的患者，被随机分为两组，分别给予甲乙两种饮食，观察食物排除

时间（小时），试问两种食物对肠蠕动效果有无差别？问可用那一种检验方法：甲组 76 75 44 55 51 66 69 68 52 60 71 62 70 75

乙组 97 74 79 83 95 101 98 95 52 64 68 88 83

n1=14, 平方和＝58418，和＝894，样本标准差＝10.11

n2=13, 平方和＝91927，和＝1077，样本标准差＝15

F=(标准差1/标准差2)2=2.2

所以，方差齐性。

Sc＝12.70

Sx1-x2=4.89

T=|x1(均数)-x2（均数）|/ Sx1-x2=|63.857—82.846|/4.89=3.88>t25,0.01单侧=2.485

所以，有极显著差异。

44、实验设计的基本原则是什么？说明其重要性，并按实验设计原则评述下面问题：

研究者为研究ADI药物预防肠道传染病的效果，设计如下试验：在甲幼儿园随机抽取大、中、小班儿童各50名组成试验组，服用ADI 药物（剂量按年龄、体重严格计算）；在乙幼儿园随机抽取大、中、小班儿童各50名组成对照组，不服用ADI 药物。但两个幼儿园参加此项试验的儿童的饮食、作息时间和体育活动情况是完全相同的。结果发现：甲幼儿园150名儿童肠道传染病的发病率明显低于乙幼儿园150名儿童肠道传染病的发病率（P 〈0.001 〉。于是，研究者得出结论：ADI药物有预防肠道传染病的作用。你认为如何？为什么？

实验设计的三大原则(或四大原则）及意义是：

对照原则：设立对照是控制各种混杂因素的基本措施；

随机化原则：提高对比组之间均衡可比的重要手段，是控制选择性偏倚唯一有效的方法。也是资料分析、统计推断的理论基础；

重复原则：重复是消除非处理因素影响的又一重要手段；

盲法原则：作为一条附加原则，通过减少主观上的干扰来更好地控制误差。

该实验设计不合理，结论不可信（不科学？？？哪个说法好一些啊：（）

根本的原因是没有做好随机化。随机化是实验研究中据设计要求，每一个受试对象都有同等的机会被分配到任何一个组中去，分组的结果不受人为因素的干扰和影响。本实验中在甲幼儿园的一定被分到实验组而乙的一定是对照组。

由此而产生的结果是：虽然“两个幼儿园参加此项试验的儿童的饮食、作息时间和体育活动情况是完全相同的”但是没有考虑其他的未知因素的影响，（如易感度及发病机会可能不相等？？？不敢确定，因为老师把环境因素什么的给否认了）实验前的基础条件不同，即均衡性不存在，因而不能显示“对照”的作用。

所以，合理的设计应该是在甲幼儿园抽的50名受试者随机分为实验和对照组，乙幼儿园也同样，然后合并进行实验组和对照组并进行后续分析。

By RRChen

P．S．以上只是个人的一点想法，不知道与老师的本意有多大距离。

这道题似乎很重要，大家一定要各抒己见，争取拿到一个比较完美的答案：）

God bless us！

45、某地抽查了360名男性红细胞计数，均数为4.66Χ1012/L，标准差为0.5746Χ1012/L，同时抽查了255名女性红细胞计数，均数为4.18Χ1012/L，标准差为0.2910Χ1012/L。问：