拉丁方试验设计及统计分析

前言

拉丁方试验设计及分析

1前言

“拉丁方”的名字最初是由R、A、Fisher给出的。拉丁方设计（latin square design）是从横行和直列两个方向进行双重局部控制，使得横行和直列两向皆成单位组，是比随机单位组设计多一个单位组的设计。在拉丁方设计中，每一行或每一列都成为一个完全单位组，而每一处理在每一行或每一列都只出现一次，也就是说，在拉丁方设计中，试验处理数=横行单位组数=直列单位组数=试验处理的重复数。在对拉丁方设计试验结果进行统计分析时，由于能将横行、直列二个单位组间的变异从试验误差中分离出来，因而拉丁方设计的试验误差比随机单位就在于提供对实验处理顺序的控制，使实验条件均衡，抵消由于实验处理的先后顺序的影响而产生的顺序误差，因而也可称之为抵消法设计。组设计小，试验精确性比随机单位组设计高。

拉丁方设计又叫平衡对抗设计(baIanced design)、轮换设计。这三个名称是从其模式、作用和方法三个不同的角度来说明这种设计的意义。所谓平衡对抗设计，是指在实验中，由于前一个实验处理往往会影响后一个实验处理的效果，而该实验设计的作用。所谓轮换设计，是指在实验中，由于学习的首因效应，先实验的内容，被试容易记住；又因为学习的近因效应，对于刚刚学过的内容，被试回忆的效果一般也较好。因此、在实验方法上，有必要使不同实验条件出现的先后顺序轮换，使情境条件以及先后顺序对各个实验组的机会均等，打破顺序界限。所谓拉丁方设计，是指平衡对抗设计的结构模式，犹如拉丁字母构成的方阵。例如四组被试接受A、B、C、D四种处理，其实验模式为：

上述模式表可以看出，每种处理即表中的字母在每一行和每一列都出现了一次而且仅出现了一次。像这样的一个方阵列就称为一个拉丁方。要构成一个拉丁方，必须使行数等于列数，并且两者都要等于实验处理的种数。

拉丁方试验设计及分析

在只有两个实验处理的情况下，通常采用的平衡对抗设计是以ABBA的顺序来安排实验处理的顺序。或者把单组被试分为两半．一半按照ABBA的顺序实施处理，另一半按照BAAB的顺序实施处理。

2选题背景

源于生产实践，在畜牧、水产等动物试验中，如果要控制来自两个方面的系统误差且试验动物的数量又较少，则常采用拉丁方设计

。

2.1研究的目的和意义

拉丁方设计（latin square design）是从横行和直列两个方向进行双重局部控制，使得横行和直列两向皆成单位组，是比随机单位组设计多一个单位组的设计。在拉丁方设计中，每一行或每一列都成为一个完全单位组，而每一处理在每一行或每一列都只出现一次，也就是说，在拉丁方设计中，试验处理数=横行单位组数=直列单位组数=试验处理的重复数。在对拉丁方设计试验结果进行统计分析时，由于能将横行、直列二个单位组间的变异从试验误差中分离出来，因而拉丁方设计的试验误差比随机单位组设计小，试验精确性比随机单位组设计高。

课题的目的是：因为在拉丁设计中，横行单位组数、直列单位组数、试验处理数与试验处理的重复数必须相等，所以处理数受到一定限制。若处理数少，则重复数也少，估计试验误差的自由度就小，影响检验的灵敏度；若处理数多，则重复数也多，横行、直列单位组数也多，导致试验工作量大，且同一单位组内试验动物的初始条件亦难控制一致。因此，拉丁方设计一般用于5-8个处理的试验。在采用4个以下处理的拉丁方设计时，为了使估计误差的自由度不少于12，可采用“复拉丁方设计”，即同一个拉丁方试验重复进行数次，并将试验数据合并分析，以增加误差项的自由度。

应当注意，在进行拉丁方试验时，某些单位组因素，如奶牛的泌乳阶段，试验因素的各处理要逐个地在不同阶段实施，如果前一阶段有残效，在后一阶段的试验中，就会产生系统误差而影响试验的准确性。此时应根据实际情况，安排适当的试验间歇期以消除残效。另外，还要注意，横行、直列单位组因素与试验因素间不存在交互作用，否则不能采用拉丁方设计。

其研究的意义在于：1、精确性高拉丁方设计在不增加试验单位的情况下，

第 2 页（共15 页）

前言

比随机单位组设计多设置了一个单位组因素，能将横行和直列两个单位组间的变异从试验误差中分离出来，因而试验误差比随机单位组设计小，试验的精确性比随机单位组设计高。2、试验结果的分析简便

2.2现状和发展趋势与研究的主攻方向

拉丁方试验从实际应用上来说，在计算机科学、数字通讯、光纤网络优化、实验设计、生物基因工程等方面都有着重要的应用，其不仅在基础数学研究中具有极其重要的地位，在其它的学科中也有重要的应用，如心理学、生物等学科中均有重要应用。

近年来，正交拉丁方理论在实验设计、计算机科学、编码理论和保密通讯等领域得到了重要的应用，这为正交拉丁方理论的研究提供了巨大的原动力。本研究方向近年来在frame自正交拉丁方、带对称正交侣的自正交拉丁方、r-自正交拉丁方、自正交的Mendelsohn三元系、横截设计等方面取得了一系列的研究成果。

3试验设计及拉丁方试验设计

3.1试验设计

试验设计的基本工具是正交表，正交表是根据均匀分布的思想，运用组合数学理论构造的一种数学表格．试验设计的方法很多，不同的方法用于解决在实际工作中所遇到的不同的问题，应用最广泛和最具典型性的方法有区组设计、正交设计、参数设计、回归设计、均匀设计、混料设计、饱和设计与超饱和设计”。为比较某因子的多个水平，按某个已知的噪声因子把全部试验单元分为若干个组并进行试验和统计分析的方法称为区组设计。根据不同情况设计具体试验的方法有随机化完全区组设计、平衡不完全区组设计和链式区组设计。区组设计被广泛用于因素水平比较试验。

拉丁方试验设计及分析

正交试验设计是一种常用多因子试验设计方法，它利用正交表k(q'选择试验条件和安排试验计划。并利用正交表的特点进行数据分析，减少试验次数，找出最好的或满意的试验计划组合。对应试验具体情况和要求不同，正交设计方法和统计分析方法也有相应的调整和优化。正交试验设计中的裂区设计是现今一大研究热点。

试验设计的主要作用是减低试验次数、提高试验精度，使研究人员从试验结果中获得无偏的处理效应及试验误差的估计，进行正确而有效的比较。为了控制干扰因子引起的差异，降低试验误差，在试验设计中要遵循三条基本原则。

一．重复(Replication)

重复性是科学调查结论的基本要求。相同处理设置试验单元重复后就可研究在试验单元间的变异。设置重复主要作用在于；1．估计试验误差；2．降低试验误差，提高试验精度．

二．随机化(Randomization)

随机化指试验中每一个处理都有相等的机会实施安排在任何一个试验单元上。随机可以消除任何人为的主观偏性及各种干扰因子的影响，以保证获得处理效应及误差变异的有效无偏估计。

三．区域控制(Blocking)

区域控制是将试验单元按系统干扰因子的环境控制因子进行区组划分，实施区组控制，使同一区组内的单元间环境因子保持一致，保证同一区组中局部范围内单元间误差的同质

性。

3.2拉丁方试验设计

拉丁方设计（latin square design）在统计上控制两个不相互作用的外部变量并且操纵自变量。每个外部变量或分区变量被划分为一个相等数目的区组或级别，自变量也同样被分为相同数目的级别。如果将k个不同符号排成k列，使得每一个符号在每一行、每一列都只出现一次的方阵，叫做k×k拉丁方。应用拉丁方设计就是将处理从纵横二个方向排列为区组(或重复)，使每个处理在每一列和每一行中出现的次数相等（通常一次），即在行和列两个方向都进行局部控制。所以它是比随机区组多一个方向局部控制的随机排列的设计，因而具有较高的精确性。

第 4 页（共15 页）

拉丁方试验设计的具体实例

拉丁方设计的特点是处理数、重复数、行数、列数都相等。最小的可以为2×2拉丁方设计,没有诸如2×3拉丁方设计。它的每一行和每一列都是一个区组或一次重复，而每一个处理在每一行或每一列都只出现一次，因此，它的处理数、重复数、行数、列数都等于5。拉丁方设计的优点是：精确度高。缺点是：由于重复数与处理数必须相等，使得两者之间相互制约，缺乏伸缩性。因此，采用此类设计时试验的处理数不能太多，一般以4～10个为宜。其具体的应用过程是这样的：

假设我现在要做一个实验，被试一共要进行5个小测试，并且需要重测多次，因此对这5个测试的排序就需要列入变量控制之内，不可能多次都一样的顺序，因此为了平衡这种顺序效应，采取拉丁方设计，先命名5个小测试分别为1，2，3，4，5。那么对其的排序就是这样的：

第一组测试顺序：1，2，5，3，4

第二组测试顺序：2，3，1，4，5

第三组测试顺序：3，4，2，5，1

第四组测试顺序：4，5，3，1，2

第五组测试顺序：5，1，4，2，3

其顺序是这样确定的，横排：1，2，n，3，n-1，4，n-2……（n代表要排序的量的个数）竖排：1，2，3，4，5 再轮回1。

（1）设计的基本要求：①必须是三个因素的实验，且三个因素的水平数相等（若三因素的水平数略有不同，应以主要处理因素的水平数为主，其它两因素的水平数可进行适当调整）；②三因素间是相互独立的，均无交互作用；③各行、列、字母所得实验数据的方差齐。

（2）设计步骤：①根据主要处理因素的水平数，确定基本型拉丁方，并从专业角度使另两个次要因素的水平数与之相同；②先将基本型拉丁方随机化，然后按随机化后的拉丁方阵安排实验。可通过对拉丁方的任两列交换位置，或/及任两行交换位置实现随机化；③规定行、列、字母所代表的因素与水平，通常用字母表示主要处理因素。

4、拉丁方试验设计数据处理的相关理论

拉丁方试验设计及分析

第 6 页（共 15 页）

拉丁方设计试验结果的分析，是将两个单位组因素与试验因素一起，按三因素试验单独观测值的方差分析法进行，但应假定3个因素之间不存在交互作用。将横行单位组因素记为A ，直列单位组因素记为B ，处理因素记为C ，横行单位组数、直列单位组数与处理数记为r ，对拉丁方试验结果进行方差分析的数学模型为：

（I=j=k =1，2，…，r ）

式中：μ为总平均数；为第I 横行单位组效应；为第j 直列单位组效应，

为第k 处理效应。单位组效应、通常是随机的，处理效应

通常是固定的，

且有

；

为随机误差，相互独立，且都服从N （0，σ2）。

注意：k 不是独立的下标，因为I 、j 一经确定，k 亦随之确定。平方和与自由度划分式为：

SS T = SS A +SS B +SS C +SS e

df T = df A +df B +df c +df e

矫正数 C =x 2../r 2 总平方和 SS T =Σx 2ij(k)-C 横行平方和 SS A =Σx 2I./r - C 直列平方和 SS B =Σx 2.j / r – C 处理平方和 SS C =Σx 2(K)/ r – C 误差平方和 SS e = SS T - SS A - SS B - SS c 总自由度 df T = r 2-1 横行自由度 df A = r -1 直列自由度 df B = r -1 处理自由度 df C = r -1

误差自由度 df e =df T -df A -df B -df C =(r -1)( r -2)

拉丁方试验设计的具体实例

关于方差分析的基本步骤现归纳如下：

（一）计算各项平方和与自由度。

（二）列出方差分析表，进行F检验。

（三）若F检验显著，则进行多重比较。多重比较的方法有最小显著差数法(LSD 法)和最小显著极差法(LSR法：包括q检验法和新复极差法)。表示多重比较结果的方法有三角形法和标记字母法。

5 拉丁方试验设计的具体实例

在畜牧、水产等动物试验中，如果要控制来自两个方面的系统误差，且试验动物的数量又较少，则常采用拉丁方设计。下面结合具体例子说明拉丁方设计方法。

为了研究5种不同温度对蛋鸡产蛋量的影响，将5栋鸡舍的温度设为A、B、C、D、E，把各栋鸡舍的鸡群的产蛋期分为5期，由于各鸡群和产蛋期的不同对产蛋量有较大的影响，因此采用拉丁方设计，把鸡群和产蛋期作为单位组设置，以便控制这两个方面的系统误差。拉丁方设计步骤如下：

（一）选择拉丁方选择拉丁方时应根据试验的处理数和横行、直列单位组数先确定采用几阶拉丁方，再选择标准型拉丁方或非标准型拉丁方。此例因试验处理因素为温度，处理数为5；将鸡群作为直列单位组因素，直列单位组数为5；将产蛋期作为横行单位组因素，横行单位组数亦为5，即试验处理数、直列单位组数、横行单位组数均为5，则应选取5×5阶拉丁方。本例选取前面列出的第2个5 × 5标准型拉丁方，即：

（二）随机排列在选定拉丁方之后，如是非标准型时，则可直接按拉丁方中的字母安排试验方案。若是标准型拉丁方，还应按下列要求对横行、直列和试验处理的顺序进行随机排列。

3×3标准型拉丁方：直列随机排列，再将第二和第三横行随机排列。

4×4标准型拉丁方：随机选择4个标准型拉丁方中的一个，然后再将横行、直列及处理都随机排列。

下面对选定的5×5标准型拉丁方进行随机排列。先从随机数字表（Ⅰ）第22行、第8列97开始，向右连续抄录3个5位数，抄录时舍去“0”、“6以上的数”和重复出现的数，抄录的3个五位数字为：13542，41523，34521。然后将上面选定的5×5拉丁方的直列、横行及处理按这3个五位数的顺序重新随机排列。

1、直列随机将拉丁方的各直列顺序按13542顺序重排。

2、横行随机再将直列重排后的拉丁方的各横行按41523顺序重排。

3、把5种不同温度按第三个5位数34521顺序排列即：A=3，B=4，C=5，D=2，E=1，也就是说，在拉丁方中的A表示第3种温度，B表示第4种温度等，依次类推。从而得出5×5拉丁方设计，如表5.01所示。

表5.01 5种不同温度对鸡产蛋量影响的拉丁方设计

第8 页（共15 页）

产蛋期

鸡群

一

二三四五 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ

D （2） A （3）

E （1） B （4） C （5）

E （1） C （5） A （3） D （2） B （4）

A （3） E （1）

B （4）

C （5）

D （2）

B （4） D （2）

C （5） E （1） A （3）

C （5） B （4）

D （2） A （3）

E （1）

注：括号内的数字表示温度的编号

由表 5.01可以看出，第一鸡群在第Ⅰ个产蛋期用第2种温度，第二鸡群在第Ⅰ个产蛋期用第1种温度，等等。试验应严格按设计实施。

6试验结果的统计分析

由前面拉丁方试验设计数据处理的相关理论我们可以得知：

将横行单位组因素记为A ，直列单位组因素记为B ，处理因素记为C ，横行单位组数、直列单位组数与处理数记为r ，对拉丁方试验结果进行方差分析的数学模型为：

（I=j=k =1，2，…，r ）

式中：μ为总平均数；为第I 横行单位组效应；为第j 直列单位组效应，

为第k 处理效应。单位组效应、通常是随机的，处理效应

通常是固定的，

且有

；

为随机误差，相互独立，且都服从N （0，σ2）。

注意：k 不是独立的下标，因为I 、j 一经确定，k 亦随之确定。平方和与自由度划分式为：

SS T = SS A+SS B+SS C+SS e

df T = df A+df B+df c+df e

例1的试验结果如表6.10所示。

注：括号内数字为产蛋量

表6.11 各种温度（处理）的合计

现对表6.10资料进行方差分析。

1、计算各项平方和与自由度

第10 页（共15 页）

矫正数C=x2../r2=5492/52=12056.04

总平方和 SS T =Σx 2ij(k)-C=232+212+……+192-12056.04= 12157-12056.04=100.96 横行平方和SS A =Σx 2I./r- C =(1082+1052+……+1042)/5-12056.04=27.36

直列平方和SS B =Σx 2.j/ r - C =(1092+1082+……+1062)/5-12056.04=22.16

处理平方和SS C =Σx 2(K)/ r - C=(1162+1142+……+1012)/5-12056.04=33.36

误差平方和SS e= SS T- SS A- SS B- SS c=100.96-33.36-27.36-22.16= 18.08

总自由度df T= r 2-1=52-1=24

横行自由度df A= r-1=5-1=4

直列自由度df B= r-1=5-1=4

处理自由度df C= r-1=5-1=4

误差自由度df e=df T-df A-df B-df C=(r-1)( r-2)=(5-1)(5-2)=12

2、列出方差分析表，进行F检验

表6.10 表6.11资料的方差分析表

经F检验，产蛋期间和鸡群间差异显著,温度间差异极显著。因在拉丁方设计中，横行、直列单位组因素是为了控制和降低试验误差而设置的非试验因素，所以即

使显著一般也不对单位组间进行多重比较。下面对不同温度平均产蛋量间作进行多重比较。

3、多重比较

列出多重比较表，见表6.12。

表 6.12不同温度平均产蛋量多重比较表（q法）

-20.2 -21 -22.6 -22.8 温度平均数标准误为:

由df e=12和k=2，3，4，5从q值表查得临界q值：q0.05和q0.01,并与相乘得

值，列于表6.13。

表6.13 q值和LSR值表

第12 页（共15 页）

多重比较结果表明：温度A、B、D平均产蛋量显著地高于E，即第3、4、2种温度的平均产蛋量显著高于第1种温度的平均产蛋量，其余之间差异不显著。第1种和第5种温度平均产蛋量最低。

2）优缺点

（1）优点：①拉丁方的行与列皆为配伍组，可用较少的重复次数获得较多的信息；②双向误差控制，使观察单位更加区组化和均衡化，进一步减少实验误差，比配伍组设计优越。

（2）缺点：①要求三因素的水平数相等且无交互作用。虽然当三因素的水平数不等时，可以通过调整次要因素的水平数以满足设计的要求，但有时无法达到；况且因素间可能存在交互作用，故在实际工作中有一定的局限性；②当因素的水平数（γ）较少时，易受偶然因素的影响。为了提高精确度，可应用m个γ×γ拉丁方设计（可参照有关统计学书籍）; ③重复数等于处理数，灵活性不强。处理数多时，则重复过多。处理数少时，重复少，则估计误差的自由度太小，精确度低。因此，适用于5－8个品种或处理的试验。如果在品种数或处理数少时，为了提高试验的精确度，可采用复拉丁方设计，即将一个拉丁方试验重复几次。

参考文献

一、刘思衡. 《作物育种与良种繁育学词典》. 北京:中国农业出版社, 2001.

责任编辑：中国水稻研究所科技信息中心、国家水稻数据中心

二、《南开大学法政学院学术论丛(下)》2002年S2期

三、舒华《心理与教育研究中的多因素实验设计》北京师范大学出版社1994-7-1

四、李云雁胡传荣《实验设计与数据处理》北京化学工业出版社2005

五、周概荣《应用统计方法辞典》北京中国统计出版社1992

六、韩于羹《应用数理统计》北京康空航天大学出版社1989

七、吴乙申《应用统计学》机械工业出版社1986

八、朱燕汤《数理统计》西北工业大学出版社1990

九、金良超《正交设计与多指标分析》北京中国铁道出版社1988

十、中国科学院数学研究所数理统计组《正交实验法》北疆人民教育出版社1975

十一、方开泰《均匀设计》应用数学报1989

十二、杨虎《数理统计》北京高等教育出版社2004

十三、李永乐胡庆军《应用数理统计》国防科技大学出版社1995

十四、明道绪《生物统计附设计》第三版。

致谢

首先，我要深深的感谢我的指导老师高明成老师这段时间来对我的耐心指导和悉心关怀，高老师渊博的学识、严谨的治学态度、勤勉的敬业精神和高标准严要求的精神，使我这段时间来学到了最宝贵的知识，将使我受益终生.高老师从毕业论文的选题、开题、定稿到具体的内容安排等各方面，都给予了悉心的指导，并且在整个修改过程中严格把关，提出了很多宝贵意见，最后得以成文凝聚着何老师的心血.

其次，我要深深的感谢长江大学信息与数学学院的领导和尊敬的其他带课老师，他们在我大学四年学习期间，不但教我知识还给予我很多有益的指导和帮助.总之，我要向长江大学信息与数学学院的全体老师表示诚挚的谢意，你们渊博的知识、勤勉的敬业精神和课堂上精彩的讲解让我受益匪浅，是你们无私地传授知

第14 页（共15 页）

识把我领入了求真知、解疑惑的广阔天地.

最后感谢我的父母和亲人，你们不管在任何时候都义无反顾的支持我.回首近四年的学习生活，老师的教导和同学们的深厚情谊都给我留下了永恒而美好的回忆，这一切将成为我今后学习、生活和工作中最为宝贵的财富，激励我向前迈进.

试验设计与统计分析

广东药学院自编教材试验设计与统计分析卫生统计学教研室 2014.8

第一章绪论在医药卫生、食品等专业研究领域，常需要开展大量的试验来确定或验证研究者在科研过程中提出的科学假设，例如临床上研究某种新的降糖药的疗效时，研究者需要将研究对象（如糖尿病患者）随机地分组，使其中一组患者服用研究中的该降糖药，另一组患者服用传统的降糖药，进而比较两组药物的疗效。但在具体的试验实施之前，研究者需要面对很多问题，如试验中试验对象应如何选择和分组？如何在试验过程中避免服用不同试验药物对试验对象心理产生影响，继而影响到最终疗效的判断？选择什么样的指标可更好的反映药物疗效？样本量需要多少？试验数据应如何收集以及运用何种统计方法进行分析等等问题。因为研究过程中研究结果会受到诸多因素影响，如研究对象的年龄、性别和病情可能影响药物疗效，如果不采取科学的方法使这些因素在比较组间分布均衡，就不能得到令人信服的结论。因此为使科学研究在消耗最少人力和物力的情况下，最大限度地减少误差，获得科学可靠的结论，需要在研究开始之前对整个试验过程做出精心安排，制定详细具体的试验实施方案，即进行试验设计（experimental design）。一个科学合理的试验设计，可以达到事半功倍的效果，是试验获得成功的关键。一、试验设计的基本要素医学试验包括三个基本要素：即处理因素、试验对象和试验效应。如研究某降糖新药的疗效，处理因素为降糖新药及比较的传统降糖药；研究者需用糖尿病患者作为试验对象；试验效应是能反映药物疗效的指标，如患者空腹血糖或餐后血糖的下降。处理因素作用于试验对象后产生试验效应（图1），三个要素缺一不可，因此试验设计时要先明确三个基本要素，再制定详细的研究计划。 1. 处理因素处理因素（treatment）是指研究者根据研究目的施加于试验对象，以考察其试验效应的因素。如临床上研究降糖药的疗效，降糖药即为处理因素。在试验过程中处理因素的状态称为水平（level），如比较降糖新药和传统降糖药的疗效，

如何理解拉丁方实验设计

如何理解“拉丁方实验设计”(邓涛) 近来，不少学生问到拉丁方设计如何理解的问题，而且提出不同教材的表述也不一样.为了不去一一解答，我这里再结合《应用实验心理学》上的表述作一说明. 我的基本看法是：拉丁方实验设计与区组实验设计一样，都是为了平衡额外变量，以防止这些额外变量成为混淆因子，破坏实验研究的内部效度.如果简化点来解释，一般来说，区组实验设计多用于对一个额外变量的平衡，如被试因素、时间顺序因素、空间位置因素等；拉丁方实验设计则可以看成是区组设计的扩展，即扩展到可以平衡两个额外变量（当然，如果设计巧妙，也可以达到对多于两个额外变量的平衡，但那也是在二维平衡模式上变化出来的）.为了说明，拉丁方设计及其与区组设计的联系，我们先说一说区组设计. 区组实验设计是在考察自变量影响效应的实验中，考虑到一个额外变量的影响，将这个额外变量作为区组变量，对其在各种实验处理条件下产生的影响进行平衡，同时将该区组变量引起的变异从残差中分离出来. 比如，限于实验室条件，研究者开展某一实验研究时每天只能为4名被试进行测试，实验处理也有四个水平：A1、A2、A3、A4.如果认为不在每周中的同一天进行测试，可能会引起测试结果的变化，这种影响又是比较重要的.于是可以将测试时间作为区组变量，即把同一天接受测试的被试看作是一个区组.这样就可以形成一个区组实验设计，如表2-8所示. 表2-8 四种实验处理的随机区组实验设计现在我们进一步设想：假如，在每天的实验中，一次只能测试一人，每天参加实验的四名被试只能分别在下午2～3点、3～4点、4～5点和5～6点的四个时段接受测试，而测试时段不同也可能会造成结果变化.这样一来，每一种实验处理条件安排的时段就也要取得平衡才行，你不能每天都在2点钟安排所有被试接受A1处理条件，或3点钟接受A1处理条件.于是，研究中采用测试天和测试时段两方面因素的平衡方法安排实验，构成了一个单因素的拉丁方实验设计，设计模式如图2-9所示.在这一设计中，测试是在星期几、测试是在每一天的哪一时段，这两个额外变量就都取得了很好的平衡. 从这一例子可以看出，拉丁方（latin square）是一个含P行P列，把P个实验处理分配给P×P方格的管理方案，它便于在复杂研究程序中有条理地管理各个工作单元，并平衡两种额外变量的影响.在工农业生产实验和心理与教育研究中，拉丁方都得到普遍应用.在这种实验设计中，首先根据自变量处理的水平数确定两个额外变量的水平数，然后利用两个额外变量的各个水平结合在一起构造一个拉丁方格，最后再将自变量的不同处理平衡地安排在这个方格中，就构成了一个研究方案，其结果要保证自变量的每一个水平在拉丁方格的每一行和每一列都出现且只出现一次.很明显，在这种设计中，自变量的水平数或水平结合数、额外变量的水平数必须相等.

实验设计的统计学基本原则

第十一章实验设计的统计学基本原则实验（Experiment）：指由研究者主动地决定给予部分实验对象某种处理，给予另部分对象某种对照处理的研究设计形式，这种处理的分配常常是随机的。实验设计（Experimental design）：是通过良好地计划对象的选择、处理因素的分配、结果指标的测量和资料分析来保证比较组间对象和实验条件是均衡的，实验结果有较好的可比性，并且较好地控制误差以能用较小的样本获取可靠的结论。一．实验设计的三要素：受试对象、处理因素和实验效应。 1．处理因素（treatment）：根据研究目的，对受试对象施加的某种措施，称为处理因素。注意：①抓住主要因素。 ②控制混杂因素（“非处理因素”在各组中应尽可能相同）。 ③标准化（处理因素应该标准化，即研究过程中处理应该自始至

终保持一致，不能因任何原因中途改变。） 2．受试对象（subject）：动物——种类，品系，窝别人——诊断，依从性注意受试对象的同质性(homogeneity) 3．实验效应（effect）：指标选择：有效，客观，灵敏，精确。（头痛，发烧）指标观察：对人的观察应注意避免偏性，提倡盲法。主观指标的量化：如划记评分。完全不满意完全满意 0 1 2 3 4 5 6 7 8 9 10 二．实验研究的分类：根据实验的对象不同，实验分成三类。 1. 动物实验（animal experiment） 2. 临床试验（Clinical trial）

3. 现场干预试验（Intervention trial）三．实验中的变异及其来源：在实验中，由于实验对象自身特点、实验条件的变化和实验结果测量的不确定性造成实验结果与真值的差别称实验误差，根据统计分析上的处理不同，实验误差分成两类： 1. 随机误差：由大量、微小的、偶然的因素的共同作用引起的不易控制的误差称随机误差。如在实验中，温度、湿度、风向、振动、试剂、仪器、操作员等都可能造成结果的偏差。随机变异是没有倾向性的，在大量观察条件下，随机误差的分布呈标准N。随机误差的规律可以用统计方法分析。正态分布()1,0 2.系统误差（systematic error）：由于在对象选择、处理因素分配的不随机、测量结果的不准确造成实验结果有倾向性地偏离真值称系统误差，或称偏倚

试验设计与统计分析教学大纲

山西农业大学信息学院《试验设计与统计分析》教学大纲课程名称：试验设计与统计分析 Experiment Design and Statistical Analysis 课程编码：105011 课程类别：专业基础课学时/学分：48学时/3学分适用专业：资环、环科等专业一、前言 1、课程性质《试验设计与统计分析》，是数理统计学在生物科学领域的应用，主要涉及科学研究中的试验设计、抽样观测和统计推断，是一门应用数学。课程还同时融入国际权威的SAS统计分析，通过上机处理试验实例的数据，巩固和加深理解所学统计原理及方法。课程不仅讨论如何科学地设计试验，而且还讨论如何科学地收集数据、整理数据、分析数据、解释数据和做出结论，是从事科学研究必不可少的基础知识。《试验设计与统计分析》是资环、环科专业的一门专业基础必修课程。 2、教学目标通过课堂讲授、课下作业和上机数据处理三个环节的教学过程，使学生掌握基本的试验设计与统计分析方法，掌握试验数据处理的程式步骤和技能。 3、教学要求针对试验设计与统计分析的学科特点，结合专业的性质，讲授课程时理论与方法并重，力图把统计原理讲解的清晰易懂，使学生了解典型内容的基本原理和方法，理解统计方法的理论背景，掌握一些基本技能，从而培养学生分析解决实际问题的能力。 4、先修课程高等数学、线性代数、概率论等

二、课程内容绪论教学内容及总体要求：掌握：（1）试验设计与统计分析的概念、特点；（2）总体与样本、样本含量、参数与统计量的概念；（3）统计分析的基本要求。了解：（1）试验设计与统计分析的作用及其主要内容；（2）试验设计与统计分析的发展概况；（3）错误与误差、准确性与精确性的概念。教学目标：通过学习，使学生掌握试验设计与统计分析的概念、特点；总体与样本、样本含量、参数与统计量的概念；统计分析的基本要求。教学方式方法建议：课堂讲授、课堂讨论学时：2学时一、试验在科学研究中的作用二、试验研究的一般程式及过程三、试验设计与统计分析的涵义四、试验设计与统计分析的必要性五、课程特点与学习方法六、常用术语和基本概念思考题： 1、总体与样本、样本含量、参数与统计量的概念； 2、统计分析的基本要求第一章田间试验设计（6学时）第一节田间试验设计基础 1、田间试验设计概述 2、试验设计中的基本概念第二节田间试验的种类 1、按试验性质分类

实验设计与统计分析

填空题 1.数据资料按其性质不同各分为资料和资料两种。 2.有共同性质的个体所组成的集团称为。从总体中抽取部分个体进行观测，用以估计总体的一般特性，这部分被观测的个体总称为。 3.由总体中包含的全部个体求得的能够反映总体性质的特征数称为；由样本的全部观察值求得的用以估计总体参数的特征数叫。 4..试验误差可以分为误差和误差两种类型。 5.从总体中抽取的样本要具有代表性，必须是抽取的样本。 6.样本根据样本容量的多少可以分为和。 8.小麦品种A穗长的平均数和标准差值为12cm和3cm，品种B为18cm和3.5cm，根据__________，判断品种______的该性状变异大。 9.某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验，收获时各随机抽取抽取50绳测其毛重，结果如下所示：平均数X(kg)极差R(kg)标准差S(kg)变异系数CV% 贻贝单养42.70307.0816.58贻贝与海带混养52.1030 6.3412.16根据和，判断的效果好。 10.在统计学中，常见平均数主要有和。 11. 12. 13. 14. 15. 16. 17. 简答题 1.如何控制、降低随机误差，避免系统误差？ 2.什么是准确性，精确性？如何提高试验的正确性？ 3.统计表与统计图有何用途？常用统计图、统计表有哪些？ 4.生物统计学中常用的平均数有几种？各在什么情况下应用？ 5.为什么变异系数要与平均数、标准差配合使用？多选题 1.下列总体中属于有限总体的是（）。 A 保定地区棉田中棉铃虫的头数 B 20m2的试验小区中鲁玉4号玉米的株高 C 66.7万公顷鲁玉4号玉米的株高 D 320株水稻中糯稻的株数 2.下列数据资料中属于连续型变数资料。

成组实验设计方案及其统计分析

成组实验设计及其统计分析成组设计及其统计分析 1. 实验设计设实验因素A有A1,A2２个水平,将全部n(n最好是偶数)个受试对象随机地均分成２组,分别接受A1,A2２种处理。再设每种处理下观测的定量指标数为k,当k=1时, 属于一元分析的问题。当k≥2时,属于多元分析的问题。在成组设计中,因2组受试对象之间未按重要的非处理因素进行两两配对, 无法消除个体差异对观测结果的影响,因此,其实验效率低于配对设计。 2. 前提条件与检验法的选用在分析成组设计资料前,需考察资料是否满足下述2个前提条件:①正态性,即各组数据应独立抽自正态总体。②方差齐性,即2组资料的总体方差应该相等。下面根据这2个前提条件的满足情况,给出统计检验法的选用办法: 前提条件满足情况可选用的统计检验法 ①、②均满足成组设计资料的一般t检验 ①满足、②不满足近似t检验,即t'检验。或非参数检验 ①不满足非参数检验在后2种情形中,若资料经过某种变量变换后能满足①、②2个前提条件,则对变量变换后的数据可用成组设计资料的一般t检验来分析。 3.应用实例 (1)一元的情形 ①成组设计资料的一般t检验 [例2.2.8]随机将20只雌性中年大鼠均分为甲、乙2组,甲组大鼠不接受任何处理(即空白对照),乙组中的每只大鼠接受3mg/kg的内毒素。分别测得2组大鼠的肌酐(mg/L)数据,试检验2总体均数之间有无显著差别。甲(对照)组: 6.2,3.7, 5.8,2.7,3.9,6.1,6.7,7.8,3.8,6.9 乙(处理)组: 8.5,6.8,11.3,9.4,9.3,7.3,5.6,7.9,7.2,8.2 [分析与解答]先假定此资料满足正态性这一前提条件(后面将用程序来实现)。 2总体方差的齐性检验:H0:σ12=σ22,H1:σ12≠σ22,α=0.05。用计算器实现统计计算所需的公式: (2.2.4) 式中MS1为较大均方、MS2为较小均方,SS、df分别为离差平和及自由度。F～F(df1,df2), 拒绝域:F≥Fα(df1,df2),则P≤α。本例的已知条件和中间结果: 甲组: n=10, df=9, ∑X=53.6, X-=5.36, ∑X2=313.26, SS=25.964, MS=2.884889 乙组: n=10, df=9, ∑X=81.5, X-=8.15, ∑X2=687.17, SS=22.945, MS=2.549444 显然,甲组MS大于乙组MS,故应把甲组的有关统计量放在式(2.2.4)的分子上。代入公式(2.2.4)计算的结果: F=1.132 查方差齐性检验用的F临界值表,得:F0.05(9,9)=4.03,因F0.05,

临床药代动力学试验的常见设计类型与统计分析

发布日期 20140327 化药药物评价 >> 临床安全性和有效性评价临床药代动力学试验的常见设计类型与统计分析张学辉，卓宏，王骏化药临床二部一、临床药代动力学试验的统计分析问题现状临床药代动力学试验在新药上市注册申请中占有重要地位。与大样本量的临床试验相比，这类试验样本数少、观测指标少，其统计分析问题要简单很多，未引起申请人或研究者的重视，一般较少邀请统计专业人员参与。甚至一些人认为这类试验是描述性试验，不需要进行专业的统计分析。其实正是因为这类试验的样本数少，才要更加重视其试验设计和统计分析的规范性，才能得出相对可靠的专业结论。从目前申报资料看，存在较多问题： 1 ）研究设计时未充分考虑三要素”（受试者、试验因素、观察指标），无法满足研究目标的专业需要；2）研究设计不符合四原则”（随机、对照、重复和均衡），不采用常见的设计类型，设计出一些不同寻常的异型试验； 3）资料整理和统计分析方法选用不当，与研究设计类型不匹配，尤其是滥用 t 检验和单因素多水平设计资料的方差分析方法。临床药代动力学试验的一般要求参见技术指导原则 ⑴。本文拟介绍这类试验的常见研栏目标题作者部门正文内容

究设计类型与统计分析方法，供大家参考。二、创新药物临床药代动力学试验这里的创新药物是指新化学实体。这类药物通常在健康受试者中进行多项的临床药代动力学试验，包括单次给药、多次给药、食物影响、药代动力学相互作用等药代动力学试验。后续还要进行目标适应症患者和特殊人群的药代动力学试验。 2.1创新药物单次给药药代动力学试验创新药物的健康受试者单次给药药代动力学试验通常在I期耐受性试验结束后进行。受试者例数一般要求每个剂量组8?12例，男女各半。药物剂量，一般选用低、中、高三种剂量，有时会选用更多剂量。剂量的确定主要根据I 期临床耐受性试验的结果，并参考动物药效学、药代动力学及毒理学试验的结果，以及经讨论后确定的拟在∏期临床试验时采用的治疗剂量推算。高剂量组剂量必须接近或等于人最大耐受的剂量。由于该类药物初上人体试验，出于安全性和伦理的考虑，每位受试者只给药一次，最常采用多剂量组平行设计。一般设计为在健康受试者（男女各半）中、随机、开放、多剂量组平行、单次给药的药代动力学试验。整理这类试验的药代动力学参数时，可以归类为两因素（剂量、性别）析因设计。各剂量组内性别间差异无统计学意义或者不考虑性别因素时，可以将该试验简化为单因素（剂量）的平行组设计。安全性好的药物，在伦理允许情况下，也可采用多剂量组、多周期的交叉设计。交叉设计的优点是节省样本量、自身对照、减少个体间变异，缺点是多周期时间长、重复测量次数多、受试者依从性差易脱落、统计分析方法复杂。当选用低、中、高三个剂量组时，通常采用随机、开放、单次给药、三剂量组

常见的实验设计与计算举例

常见的实验设计与举例一、单因素实验设计单因素完全随机设计、单因素随机区组设计、单因素拉丁方实验设计和单因素重复测量实验设计是四种基本的实验设计，复杂的实验设计大多都是在这四种形式上的组合。研究者根据不同的研究假设、实验目的与条件使用不同的实验设计，但无论哪种实验设计都有一个共同的目标，即控制无关变异，使误差变异最小。 1.完全随机设计研究中有一个自变量，自变量有两个或多个水平，采用随机化方法，通过随机分配被试给各个实验处理，以期实现各个处理的被试之间在统计上无差异，这种设计每个（组）被试只接受一个水平的处理。完全随机实验的方差分析中，所有不能由处理效应解释的变异全部被归为误差变异，因此，处理效应不够敏感。例：研究阅读理解随着文章中的生字密度的增加而下降。自变量为生字密度，共有四个水平：5:1、10:1、15:1、20:1，因变量是被试的阅读理解测验分数。实验实施时，研究者将32名被试随机分为四个组，每组被试阅读一种生字密度的文章，并回答阅读理解测验中有关文章内容的问题。完全随机实验设计实施简单，接受每个处理水平的被试数量可以不等，但需要被试的数量较大，且被试个体差异带来的无关变异混杂在组内变异中，从而使实验较为不敏感。完全随机实验数据的统计分析，如果是单因素两组设计，采用独立样本t检验；如果是单因素完全随机多组设计则采用一元方差分析（One -Way ANOV A）。 2.随机区组设计研究中有一个自变量，自变量有两个或多个水平，研究中还有一个无关变量，也有两个或多个水平，并且自变量的水平与无关变量的水平之间没有交互作用。当无关变量是被试变量时，一般首先将被试在这个无关变量上进行匹配，然后将他们随机分配给不同的实验处理。例：仍以文章的生字密度对阅读理解影响的研究为例，但由于考虑到学生的智力可能对阅读理解测验分数产生影响，但它又不是该实验感兴趣的因素，于是研究者采用单因素随机区组设计，在实验实施前，研究者首先给32个学生做了智力测验，并按智力测验分数将学生分为8个区组，然后随机分配每个区组内的4个同质被试分别阅读一种生字密度的文章。

拉丁方设计

拉丁方设计 ----------------------------------------------------------------- “拉丁方”的名字最初是由R、A、Fisher给出的。拉丁方设计（latin square design）是从横行和直列两个方向进行双重局部控制，使得横行和直列两向皆成单位组，是比随机单位组设计多一个单位组的设计。在拉丁方设计中，每一行或每一列都成为一个完全单位组，而每一处理在每一行或每一列都只出现一次，也就是说，在拉丁方设计中，试验处理数=横行单位组数=直列单位组数=试验处理的重复数。在对拉丁方设计试验结果进行统计分析时，由于能将横行、直列二个单位组间的变异从试验误差中分离出来，因而拉丁方设计的试验误差比随机单位组设计小，试验精确性比随机单位组设计高。拉丁方设计又叫平衡对抗设计(baIanced design)、轮换设计。这三个名称是从其模式、作用和方法三个不同的角度来说明这种设计的意义。所谓平衡对抗设计，是指在实验中，由于前一个实验处理往往会影响后一个实验处理的效果，而该实验设计的作用就在于提供对实验处理顺序的控制，使实验条件均衡，抵消由于实验处理的先后顺序的影响而产生的顺序误差，因而也可称之为抵消法设计。所谓轮换设计，是指在实验中，由于学习的首因效应，先实验的内容，被试容易记住；又因为学习的近因效应，对于刚刚学过的内容，被试回忆的效果一般也较好。因此、在实验方法上，有必要使不同实验条件出现的先后顺序轮换，使情境条件以及先后顺序对各个实验组的机会均等，打破顺序界限。所谓拉丁方设计，是指平衡对抗设计的结构模式，犹如拉丁字母构成的方阵。例如四组被试接受A、B、C、D四种处理，其实验模式为：上述模式表可以看出，每种处理即表中的字母在每一行和每一列都出现了一次而且仅出现了一次。像这样的一个方阵列就称为一个拉丁方。要构成一个拉丁方，必须使行数等于列数，并且两者都要等于实验处理的种数。在只有两个实验处理的情况下，通常采用的平衡对抗设计是以ABBA的顺序来安排实验处理的顺序。或者把单组被试分为两半．一半按照ABBA的顺序实施处理，另一半按照BAAB 的顺序实施处理。一、拉丁方简介（一）拉丁方——以n个拉丁字母A，B，C……，为元素，作一个n阶方阵，若这n 个拉丁方字母在这n阶方阵的每一行、每一列都出现、且只出现一次，则称该n阶方阵为n×n 阶拉丁方。例如：2×2阶、3×3阶拉丁方。

2014年临床科研设计与统计分析考题

2014年《临床科研设计与统计分析》试题一、名词解释 1、ANOV A:方差分析(Analysis of Variance，简称ANOVA)，又称“变异数分析”或“F检验”，是R.A.Fisher发明的，用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响，研究所得的数据呈现波动状。造成波动的原因可分成两类，一是不可控的随机因素，另一是研究中施加的对结果形成影响的可控因素。 2、ITT 随机对照试验中的意向性治疗分析(intention—to—treat analysis，ITT)，是指参与随机分组的对象，无论其是否接受该组的治疗，最终应纳入所分配的组中进行疗效的统计分析u 。该项原则强调，只要是参与了随机分配的病例，就应当纳入最后的结果分析。 3、NNT是指获得1例某种有利结局或防止1例某种不良结局发生,用某种干预方法所处理的人数.NNT越小越好,人数没有小数,所以最小是1.意味着每治疗1例病人,1例有效. 4、霍桑效应是指那些意识到自己正在被别人观察的个人具有改变自己行为的倾向。 5、DME 设计、测量、评价二、简答题 1、科研设计的原则 2、病因研究的研究设计类型，从论证强度及可行性分析。 3、预后研究的常见偏倚及预防措施 4、根据您的专业背景设计RCT的流程图，并用PICOS阐释 5、案例分析（等级资料效果差异的分析，用秩和检验，误用卡方检验） 6、卡方检验的应用条件（四格表n≥40，最小理论频数≥5时，用一般卡方检验，……什么条件用校正卡方检验，……什么条件用Fisher确切概率。题中以SPSS或者SARS的统计结果出现，请你分析是否有统计学意义） 7、多元回归分析中用逐步法做模型构建，以统计结果出现的。 8、对课程的意见和建议（一定要记得答，有分的）经验总结： ①没学的也会考。 ②只学《临床科研设计》的同学一般先考，她们考过的题，很多我们都考了，一定要把她们考的题记住啊！！！ ③没有大的计算题，临床科研设计主要教的是设计方案、选择统计方法而不是统计计算的具体过程。

实验设计与统计分析

实验设计名词解释总体：具有共同性质的个体所组成的集合体样本：从总体中抽出一部分个体进行研究，这部分个体的总合称为样本或抽样总体极差：资料中最大观察值与最小观察值的差值称为极差方差：离均差平方的平均数称为方差标准差：方差的正平方根称为标准差变异系数：该样本的标准差对均数的百分数频率：在大量重复试验中某一事件已发生的次数占试验总次数的比率称为频率概率：描述随机事件出现的可能性大小的一个概念频数：总体或样本中某观察值或某区间的观察值所出现的次数频数分布：总体或样本中不同观察值或不同区间的观察值出现的次数组成的分布抽样分布：研究从总体中独立抽取随机样本的统计数的概率分布置信限：区间的上下限置信概率（置信系数）：保证合理误差范围的概率因素：对某些事物的存在状况能够产生影响的其他事物试验因素：人为控制该影响因素的变化状态，使其影响程度可以得到准确的测量或判断不同水平：一个试验因素不同质或不同量的存在状态，叫试验因素的不同水平试验处理：人为地使试验因素处于不同水平或试验因素不同水平的组合，称为试验处理试验方案：同一试验所处理的总和称为试验方案试验效应：指因素的相对独立作用，也就是因素对性状所引起的增加或减少作用简单效应：在一种情况下因素的相对独立作用主效应：同一试验中同一因素的简单效应平均值称为主效应重复：同一处理在试验中出现的次数（重复具有降低试验误差，扩大试验的代表性；估计试验误差大小，判断试验可靠程度）个体试验：同一内容的试验只在一两个不同的地点设置群体试验：同一内容试验在有许多代表性的地点统一布置、统一方法、同时进行，这样的试验叫做群体试验参数：能说明不同总体集中性和变异性特征的数值称总体特征数匀地播种：在即将进行试验的土地上连续几茬播种密生植物以便均衡土壤肥力差异的方法。相关系数：对于坐标散点，显线性相关的两个变量，如果不需要由x预测y，只需要了解x 与y是否确定有相关系数，相关关系的密切程度如何，以及相关性质，则只需计算出一个新的统计量简答题 1、正态分布的特点答：正态分布是一种常见也是最重要的连续性随机变量的理论分布。其特点①以算术平均数u为轴点，左右对称②在x=u处，值最大，其算术平均数、中位数、众数相等，合并为一③正态分布的多数次数集中于算术平均数u附近，离平均数越远，其相应的次数越少④正态分布曲线在∣x-u∣≧ō处有拐点，曲线左右延伸⑤正态分布曲线与x轴之间的总面积等于 1. 2、试验研究一般程序答：㈠选题确定试验研究的具体目标和任务㈡作好试验计划设计和确定完成试验任务的方法步骤（①设计试验方案②确定试验方法③制定管理措施④确定观察测定项目及其方法与

临床科研设计与分析试卷(带答案)

临床科研设计与分析试卷(带答案) 适用范围： __________ 出题教师： __________ 题型得分单选题名词解释简答题论述题总分1. 资料整理的基础工作和资料分析的首要工作是对资料进行： ( ) A. 审核B. 演绎分析C. 归纳分析D. 分类 2. 查得资料比较杂乱，没有时代特点，属于哪种文献检索的特点：( ) A. 引文查找法B. 顺差法C. 综合查找法D. 逆差法 3. 某医生用针刺疗法治疗三种不同的疾病，目的在于弄清：针刺治疗对哪种病疗效最好，三种病人分别在甲、乙、丙三组接受相同的辅助治疗。该医生每天依次给甲、乙、丙三组病人（每组30人）一一扎针，这样做人为产生了： ( ) A. 重复误差B. 随机误差C. 条件误差D. 抽样误差 4. 实验研究变量的三个组成部分是： ( ) A. 实验变量、过程变量和无关变量B. 实验变量、效果变量和无关变量C. 效果变量、过程变量和无关变量D. 效果变量、目标变量和有关变量 5. 为了避免重复劳动，提高科学研究的效益，必要的工作是： ( ) A. 文献检索B. 选定课题C. 课题论证D. 历史分析 6. 根据访谈过程是否有严格设计的访谈提纲，可以把访谈调查分为：

( ) A. 结构性访谈调查和非结构性访谈调查 B. 个别访谈调查和集体访谈调查 C. 电话访谈调查和网络访谈调查 D. 一次性访谈调查和重复性访谈调查7. 研究生没有公开发表的学位论文属于类文献： ( ) A. 教育档案B. 书籍C. 其他D. 报刊8. 书目属于文献等级中的： ( ) A. 一次文献B. 四次文献C. 二次文献D. 三次文献9. 反映实验自变量与因变量的因果关系的真实性，决定实验结果解释的是： ( ) A. 内在效度 B. 生态效度C. 外在效度D. 总体效度10. 许多人习惯用单因素设计取代多因素设计，这样做在什么情况下易得出错误的结论： ( ) A. 因素之间独立时B. 样本含量较小时C. 因素之间有交互作用时D. 实验者操作不太熟练时11. 开展一项科学研究，何时开始运用统计学知识： ( ) A. 从最初的试验设计开始B. 有了试验数据之后C. 从计算机算出结果开始D. 有了试验设计之后12. 以下属于三次文献的是： ( ) A. 索引B. 手册C. 论文D. 文摘13. 为了研究一组因素X1，X2，，Xg对一组肺癌患者生存时间长短的影响，对病人进行追踪随访观察，观察结果分为两档，，即病人生存时间?2年和?2年，考察的危险因素有治疗方法（4种）、治疗前

拉丁方试验设计

拉丁方试验设计拉丁方试验设计在统计上控制两个不相互作用的外部变量并且操纵自变量。每个外部变量或分区变量被划分为一个相等数目的区组或级别，自变量也同样被分为相同数目的级别。它是从横行和直列两个方向进行双重局部控制，使得横行和直列两向皆成单位组，是比随机单位组设计多一个单位组的设计。在拉丁方设计中，每一行或每一列都成为一个完全单位组，而每一处理在每一行或每一列都只出现一次，也就是说，在拉丁方设计中，试验处理数=横行单位组数=直列单位组数=试验处理的重复数。拉丁方——以n个拉丁字母A，B，C……，为元素，作一个n 阶方阵，若这n个拉丁方字母在这n阶方阵的每一行、每一列都出现、且只出现一次，则称该n阶方阵为n×n阶拉丁方。第一行与第一列的拉丁字母按自然顺序排列的拉丁方，叫标准型拉丁方。拉丁方设计一般用于5~8个处理的试验，设计的基本要求：必须是三个因素的试验，且三个因素的水平数相等；三因素间是相互独立的，均无交互作用；各行、列、字母所得实验数据的方差齐（F 检验）。试验设计的步骤：根据主要处理因素的水平数，确定基本型拉丁方，并从专业角度使另外两个次要因素的水平数与之相同；先将基本型拉丁方随机化，然后按随机化后的拉丁方阵安排实验。可通过对拉丁方的任两列交换位置或任两行交换位置实现随机化；规定

行、列、字母所代表的因素与水平，通常用字母表示主要处理因素。数据处理的相关理论：拉丁方设计实验结果的分析，是将两个单位组因素与试验因素一起，按三因素试验单独观测值的方差分析法进行。将横行单位组因素记为A ，直列单位组因素记为B ，处理因素记为C ，横行单位组数、直列单位组数与处理数记为r ，对拉丁方试验结果进行方差分析的数学模型为： ),,2,1()()(r k j i x k ij k j i k ij ===++++=εγβαμ 式中:μ为总平均数；i α为第i 横行单位组效应；j β为第j 直列单位组效应，）（k γ为第k 处理效应。单位组效应i α、j β通常是随机的，处理效应）（k γ通常是固定的，且有01=∑=r k k γ；)(k ij ε为随机误差，相互独立，且都服从），（20σN 。平方和与自由度划分式为： e C B A T SS SS SS SS SS +++= e C B A T v v v v v +++= 矫正数：22/..r x C = 总平方和：C x SS k ij T -=∑2 )( 横行平方和：C r x SS i A -=∑/2. 直列平方和：C r x SS j B -=∑/2. 处理平方和：C r x SS k C -=∑/2)( 误差平方和：C B A T e SS SS SS SS SS ---= 总自由度：12-=r v T 横行自由度：1-=r v A

拉丁方试验设计

拉丁方试验设计的具体实例拉丁方试验设计拉丁方试验设计在统计上控制两个不相互作用的外部变量并且操纵自变量。每个外部变量或分区变量被划分为一个相等数目的区组或级别，自变量也同样被分为相同数目的级别。它是从横行和直列两个方向进行双重局部控制，使得横行和直列两向皆成单位组，是比随机单位组设计多一个单位组的设计。在拉丁方设计中，每一行或每一列都成为一个完全单位组，而每一处理在每一行或每一列都只出现一次，也就是说，在拉丁方设计中，试验处理数=横行单位组数=直列单位组数=试验处理的重复数。拉丁方——以n个拉丁字母A，B，C……，为元素，作一个n 阶方阵，若这n个拉丁方字母在这n阶方阵的每一行、每一列都出现、且只出现一次，则称该n阶方阵为n×n阶拉丁方。第一行与第一列的拉丁字母按自然顺序排列的拉丁方，叫标准型拉丁方。拉丁方设计一般用于5~8个处理的试验，设计的基本要求：①必须是三个因素的试验，且三个因素的水平数相等；②三因素间是相互独立的，均无交互作用；③各行、列、字母所得实验数据的方差齐（F 检验）。试验设计的步骤：①根据主要处理因素的水平数，确定基本型拉丁方，并从专业角度使另外两个次要因素的水平数与之相同；②先将基本型拉丁方随机化，然后按随机化后的拉丁方阵安排实验。可通过对拉丁方的任两列交换位置或任两行交换位置实现随机化；③规定

实验设计与数据统计分析.doc

第二章实验设计与数据统计分析 ?实验设计的基本问题 –变量的选择与控制 –实验中的效度 ?真实验设计 –完全随机设计 –多因素实验设计 –随机化区组设计 ?准实验设计和非实验设计一、实验设计的基本问题（一）变量的选择与控制 1、变量的选择 2、实验设计中的控制 –何谓控制？ –控制的应用对变量的控制：随机化使用控制组 3、实验误差 –是存在于实验单元内作同样处理所得观测数据间的变差的度量。 –实验误差的来源：内在变差；环境和操作的不一致；重复实验的误差。或S;G;R型误差。（二）实验中的效度何谓实验效度？ –一项实验所能揭示的事物本质规律的有效性程度。自从1966年科贝尔(Campbell)和斯大理(Stanly)提出内在效度(InternaI Validity)和外在效度(ExternalVa1idity)这一概念描述研究效度以来，很多学者对影响效度的因素作过认真的研究，提出很多方面的因素。1979年库克(Cook)和科柏尔(Campbell)认为这一划分方法不够完整，后又从内在效度中抽出一部分命名为统计结论效度(Statistical Conc1usion Validity)，由外在效度中提出一部分命名为构想效度(Construct Validity)。 1、内部效度及影响因素含义：实验处理被精确估计的程度。 ?影响内部效度的因素 –历史：在实验中，与实验变量同时发生，并对实验结果产生影响的特定事件。 –成熟或自然发展的影响： –选择： –测验： –被试的亡失： –统计回归： –仪器的使用： –选择和成熟的交互作用及其他。 2、外部效度及影响因素含义：实验结果能被概括到实验情境条件以外的程度。 ?影响外部效度的因素： –测验的反作用效果

常用几种实验设计统计分析方法的正确选择一完全随机设计资料的统计分析方法

读者作者编者常用几种实验设计统计分析方法的正确选择&一’ 完全随机设计资料的统计分析方法闫丽娜e杨海涛e高霞河北医科大学流行病与卫生统计教研室河北石家庄050017> 关键词:统计学e医学;方法;数据收集中图分类号:R195.1 文献标识码:A 文章编号:1004-583X(2013)03-N-02 d o i:10.3969/.i s s n.1004-583X.2013.03.045 在医学科学研究中要实现完整而准确的统计分析首先要确定实验设计的类型详见本刊2013年28卷第2期医学科研中常用实验设计方法其次分清资料的类型根据数据资料类型分为定量资料和定性资料两种定量资料是通过一定的度量衡方法对观察单位测得的数据有度量衡单位医学上常见的各种生理学生化学指标如血压脉搏血红蛋白白细胞血清胆固醇等都为定量资料进行统计描述时若为正态分布常用平均值标准差I S>表示若为非正态分布常用[中位数四分位数距>][M G R>]表示定性资料是将观察单位按某种属性或类别分组然后清点各组的观察单位数如性别血型某病的治愈未愈人数等都为定性资料进行统计描述时常用例>构成比相对比表示再者应该考虑各种统计方法的适用条件现将完全随机设计资料中常用的统计分析方法介绍如下 1数据资料为定量资料 1.1两样本之间进行比较一般应用统计软件先对其正态性和方差齐性进行检验检验水准常取0.10如果两资料满足正态分布同时方差齐选择两独立样本I检验[1]如果只满足正态分布而方差不齐则应用I H检验如果不服从正态分布或既不是正态分布又不能满足方差齐性应选用两独立样本比较的秩和检验W i l c o x o n秩和检验>[2]常见错误=不考虑I 检验和检验的适用条件一律采用I检验 1.2多样本之间比较首先也要考虑是否满足正态性和方差齐性方法同前如满足选用完全随机设计方差分析若P＞ 0.05认为多个总体均值之间无差别若P＜0.05认为多个总体均值总的来说有差别还需进一步做两两比较常用 S N K检验G检验>L S D-I检验B o n f e r r o n i检验[3]S N K 检验G检验>适用于所有各组两两间的比较即探索性研究例如3种抗癌药物的治疗效果两两之间是否有差别事先未知任何信息需要用S N K检验去探索性分析到底哪两组有差别L S D-I检验适用于证实性研究中事先计划好的某几对均值间的比较例如两个试验组如某新药不同的两个剂量组>与对照组比较是否有差异可采用L S D-I检验分别对两剂量组与安慰剂进行检验B o n f e r r o n i检验是多重比较中应用最多的方法该方法优点是简单适用范围广但结果较为保守例如3组间两两比较共需比较3次初始检验水准为0.05调整后的检验水准为0.05/3=0.017两两比较所得P 值要与0.017比较从而得出结论如不满足则选用多个样本比较的秩和检验K r u s k a l-W a l l i s~检验>当P＜0.05时常采用扩展的I检验进行两两比较常见错误=不考虑方差分析后两两比较的适用范围方差分析后一律采用S N K检验 2数据资料为无序定性资料 2.1两样本之间进行比较t若为两分组结局变量为两水平即普通2X2四格表见表1结局变量为有效和无效当n j40且四个格子理论频数T>j5时选用四格表检验;当n j40但存在有格子的理论频数1＜T t5时选用校正o2检验;当n t40或存在理论频数T t1时不宜采用o2检验选用F i s h e r确切概率法;当P。a时选用四格表资料的F i s h e r确切概率法＠若仍为两分组结局变量为三水平及以上即2X C表见表2结局变量为A型B型A B型O型>要比较两者的构成比是否有差别时若不存在超过1/5以上的格子理论频数1＜T t5或不存在任何一个格子的理论频数T t 1选用RXC表o2检验的方法否则选用F i s h e r确切概率法常见错误=四格表资料不考虑例数和理论频数等适用条件一律采用四格表o2检验;2XC表资料不计算各个格子的理论频数导致不考虑是否有1/5以上的格子理论频数1＜T t5或有任何一个格子的理论频数一律采用RXC表o2检验表1两种药物治疗脑动脉硬化的疗效[例>] 组别例数有效无效新药组444193.2>36.8> 传统药物组241875.0>625.0> 表2患者与健康输血员血型分布例> 组别例数A型B型A B型O型合计疾病组239476********* 健康组18752541962187 2.2多样本之间进行比较如果比较多组之间率或构成比有无差别或推断两种分类变量有无关联性适用条件同2X C表选用RXC表o2检验RXC表o2检验如果有差异还需采用率的多重比较进一步推断哪两个总体率间有差别一般选用S c h e f f e'可信区间法及B o n f e r r o n i检验水准调整法[4] 3数据资料为有序定性资料 3.1两样本之间进行比较即单向有序资料如分组变量为两药物组结局变量为显效有效无效>选用两独立样本 W i l c o x o n秩和检验常见错误=不考虑结局变量是否有序一律选用RXC表o2检验 3.2多样本之间进行比较t若分组变量如年龄各阶段>有序而结局变量无序可视为双向无序采用RXC表检验; (下转正文第244页) N<临床荟萃>2013年3月5日第28卷第3期C l i n i c a l F o c u s M a r c h52013V o l28N o.3万方数据

交叉实验设计及其统计分析

交叉实验设计及其统计分析交叉设计及其统计分析为了更好地消除或减少重要的非处理因素的影响, 常用交叉设计取代配对设计。此设计一般只适合安排1个2水平的试验因素,2个与试验因素无交互作用的重要非处理因素。１．试验设计选取n(n为偶数)个受试对象,按某属性(即第1个区组因素)将受试对象配成n/2对,用随机的方法决定每对中的1个受试对象接受2种处理的先后顺序(即第2个区组因素),让该对中的另1个受试对象接受处理的顺序相反。2种处理先后作用于同1个受试对象,并且交叉出现在各对受试对象之间,故称为交叉设计。值得注意的是:由于2种处理先后作用于同1个受试对象,故此设计仅限于处理的作用在短时间内就能消失的试验问题中。否则,易造成2种处理的效应混杂。２．应用实例 [例2.3.7]为研究A(90402中药复方)、B(安慰剂) 2种药物(处理因素)对提高高原劳动能力的影响,以条件近似的12名健康人测试, 把受试对象和测定顺序Ⅰ(1992.12.18～12.24)与Ⅱ(1993.4.6～4.10)作为2个重要的非处理因素,每人都用2种药物各1次,条件最接近的每2人配成1对,用随机的方法确定每对中之一使用A、B药物的顺序,另1个人的顺序相反。有人进行了交叉设计并收集到试验数据如下, 观测指标为PWC170(即把心跳校正到每分钟170次时能做的功(kg.m)),试分析此资料。表2.3.42种药物对提高高原劳动能力的试验结果 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━受试者药物与PWC170受试者药物与PWC170 ━━━━━━━━━━━━━━━━━━━━━━━编号顺序:ⅠⅡ编号顺序:ⅠⅡ ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━1A159.4B153.82B129.4A 159.8 3A156.1B .4B122.1A 137.6 ... ................... .................... 11A180.1B150.712B122.8 A . ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━注: 详细资料见[ANOVAN5.PRG];第3号与第12号两人的数据不全,不参入计算。 [分析与解答]H0:2种药物的影响结果相同;H1:2种药物的影响结果不同;α=0.05。对2个区组因素─受试者、测定顺序也有类似的假设。