实验设计的基本原理

实验设计的基本原理
实验设计的基本原理

实验设计的基本原则

在实验设计中,应当严格遵守对照、随机、重复和均衡四个基本原则。

1、对照的原则

1)设立对照的意义

设立对照组的的意义在于使实验组和对照组内的非处理因素的基本一致,即均衡可比。对照的意义还可以用以下符号表达:

实验效应是与混在一起的,实验设计的主要任务是如何使能单独显示出来。

设立对照,使实验中两组(或多组)的均衡,即。这样,实验组的效

应就可以显示出来。

:处理因素;与:相同的非处理因素;:与之差;:实验效应,

与是与的影响结果;:与之差的效应。这样,通过对照就消

除了非处理因素对实验效应的影响。

2)对照的基本形式

对照的形式有多种,可根据研究目的和内容加以选择,常用的有下列几种。

(1)空白对照对照组不施加任何处理因素。例如,观察某种疫苗预防肾综合征出血热的效果,选择人口数量和构成、发病水平、地理环境、主要宿主鼠类基本相似的两个疫区,一个作为试验区,在人群中接种疫苗,另一个作为对照区,不施加任何干预措施,处理因素完全空白。这种对

照只有在处理因素很强,非处理因素很弱的情况下才能使用。在临床试验中,一般不用空白对照。

(2)实验对照对照组不施加处理因素,但施加某种实验因素。如观察赖氨酸对儿童发育的影响,实验组儿童课间加食含赖氨酸的面包,对照组儿童课间加食不含赖氨酸的面包。处理因素是赖氨酸,非处理因素的面包量两组是相同的。

(3)标准对照不设立专门的对照组,而是用现有标准值或正常值做对照。在临床试验中常以某疗法为标准对照组,这种对照应注意标准组必须是代表当时水平的疗法,切不可用降低标准组的方法使实验效应提高。但实验研究一般不用标准对照,因为实验条件不一致,常常影响对比效果。

(4)自身对照对照与实验在同一受试者身上进行,如用药前后作为对比。一般情况下还要求设立平行对照组。

(5)相互对照这种对照不设立对照组,而是两个或几个试验组相互对照。例如用莫雷西嗪治疗冠心病、高血压、心肌病和失调症引起的室性早搏时,设立冠心病组、高血压组、心肌病组和失调症组四个治疗组,相互比较它们的疗效。

(6)配对对照把研究对象条件相同的两个配成一对,分别给以不同的处理因素,对比两者之间的不同效应。配对对照常用于动物实验,临床试验也可采用,但严格地说,很难找到相同或十分相似的对子。

(7)历史对照以本人过去的研究或他人研究结果与本次研究结果做对照。除了非处理因素影响较小的少数疾病外,一般不宜使用这种对照。用时要特别注意资料的可比性。

2、随机的原则

1)随机的意义

所谓随机,就是每一个受试对象都有同等的机会被分配到任何一个组中去,分组的结果不受人为因素的干扰和影响。实验设计中必须贯彻随机化原则,因为在实验过程中许多非处理因素在设计时研究者并不完全知道,必须采用随机化的办法抵消这些干扰因素的影响。

2)随机化的实施

实验设计中所指的总体不是泛指的无限总体,而是根据研究假设的要求规定的纳入标准,如动物的体重、年龄、病人的病情、经济条件、父母的文化程度等所选择的受试对象(即本次实验的有限总体),再把这些受试对象随机分入实验组和对照组中,以增强可比性,称为随机分配(randomized allocation)。随机化的实施就是如何进行随机分配。随机化的方法有多种,最简单的如抽签。但在实验设计中广泛应用随机数字表和随机排列表。

(1)随机数字表和随机排列表

随机数字表表内数字相互独立,全部数字无论从横行、纵行或斜向等各种顺序均呈随机状态。因此,使用时可从任何一个数字开始,按任意一个顺序录用。例如,拟将12只大鼠随机分入甲、乙两组,每组6名。应先把受试者按体重由小到大编号,然后从随机数字表任意一处查出12个随机数,遇到相同的随机数则去掉(如从“随机数字表“第35行第1列向右查)。并将随机数由小到大编秩(秩次R),令R为1~6者分入甲组,R为7~12者分入乙组。

动物编号123456789101112

随机数字 69 92 06 34 13 59 71 74 17322755

秩次R9 121628 10 113547

分组结果乙乙甲甲甲乙乙乙甲甲甲乙

随机排列表随机排列表比随机数字表更有实用性。它可以简便地将受试对象随机分配到实验所要求的各组中去,也可以对处理因素进行随机排列,但不适用于随机抽样研究。

本表共有n分别为10、20、30、40、50、100等不同自然数排列而成的六种随机排列表,本教材引用n为20的随机排列表。是每行或每列数字与顺序的等级相关系数,越小表示数字排列随机化程度越好。

例如,将10只小鼠随机分入甲、乙两组。先将小鼠按体重由小到大编号,然后任意取n为20随机排列表中的任意一行或一列随机数,遇到大于或等于10的随机数则舍去。本例取随机排列表中第6行,令单号分入甲组,双号分入乙组。

动物编号:12345678910

随机数字:2814309675

分组结果:乙乙甲乙甲乙甲乙甲甲

所以,第3、5、7、9、10只小鼠被分入甲组,第1、2、4、6、8只小鼠被分入乙组。

(2)几种常用随机分组方法

大样本完全随机分组适用于每组例数大于100时的情况。方法是每个受试者给一个3位数的随机数,规定随机数区间:

分两组(等概率)000~499500~999

分三组(等概率)000~332333~665666~998

分四组(等概率)000~249250~499500~749750~999

分五组(等概率)000~199200~399400~599600~799800~999

余类推,多余的随机数可忽略,如分三组时取000~998,分六组时取000~995之间的随机数。

在有些特殊情况下需进行不等概率分组时,可按比例调整随机区间。如按1:2分组,A组的随机数区间为000~333,B组为334~999;按1:3分组,A组为000~249,B

组为250~999。在临床试验中,不等概率分组的比例不能超过1:3。表13.1是1:2完全随机分组举例。

表13.1300例受试者1:2完全随机分组举例

受试者编号 1 2 3 4 5 6 7 8 9 10 11 (300)

随机数849 140 539 006 860 347 323 387 563 678 253 (961)

处理 B A B A B B A B B B A … B

表13.2等概率随机分组例数分布的抽样试验

随机数区间

总例数

100 200 300 400 600 800 1000 1500 2000

000~

099

11 23 30 36 58 77 93 144 191 100~

199

6 1

7 29 3

8 54 68 90 137 180 200~

299

14 25 35 47 70 92 113 172 226 300~

399

9 20 30 42 59 87 106 157 216 400~

499

10 23 39 50 72 92 118 165 218 500~

599

12 23 34 43 69 90 112 146 193 600~

699

10 18 28 34 52 79 95 149 203 700~

799

9 17 28 39 62 79 99 147 189 800~

899

6 12 1

7 31 45 66 83 13

8 193 900~

999

13 22 30 40 59 70 91 145 191

最小

例数

分2组50 92 137 187 287 384 480 725 969 (50)(100)(150)(200)(300)(400)(500)(750)(1000)分5组17 34 47 71 104 136 174 281 371 (20)(40)(60)(80)(120)(160)(200)(300)(400)

备注:括号内为每组理想例数。

对于完全随机分组,各组例数没有必要调整到理想情况(如等概率分组两组例数相等)。表13.2的抽样试验结果还说明,当每组例数达到100例时,各组例数应该是大体相当的。万一出现比例严重失衡的情况,如200例等概率分组时,出现85:115或更不平衡的情况(出现概率小于0.05),需重新分组。

随机数区间

总例数

100 200 300 400 600 800 1000 1500 2000

000~

099

11 23 30 36 58 77 93 144 191 100~

199

6 1

7 29 3

8 54 68 90 137 180 200~

299

14 25 35 47 70 92 113 172 226 300~

399

9 20 30 42 59 87 106 157 216 400~

499

10 23 39 50 72 92 118 165 218 500~

599

12 23 34 43 69 90 112 146 193 600~

699

10 18 28 34 52 79 95 149 203 700~

799

9 17 28 39 62 79 99 147 189 800~

899

6 12 1

7 31 45 66 83 13

8 193 900~

999

13 22 30 40 59 70 91 145 191 最小

例数

分2组50 92 137 187 287 384 480 725 969 (50)(100)(150)(200)(300)(400)(500)(750)(1000)分5组17 34 47 71 104 136 174 281 371 (20)(40)(60)(80)(120)(160)(200)(300)(400)备注:括号内为每组理想例数。

对于完全随机分组,各组例数没有必要调整到理想情况(如等概率分组两组例数相等)。表13.2的抽样试验结果还说明,当每组例数达到100例时,各组例数应该是大体相当的。万一出现比例严重失衡的情况,如200例等概率分组时,出现85:115或更不平衡的情况(出现概率小于0.05),需重新分组。

表13.3n个区组随机排列结果

区组

(入院时间)

随机数随机数序号随机排列结果

患者1 患者2 患者3 患者1 患者2 患者3 患者1 患者2 患者3

1 69 01 75

2 1

3 B A C

2 18 65 81 1 2

3 A B C

3 85 22 50 3 1 2 C A B

4 88 50 76 3 1 2 C A B

5 05 87 24 1 3 2 A C

B

6 90 64 16 3 2 1 C B A

方法2当处理数k较小时(如k<5),由方法1得到的区组内处理的排序顺序可能出现重复,如表13.3中的区组3和4。此时,可用表13.4中全排列顺序确定各区组的排列方式。

表13.4k=3,4时区组内处理的全排列

K=3 1ABC 2ACB 3BAC 4BCA 5CAB 6CBA

K=4 1ABCD 2ABDC 3ACBD 4ACDB 5ADBC 6ADCB

7BACD 8BADC 9BCAD 10 BCDA 11 BDAC 12 BDCA

13 CABD 14 CADB 15 CBAD 16 CBDA 17 CDAB 18 CDBA

19 DABC 20 DACB 21 DBAC 22 DBCA 23 DCAB 24 DCBA

例如,当k=3时,对5个区组内A,B,C三种处理进行随机排列。

取6个随机数:498,739,853,994,563,479,排序结果位2,4,5,6,3,1,查表13.4对应的序号,第一个区组的对应的序号是2,排列方式为ACB,第二个区组的对应的序号是4,排列方式为BCA,第三个区组的对应的序号是5,排列方式为CAB,第四个区组的对应的序号是6,排列方式为CBA,第五个区组的对应的序号是3,排列方式为BAC。

当k=2时(配对设计),因排列方法只有2种,即AB和BA,可用每个对子随机数的奇偶决定,但为了保证所有对子中这两种顺序出现机会均等,还可采用分段随机数分组的方法。

分段随机分组分段随机分组的基本思想是利用随机数生成若干数目相同的随机排列序列,再根据序列号进行分组,其目的是使分组结果达到预想的例数分配,

既适用于小样本又适用于大样本。基本步骤是:①将分组过程分多个阶段进行,每个阶段只对m个试验材料随机分组。m必须是处理数的倍数,为了保证随机效果,m最好是处理数的5倍以上;②取m个3位随机数从小到大排序,得序号R;

③规定R所对应的处理,如20个动物等分为两组,则R:1~10为A组,R:11~20为B组。15名患者按1:2分为两组,则R:1~5为A组,R:6~15为B组。18名患者等分三组,R:1~6为A组,R:7~12为B组,R:13~18为C组。余类推。④将m个观察对象分配完毕以后,再按以上方法对下一批m个观察对象分组,直至分组结束。

例如,将200名受试者随机等分为两组。

令m=10,需分20段完成全部分组。规定每段随机排列序号R对应处理,R:1~5为A组,R:6~10为B组,第1和第2阶段的分组结果见表13.5。

表13.5分段随机分组举例

受试者序号

第1阶段分组结果

1 2 3 4 5 6 7 8 9 10

随机数421 333 459 418 384 400 213 391 754 318 R 8 3 9 7 4 6 1 5 10 2 处理 B A B B A B A A B A

受试者序号

第2阶段分组结果

1 2 3 4 5 6 7 8 9 10

随机数391 910 351 024 425 293 361 660 081 911

R 6 9 4 1 7 3 5 8 2 10

处理 B B A A B A A B A B

由表13.5第2阶段分组结果可看出,若采用随机数的奇偶数决定组别,则有7个奇数,3个偶数,不能达到每组例数相等的分组结果,但用随机数排列序号R 分组,可保证各组例数相等。配对设计时亦可采用此方法,如20个对子,预先规定R:1~10时处理排列顺序为AB,R:11~20时为BA。同理,当单位组个数n大于表5中的排列方式数时,亦可采用分段随机分组的方法,并规定m=k!,以最大限度地减少相同排列的重复次数。

3、重复原则

所谓重复,就是实验要有足够的样本含量。重复是消除非处理因素影响的又一重要手段。

1)影响样本含量大小的因素实验所需的样本含量取决于以下4个因素:

(1)假设检验的第Ⅰ类错误的概率(检验水准)取值越小,实验所需的样本含量越大。

(2)假设检验的第Ⅱ类错误的概率(检验水准)取值越小,实验所需的样本

含量越大。另外,如果把第Ⅱ类错误的概率定为,那么就是假设检验的

检验效能(power),即处理组间实际上有差别,且假设检验结果能发现该差别的概率,通常检验效能取值为0.80,0.90,0.95或0.99。检验效能越大,实验所需的样本含量越大。

(3)处理组间的差别处理组间的差别越小,实验所需的样本含量越大。

(4)实验单位的标准差实验单位的标准差越大,实验所需的样本含量越大。

2)确定样本含量时应当具备的条件

(1)建立检验假设。

(2)定出检验水准和检验效能首先确定本次实验中允许犯第Ⅰ类错误的概率,通常取;同时还应明确是单侧或双侧检验。然后,在特定的检验水准

条件下(比如),确定检验效能,通常定为0.80,根据需要有时

可以定为0.90或0.75。但是,在科研设计时检验效能不宜低于0.75,否则检验的结果很可能反映不出总体的真实差异,出现非真实的阴性结果。

确定检验水准和检验效能,实际上是如何确定假设检验时犯第Ⅰ类错误的概率

和第Ⅱ类错误的概率,和的大小应根据第Ⅰ类错误和第Ⅱ类错误的危害性

来决定。以新药疗效论证的临床试验为例,第Ⅰ类错误是将疗效与对照药本无差别的新药看作对照药的替代品,第Ⅱ类错误是将疗效优于对照药的新药看作与对照药的疗效相同。如果新药的生产成本低于对照药且副作用比对照药小,不妨将

和定得小一些,如,。反之,若新药的生产成本高于对照

药或副作用比对照药大,应将定的略小一些,定得大一些,如,

。检验效能就是优秀药物经过实验被发现的概率。当研究者倾向接受

时,应取较大的值,如0.95,0.99。

(3)确定所比较的总体参数间的差值和总体标准差例如,比较两总体均数或总体率的差异时,应当知道总体间的差值的信息。如两总体均数间的差值

的信息。两总体率间的差值的信息。有时研究者很难得到

总体参数的信息,可以用专业上(临床上)认为有意义的差值代替,如平均舒张压的差值0.69kPa(5mmHg)等。当然,也可以根据试验的目的认为规定,如规定实验的新药有效率超过标准药物有效率的30%才有推广意义等。此外,确定两均数比较的样本含量还需要估计总体标准差的信息。

还可以通过预试验,获得样本间的差值和样本标准差做为总体参数间的差值和总体标准差的估计值进行样本含量的估计。

3)确定样本含量的用途

(1)估算达到有统计学意义的最低样本含量例如,根据文献报道血吸虫病人血红蛋白平均含量为90g/L,标准差为25g/L,现欲观察呋喃丙胺治疗后能否使血红

蛋白增加。规定治疗后血红蛋白至少增加10g/L以上为有效,(双侧),

,问应治疗多少病人?

回答这一问题可用下面的公式进行估算:

=10g/L,=25g/L, ,单侧

例。

(2)估计检验效能对于现有的实验结果,已知样本含量,可以根据总体的差值估计实验的检验效能是否够大。例如,在查阅文献和借鉴前人经验时,若其假设检验的结果为,则做出无统计学意义的“阴性”结论时,研究者则面

临着犯第Ⅱ类错误的可能性,应当考虑是否总体间的差异确实存在,有可能由于检验效能不足而未能把总体中确有的差异反映出来。目前,许多国际会议对于假

设检验中做出的“阴性”结论,应附有犯第Ⅱ类错误的概率为据,因而有必要介绍估计检验效能的方法。

例如,两样本均数比较的资料,当两样本例数相等时可用下式计算其检验效能:

式中为两组合计例数。

(3)估计总体参数的差异()根据已知条件初步确定样本含量,并规定期望的检验效能为0.90,估计总体参数的差值,例如,两样本均数比较

4)常用的估计样本含量的方法

当研究者确定和,并对和做出估计后,就可以根据设计类型和要求估计样本含量。

(1)样本均数与总体均数的比较确定和后,令,为实验结果的总体标准差,样本含量的计算公式为:

(13.1)

其中,为实验所需的样本含量,有单双侧之分,只取单侧,和为相应的正态分位数。

例13.1 据文献报道,脑血栓形成后血浆纤维蛋白浓度的均数和标准差分别为4.3(g/L)和1(g/L)。现试验一治疗措施,

期望试验结果至少使血浆纤维蛋白浓度平均下降1(g/L),问至少需要观察多少

病例?

解:用公式13.1计算,取,,又知,。由标准正态分布表查出单侧界值,单侧,代入公式,

因此,该治疗方案至少需要治疗16例病人作为样本。

(2)配对设计和交叉试验的样本含量估计配对试验和交叉试验估计样本例数的公式为:

(13.2)

式中,为实验所需的对子数目,是每对观察对象差值的标准差,为期望

能达到的最小差值,有单双侧之分,只取单侧,和为相应的正态分位数。

例13.2 研究碳酸铝对白细胞减少症的治疗效果,期望治疗后比治疗前平均增加

/L,已知标准差为,规定(双侧检验),,求样本含量.

解: 用公式13.2计算,由标准正态分布表查出双侧界值,单侧

,代入公式,

可取15个患者参加试验。

(3)两样本均数比较两样本均数比较的完全随机设计分两组例数相等和两组例数不等两种情形,但当两组例数相等时检验效能最高,设计时应尽量使两组例数相等,对于两组例数不等的情形,应使两组例数相近。这里仅介绍两组例数相等时的样本含量估算方法。公式为:

(13.3)

式中,为每组所需的样本例数,其它符号的意义同公式(13.1)。

例13.3 用新药降低高血脂患者的胆固醇,研究者规定试验组与对照组(安慰剂)相比,血清胆固醇平均降低0.5mmol/L以上才有推广价值。

引用文献中胆固醇的标准差为0.8mmol/L,规定(单侧检验),,求每组所需例数。

解:用公式13.3计算,取,,又知,。由标准正态分布表查出单侧界值,单侧,代入公式,

所以,每组需要44例。

(4)样本率与总体率的比较确定和后,为历史对照的总体率,为实验

结果的总体率,,令,为实验结果的总体标准差,样本含量的计算公式为:

(13.4)

式中,为所需的样本含量,有单双侧之分,只取单侧,和为相应的正态分位数。

例13.4 已知常规治疗某病的有效率为80%,现试验一种新疗法,预计有效率为90%,规定(单侧检验),,求所需例数。

解:,,,单侧界值,单侧,代入公式(13.4)

所需样本例数为137例。

(5)两样本率的比较两样本均数比较的完全随机设计有两组例数相等和两组例

数不等两种情形,但当两组例数相等时检验效能最高,设计时应尽量使两组例数相等,对于两组例数不等的情形,应使两组例数相近。这里仅介绍两组例数相等时的样本含量估算方法。公式为:

(13.5)

式中,为两组总例数,每组的例数为,和分别代表两组的总体率,

表示两组的合并率。有单双侧之分,只取单侧,和为相应的正态分位数。

例13.5 用旧药治疗慢性肾炎的近控率为30%,现实验新药的疗效,要求新药的近控率达到50%才能推广应用使用,二者合并率为40%,(单侧),

,问每组需要多少病例?

解:已知,,,单侧界值,单侧,代入公式(13.5)

所以,每组各取103例参加试验。

(6)配对计数资料配对计数资料的整理格式如表13.6,一般用检验进行处理。

其样本含量的估算见公式(13.6)。

表13.6A、B两种检验方法比较

A法

B法

合计+ -

+ a b a+b - c d c+d 合计a+c b+d a+b+c+d

(13.6)

式中,为实验所需的对子数,,,,

有单双侧之分,只取单侧,和为相应的正态分位数。

例13.6 已知某菌种接种于甲、乙两种培养基的结果如下:

甲培养基阳性、乙培养基阴性的,甲培养基阴性、乙培养基阳性的

,(双侧检验),,现准备研究一种新的与该菌种相似的菌种,问需观察多少样本对子数?

解:,,,双侧界值,单侧,代入公式(13.6)

所以,该实验至少应取57对样品。

(7)多个样本均数比较多个样本均数比较的设计类型有多种,这里仅介绍各组例数相等的完全随机设计和随机区组设计的多个样本均数比较的样本含量估算方法。公式为:

(13.7)

式中为各组样本所需例数,和分别为第个样本的均数和标准差的初估值,,为组数。值由值表查得。先以和,,,查得代入公式(13.7)求得,第二次由,查得,代入公式(13.7)中求,访此进行,直至前后两次求得结果趋于稳定为止,即为所求的样本例数。以上为完全随机设计时的值求法,当为随机区组设计时,

第一次,公式(13.7)中的用误差均方代替。

例13.7 某医院为研究三种药物的退药效果,经预试验得到药物退热时间(天)的分别为,,。给定,,问正式试验各组需观察多少病例?

解:,,,,,,,

,,则

以,,查值表,,代入公式(13.7)计算

查值表得,再代入公式(13.7)计算

查值表得,再代入公式(13.7)计算

这时,,所以,正式试验时每组至少需观察19例病人。

(8)多个样本率比较多个样本率比较的设计类型有多种,这里仅介绍各组例数相等的完全随机设计的多个样本率比较的样本含量估算方法。公式为:

(13.8)式中为每个样本所需观察例数,和分别为最大率和最小率,当仅知最大率和最小率差值时,则取,,是给定、

和自由度,由值表查得,为组数。公式中平面角的单位是弧度。

例13.8 某研究者拟观察A、B、C三种治疗方法治疗某病的治疗效果,预试验结果为:A法有效率54.8%,B法有效率28.46%,C法有效率14.9%,问正式试验各组需观察多少例病人?

解:,,以,,,查值表得,代入公式(13.8)中

所以每组各需33例病人参入试验。

(9)估计总体均数确定后,令为期望估计误差的最小值,为总体标准差,样本含量的计算公式为:

(13.9)式中为所需的样本含量,有单、双侧之分,为相应的正态分位数。

例13.9 某研究者拟用单纯抽样方法了解某地区成年男子血红蛋白的平均水平,希望误差不超过2g/L,根据文献,血红蛋白的标准差约为25g/L,如(双侧),问需调查多少病人?

解:代入公式(8.9)

所以,需调查600人。

(10)估计总体率确定后,令为期望估计误差的最小值,为总体率的标准差,样本含量的计算公式为:

(13.10)

式中为所需的样本含量,有单、双侧之分,为相应的正态分位数。

例13.10 据以往调查结果,高血压的患病率为8%,某研究者欲了解某地高血压的患

患病率,希望误差不超过2%,问需调查多少人?

解:取(双侧),,,,代入公式(13.10)得

所以,需要调查707人。

(11)直线相关分析的样本含量如果实验设计的目的是观察变量之间的相关关系,则需要用如下公式估算用于相关分析的样本含量。

(13.11)

式中,为相关分析的样本例数,为估计的总体相关系数,有单双侧之分,

只取单侧,和为相应的正态分位数。

例13.11 研究健康儿童发硒(X,1000ppm)与血硒(Y,1000ppm)的相关关系,根据参考文献报道,总体相关系数,问需要抽取多少名儿童作相关分析?

解:已知,规定(双侧检验),,双侧界值,单侧,代入公式(13.11)

所以,需要抽取9名儿童作相关分析。

有关两相关系数的比较,生存率分析等的样本含量估算方法参见有关书籍。

4、均衡原则

1)均衡的意义

所谓均衡,就是要设法使各条件(即实验因素的各水平组合)下的受试对象受到非处理因素的干扰和影响的机会和数量基本相等。这样以来,由各组受试对象反映出来的实验效应才能较为客观地体现出处理因素因素取不同水平时所产生的效果。

2)均衡对照的实施

对照的一个极其重要的前提是对照必须是均衡的。贯彻均衡的原则就是对照组除了缺少一个处理因素外,其它条件应与实验组均衡一致。这就是上述对照原则中

表述的的原则。均衡性越好,就越能显示出试验组处理因素所产生的效

应,从而可以减少非处理因素对实验结果的影响。在实验(或试验)设计中,没有对照就无法比较鉴别,有了对照没有遵循均衡原则也同样得不到正确的结论。

例如,有人在研究耐力训练与提高战士体质的关系时,设计了如下实验:以血乳酸为主要观察指标,用20名连队的战士按训练方案进行耐力训练,以机关同龄的20名战士为对照,对照组进行日常活动,观察经4周训练后,两组战士进行一定的运动时血乳酸的变化,结果如表13.7:

表13.7:两组战士训练前后血乳酸(mg/L)的观察结果

组别训练前训练后

训练组38.2±3.533.1±3.1** ##

对照组40.0±4.038.9±3.5

* * 与训练前比P<0.01# # 与对照组比P<0.01

因而,所给出的耐力训练提高了战士的耐力的结论毫无意义。因人们早就认识到了训练和不训练不一样。应研究不同训练方案对提高战士体质之间的差别有无显著性意义,以探索最大限度地提高战士体质的最佳方案。另外,分组时,连队战士和机关战士都应随机抽取,然后将各自的样本含量的一半随机分入试验组和对照组。

该设计和结论,从逻辑上讲是合理的,然而仔细考虑后就会发现有严重的缺陷。主要问题是对照选择不合理,使训练组和对照组的非处理因素不均衡。本试验中,对照组除训练因素外,其他应尽可能与试验组一致,而机关战士和连队的战士由于工作性质不同,体能的基础可能存在较大的差别,一开始两组之间就不具备均衡原则。

实验设计的意义、原则与基本内容

实验设计的意义、原则与基本内容[关键词] 健康网讯: 一、实验设计的意义实验设计是科学研究计划内关于研究方法与步骤的一项内容。在医学科研工作中,无论实验室研究、临床疗效观察或现场调查,在制订研究计划时,都应根据实验的目的和条例,结合统计学的要求,针对实验的全过程,认真考虑实验设计问题。一个周密而完善的实验设计,能合理地安排各种实验因素,严格地控制实验误差,从而用较少的人力、物力和时间,最大限度地获得丰富而可靠的资料。反之,如果实验设计存在着缺点,就可能造成不应有的浪费,且足以减损研究结果的价值。总之,实验设计是实验过程的依据,是实验数据处理的前提,也是提高科研成果质量的一个重要保证。二、实验设计的原则实验设计有属于专业方面的,有属于统计方面的。从统计方面说,主要应当考虑对照、重复、随机化等问题,这就是所谓实验设计的三原则。其具体内容我们将在第二、三、四节介绍。三、实验设计的基本内容(一)拟定相互比较的处理所谓处理,指的是在实验研究中欲施加给受试对象的某些因素。如营养实验的各种饲料,治疗某病的几种疗法或药物,药理研究中某药的各种剂量等。在实验的全过程中,处理因素要始终如一保持不变,按一个标准进行实验。如果实验的处理因素是药物,那么药物的成份、含量、出厂批号等必须保持不变。如果实验的处理因素是手术,那么就不能开始时不熟练,而应该在实验之前使熟练程度稳定一致。(二)确定实验对象及数量这里指的是实验所用的动物或活体组织标本等。在实验设计中,要根据实验观察的目的与内容,明确规定采用什么样的实验对象,实验对象中的每个实验单位必须具备的条件与要求,以保证受试对象的一致性。实验对象需要有一定的数量,例数不能太少,也不宜过多。如何估计例数,详见第四节。(三)确定将各实验单位分配到各种处理中去的原则这主要是随机分配或随机化问题。第三节将介绍几种常用的随机分组方法。(四)拟定观察项目和登记表要根据研究目的和任务,选择对说明实验结论最有意义,并具有一定特异性、灵敏性、客观性的观察项目。必要的项目不可遗漏,数据资料应当完整无缺;而无关紧要的项目就不必设立,以免耗费人力物力,拖延整个实验的时间,尔后,要按照观察项目之间的逻辑关系与顺序,编制成便于填写和统计的登记表,以便随时记录实验过程中获得的数据资料。同一项目的度量衡单位必须统一符号(如+、++、+++等),应有明确的定义。(五)拟定对资料整理分析的预案这就是对将获得的数据资料准备如何进行整理?要计算哪些统计指标?用什么统计分析方法?事先必须有个初步的设想。例如对计数资料,是计算率还是百分比?若计算率,分子是什么?分母是什么?各组同一项目的某个率或百分比如何进行比较?又如对计量资料,是计算算术均数、几何均数还是中位数?同一项目各均数间应采用什么方法作比较?切忌实验设计时不认真考虑,实验过后拿数字去找统计方法。

实验设计与数据处理试题库

一、名词解释:(20分) 1.准确度和精确度:同一处理观察值彼此的接近程度同一处理的观察值与其真值的接近程度 2.重复和区组:试验中同一处理的试验单元数将试验空间按照变异大小分成若干个相对均匀的局部,每个局部就叫一个区组 3回归分析和相关分析:对能够明确区分自变数和因变数的两变数的相关关系的统计方法: 对不能够明确区分自变数和因变数的两变数的相关关系的统计方法 4.总体和样本:具有共同性质的个体组成的集合从总体中随机抽取的若干个个体做成的总体 5.试验单元和试验空间:试验中能够实施不同处理的最小试验单元所有试验单元构成的空间 二、填空:(20分) 1.资料常见的特征数有:(3空)算术平均数方差变异系数 2.划分数量性状因子的水平时,常用的方法:等差法等比法随机法(3空) 3.方差分析的三个基本假定是(3空)可加性正态性同质性 4.要使试验方案具有严密的可比性,必须(2空)遵循“单一差异”原则设置对照 5.减小难控误差的原则是(3空)设置重复随机排列局部控制 6.在顺序排列法中,为了避免同一处理排列在同一列的可能,不同重复内各处理的排列方式常采用(2空)逆向式阶梯式 7.正确的取样技术主要包括:()确定合适的样本容量采用正确的取样方法 8.在直线相关分析中,用(相关系数)表示相关的性质,用(决定系数)表示相关的程度。 三、选择:(20分) 1试验因素对试验指标所引起的增加或者减少的作用,称作(C) A、主要效应 B、交互效应 C、试验效应 D、简单效应 2.统计推断的目的是用(A) A、样本推总体 B、总体推样本 C、样本推样本 D、总体推总体 3.变异系数的计算方法是(B) 4.样本平均数分布的的方差分布等于(A) 5.t检验法最多可检验(C)个平均数间的差异显著性。 6.对成数或者百分数资料进行方差分析之前,须先对数据进行(B) A、对数 B、反正弦 C、平方根 D、立方根 7.进行回归分析时,一组变量同时可用多个数学模型进行模拟,型的数据统计学标准是(B) A、相关系数 B、决定性系数 C、回归系数 D、变异系数 8.进行两尾测验时,u0.10=1.64,u0.05=1.96,u0.01=2.58,那么进行单尾检验,u0.05=(A) 9.进行多重比较时,几种方法的严格程度(LSD\SSR\Q)B 10.自变量X与因变量Y之间的相关系数为0.9054,则Y的总变异中可由X与Y的回归关系解释的比例为(C) A、0.9054 B、0.0946 C、0.8197 D、0.0089 四、简答题:(15分) 1.回归分析和相关分析的基本内容是什么?(6分)配置回归方程,对回归方程进行检验,分析多个自变量的主次效益,利用回归方程进行预测预报: 计算相关系数,对相关系数进行检验 2.一个品种比较试验,4个新品种外加1个对照品种,拟安排在一块具有纵向肥力差异的地块中,3次重复(区组),各重复内均随机排列。请画出田间排列示意图。(2分) 3.田间试验中,难控误差有哪些?(4分)土壤肥力,小气候,相邻群体间的竞争差异,同一群体内个体间的竞争差异。 4随即取样法包括哪几种方式?(3分)简单随机取样法分层随机取样法整群简单随机取样法 五、计算题(25分) 1.研究变数x与y之间的关系,测得30组数据,经计算得出:x均值=10,y均值=20,l xy=60, l yy=300,r=0.6。根据所得数据建立直线回归方程。(5分)a=2 b=1.8 y=2+1.8 x 2.完成下列方差分析表,计算出用LSR法进行多重比较时各类数据填下表:

实验方案的设计与评价

实验方案的设计与评价 一、实验方案的设计 (一)、一个相对完整的化学实验方案一般应包括的内容有:实验名称、实验目的、实验原理、实验用品和实验步骤、实验现象记录,及结果处理、问题和讨论等。 (二)、实验方案设计的基本要求 1、科学性 (1)、当制备具有还原性的物质时,不能用强氧化性酸,如: ①、制氢气不能用HNO3、浓H2SO4,宜用稀H2SO4等。另外,宜用 粗锌(利用原电池原 理加快反应速率),不宜用纯锌(反应速率慢)。 ②、同理,制H2S、HBr、HI等气体时,皆不宜用浓H2SO4。前者宜 用稀盐酸,后两者宜 用浓磷酸。 FeS + 2HCl = FeCl2+ H2S↑H3PO4+ NaBr NaH2PO4+ HBr↑(制HI用NaI) (2)、与反应进行、停滞有关的问题 用CaCO3制CO2,不宜用H2SO4。生成的微溶物CaSO4会覆盖在CaCO3表面,阻止反应进 一步进行。 (3)、MnO2和浓盐酸在加热条件下反应,制备的Cl2中含HCl气体和水蒸气较多;若用 KMnO4代替MnO2进行反应,由于反应不需加热,使制得的Cl2中含HCl气体和水蒸气极 少。 (4)、酸性废气可用碱石灰或强碱溶液吸收,不用石灰水,因为Ca(OH)2属于微溶物质,石灰水中Ca(OH)2的含量少。 (5)、检查多个连续装置的气密性,一般不用手悟法,因为手掌热量有限。 (6)、用排水法测量气体体积时,一定要注意装置内外压强应相同。

(7)、实验室制备Al(OH)3的反应原理有两个:由Al3+制Al(OH)3,需加氨水;由AlO2-制Al(OH)3,需通CO2气体。 (8)、装置顺序中,应先除杂后干燥。如实验室制取Cl2的装置中,应先用饱和食盐水除去HCl气体,后用浓H2SO4吸收水蒸气。 2、可行性 (1)、在制备Fe(OH)2时,宜将NaOH溶液煮沸,以除去NaOH溶液中溶解的O2;其次在新制的FeSO4溶液中加一层苯,可以隔离空气中的O2,防止生成的Fe(OH)2被氧化。 (2)、实验室一般不宜采用高压、低压和低温(低于0℃)等条件。 (3)、在急用时:宜将浓氨水滴入碱石灰中制取NH3,不宜用NH4Cl与Ca(OH)2反应制取NH3;又如,宜将浓HCl滴入固体KMnO4中制备Cl2;还有将H2O2滴入MnO2中制O2,或将H2O滴入固体Na2O2中制备O2等。 (4)、收集气体的方法可因气体性质和所提供的装置而异。 (5)、尾气处理时可采用多种防倒吸的装置。 3、安全性 实验设计应尽量避免使用有毒的药品和一些有危险性的实验操作,当必须使用时,应注意 有毒药品的回收处理,要牢记操作中应注意的事项,以防造成环境污染和人身伤害。 (1)、制备可燃性气体,在点燃前务必认真验纯,以防爆炸! (2)、易溶于水的气体,用溶液吸收时应使用防倒吸装置。 (3)、对强氧化剂(如KClO3等)及它与强还原剂的混合物,千万不能随意研磨,以防止 发生剧烈的氧化还原反应,引起人身伤害等事故。 (4)、有毒气体的制备或性质实验均应在通风橱或密闭系统中进行,尾气一般采用吸收或燃 烧的处理方法。 (5)、混合或稀释时,应将密度大的液体缓慢加到密度小的液体中,以防液体飞溅。如浓硫 酸的稀释等。 (6)、用Cu制CuSO4,可先将Cu在空气中灼烧成CuO,再加稀

实验设计的统计学基本原则

第十一章实验设计的统计学基本原则 实验(Experiment):指由研究者主动地决定给予部分实验对象某种处理,给予另部分对象某种对照处理的研究设计形式,这种处理的分配常常是随机的。 实验设计(Experimental design):是通过良好地计划对象的选择、处理因素的分配、结果指标的测量和资料分析来保证比较组间对象和实验条件是均衡的,实验结果有较好的可比性,并且较好地控制误差以能用较小的样本获取可靠的结论。 一.实验设计的三要素:受试对象、处理因素和实验效应。 1.处理因素(treatment):根据研究目的,对受试对象施加的某种措施,称为处理因素。 注意:①抓住主要因素。 ②控制混杂因素(“非处理因素”在各组中应尽可能相同)。 ③标准化(处理因素应该标准化,即研究过程中处理应该自始至

终保持一致,不能因任何原因中途改变。) 2.受试对象(subject):动物——种类,品系,窝别 人——诊断,依从性 注意受试对象的同质性(homogeneity) 3.实验效应(effect): 指标选择:有效,客观,灵敏,精确。(头痛,发烧) 指标观察:对人的观察应注意避免偏性,提倡盲法。 主观指标的量化:如划记评分。 完全不满意完全满意 0 1 2 3 4 5 6 7 8 9 10 二.实验研究的分类:根据实验的对象不同,实验分成三类。 1. 动物实验(animal experiment) 2. 临床试验(Clinical trial)

3. 现场干预试验(Intervention trial) 三.实验中的变异及其来源: 在实验中,由于实验对象自身特点、实验条件的变化和实验结果测量的不确定性造成实验结果与真值的差别称实验误差,根据统计分析上的处理不同,实验误差分成两类: 1. 随机误差:由大量、微小的、偶然的因素的共同作用引起的不易控制的误差称随机误差。如在实验中,温度、湿度、风向、振动、试剂、仪器、操作员等都可能造成结果的偏差。 随机变异是没有倾向性的,在大量观察条件下,随机误差的分布呈标准N。随机误差的规律可以用统计方法分析。 正态分布()1,0 2.系统误差(systematic error):由于在对象选择、处理因素分配的不随机、测量结果的不准确造成实验结果有倾向性地偏离真值称系统误差,或称偏倚

试验设计及数据分析第一次作业习题答案

习题答案 1.设用三种方法测定某溶液时,得到三组数据,其平均值如下: 试求它们的加权平均值。 解:根据数据的绝对误差计算权重: 因为 所以 2.试解释为什么不宜用量程较大的仪表来测量数值较小的物理量。 答:因为用量程较大的仪表来测量数值较小的物理量时,所产生的相对误差较大。如 3.测得某种奶制品中蛋白质的含量为,试求其相对误差。 解: 4.在测定菠萝中维生素C含量的测试中,测得每100g菠萝中含有维生素C,已知测量的相对误差为%,试求每100g菠萝中含有维生素C的质量范围。 解:,所以 所以m的范围为 或依据公式 5.今欲测量大约8kPa(表压)的空气压力,试验仪表用1)级,量程的弹簧管式压力表;2)标尺分度为1mm的U型管水银柱压差计;3)标尺分度为1mm的U形管水柱压差计。 求最大绝对误差和相对误差。 解:1)压力表的精度为级,量程为, 则

2)1mm汞柱代表的大气压为, 所以 3)1mm 水柱代表的大气压:,其中,通常取 则 6.在用发酵法生产赖氨酸的过程中,对产酸率(%)作6次评定。样本测定值为,,,,,,求该组数据的算术平均值、几何平均值、调和平均值、标准差s 、标准差、样本方差、总体方差、算术平均误差和极差。 解: 数据计算公式计算结果算术平均值 几何平均值 调和平均值 或 标准样本差 总体标准差 样本方差 总体方差 算术平均误差 极差 7.A与B 两人用同一种分析方法测定金属钠中的铁,测得铁含量()分别为:

分析人员A:,,,,,,,,, 分析人员B:,,,,,,,,, 试问A与B两人测定铁的精密度是否有显著性差异?() 解:依题意,检验A与B两人测定铁的精密度是否有显著性差异,采用F双侧检验。根据试验值计算出两种方法的方差以及F值: 根据显著性水平,,查F分布表得, 。所以,A与B两人测定铁的方差没有显著差异,即两人测定铁的精密度没有显著性差异。 分析人员A分析人员B 8 8 10 104 6 68 4 6 6 88 F-检验双样本方差分析 分析人员A分析人员B 平均 方差 观测值1010 df99 F P(F<=f) 单尾0. F 单尾临界 8.用新旧两种工艺冶炼某种金属材料,分别从两种冶炼工艺生产的产品中抽样,测定产品中的杂质含量(%),结果如下: 旧工艺(1):,,,,,,,,,,,,; 新工艺(2):,,,,,,,, 试问新冶炼工艺是否比旧工艺生产更稳定,并检验两种工艺之间是否存在系统误差?() 解:工艺的稳定性可用精密度来表征,而精密度可由极差、标准差或方差等表征,这里依据

实验设计方案怎么写

实验设计方案怎么写 首先要知道实验目的,然后找到适合的实验方法,再根据实验方法设计实验步骤(如果是现成的方法更好),根据步骤归纳总结所需要的仪器试剂等,最后按照实验目的,实验原理,实验方法,仪器试剂,实验步骤,数据处理这几部分进行总结即可。 开放实验室管理系统设计方案怎么写 在学校实验室的管理中,发现了一些问题,其中如:在统筹安排各班级上实验课的时间需要人工实现,而且经常会出现同时有多个班级要使用实验室的冲突,并且调课后没有及时通知老师和班级同学。为了方便实验室的管理,我们提出利用网络来管理实验室的上机情况。以学校的网络实验室为背景,开发一个开放实验室管理系统设计方案......... 六.实验室管理信息系统 功能描述: 实验室的使用情况、查看实验信息、增加实验项目、增加实验材料。实验室的管理员通过本系统可以清楚的掌握实验室当时的使用情况;同时管理员还可以通过系统的操作界面清楚地了解其中任何一个实验室的试验信息(例如:实验项目的个数、预约的实验时间、实验项目的名字、所需要的实验器材、实验人数等);当外界人员需要申请在某一实验室做项目时,管理员可以通过查看实验室的使用情况而合理的给申请者安排做实验的时间;为了方便增加实验项目输入实验信息,在系统中备份一些实验常用的实验器材,但是每个实验对器材的要求是不一样的,在系统中我们可以任意的加进实验所需器材,为了提高管理效率系统将器材分为大型中型和小型三类 学校下周让交一份自己设计的实验方案!基本要求 a、实验题目。(如测量某一物理量) b、写出实验的理论依据及实验公式的推导过程。 c、根据实验要求合理选择所需仪器。 d、实验步骤、注意事项。 e、对结果进行分析,得出结论。 当然不是自己做的也差不多,推荐些网址也行。 实验目的:验证上端开口盛水容器底部小孔出水速度v与小孔离液面高度h之间的关系 实验器材:底部侧面钻有小孔的大容器、米尺、软木塞、铅直器。 实验步骤: 1.用软木塞封闭小孔; 2.将容器置于一定高度H处,并向其中加深度为h的水, 3.拔开软木塞让水流流动一小段时间后再封闭小孔; 4.测量水流最远着地点距小孔正下方的距离L; 5.多次重复1—4步; 6.整理实验器材。 数据处理: 由平抛运动可求水流在空中流动时间,由水平方向可得水流出口速度. 初中物理创新实验设计方案(测量纸片下落的速度) 作者:朱文军文章来源:初中物理点击数:309 更新时间:2008-10-10 一、实验名称:测量纸片下落的速度 二、实验设计思路: 实验“测量纸片下落的速度”所提供的实验器材有卷尺、秒表、纸片,但是采用这些实验器材

试验设计与统计分析教学大纲

山西农业大学信息学院 《试验设计与统计分析》教学大纲 课程名称:试验设计与统计分析 Experiment Design and Statistical Analysis 课程编码:105011 课程类别:专业基础课 学时/学分:48学时/3学分 适用专业:资环、环科等专业 一、前言 1、课程性质 《试验设计与统计分析》,是数理统计学在生物科学领域的应用,主要涉及科学研究中的试验设计、抽样观测和统计推断,是一门应用数学。课程还同时融入国际权威的SAS统计分析,通过上机处理试验实例的数据,巩固和加深理解所学统计原理及方法。课程不仅讨论如何科学地设计试验,而且还讨论如何科学地收集数据、整理数据、分析数据、解释数据和做出结论,是从事科学研究必不可少的基础知识。《试验设计与统计分析》是资环、环科专业的一门专业基础必修 课程。 2、教学目标 通过课堂讲授、课下作业和上机数据处理三个环节的教学过程,使学生掌握基本的试验设计与统计分析方法,掌握试验数据处理的程式步骤和技能。 3、教学要求 针对试验设计与统计分析的学科特点,结合专业的性质,讲授课程时理论与方法并重,力图把统计原理讲解的清晰易懂,使学生了解典型内容的基本原理和方法,理解统计方法的理论背景,掌握一些基本技能,从而培养学生分析解决实际问题的能力。 4、先修课程 高等数学、线性代数、概率论等

二、课程内容 绪论 教学内容及总体要求: 掌握:(1)试验设计与统计分析的概念、特点;(2)总体与样本、样本含量、参数与统计量的概念;(3)统计分析的基本要求。了解:(1)试验设计与统计分析的作用及其主要内容;(2)试验设计与统计分析的发展概况;(3)错误与误差、准确性与精确性的概念。 教学目标: 通过学习,使学生掌握试验设计与统计分析的概念、特点;总体与样本、样本含量、参数与统计量的概念;统计分析的基本要求。 教学方式方法建议: 课堂讲授、课堂讨论 学时:2学时 一、试验在科学研究中的作用 二、试验研究的一般程式及过程 三、试验设计与统计分析的涵义 四、试验设计与统计分析的必要性 五、课程特点与学习方法 六、常用术语和基本概念 思考题: 1、总体与样本、样本含量、参数与统计量的概念; 2、统计分析的基本要求 第一章田间试验设计(6学时) 第一节田间试验设计基础 1、田间试验设计概述 2、试验设计中的基本概念 第二节田间试验的种类 1、按试验性质分类

实验设计思路

DOE实验设计方法 工艺部 张惠 2011.01.18

目录 ?DOE简介 ?正交实验基础 ?指标、因素、水平 ?正交表及其特点 ?正交实验设计及分析 ?JMP中DOE使用 ?田口设计(Taguchi Arrays)

DOE简介 DOE: Design of Experiment 实验设计 实验设计是研究如何制定适当实验方案以便对实验数据进行有效的统计分析的数学理论与方法,通过有目的地改变一个系统的输入来观察输出(响应)的改变情况。 实验设计的意义: 1.确定哪些参数对响应的影响最大; 2.确定哪些参数设定在什么水平,以便响应达到或尽可能达到希望值(on target); 3.确定应把有影响的参数设定在什么水平,以便响应的分散度(或方差)尽可能减小; 4.确定应把有影响的参数设定在什么水平,以便不可控参数(噪声参数)对响应的影 响尽可能减小。 在工序开发的早期应用实验设计方法能够提高产量;减少变异性,与额定值或目标值更为一致;减少开发时间;降低总成本。

实验设计在生产/制造过程中的位置: 可控制因素 生產/ 制造 過程 不可控制因素

通过实验,进行优化设计 统计技术在生产/制造过程中 的应用是对过程中输入的变 量(人、机、料、法、环) 进行有目的地优化,使输出 的结果更加理想。 实验设计是其中较为有效的 一种工程工具。 通过实验,控制其不良的影响程度

正交实验基础 实验设计大致可以分为四种类型:析因设计、区组设计、回归设计和均匀设计,析因设计又分为全面实施法和部分实施法。析因设计就是我们常说的正交实验设计。 为什么要进行正交实验: 在实际生产中,影响试验的因素往往是多方面的,我们要考察各因素对试验影响的情况。在多因素、多水平试验中,如果对每个因素的每个水平都互相搭配进行全面试验,需要做的试验次数就会很多。比如对3因素7水平的试验,如果3因素的各个水平都互相搭配进行全面试验,就要做73=343次试验,对6因素7水平,进行全面试验要做76=117649次试验。这显然是不经济的。我们应当在不影响试验效果的前提下,尽可能地减少试验次数。正交设计就是解决这个问题的有效方法。 正交设计的主要工具是正交表。

成组实验设计方案及其统计分析

成组实验设计及其统计分析 成组设计及其统计分析 1. 实验设计 设实验因素A有A1,A22个水平,将全部n(n最好是偶数)个受试对象随机地均分成2组,分别接受A1,A22种处理。再设每种处理下观测的定量指标数为k,当k=1时, 属于一元分析的问题。当k≥2时,属于多元分析的问题。 在成组设计中,因2组受试对象之间未按重要的非处理因素进行两两配对, 无法消除个体差异对观测结果的影响,因此,其实验效率低于配对设计。 2. 前提条件与检验法的选用 在分析成组设计资料前,需考察资料是否满足下述2个前提条件:①正态性,即各组数据应独立抽自正态总体。②方差齐性,即2组资料的总体方差应该相等。下面根据这2个前提条件的满足情况,给出统计检验法的选用办法: 前提条件满足情况可选用的统计检验法 ①、②均满足成组设计资料的一般t检验 ①满足、②不满足近似t检验,即t'检验。或非参数检验 ①不满足非参数检验 在后2种情形中,若资料经过某种变量变换后能满足①、②2个前提条件,则对变量变换后的数据可用成组设计资料的一般t检验来分析。 3.应用实例 (1)一元的情形 ①成组设计资料的一般t检验 [例2.2.8]随机将20只雌性中年大鼠均分为甲、乙2组,甲组大鼠不接受任何处理(即空白对照),乙组中的每只大鼠接受3mg/kg的内毒素。分别测得2组大鼠的肌酐(mg/L)数据,试检验2总体均数之间有无显著差别。 甲(对照)组: 6.2,3.7, 5.8,2.7,3.9,6.1,6.7,7.8,3.8,6.9 乙(处理)组: 8.5,6.8,11.3,9.4,9.3,7.3,5.6,7.9,7.2,8.2 [分析与解答]先假定此资料满足正态性这一前提条件(后面将用程序来实现)。 2总体方差的齐性检验:H0:σ12=σ22,H1:σ12≠σ22,α=0.05。 用计算器实现统计计算所需的公式: (2.2.4) 式中MS1为较大均方、MS2为较小均方,SS、df分别为离差平和及自由度。F~F(df1,df2), 拒绝域:F≥Fα(df1,df2),则P≤α。 本例的已知条件和中间结果: 甲组: n=10, df=9, ∑X=53.6, X-=5.36, ∑X2=313.26, SS=25.964, MS=2.884889 乙组: n=10, df=9, ∑X=81.5, X-=8.15, ∑X2=687.17, SS=22.945, MS=2.549444 显然,甲组MS大于乙组MS,故应把甲组的有关统计量放在式(2.2.4)的分子上。 代入公式(2.2.4)计算的结果: F=1.132 查方差齐性检验用的F临界值表,得:F0.05(9,9)=4.03,因F0.05,

实验设计 DOE 的七大步骤分析

实验设计(DOE)的七大步骤分析 无论在六西格码,还是在工程、科技等方面,试验设计都是我们常用来解决问题的方法,其应用可以说涵盖所有的行业。 试验设计最开始是在农林方面的研究,所以我们现在的很多试验设计专用名词都源于此,BLOCK,区组的意思,其原始含义就是田地的四方块,随着研究的深入,逐步应用于、医药、化工等各个领域。试验设计的方法很多,根据具体的问题模型和目的我们可以选择适当的设计方法,如混合设计、曲面设计、裂区设计、田口设计、均匀设计等等。试验设计骈弃了以往单个因子逐步调整的做法,避免了忽视交互作用等方面的问题,从而更加系统有效的解决我们所关注的指标。区别于最初农林方面试验设计应用的是,我们可以在很多的行业中采用渐进的方法来采取试验设计方案,而不期望于一步到位。 第一步确定目标 我们通过控制图、故障分析、因果分析、失效分析、能力分析等的运用,或者是直接实际的反映,会得出一些关键的问题点,它反映了某个指标或参数不能满足我们的需求,但是针对这样的问题,我们可能运用一些简单的方法根本就无法解决,这时候我们可能就会想到试验设计。对于运用试验设计解决的问题,我们首先要定义好试验的目的,也就是解决一个什么样的问题,问题给我们带来了什么样的危害,是否有足够的理由支持试验设计方法的运作,我们知道试验设计必须花费较多的资源才能进行,而且对于生产型企业,试验设计的进行会打乱原有的生产稳定次序,所以确定试验目的和试验必要性是首要的任务。随着试验目标的确定,我们还必须定义试验的指标和接受的规格,这样我们的试验才有和试验成功的度量指标。这里的指标和规格是试验目的的延伸和具体化,也就是对问题解决的着眼点,指标的达成就能够意味着问题的解决。? 第二步剖析流程 关注流程,是我们应该具备的习惯,就像我们的很多企业做水平对比一样,经常会有一个误区,就是只讲关注点放在利益点上,而忽略了对流程特色的对比,试验设计的展开同样必须建立在流程的深层剖析基础之上。任何一个问题的产生,都有它的原因,事物的好坏、参数的便宜、特性的欠缺等等都有这个特点,而诸多原因一般就存在于产生问题的流程当中。流程的定义非常的关键,过短的流程可能会抛弃掉显着的原因,过长的流程必将导致资源的。我们有很多的方式来展开流程,但有一点必须做到,那就是尽可能详尽的列出可能的因素,详尽的因素来自于对每个步骤地详细分解,确认其输入和输出。其实对于流程的剖析和认识,就是改善人员了解问题的开始,因为并不是每个人都能掌握好我们所关注的问题。这一步的输出,使我们的改善人员能够了解问题的可能因素在哪里,虽然不能确定哪个是重要的,但我们至少确定一个总的方向。? 第三步筛选因素 流程的充分分析,使我们有了非常宝贵的资料,那就是可能影响我们关注指标的因素,但是到底哪个是重要的呢?我们知道,对一些根本就不或微小影响因素的全面试验分析,其实就是一种浪费,而且还可能导致试验的误差。因此将可能的因素的筛选就有必要性,这时,我们不需要确认交互作用、高阶效应等问题,我们的目的是确认哪个因素的影响是显着的。我们可以使用一些低解析度的两水平试验或者专门的筛选试验来完成这个任务,这时的试验也将最小处理。而且对于这一步任务的完成,我们可以应用一些历史数据,或者完全可靠的经验理论分析,来减少我们的试验因子,当然要注意一点就是,只要对这些数据或分析有很小的怀疑,为了试验结果的可靠,你可以放弃。筛选因素的结果,使得我们掌握了影响指标的主要因素,这一步尤为关键,往往我们在现实中是通过完全的经验分析得出,甚至抱着可能是的态度。?

试验设计习题及答案

【西北农林科技大学试验设计与分析复习题】员海燕版 一、名词解释(15分) 1.重复:一个条件值的每一个实现。或因素某水平值的多次实现。 2.因素:试验中要考虑的可能会对试验结果产生影响的条件。常用大写字母表示。 3.水平:因素所处的不同状态或数值。 4.处理:试验中各个因素的每一水平所形成的组合 5.响应:试验的结果称为响应; 响应函数:试验指标与因素之间的定量关系用模型 ε+=),,(1n x x f y Λ表示,其中 ),,(1n x x f y Λ=是因素的值n x x ,,1Λ的函数,称为响应函数。 6.正交表:是根据均衡分散的思想,运用组合数学理论在拉丁方和正交拉丁方的基础上构造的一种表格。 7.试验指标:衡量试验结果好坏的指标 8.随机误差:在试验中总存在一些不可控制的因素,它们的综合作用称为~ 9.交互作用:一般地说,如果一个因素对试验指标的影响与另一个因素所取的水平有关,就称这两个因素有交互作用。 10.试验设计:是研究如何合理地安排试验,取得数据,然后进行综合的科学分析,从而达到尽快获得最优方案的目的。 11.试验单元:在试验中能施以不同处理的材料单元。 12.拉丁方格:用拉丁字母排列起来的方格,要求每个字母不论在方格的行内还是列内都只出现一次。 13.综合平衡法:先对各项指标进行分析,找出其较优生产条件,然后将各项指标的较优生产条件综合平衡,找出兼顾各项指标都尽可能好的生产条件的方法。 14.综合评分法:是用评分的方法,将多个指标综合成单一的指标---得分,用每次试验的得分来代表试验的结果,用各号试验的分数作为数据进行分析的方法。 15.信噪比:信号功率与噪声功率之比。 16.并列法:是由相同水平正交表构造水平数不同的正交表的一种方法。 17.拟水平法:是对水平数较少的因素虚拟一些水平使之能排在正交表的多水平列上 的一种方法。 18.直和法:是先把一部分因素和水平放在第一张正交表上进行试验,如果试验结果 达不到要求,再利用第一阶段试验结果提供的信息,在第二张正交表上安排下一 阶段的试验,最后再对两张正交表上的结果进行统一分析的方法。 19.直积法: 在某些试验设计中,试验因素常可分为几类,为了考察其中某两类因素 间的交互作用,常采用的把两类因素所用的两张正交表垂直叠在一起进行设计和 分析的一种方法。 20.稳健设计:为了减少质量波动,寻找使得质量波动达到最小的可控因素的水平组合 二、简答题(10分) 1.试验设计的基本原则是什么? 答:一是重复,即一个条件值的每一个实现。作用是提高估计和检验的精度 二是随机化,是通过试验材料的随机分配及试验顺序的随机决定来实现的 三是区组化,也就是局部控制。 2.试验设计的基本流程是什么? 1明确试验目的 2选择试验的指标,因素,水平 3设计试验方案 4实施试验 5对获得的数据进行分析和推断。 3.试验设计的相关分析有哪几种? 一是相关系数,即用数理统计中的两个量之间的相关程度来分析的一种方法。 二是等级相关,是把数量标志和品质标志的具体体现用等级次序排序,再测定标志等级和标志等级相关程度的一种方法。有斯皮尔曼等级差相关系数和肯德尔一致相关系数) 4.为什么要进行方差分析? 方差分析可检验有关因素对指标的影响是否显着,从而可确定要进行试验的因素; 另外,方差分析的观点认为,只需对显着因素选水平就行了,不显着的因素原则上可在试验范围内取任一水平,或由其它指标确定。 5.均匀设计表与正交表,拉丁方设计的关系 6.产品的三次设计是什么? 产品的三次设计是系统设计,参数设计,容差设计。 三、(15分) 1.写出所有3阶拉丁方格,并指出其中的标准拉丁方格和正交拉丁方格

《实验设计方法》教案

教师教案( 2005 —2006 学年第 1 学期 ) 课程名称:试验设计方法 授课学时:32 授课班级:23034010-11 任课教师:何为 教师职称:教授 教师所在学院:微电子与固体电子学院电子科技大学

绪论 1学时 教学内容及要求 试验设计方法在科学研究中的作用 1. 科学研究的基本过程 2. 科学研究的基本方法 3. 试验设计方法的主要内容 ●试验设计方法在科学技术发展中的地位和作用。 ●试验设计方法的起源。 ●我国试验设计方法的发展和现状。 ●使用试验设计方法的目的、内容和应用。 ●试验设计方法是当代科技和工程技术人员必须掌握的技术方法。 ●教学内容:正交试验法、优选法基础、回归分析法、均匀设计法、单 纯形优化法 参考资料 ?项可风.试验设计与数据分析.上海科技出版社.1991年 ?陈宝林.最优化理论及算法.清华大学出版社.1990年 ?邓正龙.化工中的优化方法.化学工业出版社.1991年 ?陈魁.试验设计与分析.清华大学出版社.1996年 ? (日)田口玄一.实验设计法.魏锡,王世芳译.机械工业出版社.1987 ? Phadke, M.S. "Quality Engineering Using Robust Design" Prentice Hall, Englewood Cliff, NJ. November 1989 ? Taguchi, Genichi. "System of Experimental Design" Edited by Don Clausing. New York: UNIPUB/Krass International Publications, Volume 1 & 2, 1987 ? Montgomery, D. C.. Design and analysis of experiment. New York: Wiley.1997 ?杨德.试验设计与分析.中国农业出版社.2002 第一章正交试验基本方法 5学时 授课时数: 一、教学内容及要求 ●多因素试验问题、正交试验、正交表符号的意义。 ●因素、水平、自由度、试验指标、交互作用。均衡分散性、整齐可比

实验设计与分析

实验设计与分析 永嘉县罗浮中学叶文俊 近年来的生物学高考中,实验设计与评价题已经成了一种热点题型。实验设计与评价题侧重考查学生的实验能力、思维能力和创新能力等各方面的能力,以及进行科学实验的思想和方法,能较好地体现新课程的教学理念,有利于指导新一轮教育课程改革,以适应现代社会对人才需要的发展。实验设计题的能力要求高,难度大,在平时练习中,一直存在着学生怕做实验设计题,一遇到实验设计便愁眉苦脸,难以下笔的现象。在高考备考中,如何提高学生的生物实验设计与评价能力呢? 一、明确高考考试大纲要求: 2005年高考生物学科考试大纲能力要求第3条明确指出,理解所学实验、实习的内容,包括实验目的、原理、方法和操作步骤,掌握相关的操作技能;具备验证相关生物学事实的能力,并能对实验现象和结果进行解释、分析和处理;能对一些生物学问题进行初步的探究性研究。 实验能力要求可分两个层次: (1)会观察、分析和解释实验中产生的现象、数据并得出合理的实验结论,具备验证简单生物学事实的能力。 (2)灵活运用已学过的自然科学理论,设计简单的实验方案,理解探索性实验的一般方法。 二、了解高考实验试题类型: 研究近几年来高考题中的实验题可以发现,实验设计、评价的理解能力、实验条件的控制和对实验结果的归纳、总结能力是现在考察的重点方向。且考察中学生“未证实过的”实验问题材料是命题的主要来源,涉及实验的题型主要是设计探究验证型和分析推理判断型实验题。 (1)设计探究验证型 依据实验目的,来设计实验过程、预测实验结果的试题。 例1:(04年全国新课程卷1)31.(20分)胰高血糖素对小白鼠和人具有相同的生理作用。为了验证“胰高血糖素具有升高血糖的生理作用”,请以小白鼠为实验对象设计实验步骤,预测和解释实验应出现的结果,并写出实验结论。(一)实验材料和用具:正常实验小白鼠2只,生理盐水,用生理盐水配制的适宜浓度的胰高血糖素溶液,班氏糖定性试剂,注射器,试管,烧杯等。 (二)实验步骤:(实验提示:采用腹腔注射给药,给药剂量不作实验设计要求;给药1小时后,用注射器在小鼠膀胱处穿刺取尿液。) (三)实验结果的预测、解释和结论 解析:本题是一道典型的常规对照实验设计类试题,虽然开放性很强,但由于给出了实验提示,应该说难度不是很大,只是对学生的文字描述能力和思维的合理性提出要求。不过最后对尿液中葡萄糖的检验是一个对物质鉴定知识的联系,需要学生能够自然而然地联想并设计出来,这对思维的缜密就有了相当高的要求。 (2)分析推理判断型 依据所提供的实验,分析其中原因或得出正确的实验结论 例2:(04北京卷)(15分)一种以地下茎繁殖为主的多年生野菊分别生长在海拔10m、500m、1000m的同一山坡上。在相应生长发育阶段,同一海拔的野菊株高无显著差异,但不同海拔的野菊株高随海拔的增高而显著变矮。为检验环境和遗传因素对野菊株高的影响,请完成以下实验设计。 (1)实验处理:春天,将海拔500m、1000m处的野菊幼芽同时移栽于10m处。

试验设计与数据分析试题A

试验设计与数据分析试题(A) 一、选择题: 1、已知某样品质量的称量结果为:2.0 10±g,则其相对误差,为: A、2.0, B、2.0 ±,C、% 2D、% 2.0 2、用法寻找某实验的最优加入量时,若当前存优范围是[628,774],好点是718, 则此时要做试验的加入点值是() A、.628+774 2B、628+×(774-628) C、628+774-718 D、2×718-774 3、经过平面上的6个点,一定可以找到一个次数不高于()的多项式。 A、4 B、5 C、6 D、7 4.有一条1 000 m长的输电线路出现了故障,在线路的开始端A处有电,在末端B处没 有电,现在用对分法检查故障所在位置,则第二次检查点在() A.500 m处B.250 m处 C.750 m处D.250 m或750 m处 5、L8(27)中的7代表() A. 最多允许安排因素的个数 B. 因素水平数 C. 正交表的横行数 D. 总的实验次数 6、. 在L9(34)表中,有A,B,C三个因素需要安排。则它们应该安排在()列 A. 1,2,3 B. 2,3,4 C. 3,4,5 D. 任意3列 ★7、某实验因素对应的目标函数是单峰函数,若用分数法需要从[0,21]个试验点中找最佳点,则需要做试验的次数是() A.6次B.7次C.10次D.20次

★8、. 用L 8(27)进行正交实验设计,若因素A 和B 安排在第1、2列,则A×B ,应排在第( )列。 A. 3 B. 4 C. 5 D. 6 ★9、正方体的边长为2.010±,则体积的绝对误差限为: A 、32.0 B 、32.0? C 、2.0 D 、60 ★10、有一双因素优选试验,20≤x ≤40,10≤y ≤20.使用纵横对折法进行优选.分别对因素x 和y 进行了一次优选后其新的存优范围的面积为( ) A 、200 B 、100 C 、150 D 、50 二、填空题 1.已知某样品质量的称量结果为:2.07.58±g ,则其绝对误差限为 ;相对误差为 。 2、一个正方形的边长为2.010±,则其面积的绝对误差为 。相对误差为 。 3、用牛顿法求方程0)(=x f 的根,则迭代公式:=+1n x 。 4、用牛顿法求方程x e x -=2的根,现取10=x ,1x = 。 5、给定1+n 个点,一定可以找到一个次数不高于n 的 过这1+n 个点。 6、经过(1,2),(3,5)两点的一次多项式为: 。 7、经过),(00y x ,),(11y x 两点的插值多项式为: 。 8、经过),(00y x ,),(11y x ,),(22y x ,三点的插值多项式为: 。 9、将拟合方程 x b a y +=1进行线性化处理,则令=Y ,=X ,线性方程为: 。 10、将拟合方程x b ae y =进行线性化处理,则令=Y ,=X ,线性方程为: 。 11.已知一种材料的最佳加入量在110 g 到210 g 之间,若用法安排实验,则第一次试点的加入量可以是________g.

实验设计的意义、原则与基本内容(精)

实验设计的意义、原则与基本内容 [关键词] 健康网讯: 一、实验设计的意义 实验设计是科学研究计划内关于研究方法与步骤的一项内容。在医学科研工作中,无论实验室研究、临床疗效观察或现场调查,在制订研究计划时,都应根据实验的目的和条例,结合统计学的要求,针对实验的全过程,认真考虑实验设计问题。一个周密而完善的实验设计,能合理地安排各种实验因素,严格地控制实验误差,从而用较少的人力、物力和时间,最大限度地获得丰富而可靠的资料。反之,如果实验设计存在着缺点,就可能造成不应有的浪费,且足以减损研究结果的价值。总之,实验设计是实验过程的依据,是实验数据处理的前提,也是提高科研成果质量的一个重要保证。 二、实验设计的原则 实验设计有属于专业方面的,有属于统计方面的。从统计方面说,主要应当考虑对照、重复、随机化等问题,这就是所谓实验设计的三原则。其具体内容我们将在第二、三、四节介绍。 三、实验设计的基本内容 (一)拟定相互比较的处理所谓处理,指的是在实验研究中欲施加给受试对象的某些因素。如营养实验的各种饲料,治疗某病的几种疗法或药物,药理研究中某药的各种剂量等。在实验的全过程中,处理因素要始终如一保持不变,按一个标准进行实验。如果实验的处理因素是药物,那么药物的成份、含量、出厂批号等必须保持不变。如果实验的处理因素是手术,那么就不能开始时不熟练,而应该在实验之前使熟练程度稳定一致。 (二)确定实验对象及数量这里指的是实验所用的动物或活体组织标本等。在实验设计中,要根据实验观察的目的与内容,明确规定采用什么样的实验对象,实验对象中的每个实验单位必须具备的条件与要求,以保证受试对象的一致性。实验对象需要有一定的数量,例数不能太少,也不宜过多。如何估计例数,详见第四节。 (三)确定将各实验单位分配到各种处理中去的原则这主要是随机分配或随机化问题。第三节将介绍几种常用的随机分组方法。 (四)拟定观察项目和登记表要根据研究目的和任务,选择对说明实验结论最有意义,并具有一定特异性、灵敏性、客观性的观察项目。必要的项目不可遗漏,数据资料应当完整无缺;而无关紧要的项目就不必设立,以免耗费人力物力,拖延整个实验的时间,尔后,要按照观察项目之间的逻辑关系与顺序,

实验设计与统计分析练习题

1. 研究变量间的关系用什么方法。回归相关 2. 比较多个平均数的差异用什么方法。方差分析 3. 方差组分估计解决的问题. 4.协方差分析能够解决的问题。 5. 聚类分析能够解决的问题。 7. 规划求解能够解决的问题。 8. PB 试验要解决的问题。 9.主成分分析要解决的问题。 10.随机单位组试验设计允许试验单元有差异,要求是什么,它的模型是什么. 11.相关系数的意义. 12.12,x x 与 y 二元三次回归方程?y . 13通径分析中谁反映两变量间的综合作用,反映变量间的直接作用。 14.有1、2、3、4四个处理,要比较它们的总体平均数的差异是否显著,试验单元情况如下图,请进行试验设计: 变化方向 15.SPSS 运算得树状图如下,现要聚成二类、三类、四类,分别写出各类所含地块号。 16.因素A 有4个水平,因素B 有3个水平,共有11、…、43个不同搭配 (1) 要研究搭配的不同平均数一致否,请说明试验数据在SPSS 中的数据格式 (2) 要研究A 、B 有无交互作用,请说明试验数据在SPSS 中数据格式。 17. 为求1 2,,x x y 的的二元二次回归方程,请说明数据在SPSS 中数据格式。能够 根据运算结果给出统计结论. 18.混料试验设计题(10分) y 与x 1、x 2、x 3有关系,x 1∈[0.2,1],x 2∈[0.1,1],x 3∈[0.1,1],现采用单纯形重心设计,请给出试验设计(每个试验x 1、x 2、x 3用实值)。 19.响应面分析试验设计题,y 与x 1、x 2有关系,x 1∈[3,11],x 2∈[6,10],现采用通用旋转组合设计,请给试验方案(每个试验x 1、x 2用实值)。

相关文档
最新文档