科研设计与统计常见错误
医学论文常见统计学错误与纠正

医学论文常见统计学错误与纠正一、设计与实施1.对象合格标准不明确●只报告来源和时间段,总体不清晰:大杂烩,得不到科学结论;●事前未规定合格标准和排除标准,事后排除;●不报告按照合格标准和排除标准筛选对象的过程。
2.结局指标多而杂--是事先规定的最重要的结局指标,通常以此为准来计算样本量。
常见错误:终点指标过多, 大海捞针临床试验时,不知道哪个指标在组与组间有差异;“确定某个指标后,万一组间没有差异,岂不被动?!”生理、生化、组织学、基因,都做;“内容丰富,显得水平高?!”许多仪器一下子可以做许多项目;“许多项目一一分析,哪个有意义,就报告哪个指标?!”哪些指标可能有组间差异,必须心中有数。
假说:预计将要得到的结论——假说是科研的灵魂心中无数,不要“先上马再说”●指标多,实验工作量大。
大海捞针——碰运气,不是科研!●指标多,翻来覆去分析,制造假阳性!Nature杂志统计学指南:➢常见错误之一。
仅分析1个指标时,P(假阳性)=0.05,P(1次分析不犯错误)=0.95 λ,同时分析2个指标时,P(2次分析均不犯错误) = [P(1 次分析不犯错误)] 2 P(假阳性)=1 - 0.952 ≈ 0.10, 同时分析3 个指标时,P(假阳性)=1 - 0.953 ≈ 0.14 λ同时分析10个指标时,P(假阳性)=1 - 0.9510 ≈ 0. 40➢常见错误之一(Nature) ----多重比较不校正多重比较: 对一组数据作多项比较时,必须说明如何校正α水平,以避免增大第一类错误的机会---- Bonfferoni校正(α/k来校正,k为两两比较次数)3 不重视对照为何必需对照?●消除非研究因素的混杂实验组和对照组受非研究因素的影响尽可能相同,使两组的差异主要反映研究因素的效应。
●鉴别研究因素的效应和自然发展结果。
例如,研究某药物对口腔溃疡模型兔的疗效,口腔溃疡有自愈的倾向,必须有对照扣除自愈效应。
常见错误➢没有对照!千方百计省去对照组,以减少一半工作量!? ω自身前后对照/历史对照/文献对照/ “标准”对照➢对照不当ω对照太弱:安慰剂对照/对照过强:西药+加中药~西药/对照剂量有争议:试验药,大剂量~对照药,中小剂量/对照基线不可比:试验组年轻、病轻~ 对照组年老、病重应当如何?ω事先明确研究假说,例如,新药比常规药好:以常规药为对照ω设计:研究组新药~ 对照组常规药可比性:基线可比、过程可比、终点可比ω保证可比性措施:干预性研究: 随机化观察性研究:匹配4样本量无根据ω干预性研究:“ 500 例患者随机分成两组……” 为什麽500 例?不多不少?500 例从天而降?现成送上门来?ω观察性研究:“ 10年期间A组3000例,B组258例……” ---- 有多少用多少!?应当如何?---- 报告最小样本量估算及其依据1. 比较两组测定值的均数依据:(1)预计欲比较的两总体参数的差值δ(2)预计总体标准差σ(3)允许出现假阳性结果的机会α(4)允许出现假阴性结果的机会β :例:格列美脲、格列苯脲对比研究以HbA1c 为主要终点报告依据✓欲检出HbA1c临床差异≥0.65%✓假定标准差为1.3%✓双侧检验水平0.05✓功效80% ω✓退出率20% 计算:157例2. 比较两组达标率依据:(1)预计一组发生某结局的百分比为π1(2)预计另一组发生某结局的百分比为α(3)允许犯假阳性错误的机会β(4)允许犯假阴性错误的机会π2例:格列美脲、格列苯脲对比研究以HbA1c达标为主要终点(1)预计一组发生某结局的百分比为45%(2)预计另一组发生某结局的百分比为25%(3)允许犯假阳性错误的机会α= 5%(4)允许犯假阴性错误的机会β= 20% 计算: 176 例5. 随机化,说而不做,做而不严处理分配的随机化为什么这么重要?(1) 消除分配处理有意或无意的偏倚。
医学科研中常见统计学错误(朱继民)总论

第十五章医学科研中常见的统计学错误第一节科研设计中的常见错误一、抽样设计二、实验设计中的随机原则三、实验设计中的对照原则四、实验设计中的重复原则五、实验设计中的均衡原则第二节科研数据描述中的常见错误一、统计指标的选取二、统计图表第三节医学科研统计推断中的错误一、t检验二、方差分析三、卡方( 2)检验四、相关与回归分析五、结论表达不当第十五章医学科研中常见的统计学错误医学科研中,研究者关心的研究对象的特征往往具有变异性;如年龄、性别皆相同的人其身高不尽相同、体重、血型等也都存在类似的现象。
同时,由于研究对象往往很多,或者不知到底有多少,或者研究对象不宜全部拿来做研究;所以人们往往借助抽样研究,即从总体中抽取部分个体组成样本,依据对样本的研究结果推断总体的情况。
恰恰是这种变异的存在,以及如何用样本准确推断总体的需求,使得统计学有了用武之地和发展的机遇。
诚然,合理恰当地选用统计学方法,有助于人们发现变异背后隐藏的真面目,即一般规律。
但是,如果采用的统计学方法不当,不但找不到真正的规律,反而可能得出错误的结论,进而影响研究的科学性,甚至会使错误的结论蔓延,造成不良影响。
作为医学工作者,尤其是科研工作者,必须了解当前医学科研中常见的统计学错误,以便更好地开展科研和利用科研成果。
本章借助科研中统计学误用实例,介绍常见的错用情况,以帮助读者避免类似错误的发生。
第一节科研设计中的常见错误统计学是一门重要的方法学,是一门研究数据的收集、整理和分析,从而发现变幻莫测的表面现象之后隐含的一般规律的科学。
医学科研是研究医学现象中隐含规律的科学,包括基础医学研究、临床医学研究和预防医学研究等,不管哪类医学科研都离不开统计学的支持。
要想做好医学科研,必须掌握一定的统计学知识,如总体与样本、小概率原理、资料的类型和分布、科研设计类型、统计分析的主要工作、常用统计方法以及方法的种类和应用条件等,尤其要了解当前医学科研中常见的统计学错误。
如何避免生物大数据技术中的常见错误

如何避免生物大数据技术中的常见错误生物大数据技术作为现代生命科学的重要工具,已经深入到基因组学、转录组学、蛋白质组学以及其他生物学领域的研究中。
然而,在处理生物大数据时,研究者们经常会遇到一些常见的错误。
这些错误可能导致数据分析和解释的错误,从而对研究的结果产生负面影响。
本文将从数据预处理、统计分析和结果解释三个方面,探讨如何避免生物大数据技术中的常见错误。
首先,在数据预处理方面,常见错误包括样本质量控制不严格、batch效应未考虑和异常值处理不当等。
为了避免这些错误,研究者首先应该在实验设计阶段考虑样本质量控制的重要性。
可以通过采用标准化的实验操作流程,并在样本采集前进行培训和质控验证,以确保数据的准确性和可比性。
其次,在进行样本分析之前,需要对数据中的batch效应进行校正。
不同批次的数据可能会引入不必要的噪声或偏差,给分析带来困扰。
针对这种情况,可以使用一些合适的统计方法,如ComBat 算法,来进行批次效应的校正。
最后,在处理异常值时,要谨慎选择合适的方法。
异常值本身可能是数据采集或处理过程中的偶然误差,也可能是真实的生物差异。
识别和排除异常值的方法应根据具体实验设计和数据分布情况进行选择,避免无谓的数据处理导致结果的失真。
其次,统计分析是生物大数据研究中常见的环节。
然而,在统计分析过程中,常见的错误包括假设检验误用、多重比较未纠正和样本量不足等。
为了避免这些错误,研究者应该在选择合适的统计方法之前,深入理解自己的数据和研究问题,并遵循统计学的基本原理。
在进行假设检验时,需要正确地选择适合数据类型和分布的统计方法,并正确设置显著性水平。
此外,对于多重比较问题,常见的方法包括Bonferroni 校正和Benjamini-Hochberg校正。
这些方法可以有效控制错误的发现率,并提高研究的可靠性。
最后,样本量的确定应基于预先设定的统计功效分析,以确保结果的可靠性。
样本量过小可能导致假阳性或假阴性的发生,从而影响研究结论的准确性。
统计方法应用上常见的错误

人数 人数 (%)
成 42
32
80
人
数
数 (%)
70
49
70
儿 80
40
50
童
30
12
40
合 120 72
60
计
100
61
61
表 3 中,由合计项可见新疗法治愈率为 60%,一般疗法治愈率为 61%, 研究者认为:一般疗法治愈率稍高于新疗法。
在临床科研的统计分析中,常需注意其他有 关因素对结果的影响。对表3实例进行深入研 究,可见成人的治愈率是新疗法高于一般疗 法(80%与70%),儿童的治愈率也是新疗法 高于一般疗法,结论正好相反。所以会出现 这种情况是因为成人治愈率高于儿童,而一 般疗法成人比例高于新疗法所致。
况
年龄组(岁) 沙眼人数 %
0-
47
4.6
10-
198
19.3
20-
330
32.1
30-
198
19.3
40-
128
12.4
50-
80
7.8
60-
38
3.7
70-
8
0.8
总计
1027
100.0
作者由此得出了 20-岁组人口最易患沙眼的
结论。
上述结论不正确的 ,因为各年龄组的病人到 该院就诊机会(如门诊服务对象,劳保关系等) 有所不同,以及人群中各年龄人数不同等, 对此构成比都有影响。因此,医院门诊病人 的构成比只能说明门诊沙眼病人中20-岁组病 人最多,不能说明20-岁组最易患沙眼。这是 要用年龄别患病率来说明的。年龄别沙眼患 病率是要通过对某地区人群进行普查或抽样 调查才能得到的。
医学论文常见统计错误点评-210-2019年华医网继续教育答案

2019年华医网继续教育答案-医学论文常见统计错误
点评
备注:红色选项或后方标记“[正确答案]”为正确选项
(一)科研设计误用纠错
1、医学论文中常见的问题不包括
A、科研设计
B、统计学方法
C、相对数
D、理论值[正确答案]
E、统计图表
2、常见的假随机分组不包括
A、交替分组
B、按就诊时间先后顺序分组
C、队列分组[正确答案]
D、按出生日期分组
E、按病案/病历号分组
答案详见:
3、科研设计的
四原则不包括
A、对照
B、随机
C、科学[正确答案]
D、均衡
E、重复
4、制订临床生化指标的正常值范围时
A、样本含量不少于300例[正确答案]
B、样本含量为200例
C、样本含量不大于50例
D、样本含量超过18例即可
E、样本量为18例。
误差与错误知识点总结

误差与错误知识点总结误差与错误是在科学研究、工程实践和日常生活中不可避免的问题。
误差是指测量结果与真实值之间的差异,而错误则是指人为的失误或不正确的决策。
在各个领域中,理解误差与错误的产生机制以及如何有效地管理和减小它们对于保障科学研究和工程实践的精准性和可靠性至关重要。
一、误差的类型1. 随机误差随机误差是由于测量过程中的偶然因素引起的,它可能是由于环境的影响、设备的不稳定性或实验者的操作不精确等引起的。
随机误差是不可预测的,但可以通过多次测量并求取平均值的方式来减小其影响。
2. 系统误差系统误差是由于测量装置或观测方法本身的缺陷引起的,它会使得所有测量值都偏离真实值,且偏差的方向和大小是固定的。
系统误差通常是由于设备的精度不够高、环境的影响、仪器校准不准确等原因导致的,通过仪器的定期校准和维护可以有效地减小系统误差。
3. 示例误差示例误差是指抽样过程中可能出现的偏差,它会导致统计结果的准确性受到影响。
在实验设计和数据分析中,要注意减小示例误差的影响,例如通过随机抽样和重复试验等方法来提高数据的可靠性。
二、误差的来源1. 测量装置的误差测量装置本身的精度和稳定性会对测量结果产生影响,尤其是在实验研究和工程实践中,选择合适的仪器和设备是至关重要的。
2. 环境因素的影响环境因素,如温度、湿度、压力等,会对实验过程和测量结果产生影响,特别是在实验室条件下,需要对环境因素进行严格控制。
3. 实验者的操作技术实验者的操作技术和经验水平对于测量结果的准确性和可靠性都有重要影响,对于关键性的测量要求实验者进行严格的训练和规范操作。
4. 数据处理方法的选择不同的数据处理方法会对统计结果产生不同的影响,选择适当的数据处理方法是减小误差的关键。
三、错误的类型1. 认知错误认知错误是指由于对问题的认知不准确或理解有误导致的错误,常见于科研研究和工程设计中。
2. 提取错误提取错误是指在处理数据或信息过程中,由于提取的不精确或遗漏导致的错误,这可能会导致对研究结果的错误理解。
医学科研中的常见问题与解决方法

医学科研中的常见问题与解决方法医学科研是一个复杂而严谨的过程,研究人员在进行医学研究时常常会遇到各种问题。
本文将介绍医学科研中的常见问题,并提供相应的解决方法。
一、样本选择问题在医学科研中,样本选择是一个至关重要的环节。
常见问题包括样本数量不足、样本来源不明确以及样本选择偏倚等。
为了解决这些问题,研究人员可以采取以下措施:1. 增加样本数量:通过扩大样本量,可以提高研究的统计学效力,增加研究结果的可靠性。
2. 严格筛选样本来源:确保样本来源的准确性和代表性,避免样本选择偏倚对研究结果的影响。
3. 使用随机抽样方法:通过随机抽样可以减少样本选择偏倚,提高样本的代表性。
二、实验设计问题医学科研中的实验设计是确保研究结果可靠性的关键环节。
常见问题包括实验设计不合理、实验组和对照组的选择不当等。
以下是解决这些问题的方法:1. 合理设计实验方案:在设计实验时,需要考虑实验目的、实验组和对照组的选择、实验变量的控制等因素,确保实验设计的科学性和可行性。
2. 使用随机分组方法:通过随机分组可以减少实验组和对照组之间的差异,提高实验结果的可靠性。
3. 控制实验变量:在实验过程中,需要控制实验变量的干扰,确保实验结果的准确性。
三、数据分析问题医学科研中的数据分析是对研究结果进行统计学处理和解释的过程。
常见问题包括数据分析方法选择不当、数据处理不准确等。
以下是解决这些问题的方法:1. 选择合适的数据分析方法:根据研究目的和数据类型,选择适合的数据分析方法,确保数据分析结果的准确性和可靠性。
2. 进行数据清洗和校验:在数据分析前,需要对数据进行清洗和校验,排除异常值和错误数据,提高数据的可信度。
3. 结果解释和讨论:在数据分析结果的基础上,进行结果解释和讨论,提供科学依据和建议。
四、伦理问题医学科研中的伦理问题是研究人员必须严格遵守的规范。
常见问题包括伦理审查不合格、研究过程中的伦理问题等。
以下是解决这些问题的方法:1. 提前进行伦理审查:在研究开始前,需要进行伦理审查,确保研究设计和实施符合伦理要求。
科研设计与统计常见错误

中日友好医院 李光伟
一、选题
临床科研系指以病人为研究对象的医学科学研究 其目的是为了提高诊断水平和治疗效果,改善预 后和对疾病病因做宏观研究。 选题是临床科研的起点 体现科研设计和实施的指导思想 影响临床科研工作的全过程 因此在科研过程中自始至终处于主导地位。 从这个角度来说,选题比科研方法更重要。
选题必须具有科学性。所提出的新问题、新假 设、新思路必须要符合客观规律。 临床实践是临床科研选题的源泉: 在日常临床实践中,人们无时无刻不面临着许 多诊断、治疗、病因和预后估计等问题,诊断 方法和治疗措施有待于科学的系统评价,这些课 题其中不少可能具有较高的研究价值 临床医学已发展成为一门综合性的学科,不 仅涉及生物医学,而且涉及临床经济学和医学 社会等,这一方面有许多有待研究的临床问题。
“前瞻性”研究,无前瞻性的设计
几年前做了几万人的糖尿病普查,发现了400例糖尿病和500 例糖耐量低减,几年后的今天忽然想起这些病例很可能出一篇 文章,于是又去调查了一番,找到了200例糖尿病和300例糖耐 量低减。
写出 1.糖尿病人冠心病危险因素分析 2.高危人群糖尿病的危险因素 糖尿病人冠心病危险因素分析 高危人群糖尿病的危险因素 高危人群糖尿病的危险因素.
为保证科研的成功,一个完整的科研设计应 包括以下几项内容: 有理论或实用价值的选题 选择合适的研究对象 制定可靠的测量指标 选择科学的统计分析方法 若能对结果做恰当的描述,则会得出符合实 际的结论。
随机化分组在大多数情况下十分重要, 但随机化并非总是有利的和有道理的。 在某些情况下有比随机化更重要的东西那 就是要满足适应症的要求。 适应症不合理,随机化反使结果变糟。
最后一个原则是可行性,指研究课题主要 技术指标实现的可能性。 选题时必须考虑完成课题的条件,包括人 力、物力等,如果这些条件不能满足或根 本没有条件,即使所选课题有创造性、科 学性又具有临床价值,也无望于成功。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
临床科研选题的原则
首先是研究的问题要涉及我国的常见病、多发 病、危害人民健康较严重的疾病。 第二个原则是所选的课题要有创造性和先进性, 要选择前人没有解决或没有完全解决的问题。研 究的结果应该是前人不明了或不完全明了的。
开拓性(独创性)研究最有价值。 发展性研究,争鸣性研究也有一定的价值 没有探索性,缺乏创造性,只是重复前人做过 的工作,不能算作好的科研。
选题就是要正确地发现和提出问题 这些问题有的来自于临床实践 有的来自文献资料 所谓正确就是这些提出的问题要符合科学的认识规律
提出新问题、新假设比完成一项科研工作更难 没有好的科研假设,再好的科研方法也不会有好的科 研成果。
例: 提出新问题
医生的共识----冠心病来自已知危险因素。 但是无已知危险因素的人为什么发生冠心病? 冠心病人群血同型半胱氨酸水平显著升高, 那末同性半胱氨酸是否是冠心病新的危险因素? 使之下降发生冠心病危险是否会下降?
1.
1. 研究对象要有代表性
随机化抽样的缺点是研究对象地域较为分散, 每个单位仅有少量病例,这对于干预治疗的前瞻 性研究的病人管理极为不利,耗费更多人力,常 使研究无法进行。
而在人群较多的社区进行‚整群‛调查,会 在相对较小的地域找到较大样本,从而有利干预 治疗的管理。如果其人群结构接近全局的人群, 其统计的‚率‛也有重要参考价值。
妇女健康倡议研究(WHI)
-----再好的研究也有缺陷! 忽略了HRT最明显的益处: (缓解更年期症状,治疗泌尿生殖道萎缩,防止骨质疏松) 没有遵照处方药应该严格掌握适应症的原则(性激素低下 而非所有老年妇女,更不是健康老年妇女。该研究中80%以 上是没有绝经期症状的老年妇女。不具有HRT适应症 结论不应随意扩大(品种,剂量,种族) 与某些风险相比WHI所阐明的HRT对各种事件的绝对风险是 很低的
(1)、描述性统计
描述性统计分析是统计检验的基础,能提供资 料的总体特征,不论在最后的论文报告中描述性 统计分析的结果占多大的比重,它都是实际的资 料分析过程中的起点 它为选择进一步的分析方法如选择合理的变量 提供重要的信息, 发现原始资料中的错误
忽略必须的描述性统计分析 是导致统计方法应用不当的原因。
例如糖尿病人群中 有许多人合并了高血压、高血脂病 不少人已用药物治疗 治疗中有的长期坚持用药,有人仅偶尔用药 有人血压或血脂一直控制很好,有些人时好时差 此时不论以随访的血压、血脂指标,还是以末次 随访的指标分析,都不能反映干预对疾病的影响。 这些重要混杂因素的干扰,分析的结果常会远离 实际情况.
(2)、统计分析中变量的选择
变量的确定:
研究的目的是相看哪两个变量之间的关 系(不妨假设一因,一果)
例 ;高血压为因,冠心病为果
A.明确变量的性质
重点和首要的看变量是否为正态分布 分析中对变量进行正态分布检验 血胰岛素、血脂、生长激素、皮质醇、 尿微量白蛋白,骨密度等都常为非正态分 布。 非正态分布的变量是不能以原始资料进 行参数统计分析,此时不进行正态化处理, 得出结论会面目全非。
从简单到复杂
最基本的分析形式为单个因素的不匹配不分 层资料组间比较的分析 这是病例对照研究推断性统计的基础。 可比较病例组与对照之间危险因素的分布情况, 分析其危险因素与患病之间的联系。
由于病例和对照只是总体的代表, 无法直接计 算真实的患病率,也就无法直接计算RR值,可以 估计相对危险度OR,用以来代替RR。
最后一个原则是可行性,指研究课题主要 技术指标实现的可能性。 选题时必须考虑完成课题的条件,包括人 力、物力等,如果这些条件不能满足或根 本没有条件,即使所选课题有创造性、科 学性又具有临床价值,也无望于成功。
临床科研选题时应注意几点:
前沿,新颖,最好实用(近5-10年有无类似
工作,或存在某些问题) 涉及人群健康的重大问题(发病危险因素, 提出新的诊断方法) 建立新实验方法(提供研究新手段) 确定新药疗效及副作用
女性激素补充治疗的循证研究
(妇女健康倡议研究WHI) 19世纪70年代结论: 雌激素加孕激素能有效缓解更年期症状,治疗泌尿生殖道萎 缩,防止骨质疏松。但不会增加子宫内膜癌危险。
WHI(大规模,多中心,随机对照)结论:
雌激素孕激素联合治疗不宜用于绝经后妇女心血管疾病预防, 预防骨质疏松时应考虑乳腺及心血管病风险。弊多利少! 心脏事件 29%,卒中 41%,乳腺癌 26%, 结肠癌 37%,髋骨骨折 34%
过度严格的选择会有轻型病人被排除, 使研究结果出现偏差。
例:冠心病与胰岛素的关系 仅用冠脉造影资料作为诊断标准 结果发现 冠脉造影(-)者:FINS 22 mm/ml 冠脉造影(+)者:FINS 23 mm/ml 结论是冠心病与胰岛素无关 问题出在什么地方?
问题出在‚诊断标准‛:
冠脉造影(-)的人为什么能接受这种不无危险的检查? 因为这些人已有许多危险因素!! 或有轻度狭窄但达不到‚狭窄的定义‛的切点
终点事件过少
有些研究者为了某种原因,希望尽早发表自己 研究的结果,仅随访极短的时间(半年或一年),仅 有几个或十几个终点事件(如死亡)就进行多因素 分析,寻找危险因素。
终点事件过少的这种分析看上去可能条条是道, 但其结果往往是不可靠的。应延长随访时间,增加 终点事件后再分析 Navigntor研究设计出现1000个终点事体时才结题。
选题必须具有科学性。所提出的新问题、新假 设、新思路必须要符合客观规律。 临床实践是临床科研选题的源泉: 在日常临床实践中,人们无时无刻不面临着许 多诊断、治疗、病因和预后估计等问题,诊断 方法和治疗措施有待于科学的系统评价,这些课 题其中不少可能具有较高的研究价值 临床医学已发展成为一门综合性的学科,不 仅涉及生物医学,而且涉及临床经济学和医学 社会等,这一方面有许多有待研究的临床问题。
没达到‚狭窄‛切点, 只是时间尚短。 这并不能说明胰岛素与冠心病无关。
(二)、选择试验效果测试指标:
对测量的方法和指标的要求
① 敏感性要好:对于治疗出现的客观反应,要能敏感地发现 并能量度,其敏感性越高越好; ② ③
(二)、选择试验效果测试指标: 选择要求
关联性:指标与研究目的有本质的联系,应能确切反映处理 因素的作用。 生物学意义合理:冠脉造影,HbA1c看降糖药 物疗效。 灵敏性:指标能正确反映效应变化的最小数量或最小水平 。 特异性:对治疗反应的阳性结果要能准确地测量和确定,其 特异性越强越好;尽量选用客观指标作为主要观察指标。 精确性:包含准确度(效度)和精密度(信度)两个方面。 稳定性:变异程度 经济可行:在考虑敏感性和特异性的基础上,应从各种方法 比较中,选择经济及可行性良好的测试方法和指标。 指标的选择要少而精
现在大多数的国际医学刊物发表的论文中要 求作者同时给出点估计、区间估计和具体的检验 统计值,如相对危险度(Relative Risk , RR, RR值 就是暴露人群发病机与非暴露人群发病机率之比, 即a/(a+b)与c/(c+b)之比),RR的95%可信限和P值。 诸如95%可信限的区间估计可以提供更多有价值 的信息 但在我国临床科研的统计学应用中尚未引起足 够的重视。片面地认为越复杂的统计方法越好, 而忽视统计检验方法的适用性和恰当性。
(一). 研究对象的选择
要想证实研究者的思想,确定入选和 排除标准,选择合理的研究对象是关键 的一环。 Nhomakorabea1.
1. 研究对象要有代表性
做疾病患病率的调查,随机化的原则可 保证研究样本是总体人群的‚缩影‛,从而 避免结果失真。 从某一局部地区‚整体人体‛调查出的 ‚率‛如推广到普遍认群,应说明该局部的 ‚整体‛人群与全局的人群结构相似。
科研设计与统计常见错误 解析
中日友好医院 李光伟
一、选题
临床科研系指以病人为研究对象的医学科学研究 其目的是为了提高诊断水平和治疗效果,改善预 后和对疾病病因做宏观研究。
选题是临床科研的起点 体现科研设计和实施的指导思想 影响临床科研工作的全过程 因此在科研过程中自始至终处于主导地位。 从这个角度来说,选题比科研方法更重要。
例1, 看生长激素水平与身高的关系: 对25—74岁者测GH与身高 结果发现GH与身高不相关 结论肯定错了 因为GH的最重要作用在于促生长 原因是人群选择失当 GH促生长表现在身高增长期,即儿童期 成人身高已不再增高。
研究肥胖与糖尿病的关系 不能仅选择超重和肥胖的人群(BMI 25-30) 因为(BMI 25-27) 与(BMI 27-30)的人群糖尿病的患病率 可能无明显差别, 但与BMI〈24人群差别会很显著
为保证科研的成功,一个完整的科研设计应 包括以下几项内容:
有理论或实用价值的选题 选择合适的研究对象 制定可靠的测量指标 选择科学的统计分析方法
若能对结果做恰当的描述,则会得出符合实 际的结论。
随机化分组在大多数情况下十分重要, 但随机化并非总是有利的和有道理的。
在某些情况下有比随机化更重要的东西那 就是要满足适应症的要求。 适应症不合理,随机化反使结果变糟。
三. 统计分析
在我国临床科研的统计学应用中,在统计方法 的选择上存在过分强调统计检验而忽略统计学估计 的倾向,存在统计方法越复杂越好的片面看法。 在发表的医学论文中,大多强调是否得到差别 有统计学意义,而较少对测定值进行95%可信区间 估计,提及样本量估计及抽样方法、样本代表性问 题的文章就更少了 在80年代初期,国外医学杂志针对类似的情况 曾进行广泛的讨论,提出应重视区间估计的意义而 不能将注意力集中在P值是否小于0.05上。
有的放矢 无病呻吟
二、研究设计
科研设计是科研的灵魂 严密的设计是取得有价值结果的先决条件 从这个意义上说没有‚设计‛就没有科研。 不少回顾性分析,内容包罗万象,是研究无主题的反映: 研究者在研究之初对研究要解决的问题即主攻方向心中无 数,对研究所报的态度是’逮着什么算什么’,并不是想 通过研究解决某一特定的问题,或不知道通过研究能解决 什么问题。 这些研究缺乏严格的设计或无设计,这类研究即使有重 要的发现也属偶然。