如何快速准确发现稿件或论文中的统计学错误
论文写作技巧如何写出准确的数据描述和分析结果

论文写作技巧如何写出准确的数据描述和分析结果在撰写论文过程中,数据描述和分析结果是至关重要的部分,它们对于传达研究结果和得出有力结论具有重要作用。
因此,掌握准确的数据描述和分析技巧是每位研究者必备的能力。
本文将介绍一些有效的方法和技巧,帮助读者写出准确、清晰和有说服力的数据描述和分析结果。
一、数据描述技巧1. 简洁清晰地呈现数据:数据描述的目标是提供对数据的客观描述,因此,尽量避免使用过于复杂或冗长的句子。
选择简练的词汇和短语,以确保读者能够快速理解和掌握信息。
同时,通过使用适当的图表、表格或图像来呈现数据,可以更直观地展示研究结果。
2. 使用恰当的统计指标:在描述数据时,要选择恰当的统计指标和测量单位。
比如,选择平均值、中位数或百分比等统计指标来描述数量型数据;使用标准差、协方差等指标来描述数据的离散程度和相关性。
另外,确保使用一致的测量单位来避免混淆和错误的解读。
3. 引用数据来源和样本量:在描述数据时,应注明数据的来源和样本量,这样可以增加数据可信度和说服力。
提供数据来源的详细信息,比如调查问卷、实验方法或数据库名称,可以帮助读者验证数据的可靠性和可重复性。
4. 分类和分组数据:如果数据涉及多个类别或不同组别,可以使用合适的分类和分组方法来更好地描述和分析数据。
通过将数据进行分层分组,可以凸显不同类别或群体之间的差异和相似性,从而得出更有深度和准确性的结论。
二、分析结果技巧1. 使用适当的统计方法:对于数量型数据,选择合适的统计方法来进行数据分析非常重要。
常见的统计方法包括 t 检验、方差分析、相关分析、回归分析等。
根据研究问题的特点和数据类型,选择合适的方法来进行分析,并确保使用正确且可靠的统计软件进行计算。
2. 解释分析结果:在分析结果时,不仅要给出具体的数值,还要解释这些数值的含义和影响。
使用简洁明了的语言解释分析结果,注意避免使用过于专业化或晦涩的术语。
可以通过比较实验组和对照组的差异、提供实际案例或引用相关研究结果,加深读者对于分析结果的理解和认同。
医学期刊论文常见统计学错误

医学期刊论文常见统计学错误1.统计表达和描述方面存在的错误:(1)统计表中数据的含义未表达清楚,令人费解。
(2)统计图方面的主要错误有2个,其一,横坐标轴上的刻度值是随意标上去的,等长的间隔代表的数量不等,在直角坐标系中,从任何一个数值开始作为横轴或纵轴上的第一个刻度值;其二,用条图或复式条图表达连续性变量的变化趋势;(3)运用相对数时,经常混淆“百分比”与“百分率”;(4)在表达多组定量资料时,即使定量资料偏离正态分布很远,仍采用“x珋±s”表达(标准差S>x珋),特别当表中采用标准误Sx珋取代标准差s时,前述的错误很难被察觉出来。
2.定量资料统计分析方面存在的错误:(1)当定量资料不满足参数检验的前提条件时,盲目套用参数检验方法;(2)不管定量资料对应的实验设计类型是什么,一律套用单因素2水平(或叫成组)设计定量资料的t检验或单因素多水平设计定量资料的方差分析。
3.定性资料统计分析方面存在的错误:(1)把χ2检验误认为是处理定性资料的万能工具;(2)忽视资料的前提条件而盲目套用某些定性资料的统计分析方法;(3)盲目套用秩和检验;(4)误用χ2检验实现定性资料的相关分析。
4.简单线性相关与回归分析方面存在的错误:(1)缺乏专业知识,盲目研究某些变量之间的相互关系和依赖关系;(2)不绘制反映2个定量变量变化趋势的散布图,盲目进行简单线性相关与回归分析,常因某些异常点的存在而得出错误的结论;(3)常用直线取代2定量变量之间事实上呈“S形或倒S形”的曲线变化趋势。
5.多因素或多自变量的实验资料进行分析存在的错误:(1)将原本属于多因素实验研究,拆分成一系列单因素的研究来分析,这种“化繁为简、化整为零”的处理,割裂了原先的整体设计,无法研究多因素之间的内在联系或交互作用,容易得出片面、甚至错误的结论;(2)虽然将多个自变量都包括在一个多重线性回归方程或多重Logistic回归方程之中,但整个回归方程没有统计学意义或回归方程中有很多无统计学意义的自变量,就依据这样的回归方程去下结论。
医学论文常见统计学错误与纠正

医学论文常见统计学错误与纠正一、设计与实施1.对象合格标准不明确●只报告来源和时间段,总体不清晰:大杂烩,得不到科学结论;●事前未规定合格标准和排除标准,事后排除;●不报告按照合格标准和排除标准筛选对象的过程。
2.结局指标多而杂--是事先规定的最重要的结局指标,通常以此为准来计算样本量。
常见错误:终点指标过多, 大海捞针临床试验时,不知道哪个指标在组与组间有差异;“确定某个指标后,万一组间没有差异,岂不被动?!”生理、生化、组织学、基因,都做;“内容丰富,显得水平高?!”许多仪器一下子可以做许多项目;“许多项目一一分析,哪个有意义,就报告哪个指标?!”哪些指标可能有组间差异,必须心中有数。
假说:预计将要得到的结论——假说是科研的灵魂心中无数,不要“先上马再说”●指标多,实验工作量大。
大海捞针——碰运气,不是科研!●指标多,翻来覆去分析,制造假阳性!Nature杂志统计学指南:➢常见错误之一。
仅分析1个指标时,P(假阳性)=0.05,P(1次分析不犯错误)=0.95 λ,同时分析2个指标时,P(2次分析均不犯错误) = [P(1 次分析不犯错误)] 2 P(假阳性)=1 - 0.952 ≈ 0.10, 同时分析3 个指标时,P(假阳性)=1 - 0.953 ≈ 0.14 λ同时分析10个指标时,P(假阳性)=1 - 0.9510 ≈ 0. 40➢常见错误之一(Nature) ----多重比较不校正多重比较: 对一组数据作多项比较时,必须说明如何校正α水平,以避免增大第一类错误的机会---- Bonfferoni校正(α/k来校正,k为两两比较次数)3 不重视对照为何必需对照?●消除非研究因素的混杂实验组和对照组受非研究因素的影响尽可能相同,使两组的差异主要反映研究因素的效应。
●鉴别研究因素的效应和自然发展结果。
例如,研究某药物对口腔溃疡模型兔的疗效,口腔溃疡有自愈的倾向,必须有对照扣除自愈效应。
常见错误➢没有对照!千方百计省去对照组,以减少一半工作量!? ω自身前后对照/历史对照/文献对照/ “标准”对照➢对照不当ω对照太弱:安慰剂对照/对照过强:西药+加中药~西药/对照剂量有争议:试验药,大剂量~对照药,中小剂量/对照基线不可比:试验组年轻、病轻~ 对照组年老、病重应当如何?ω事先明确研究假说,例如,新药比常规药好:以常规药为对照ω设计:研究组新药~ 对照组常规药可比性:基线可比、过程可比、终点可比ω保证可比性措施:干预性研究: 随机化观察性研究:匹配4样本量无根据ω干预性研究:“ 500 例患者随机分成两组……” 为什麽500 例?不多不少?500 例从天而降?现成送上门来?ω观察性研究:“ 10年期间A组3000例,B组258例……” ---- 有多少用多少!?应当如何?---- 报告最小样本量估算及其依据1. 比较两组测定值的均数依据:(1)预计欲比较的两总体参数的差值δ(2)预计总体标准差σ(3)允许出现假阳性结果的机会α(4)允许出现假阴性结果的机会β :例:格列美脲、格列苯脲对比研究以HbA1c 为主要终点报告依据✓欲检出HbA1c临床差异≥0.65%✓假定标准差为1.3%✓双侧检验水平0.05✓功效80% ω✓退出率20% 计算:157例2. 比较两组达标率依据:(1)预计一组发生某结局的百分比为π1(2)预计另一组发生某结局的百分比为α(3)允许犯假阳性错误的机会β(4)允许犯假阴性错误的机会π2例:格列美脲、格列苯脲对比研究以HbA1c达标为主要终点(1)预计一组发生某结局的百分比为45%(2)预计另一组发生某结局的百分比为25%(3)允许犯假阳性错误的机会α= 5%(4)允许犯假阴性错误的机会β= 20% 计算: 176 例5. 随机化,说而不做,做而不严处理分配的随机化为什么这么重要?(1) 消除分配处理有意或无意的偏倚。
如何有效地检查和修改学术论文中的语法和拼写错误

如何有效地检查和修改学术论文中的语法和拼写错误学术论文是学术交流和知识传递的重要形式,它们的质量对于研究者而言至关重要。
然而,即使在深思熟虑和精心撰写的学术论文中,语法和拼写错误仍然时有发生。
这些错误不仅会给读者留下不专业的印象,还可能误导读者或影响对论文内容的理解。
因此,了解如何有效地检查和修改学术论文中的语法和拼写错误是每个研究者都应该掌握的技巧。
下面将介绍几种常用且有效的方法来标记和纠正学术论文中的语法和拼写错误:1. 使用拼写和语法检查工具拼写和语法检查工具是最常见的语法和拼写错误检查方式。
使用像Microsoft Word这样的文字处理软件,内建有拼写和语法检查功能,可以自动检查并标记出潜在的错误。
然而,这些工具并非完美无缺,不能完全替代人工的检查。
因此,在使用这些工具检查论文时,需要谨慎对待每一处错误标记,并结合对论文内容的理解来进行修正。
2. 定期休息和交叉检查长时间连续地编辑和校对论文容易造成疲劳和视觉疲劳,从而忽视一些潜在的语法和拼写错误。
因此,定期休息并及时交叉检查是非常重要的。
通过短暂的休息和离开一段时间再返回论文,可以让眼睛和大脑得到休息,从而更容易发现之前可能忽略的错误。
3. 逐句逐词阅读逐句逐词阅读是一种常用的检查和修改学术论文的方法。
有时候,只有通过仔细地阅读每一个句子和每一个单词,才能发现并矫正一些细微的语法和拼写错误。
在阅读过程中,可以用红笔或高亮器标记出潜在的错误,然后逐个进行修改。
4. 找到可靠的校对人员即使你是一位优秀的作者和编辑者,也难免会忽视掉一些错误。
为了确保学术论文的质量,找到可靠的校对人员是非常必要的。
他们可以提供第三方的视角,帮助发现并纠正你可能忽视的语法和拼写错误。
可以选择专业的校对服务或者请同行、导师或教授帮忙校对你的论文。
5. 查阅相关参考资料当遇到某些语法和拼写问题时,查阅相关的参考资料是很有帮助的。
例如,英文写作风格指南、拼写和语法手册等可以提供详细的规则和建议,帮助你进行修正。
医学论文中常用统计分析方法错误大全

医学论文中常用统计分析方法错误大全在医学研究领域,准确合理地运用统计分析方法对于得出可靠的研究结论至关重要。
然而,在实际的医学论文中,却存在着各种各样的统计分析方法错误,这些错误可能会导致研究结果的偏差,甚至得出错误的结论。
下面,我们就来详细探讨一下医学论文中常见的统计分析方法错误。
一、数据类型判断错误数据类型的正确判断是选择合适统计分析方法的基础。
医学研究中常见的数据类型包括计量资料、计数资料和等级资料。
然而,很多研究者在数据类型判断上出现失误。
例如,将原本应该是计数资料的数据(如疾病的治愈、好转、无效等)当成计量资料进行分析,错误地使用了均值和标准差等统计指标,而应该使用频率和百分比等指标,并采用卡方检验等方法。
二、样本量计算不合理样本量的大小直接影响到研究结果的可靠性和准确性。
一些医学论文在研究设计阶段没有充分考虑样本量的计算,导致样本量过小或过大。
样本量过小,可能会使研究结果缺乏统计学意义,无法检测出真实存在的差异;样本量过大,则会造成资源的浪费,同时增加研究的难度和成本。
正确的样本量计算应该综合考虑研究的设计类型、预期效应大小、检验水准和检验效能等因素。
三、选择错误的统计方法这是医学论文中常见的错误之一。
例如,对于两组独立样本的均数比较,应该使用 t 检验,但如果两组数据的方差不齐,就需要使用校正的 t 检验或者非参数检验方法(如 Wilcoxon 秩和检验)。
然而,很多研究者在这种情况下仍然使用了普通的 t 检验,导致结果不准确。
再比如,对于多组均数的比较,如果方差分析结果有统计学意义,还需要进一步进行多重比较。
但有些研究在这一步没有进行恰当的多重比较方法选择,导致结论不够准确。
四、忽视数据的正态性检验在进行某些统计分析(如 t 检验、方差分析等)时,要求数据服从正态分布。
然而,很多研究者在使用这些方法之前,没有对数据进行正态性检验。
如果数据不服从正态分布,却仍然使用基于正态分布假设的统计方法,就会得出错误的结论。
统计分析中常见的错误与注意事项

统计分析中常见的错误与注意事项统计分析是研究中常用的方法之一,可以帮助我们了解数据的特征、推断总体的属性,并做出相应的决策。
然而,在进行统计分析时,由于各种原因常常出现错误,这些错误可能导致结果的失真,甚至使得我们得出错误的结论。
因此,正确地理解和遵守统计分析中的注意事项至关重要。
本文将介绍统计分析中常见的错误并提供相应的注意事项,以帮助您避免这些错误并获得准确的分析结果。
首先,数据收集是统计分析的第一步,但数据收集过程中常常出现的错误之一是样本选择偏倚。
样本选择偏倚指的是样本不具有代表性,不能反映总体的特征。
为了避免样本选择偏倚,我们应该采用随机抽样的方法,确保每个个体有相等的机会被选中,并且该样本能够充分代表总体。
其次,数据质量问题也是统计分析中常见的错误。
数据质量问题包括数据缺失、数据异常和数据错误等。
在进行统计分析之前,我们应该仔细检查数据的完整性和准确性。
如果发现数据缺失,我们应该采取适当的补充方法,并考虑使用合理的插补技术。
同时,对于异常值和错误数据,我们也需要进行检查和处理,以确保数据的质量。
另一个常见的错误是在统计分析中滥用假设检验。
假设检验是统计学中常用的方法,用于判断样本是否代表了总体。
然而,由于对假设检验的理解不当,往往导致错误的结论。
在进行假设检验时,我们应该明确研究的目的和问题,并选择适当的假设检验方法。
此外,我们也应该注意对假设检验结果的正确解读和合理推断。
另一个常见的错误是在进行统计分析时忽略了样本容量的影响。
样本容量是指样本的大小或样本中观测值的数量。
样本容量的大小会影响统计分析的结果和结论的可靠性。
当样本容量较小时,我们应该使用适当的方法,如准确度更高的置信区间,来更好地描述总体特征。
另一方面,当样本容量较大时,我们可以更自信地进行推断。
此外,我们在进行统计分析时还需要注意多重比较的问题。
多重比较指的是对多个假设进行多次比较,从而增加发生错误的概率。
为了避免多重比较问题,我们可以使用适当的校正方法,如Bonferroni校正,来控制错误的发生。
如何正确检查毕业论文的拼写和语法错误

如何正确检查毕业论文的拼写和语法错误毕业论文是学生在大学期间完成的重要学术任务,不仅要表达清晰准确的观点,还需要注意拼写和语法错误,以确保论文的质量和可读性。
在本文中,将介绍如何正确检查毕业论文的拼写和语法错误,以确保论文的准确性和专业性。
一、检查拼写错误拼写错误是毕业论文中常见的问题,可能会降低读者对论文内容的理解和评价。
为了避免拼写错误,可以采取以下策略:1. 使用拼写检查工具:利用拼写检查工具,如Microsoft Word中的拼写检查功能,可以快速识别并修正拼写错误。
但要注意,这些工具不能识别语法错误,因此需要综合其他方法来检查语法。
2. 逐字逐句检查:花时间仔细阅读整个论文,逐字逐句地检查拼写错误。
特别是注意那些拼写相近但含义不同的词语,如“their”和“there”、“affect”和“effect”等。
二、检查语法错误语法错误是另一个常见的问题,可能导致表达不准确或含义模糊。
为了避免语法错误,可以采取以下步骤:1. 保持一致的时态:在整篇论文中要保持一致的时态,不要在不同的段落或句子中混用过去时、现在时或将来时。
例如,如果某一段落使用了过去时,则整个段落应该保持过去时。
2. 使用正确的主谓一致:主谓一致是语法中的重要原则,要确保主语与谓语之间的人称和数一致。
例如,如果主语是第三人称单数形式,则谓语动词也应该是第三人称单数形式。
3. 避免使用碎句和长句:碎句和过长的句子都可能导致语法错误。
碎句是指没有完整的主谓宾结构的句子,而长句可能使句子结构复杂,难以理解。
因此,要尽量避免碎句和过长的句子,保持句子简洁明了。
三、请他人校对除了自己检查拼写和语法错误外,最好请其他人帮助校对论文。
其他人的视角可能能够更容易发现你自己忽视的错误。
当请他人校对时,以下几点可能会有所帮助:1. 选择校对人员:选择具有良好拼写和语法知识的人员,最好是专业人士或熟悉你研究领域的人士,以确保校对的准确性和专业性。
医学论文中统计表达和描述方面的错误辨析与释疑

(4)写作过程中过于注重结论的表述,而忽视了统计过程的科学性。
3、决方法
为避免以上错误,医生需采取以下措施: (1)深入学习统计学基础知识,提高自身专业素养。
(2)选择合适的研究设计和统计分析方法,确保其适用性和科学性。 (3)在数据处理过程中保持科学、严谨的态度,避免主观臆断。
(4)在写作过程中注重结论的准确表述,同时统计过程的科学性和合理性。 结论 本次演示通过对医学论文中统计表达和描述方面的错误辨析与释疑,指出了 常见错误的类型、产生原因及解决方法。医生在实际应用过程中应注重提高
先前的研究表明,医学论文中的统计分析错误辨析与释疑统计资料的表达与 描述之三主要包括以下几个方面:(1)统计学假设前提的误解;(2)不恰当的 统计学方法;(3)统计结果的不合理解释;(4)误用和滥用统计指标;(5) 统计样本的偏差和质量问题。这些错误辨析与释疑统计资料的问题会影响医学论 文的质量和研究结果的可靠性。
医学论文中统计表达和描述方面的错误主要包括以下几个方面:
(1)数据转换:将不适用于特定统计方法的数据进行错误转换,导致结果 偏离真实情况。
(2)误用统计量:不正确地选择和使用统计量,导致无法准确反映研究结 果。
(3)不正确表述结论:在结论部分夸大或缩小统计结果的实际意义,甚至 得出不正确的结论。
3、统计结果的不合理解释。一些医学论文在解释统计结果时存在不合理的 情况。例如,一些论文在比较两组数据时得出了不具有统计学意义的结论,但未 对其原因进行分析和解释。此外,一些论文在多组数据比较时没有考虑到其他因 素的影响,导致结果出现偏差。
谢谢观看
(4)假设检验前提条件:在进行假设检验时未满足前提条件,导致统计结 果失真。
(5)不理解统计基本概念:对基本统计概念如随机误差、效应大小等理解 不足,影响论文质量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
/docview-4375.html如何快速准确发现稿件或论文中的统计学错误军事医学科学院生物医学统计学咨询中心胡良平刘惠刚稿件或论文中统计学应用的质量如何,是科研工作者或临床医生撰写论文时,以及杂志编辑或审稿专家审阅论文时,都不可回避的一个问题。
一提起统计学,很多人都感到很棘手,认为统计学内容涉及面很宽,应用起来又十分灵活,掌握起来就更困难了,非统计学工作者怎能看出稿件或论文中存在的统计学错误呢!其实不然,只要你具备一些起码的统计学知识,再加上大胆发挥“常识”的作用,你就可以很容易地发现一些常见的统计学错误。
本文将教你一些这方面的技巧,请在审阅稿件或论文的统计学错误时试用一下,其效果会让你大为惊喜!(一)检查有无过失误差很多人在稿件或论文中出现了一些“过失错误”。
例如,数据抄写错误或仪器未校准或试剂过期等造成数据不准;同一张表内同一个指标的小数位不一致;统计图中坐标轴上的刻度值违反数学原则(两轴交汇处不是坐标原点、等长的间隔代表不等的数量、横轴上左大右小、纵轴上上小下大);各分项数据之合计与文中所写的合计值不等;正文中所描述的数据与统计表中所列的数据不一致。
例1:原文作者研究非脱垂子宫切除微创手术在妇科的临床应用价值,研究对象的基本情况见表1(略)。
对差错的辨析与释疑:根据原作者在文字叙述部分的介绍可知,CISH组总病例数应为228例,其中子宫>8孕周病例数应为208例,而表1中将总病例数写成208例,将子宫>8孕周病例数写成188例;将TAH写成TAHP,且该组中子宫>8孕周病例数应为182例,而表1中却写成112例。
如此多的过失误差出现在同一张表格中,是不应该的。
(二)检查统计学部分的写法关于文中所用的统计学的交代应非常清楚,不应含糊其词。
例如一项研究描述了以下内容:(1)运用SAS(或SPSS)软件进行统计分析;(2)用t检验和方差分析处理定量资料;(3)用χ2检验处理定性资料;(4)用相关和回归分析研究变量之间的关系;(5)用Logistic 回归分析研究各因素对结果的影响。
对差错的辨析与释疑:从(1)的写法只能得知原作者采用了什么统计分析软件处理数据,没有交代清楚软件的版本和序列号,更没有交代文中的资料究竟是采用了哪些统计分析方法处理的。
从(2)的写法只能得知原作者处理定量资料用了两类参数检验方法,即t 检验和方差分析,至于这些统计分析方法选用得是否正确则不得而知。
因为通常情况下,比较各平均值之间的差别是否具有统计学意义,可能会用到的t检验有3种、方差分析有10种之多,它们之间的区别体现在定量资料所对应的“实验设计类型”上。
讲t检验时,应注明是“单组设计定量资料的t检验”、“配对设计定量资料的t检验”还是“成组设计定量资料的t检验”;讲方差分析时,应注明是“单因素多水平设计定量资料的方差分析”、“随机区组设计定量资料的方差分析”、“拉丁方设计定量资料的方差分析”、“交叉设计定量资料的方差分析”、“x因素析因设计定量资料的方差分析”、“具有x个重复测量的x因素设计定量资料的方差分析”,等等。
况且,t检验和方差分析都属于参数检验方法,资料是否满足检验的前提条件,也没有考察。
若不满足,即使实验设计类型碰巧对了,计算方法也是错误的。
应该选用相应设计定量资料的非参数检验方法,找不到相应的非参数检验方法时,还应设法寻找合适的变量变换方法。
从(3)的写法只能得知原作者处理定性资料一律采用了χ2检验,这是很危险的信号!只有少数列联表资料,在特定的分析目的和资料具备特定的前提条件时,才可以运用χ2检验处理定性资料,千万不应将χ2检验视为处理定性资料的万能工具。
定性资料通常可以编制成11种形式的列联表,应针对不同形式的列联表、统计分析目的和资料实际具备的前提条件,选用相应的统计分析方法,不可随意盲目乱套!从(4)的写法只能得知原作者用了相关与回归分析方法,至于是简单相关分析、偏相关分析还是复相关分析,是简单相关分析中的Pearson线性相关分析还是Spearmen秩相关分析,是简单线性回归分析、多重线性回归分析还是多重logistic回归分析,等等,都一概不知。
也就是说,没有把具体的统计分析方法交代清楚。
从(5)的写法只能得知原作者运用了Logistic回归分析,至于其因变量是什么,则一概不知。
正确写法举例:运用成组设计定量资料的t检验处理表1资料(经检验,定量资料满足参数检验的前提条件);运用三因素析因设计定量资料的方差分析处理表2资料(经检验,定量资料满足参数检验的前提条件);运用单因素3水平设计定量资料的Kruskal Wallis 秩和检验处理表3资料(经检验,定量资料不满足参数检验的前提条件);运用多重logistic 回归分析研究多个自变量对治疗成功与否的影响。
(三)检查所交代的统计分析方法与文中资料的吻合情况这是最困难的,因为当审阅者的统计学水平不够高时,无法判定原作者所交代的统计分析方法与文稿中被分析的资料所需要的方法是否吻合。
这是判断者统计学水平高低的试金石,其知识和技术需要下大气力方可学到。
这里,只能简单说一些判定的要领,供审阅者参考。
其一,若关心的结果是定量资料,需要选用合适的定量资料统计分析方法时,其要领是:(1)正确辨析定量资料所对应的实验设计类型;(2)认真检查定量资料是否满足参数检验的前提条件。
其二,若关心的结果是定性资料,需要选用合适的定性资料统计分析方法时,其要领是:(1)弄清定性资料所对应的列联表的具体类型;(2)弄清当前拟达到的统计分析目的;(3)检查定性资料是否具备拟选用的统计分析方法所要求的前提条件。
其三,若关心的是两个或多个定量变量之间的相互关系和依赖关系,需要选用合适的相关与回归分析方法时,其要领是:(1)考察在专业上是否有理由研究这些变量之间的关系;(2)绘制和分析反映两个定量变量之间变化趋势的散步图。
其他统计分析方法也有一些值得总结的要领,因篇幅所限,此处不再赘述。
(四)检查统计分析结果的表达很多学术论文在表达统计分析结果时一般只给出“P>0.05”、“P<0.05”或“P<0.01”,这是很不够的!应给出统计量的计算结果,并尽可能给出具体的P值,如:t=4.784,df=8,P=0.0014;χ2=10.360,df=3,P=0.0157。
在表达定量和定性资料的结果时,还应尽可能给出总体平均值或总体率的95%置信区间。
(五)检查结论的陈述很多学术论文在陈述结论时常说:试验组与对照组比较,差别非常显著。
这样下结论是不可取的!正确的陈述方法如下:试验组与对照组总体平均值之间的差别具有统计学意义,因试验组的平均值大于对照组的平均值,说明试验药物使该指标的取值有所升高。
(六)辨析文稿中统计学误用的策略1.识别统计表表达与描述方面错误的策略:统计表方面的主要错误是表中数据的含义未表达清楚,令人费解。
统计图方面的主要错误有两个:其一,横坐标轴上的刻度值是随意标上去的,等长的间隔代表的数量不等,在直角坐标系中,从任何一个数值开始作为横轴或纵轴上的第一个刻度值;其二,用条图或复式条图表达连续性变量的变化趋势。
运用相对数时,混淆“百分比”与“百分率”。
在表达多组定量资料时,即使定量资料偏离正态分布很远,仍采用“x±s”表达(标准差s>x),特别当表中采用标准误sx取代标准差s时,前述的错误很难被察觉出来,应将标准误还原成标准差(s=sx×n),便容易看出破绽。
2.识别统计分析方法选择方面错误的策略:误用定量资料分析方法处理定性资料,例如,用“1”代表治愈,用“0”代表未治愈,分别将实验组、对照组中的“1”和“0”相加求得算术平均值,也可求出标准差。
然后,照着统计学教科书上处理成组设计定量资料的t 检验计算公式,算出检验统计量t值,查t临界值表,得到相应的概率。
还有人只要看到实验资料中的结果变量名叫做“阳性率或百分率”,便不假思索地认为该资料为“定性资料”,想当然地选用χ2检验处理此类资料。
其实,有时可从每名受试者身上测到一个“阳性率”数据,此时,应将其视为“定量资料”,应判定定量资料所对应的实验设计类型和检查其是否满足参数检验的前提条件,以便选用相应设计定量资料的参数或非参数检验处理此定量资料。
若资料中的结果变量确实为定性的,就要弄清每次要考察的原因变量有几个,它们是定性的、定量的还是两者都有,从而决定是将资料整理成一般的列联表资料还是按数据库格式去整理资料。
若是列联表形式的资料,通常根据其具有的11种类型、分析目的和资料具备的前提条件,可以看出原文作者所选择的统计分析方法与应该选用的统计分析方法是否吻合;若是用数据库形式呈现的资料,当自变量较少时,可以转化成相应的列联表形式,当自变量较多时,不便将其转变成列联表的形式,通常可直接选用多重logistic回归分析处理。
3. 识别相关与回归分析方面错误的策略:识别相关与回归分析方面错误的策略主要在于以下两点:其一,看所研究的变量之间在专业上是否有联系,这种联系是否有专业知识为依据。
例如,若有人研究正常成年人的身高与转氨酶之间的线性相关关系,可以很有把握地说,这两个变量之间的关系缺乏临床专业知识为依据,因为转氨酶是反映某人肝功能是否正常的一个重要参考指标。
正常成年人的转氨酶数值通常在一定的正常值范围之内,不会随着人的身高改变而改变。
有时人们观察到的两个变量之间的关系是“虚假的”,从数量上看,好象关系很密切,其实它们都与另外一个变量之间有密切关系。
例如,有人连续测量某小孩12个月中各月的身高,同时,测量门前一棵小树的高度,这12对数据之间可能呈现很好的“线性相关”,其实,它们之间毫无关系。
事实上,它们都与“时间”有很好的“线性相关”。
其二,一定要绘制出反映定量变量同时变化趋势的散布图,此图可以清楚地展现所考察的定量变量之间是呈直线变化趋势、曲线变化趋势、存在个别的异常点还是杂乱无章、毫无根据的关系,如此一览无余,便知线性相关与回归分析应用得是否恰当。
4.识别多重回归分析方面错误的策略:若选用的是多重线性回归分析,要看因变量是否为近似服从正态分布的定量资料,自变量之间是否存在明显的共线性关系(若自变量之间相关性密切,就不合适);若选用的是多重logistic回归分析,要看因变量是否为定性变量(二值变量、多值有序变量还是多值名义变量),定性的因变量的具体情况不同,应选择相应的多重logistic回归分析方法;若结果变量是患者的生存时间,而且有些人的生存时间数据出现了“截尾”(即因为失访或死于其他原因,观察到的生存时间不准确),通常应选用生存分析方法中的COX模型回归分析或参数模型回归分析。
5. 识别多元统计分析方面错误的策略:若用了多元方差分析或多元协方差分析,就要考察这些定量的结果变量在专业上是否有联系,还要看设计类型判断得是否正确,资料的前提条件是否作了检查;若是为了从众多的定量变量中寻找出隐含的、测定起来很不方便的变量,一个目的是为了降低变量的维数,另一个目的是为了更好地揭示可测变量之间的内在关系,可能需要选用主成分分析、因子分析或隐变量分析等复杂的统计分析方法了。