论文撰写中常见的统计学问题及其处理
论文撰写中常见的统计学问题及其处理

论文撰写中常见的统计学问题及其处理【摘要】统计学在论文撰写中扮演着至关重要的角色,它影响着论文的质量和可信度。
在撰写论文过程中常见的统计学问题包括样本量的确定、数据处理方法的选择、结果的解释和呈现,以及如何避免常见的统计学错误。
解决这些问题需要早期咨询统计学专家,并且重视统计学在论文中的作用和意义。
只有正确处理统计学问题,才能确保论文的科学性和准确性。
建议学者们在撰写论文前要深入了解统计学知识,提前咨询专家,以确保论文的统计学部分能够科学可靠地支撑研究结论。
【关键词】统计学、论文撰写、样本量、数据处理、分析方法、结果解释、统计学错误、解决方法、重视意义、咨询专家。
1. 引言1.1 统计学在论文撰写中的重要性统计学在论文撰写中扮演着至关重要的角色。
论文的质量很大程度上取决于统计学的严谨性和正确性。
统计学能够帮助研究者从大量的数据中提取有效信息,得出科学的结论,并验证假设和研究问题。
在论文中,统计学的应用不仅可以帮助读者更好地理解研究结果,还能提高研究的可信度和说服力。
统计学在论文撰写中的重要性体现在几个方面。
通过统计学分析,研究者可以对研究问题进行量化和定量的描述,使研究结论更加客观和可靠。
统计学可以帮助研究者有效地处理大量的数据,提取有用信息,并进行数据的比较和推导。
统计学还可以帮助研究者发现数据中的规律性和趋势,从而指导下一步的研究方向和决策。
1.2 统计学问题对论文质量的影响统计学问题对论文质量的影响非常重要,因为统计学是对数据进行收集、分析和解释的科学方法。
如果在论文撰写过程中出现统计学问题,可能会导致以下几个方面的影响:统计学问题可能导致数据分析结果不准确或者失真。
如果数据的收集、处理以及分析方法不正确,很可能会得出不准确的结论,从而影响论文的科学性和可信度。
选择错误的统计分析方法或者忽略样本量的影响都可能导致数据分析结果产生偏差。
统计学问题可能导致结论的不可靠性。
统计学问题可能使得对数据结果的解释产生误导或者错误的理解,从而影响读者对论文的信服度。
医学论文中常见的统计学处理问题

医学论文中常见的统计学处理问题1.未建立或未使用多元医学参考值范围:随着现代科技的发展,在临床实践中出现了许多新仪器,新设备,如一滴血可查出数十项指标结果。
故临床医师在实践中常用多项(即多于1项)指标判断某功能或状态正常与否。
此时应注意:(1) 不能用单指标方法确定的单指标参考值范围来逐个判断多项指标观测值;(2) 对多指标观测值,不能用单指标方法确定多指标医学参考值范围;(3) 注意诊断试验评价结果;(4) 建立参考值范围的观测例数应不少于100例。
2.未进行可信区间估计:对总体参数的区间估计,通常涉及均数、率、相对危险度。
如血管扫描的准确性为92%(81%~100%)。
注意:(1) 观测例数适宜;(2) 若诊断符合率的上限接近100%。
提示新方法是可以推荐使用的;而若下限接近50%,则提示此新方法无使用意义;(3) 数据分布近似正态分布,或变量变换后近似正态分布。
3.未进行一组构成比资料的统计分析:一组构成比中任何两个构成部分间可以比较,当对任一构成部分做结论时要考虑假设检验,同时注意构成比最大为100%。
4.未按有序分类资料分析:有序分类资料(或等级资料)一般应进行秩和检验,仅当配对设计的双向有序分类资料(R×C表)研究相关关系时做χ2检验,要注意识别有序分类资料。
5.未按设计整理统计表:常见的是将配对设计的双向有序分类资料(R×C表)误整理为单个样本的有序分类资料,把配对设计的四格表误整理为一般四格表等。
6.使用不适宜的统计图、表:表中不应列出各样本部分指标均为相同的观测值,如均为零。
对一些图,要注意观察相邻刻度线的数值是什么关系?若为倍数关系时要考虑用对数线图或半对数线图。
注意将统计学基本原则与期刊编辑要求相结合,如列表,制图应注意节约版面。
7.未合理描述变量间关系:例如要分析IL-6含量与特异性IgM滴度呈正相关,绘图时只能以IL-6、IgM分别为X、Y变量绘制散点图,观察两变量间关系。
论文撰写中常见的统计学问题及其处理

论文撰写中常见的统计学问题及其处理统计学作为一门学科,旨在通过收集、处理、分析和解释数据来描述和预测事物之间的关系。
然而,在撰写论文时,研究者常常遇到一些常见的统计学问题。
以下我将介绍几个常见的问题,并讨论它们的处理方法。
首先,一个常见的问题是样本选择偏倚。
在研究中,研究者可能无意中选择了特定类型的样本,而不是随机选择。
这可能导致结果不准确或不具有代表性。
为了解决这个问题,研究者可以使用随机抽样技术来选择样本,确保样本具有代表性。
此外,还可以通过与全体人口进行比较来验证样本的代表性。
第二个问题是样本容量太小。
如果样本容量太小,研究结果可能不具备统计显著性。
为了解决这个问题,研究者可以使用统计学方法来计算所需的样本大小,以达到一定的置信度和效应大小。
此外,研究者还可以通过增加样本容量来提高统计显著性。
第三个问题是数据的缺失。
在研究中,数据可能由于各种原因而缺失,例如受访者未完全回答问题或由于设备故障而丢失。
为了解决这个问题,研究者可以使用适当的数据插补方法来填充缺失值。
有一些常用的插补方法,例如最大似然估计、多重插补和概率插补。
第四个问题是多重比较。
当研究者进行多个统计检验时,他们可能会遇到多重比较问题。
多重比较可能导致假阳性错误的增加。
为了解决这个问题,研究者可以使用适当的校正方法,如Bonferroni校正、False Discovery Rate校正或Benjamini-Hochberg过程来调整p值。
最后,一个常见的问题是相关性与因果性之间的混淆。
在统计学中,相关性仅仅描述了两个变量之间的关系,并不表示因果关系。
在撰写论文时,研究者应该小心使用正确的表述,避免将相关性误解为因果关系。
此外,如果研究目的是探讨因果关系,研究者可以使用其他设计,如实验设计或断点回归设计。
总的来说,统计学在撰写论文时常常涉及一些常见的问题。
通过正确处理样本选择偏倚、样本容量不足、数据缺失、多重比较和相关性与因果性之间的混淆等问题,研究者可以确保研究结果准确可靠,并为科学研究做出贡献。
学术论文写作中如何解决统计数据分析的难题

学术论文写作中如何解决统计数据分析的难题在学术研究中,统计数据分析是一个重要的环节,它可以帮助我们从大量的数据中提取有用的信息,验证研究假设,并得出科学的结论。
然而,统计数据分析也常常面临一些难题,如数据的质量、样本的选择、统计方法的选择等。
本文将探讨如何解决这些难题,以提高学术论文的质量和可信度。
首先,数据的质量是进行统计数据分析的基础。
在收集数据时,我们应该注意数据的准确性、完整性和一致性。
准确性意味着数据应该真实反映研究对象的特征,避免人为或系统性的误差。
完整性指数据应该包含所有必要的信息,没有遗漏。
一致性表示数据应该在不同时间点和不同来源之间保持一致。
为了确保数据的质量,我们可以采取多种方法,如使用标准的数据收集工具、进行数据清洗和验证等。
其次,样本的选择是进行统计数据分析的关键。
样本的选择应该具有代表性,能够反映整体群体的特征。
为了选择合适的样本,我们可以使用随机抽样方法,确保每个个体有相同的机会被选入样本中。
此外,样本的大小也需要考虑。
通常情况下,样本的大小应该足够大,以确保统计结果的可靠性。
如果样本过小,可能会导致统计结果不具有代表性,从而影响研究结论的准确性。
第三,统计方法的选择是进行统计数据分析的关键。
在选择统计方法时,我们应该根据研究问题的性质和数据的特点来确定。
如果研究问题是描述性的,我们可以使用描述性统计方法,如平均数、标准差、频率分布等。
如果研究问题是推断性的,我们可以使用推断统计方法,如假设检验、置信区间、回归分析等。
此外,我们还可以使用多种统计方法进行交叉验证,以增加研究结论的可信度。
最后,数据可视化是进行统计数据分析的重要工具。
通过将数据以图表的形式展示出来,我们可以更直观地理解数据的分布和关系。
常用的数据可视化方法包括条形图、折线图、散点图等。
通过数据可视化,我们可以更好地发现数据中的规律和趋势,从而支持我们的研究结论。
综上所述,学术论文写作中解决统计数据分析的难题需要注意数据的质量、样本的选择、统计方法的选择和数据可视化。
解决统计学中的问题

解决统计学中的问题统计学是一门研究数据收集、分析和解释的学科,它在各个领域都扮演着重要的角色。
然而,统计学也存在一些常见的问题,包括样本偏倚、数据挖掘和误差分析等。
本文将重点探讨如何解决统计学中的这些问题,并提出相应的解决方案。
一、样本偏倚的解决方法样本偏倚是指在统计分析中,由于样本抽取不具有代表性,导致结果与总体存在明显差异的情况。
为了解决这一问题,我们可以采取以下措施:1. 随机抽样:通过随机抽样的方式,确保每个个体以相等的概率被选入样本,从而减小样本偏倚的可能性。
2. 多元回归分析:在样本存在较大偏倚的情况下,可以通过多元回归分析来修正样本偏倚。
该方法考虑了多个自变量对结果的影响,从而提高结果的准确性。
二、数据挖掘的问题及解决方案数据挖掘是从大量数据中发现模式和规律的过程,但在实践过程中,也会面临以下问题:1. 维度灾难:当特征维度过高时,会导致模型复杂度的急剧增加,从而降低预测准确性。
为解决这一问题,可以使用特征选择算法来筛选出最相关的特征。
2. 过拟合和欠拟合:数据挖掘模型往往要对训练数据和测试数据进行拟合,但过拟合和欠拟合是常见的问题。
针对过拟合问题,可以采用交叉验证等方法,选择合适的模型参数。
而针对欠拟合问题,可以考虑增加特征或采集更多的数据。
三、误差分析的解决策略误差分析是评估模型准确性的重要手段,但在实际应用中,也存在一些需要解决的问题:1. 模型选择:误差分析中,我们需要选择合适的模型来解决特定问题。
正确选择模型是关键,可以采用交叉验证和网格搜索等方法,从多个模型中选择最佳模型。
2. 模型评估:误差分析时,我们需要选择合适的评估指标来评估模型性能。
常用的评估指标包括准确率、召回率、F1值等。
根据具体问题选择合适的评估指标,避免评估误差导致的不准确性。
四、统计学中的问题解决流程为了更好地解决统计学中的问题,可以按照以下流程进行操作:1. 确定问题和目标:明确需要解决的问题和目标。
论文撰写中如何处理数据异常和统计误差

论文撰写中如何处理数据异常和统计误差在撰写论文的过程中,数据异常和统计误差是常见的问题。
处理这些问题是确保研究结果准确可靠的关键。
本文将探讨在论文撰写中如何处理数据异常和统计误差的方法和技巧。
一、识别和处理数据异常1. 数据收集和整理:在撰写论文之前,首先需要进行数据收集和整理。
确保数据的准确性和完整性是数据异常处理的基础。
可以使用适当的方法和工具来收集和整理数据,例如使用统计软件进行数据输入和校验。
2. 数据清洗:数据清洗是处理数据异常的重要步骤。
在清洗数据时,需要识别和删除错误、离群值和缺失值。
可以使用统计软件和图表来可视化数据,以便更容易地发现异常数据。
3. 异常数据的处理:一旦发现异常数据,需要进行适当的处理。
处理方法可以根据数据的情况来决定,例如删除异常值、替换缺失值或使用插值法估计数据等。
需要注意的是,处理异常数据时要保持科学合理,避免对结果产生不良影响。
二、统计误差的处理1. 样本选择:在研究设计和数据采集阶段,样本选择是减小统计误差的关键。
应该根据研究目的和研究对象的特点,采用随机抽样或者分层抽样等方法来选择样本。
合理选择样本可以更好地反映总体特征,减少统计误差。
2. 样本容量:样本容量的大小对统计误差有着直接影响。
通常情况下,样本容量越大,统计误差越小。
因此,为了减小统计误差,应尽量提高样本容量。
可以使用统计方法计算所需的样本容量,以保证结果的可靠性。
3. 统计方法:选择合适的统计方法也是降低统计误差的重要因素。
在进行数据分析时,应根据研究的目的和数据的性质来选择适当的统计方法。
例如,如果数据符合正态分布,可以使用参数统计方法;如果数据不符合正态分布,可以使用非参数统计方法。
4. 敏感性分析:敏感性分析是评估统计误差的一种方法。
通过对模型参数和数据做出不同的假设,可以估计结果的稳定性和可靠性。
敏感性分析可以提供对结果的不确定性程度的评估,并帮助研究者更好地理解和解释结果。
总结:在论文撰写中,处理数据异常和统计误差是确保结果可信度的重要步骤。
论文撰写中常见的统计学问题及其处理

论文撰写中常见的统计学问题及其处理据不完全统计,在难以发表的、已凝聚着作者心血并花费较长时间与较大财力撰写的研究论文中,约半数以上是由于统计错误致其结果与原文主要结论相违背。
如一文采用某新药引产,96例足月孕妇的产后出血与新生儿低Apgar评分率均为2.1%(各2例),明显低于应用原药引产的19例,其产后出血与新生儿低Apgar评分发生率均为15.8%(各3例,χ2=7.164,P<0.001)。
故认为采用新药引产是一更安全的措施。
原药引产组例数偏少暂且不谈,该资料比较应采用精确法分析,结果是与原结果恰恰相反(P>0.05),这样上述的主要结论就欠可靠而难以发表,否则论文可起误导作用。
类似问题文稿中还常有出现。
现就文稿中常见的统计问题及其相应的处理方法简述如下。
一、常用的统计术语统计学中常用的概念有总体与样本、随机化与概率、计量与计数、等级资料及正态与偏态分布资料、标准差与标准误等。
如某研究采用经会阴途径测定宫颈长度,以探讨不同宫颈长度与临产时间的关系。
结果显示35例宫颈长度为25~34mm者与32例宫颈长为15~24mm者临产时间的均值±标准差(x±s)各为57.6±58.1与47.3±49.1小时。
该计量资料,经t检验显示t=0.780,P>0.05,并未提示不同宫颈长度的临产时间差异有显著意义;从标准差大于均值,显示各变量值离散程度大,呈偏态分布,故不能采用x±s这一算术均数法计算均数。
经偏态转换成近似正态分布资料后结果是:35例与32例的临产时间各为34.5±4.1与26.7±4.1小时,(t=7.778,P<0.001),两组差异有极显著意义。
可认为随着宫颈长度的缩短、临产时间也缩短。
此外,当两组资料单位不同时,其S单位也不同;即使两组单位相同的变量值,若其均数差异较大,也都应以变异系数替代s来比较两组值的离散度的大小。
医学论文常见统计学错误与纠正

医学论文常见统计学错误与纠正一、设计与实施1.对象合格标准不明确●只报告来源和时间段,总体不清晰:大杂烩,得不到科学结论;●事前未规定合格标准和排除标准,事后排除;●不报告按照合格标准和排除标准筛选对象的过程。
2.结局指标多而杂--是事先规定的最重要的结局指标,通常以此为准来计算样本量。
常见错误:终点指标过多, 大海捞针临床试验时,不知道哪个指标在组与组间有差异;“确定某个指标后,万一组间没有差异,岂不被动?!”生理、生化、组织学、基因,都做;“内容丰富,显得水平高?!”许多仪器一下子可以做许多项目;“许多项目一一分析,哪个有意义,就报告哪个指标?!”哪些指标可能有组间差异,必须心中有数。
假说:预计将要得到的结论——假说是科研的灵魂心中无数,不要“先上马再说”●指标多,实验工作量大。
大海捞针——碰运气,不是科研!●指标多,翻来覆去分析,制造假阳性!Nature杂志统计学指南:➢常见错误之一。
仅分析1个指标时,P(假阳性)=0.05,P(1次分析不犯错误)=0.95 λ,同时分析2个指标时,P(2次分析均不犯错误) = [P(1 次分析不犯错误)] 2 P(假阳性)=1 - 0.952 ≈ 0.10, 同时分析3 个指标时,P(假阳性)=1 - 0.953 ≈ 0.14 λ同时分析10个指标时,P(假阳性)=1 - 0.9510 ≈ 0. 40➢常见错误之一(Nature) ----多重比较不校正多重比较: 对一组数据作多项比较时,必须说明如何校正α水平,以避免增大第一类错误的机会---- Bonfferoni校正(α/k来校正,k为两两比较次数)3 不重视对照为何必需对照?●消除非研究因素的混杂实验组和对照组受非研究因素的影响尽可能相同,使两组的差异主要反映研究因素的效应。
●鉴别研究因素的效应和自然发展结果。
例如,研究某药物对口腔溃疡模型兔的疗效,口腔溃疡有自愈的倾向,必须有对照扣除自愈效应。
常见错误➢没有对照!千方百计省去对照组,以减少一半工作量!? ω自身前后对照/历史对照/文献对照/ “标准”对照➢对照不当ω对照太弱:安慰剂对照/对照过强:西药+加中药~西药/对照剂量有争议:试验药,大剂量~对照药,中小剂量/对照基线不可比:试验组年轻、病轻~ 对照组年老、病重应当如何?ω事先明确研究假说,例如,新药比常规药好:以常规药为对照ω设计:研究组新药~ 对照组常规药可比性:基线可比、过程可比、终点可比ω保证可比性措施:干预性研究: 随机化观察性研究:匹配4样本量无根据ω干预性研究:“ 500 例患者随机分成两组……” 为什麽500 例?不多不少?500 例从天而降?现成送上门来?ω观察性研究:“ 10年期间A组3000例,B组258例……” ---- 有多少用多少!?应当如何?---- 报告最小样本量估算及其依据1. 比较两组测定值的均数依据:(1)预计欲比较的两总体参数的差值δ(2)预计总体标准差σ(3)允许出现假阳性结果的机会α(4)允许出现假阴性结果的机会β :例:格列美脲、格列苯脲对比研究以HbA1c 为主要终点报告依据✓欲检出HbA1c临床差异≥0.65%✓假定标准差为1.3%✓双侧检验水平0.05✓功效80% ω✓退出率20% 计算:157例2. 比较两组达标率依据:(1)预计一组发生某结局的百分比为π1(2)预计另一组发生某结局的百分比为α(3)允许犯假阳性错误的机会β(4)允许犯假阴性错误的机会π2例:格列美脲、格列苯脲对比研究以HbA1c达标为主要终点(1)预计一组发生某结局的百分比为45%(2)预计另一组发生某结局的百分比为25%(3)允许犯假阳性错误的机会α= 5%(4)允许犯假阴性错误的机会β= 20% 计算: 176 例5. 随机化,说而不做,做而不严处理分配的随机化为什么这么重要?(1) 消除分配处理有意或无意的偏倚。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
论文撰写中常见的统计学问题及其处理
绝大多数的论文撰写,均需通过一定数量临床病例(或资料)的观察,研究事物间的相互关系,以探讨客观存在的新规律。
如确定新诊断、新治疗等措施是否优于原沿用的方法,就需进行两种方法比较,这就涉及统计处理;统计设计又是整个课题研究设计中一个重要的组成部分。
显然,经正确统计处理的结果可信度高,论文的质量也高。
据不完全统计,在难以发表的、已凝聚着作者心血并花费较长时间与较大财力撰写的研究论文中,约半数以上是由于统计错误致其结果与原文主要结论相违背。
如一文采用某新药引产,96例足月孕妇的产后出血与新生儿低Apgar评分率均为2.1%(各2例),明显低于应用原药引产的19例,其产后出血与新生儿低Apgar评分发生率均为15.8%(各3例,χ2=7.164,P0.06),这样上述的主要结论就欠可靠而难以发表,否则论文可起误导作用。
类似问题文稿中还常有出现。
现就文稿中常见的统计问题及其相应的处理方法简述如下。
一、常用的统计术语
统计学中常用的概念有总体与样本、随机化与概率、计量与计数、等级资料及正态与偏态分布资料、标准差与标准误等。
如某研究采用经会阴途径测定宫颈长度,以探讨不同宫颈长度与临产时间的关系。
结果显示35例宫颈长度为25~34mm者与32例宫颈长为15~24mm者临产时间的均值±标准差(x±s)各为57.6±58.1与47.3±49.1小时。
该计量资料,经t检验显示t=0.780,P>0.06,并未提示不同宫颈长度的临产时间差异有显著意义;从标准差大于均值,显示各变量值离散程度大,呈偏态分布,故不能采用x±s这一算术均数法计算均数。
经偏态转换成近似正态分布资料后结果是:35例与32例的临产时间各为34.5±4.1与26.7±4.1小时,(t=7.778,P<0.005),两组差异有极显著意义。
可认为随着宫颈长度的缩短、临产时间也缩短。
此外,当两组资料单位不同时,其S单位也不同;即使两组单位相同的变量值,若其均数差异较大,也都应以变异系数替代s来比较两组值的离散度的大小。
二、正常值范围及异常阈值的确定
如何选择研究对象,至少需多少例,正确统计处理和参考一定数量的病例数据,是确定正常值范围及异常阈值的四个重要因素。
1.研究对象:应为"完全健康者",可包括患有不影响待测指标疾病的患者。
如"正常妊娠"的条件:孕前月经周期规则、单胎、妊娠过程顺利、无产科并发症及其它有关合并症,
分娩孕周为37~41周+6,新生儿出生体重为2500~4000g和Apgar评分≥7分。
2.观察数量:观察数量应尽可能多于100例;需分组者,各组人数也是如此(标本来源困难时酌情减少)。
有些指标值如雌三醇(E3)、甲胎蛋白(AFP)、胎盘泌乳素(HPL)等随孕周进展而变化,应按孕周分组;邻近孕周均数相近者,可合并几周计算。
若为偏态分布,应以百分位数计算,则例数应≥120例。
取各孕周对象时,应考虑到所取各孕周中的例数分布大致均衡。
显然,文稿中往往以少量例数求得正常值是欠可靠的。
3.统计处理:应根据所得数据分布特征采用不同的统计处理方法。
属正态或近似正态分布的数据,可采用x±s法计算;这也适用于以一定方法能将非正态分布转换成正态或近似正态分布的资料。
对无法转换的偏态资料,应采用百分位数计算法。
具体计算(包括上下限初步制定)见文献。
4.对照数量:相应观察的病例数(包括分组)应不少于30例,这对制定某指标有临床意义的异常阈值尤其重要,这一点往往易被忽视。
如在参考较多病例数据后,唾液游离E3的下限异常阈值应为第2.5百分位数,而非通常采用的5百分位数。
否则,将会导致该指标产前监护的假阳性率增加。
三、 t检验与校正t检验(t′检验)
这是文稿中极易混淆的一类计量资料统计问题。
(一)检验的注意事项1.t检验的意义:t检验与所有统计分析相同,其结果提示现有差别不仅仅是抽样误差所致,且提示犯第一类错误的可能性大小,即t0.06与t0.05犯第一类错误的可能性各为5%与1%. 2.统计意义与临床意义的关系:统计学有显著意义,而在临床上可能是无意义的,提示该研究应继续深入,以明确该差异是否真有显著意义;相反,统计无显著意义,而临床上却是有意义的,不能贸然轻易地下结论。
应复查实验设计、方法、试剂及仪器性能、质控措施和实验数据等是否有问题,或尚需再进一步增加样本量进行复测等。
3.t检验适用范围:t检验仅适用于正态或近似正态分布(包括偏态转换)和其方差是齐性资料的检验;t检验适用于可比性资料,即除了欲比较的因素外,其它所有可影响的因素应相似。
4.t检验的结果判断:判断结果不应绝对化,P0.06,分别表示可拒绝或接受原定的假设,但两者都有5%的可能性犯第一类错误;而P值越小,只能是更有理由拒绝原定的假设。
5.单侧与双侧检验:应预先制定本研究的结果是需行双侧还是单侧检验。
对有把握确知某治疗措施或某指标是不会劣于现有的,才作单侧检验;若不知何者为优,应行双侧检
验。
因为在同一t值的界限上,单侧检验的概率(P)仅为后者的一半,也就是说单侧检验较双侧检验更易得出差别有统计意义的结论,不可随意制定。
一般讲,绝大多数研究以采用双侧检验为妥。
(二)t′检验与t检验的区别当两样本均数的方差非齐性时,应以t′替代t检验。
例如:甲组32例血清某指标值为53.9±49.6(μmol/L);乙组6例的结果为26.6±7.2(μmol/L),若不考虑两样本方差大小,t检验示t=1.331,P>0.06,提示两组血清该指标的平均含量差异无显著意义。
但先作方差齐性检验,F=47.4,Pt′0.052.875,P<0.05.显然,与上述结论恰恰相反。