统计学方法在医学论文中的正确应用
统计学方法在医学论文中的正常应用

统计学方法在医学论文中的正常应用统计学是一门广泛应用于各个学科领域的科学方法,而在医学领域中的应用尤为重要。
医学研究需要大量的数据支持,而统计学方法可以帮助研究者从数据中提取有意义的信息,并进行正确的分析和解读。
本文将探讨统计学方法在医学论文中的正常应用。
1. 数据收集与整理在医学研究中,数据的收集是非常关键的一步。
研究者需要确定数据的来源、样本的选择以及相关的变量等。
此外,还需要进行一些数据预处理的工作,如数据清洗、缺失值处理等。
统计学方法可以提供相应的技术支持,帮助研究者有效地收集和整理数据。
2. 描述性统计分析描述性统计分析是对数据进行总结和描述的过程,常用的方法包括均值、中位数、标准差、频数等。
在医学论文中,描述性统计分析通常用于描述研究样本的人口统计学特征、基线情况以及变量的分布情况等。
通过描述性统计分析,研究者可以直观地了解数据的特征,为后续的分析提供基础。
3. 参数估计与假设检验参数估计和假设检验是统计学中常用的方法。
在医学研究中,研究者常常需要估计某种治疗方法的效果或者某个因素对某种疾病的影响程度。
参数估计可以通过建立合适的统计模型来对未知参数进行估计,常用的方法有最大似然估计、置信区间估计等。
而假设检验则可以用于判断某个假设是否成立,例如判断某个新药是否具有显著的治疗效果。
参数估计和假设检验的结果可以为医学研究提供科学的依据。
4. 相关分析和回归分析在医学研究中,研究者通常需要了解不同变量之间的关系。
相关分析可以帮助研究者评估变量之间的相关程度,常用的方法有Pearson相关系数、Spearman相关系数等。
而回归分析则可以揭示自变量对因变量的影响程度,帮助研究者预测和解释结果。
相关分析和回归分析可以进一步深入理解研究对象之间的内在关系。
5. 生存分析生存分析是医学研究中的重要方法之一,主要用于评估患者的存活时间和事件发生的风险。
生存分析的方法包括Kaplan-Meier曲线、Cox比例风险模型等。
医学论文中统计图表的正确使用

医学论文中统计图表的正确使用在医学研究中,统计图表是表达和分析数据的重要工具。
本文将介绍如何在论文中正确使用统计图表,以提高研究成果的可读性和可信度。
关键词:医学论文、统计图表、数据表达、数据分析医学论文中通常需要处理大量的数据,包括临床试验、流行病学调查、基因组学等多方面的信息。
统计图表作为一种直观的数据表达方式,能够清晰地呈现研究结果,从而帮助读者更好地理解数据分析的结论。
在选择统计图表时,应根据研究数据的类型、数量和所要呈现的信息进行选择。
例如,对于比较两组数据的均值差异,可以选择柱状图或线图;对于展示多组数据间的关系,可以选择散点图或饼图。
选择合适的图表后,需要正确设置图表的各项参数。
例如,坐标轴的标签、图例、标题等,以便清晰地表达图表的含义。
同时,还需注意图表的尺度,确保数据表达的准确性。
选择正确的数据分析方法对于统计图表的使用至关重要。
常用的统计分析方法包括描述性统计、方差分析、卡方检验等。
作者需根据数据的特点和研究目的选择合适的方法进行数据分析。
统计图表中的尺度应设置合理,确保数据的准确性。
例如,在柱状图中,各柱子的高度应与其所代表的数据成比例;在线图中,线条的起伏应能反映出数据的变化。
在展示实验数据时,通常会涉及标准误差。
标准误差反映了数据散布的范围,帮助读者更好地理解数据的波动情况。
在制作图表时,应正确计算和标注标准误差。
为了使图表更加完整和易于理解,通常需要提供一些补充数据。
例如,可以在图表下方列出数据的平均值、中位数等指标,以便读者对数据进行整体把握。
下面通过一个实例来说明如何正确使用统计图表。
在一项探讨高血压与年龄关系的研究中,研究者收集了500名患者的血压和年龄数据,并采用统计图表来呈现分析结果。
由于要探讨的是高血压与年龄之间的关系,可以选择散点图来展示数据点,同时绘制一条趋势线来反映二者的关系。
在散点图中,横坐标为年龄,纵坐标为血压。
为了便于观察,可以将数据点的大小和颜色进行调整,使其在图中更加突出。
2统计结果在医学论文中的正确表达

讲座内容
一、“摘要”的统计表达
二、“引言”的统计表达 三、“材料与方法”的统计表达
四、“结果”的统计表达
五、“讨论”的统计表达
一、“摘要”的统计表达
报告研究结果的重要统计指标量(统计量的数值、
可信区间及假设检验结果)
均数,标准差,或中位数,最小值和最大值
率,或两组均数(率)之差 多个观察指标的相关系数等 统计量、P值、95%可信区间、OR值等
面对复杂的医学问题怎样处理?
“当人类科学探索者在问 题的丛林中遇到难以逾越的障 碍时,唯有统计工具可为其开 辟一条前进的通道”。
Francis Galton (1822.2.16~1911.1.17)
---英国著名遗传学家、统计学家Galton
经济学家、人口学家马寅初
学者不能离开统计学而研学;
政治家不能离开统计学而施政; 事业家不能离开统计学而执业;
医学论文的结构
一、文题
二、作者及其工作单位
三、摘要(Abstract) 四、关键词 五、前言(Introduction)
据粗略统计,在医 学期刊发表的研究论著 中,2/3以上存在统计 结果的表达和解释问题 。
六、材料与方法(Materials and Methods)
七、结果(Results)
八、讨论(Discussion) 九、其他
给出影响因素的均衡性分析结果,如年龄、性别、病情、病 程等的均衡性分析结果(统计指标)。
样本量估计的依据:参考文献、参数、公式或软件等。
实验设计中的统计设计
随机、对照、重复
采用何种设计模型
处理因素及水平的设置
非处理因素的控制
实验效应的评价指标(outcome measures):所用评价指标及
医学统计学培训医疗研究人员正确应用医学统计方法

医学统计学将与生物医学、遗传学、流行病学等多学科进行更紧密的交叉融合,共同推动医学研究的进步和发展。
多学科交叉融合
医疗研究人员应加强对统计学基础知识的学习和理解,掌握常用的医学统计方法及其适用条件。
强化统计学基础知识
医疗研究人员应积极与其他学科专家进行合作和交流,共同解决医学研究中的复杂问题,推动医学科学的进步和发展。
诊断试验性能评价
阐述如何评估诊断试验的准确性、敏感性、特异性等指标,以及如何利用ROC曲线等方法综合评价试验性能。
诊断试验优化策略
探讨如何优化诊断试验的设计和实施,包括选择合适的样本、确定最佳临界值、采用复合指标等,以提高试验的效能和效率。
医学论文中统计学方法选择与报告规范
05
根据研究目的、数据类型和分析需求,选择适当的统计学方法。
医学统计软件应用
针对医学研究中常见的统计问题,如样本量估算、缺失数据处理、多重比较等,进行了深入的探讨和解答。
医学研究中的统计问题
随着大数据和人工智能技术的不断发展,未来医学统计学将更加注重与这些技术的融合,实现更高效、更准确的数据分析和挖掘。
大数据与人工智能融合
精准医疗和个体化治疗是未来医学发展的重要方向,医学统计学将在其中发挥重要作用,为制定个性化的治疗方案提供科学依据。
确保研究样本量足够,以避免因样本量不足导致的统计偏误。
确保数据质量可靠,避免因数据问题导致的统计结果失真。
实际操作与案例分析
06
数据收集
讲解如何制定数据收集计划,选择合适的数据收集工具和方法,确保数据的准确性和完整性。
1
2
3
详细介绍SPSS软件的基本功能和操作方法,包括数据管理、统计分析、图表制作等,方便研究人员快速上手。
医学论文中的统计学表述

医学论文中的统计学表述医学文献中统计学的应用z 医学论文中,普遍使用统计分析。
如:NEJM 杂志1990年有89%的文章使用统计分析。
z 国外的生物医学杂志通常都有专门的统计学审稿人。
z 1996年,我国申报科技成果的4586篇科研论文中,统计使用率达76%,而数据分析误用率达55.7%。
国外生物医学杂志投稿统一要求Uniform Requirements for Manuscripts Submitted to Biomedical JournalsThe International Committee of Medical Journal Editors (ICMJE), 第一版:BMJ 1991; 302: 338-41.第五版:N Engl J Med 1997; 336:309-316第六版:J Epidemiol Community Health. 2004; 58(9): 731–733.论文中的统计学表述论文结构:●引言(Introduction)明确阐述研究目的(objective)●方法(Methods )阐述统计设计思路及所用统计方法●结果(Results )表述实验(观察)数据的统计分析结果●讨论(Discussion )根据统计分析结果展开论述(材料和)方法●研究对象(subjects)9来源9入选标准和排除标准9总例数9基本情况描述(如人的年龄、性别等;动物的种系、年龄、性别、体重等)●统计设计方法■调查设计•何种研究方法(前瞻性、回顾性、横断面研究等)•样本容量,抽样方法及过程•数据质量及偏倚(bias)的控制■实验设计•采用何种设计方法(如自身配对设计、成组设计、交叉设计、析因设计等)•随机化方法及各组样本容量(n)(材料和)方法■临床试验设计:•随机化方法及各组样本容量(n )•纳入和排除标准•盲法•随访(失访情况的详细阐述)•处理标准(治疗或诊断标准)●实验效应的评价指标(outcome measures)•所用评价指标及其测量方法•测量误差的控制及评价(如多中心、多测量者、多测量仪器等问题)(材料和)方法●统计方法及统计软件(方法部分的最后一段)■一般采用双侧检验,单侧检验须特别说明,并阐述理由;■采用权威的统计软件并注明版次:SPSS 19.0, SAS 6.0, STATA 10.0, BMDP, SYSTAT, SPLM 等;■统计方法具体、确切;(材料和)方法计量资料的统计分析方法一组单样本t 检验两组多组配对设计配对t 检验成组设计两独立样本t 检验配伍组设计配伍组方差分析成组设计单因素方差分析重复测量重复测量ANOVA 多重比较:SNK, LSD, Scheffe, Duncan等级资料的统计分析方法两组多组配对设计Wicoxon 符号秩和检验成组设计Mann-Whitney 检验配伍组设计Friedman 检验成组设计Kruskall Wallis 检验计数资料的统计分析方法一组单样本率的u 检验两组多个率或构成比的比较χ2检验配对设计McNemar 检验成组设计χ2检验相关与回归分析方法相关: Pearson 线性相关(正态分布资料),Spearman 相关(偏态分布或等级资料)回归分析:线性回归/非线性回归logistic 回归:—条件logistic 回归—非条件logistic 回归Cox 回归结果●统计描述■计量资料:n, ±S ( ±SE),有的还给出min 、max 、CV 。
统计学方法的正确使用问题(一)

211心肺血管病杂志2019年1月第38卷第1期㊀Journal of Cardiovascular&Pulmonary Diseases,January2019,Vol.38,No.1㊃读者㊃作者㊃编者㊃摘要⓪统计学方法的正确使用问题(一)1.忽略统计学方法使用的前提条件㊀随着统计软件的广泛应用,有些医学生获得数据后直接选择软件中常见的几种统计学方法进行分析,完全不考虑本研究的数据是否满足该方法的使用条件㊂例如,医学研究中经常要进行两组或多组间均数的比较,有些医学生直接就采用t检验或方差分析进行统计㊂实际上,t检验和方差分析都是参数检验,需要满足前提条件:正态性和方差齐性㊂正态性是指各组资料要服从正态分布(或近似正态分布);方差齐性指各组资料取自的总体方差相等㊂目前常用的统计软件都可以对资料的正态性和方差齐性进行验证,但是很多学生都忽略了这一步,因而可能出现统计学问题㊂只有按照各种统计学方法自身的适用条件来合理使用,统计方法才能成为发现数据内在统计规律的有力工具㊂2.忽略研究设计,盲目套用统计方法㊀(1)误用t检验处理单因素多水平资料:t检验和方差分析是医学论文中最常用的㊁也通常被认为是最简单的统计学方法,然而实际应用中的正确率却低于10%[2]㊂除了上述的说明不清楚和忽略使用条件的问题外,忽略研究设计也常常是导致t检验和方差分析使用错误的原因㊂对于呈正态分布的单因素多水平定量资料,两组间的比较可用t检验;两组以上资料的比较则需选用方差分析㊂有些医学生简单地使用t检验来处理多组间的比较㊂这样做的问题是由于多次采用t检验,增加了假阳性错误的概率;同时失去了原来多组设计的意义,不能给出概括性的结论,因此结论不可靠㊂正确的方法是当满足方差分析的前提条件时应采用单因素多水平定量资料的方差分析;当检验结果为各组总体均数间不完全相等时,再进一步进行组间均数的两两比较㊂如果当任何两个均数之间都要比较,可采用SNK 法,而如果要分别将各试验组与同一个对照组比较,可采用Dunnett法㊂当资料不满足方差分析的前提条件时,需对资料进行数据正态化处理或采用秩和检验㊂(2)误用单因素方差分析处理重复测量的资料:医学研究中常需要对同一受试对象的某项指标在不同时点进行重复测量,此类资料即为重复测量的资料,例如研究对象服用某种药物后多个时间点的血压值㊂由于同一个体不同次测量的结果往往存在相关性,这时用单因素多水平方差分析来比较不同时点的测量结果是不恰当的,因为单因素方差分析要求各比较组间是独立的㊂如果仅将两个时间点上的数据放在一起进行配对t检验则割裂了原来多组比较的整体设计㊂正确方法的方法是先判断重复测量数据之间是否存在相关性(如SPSS的球形检验),如不存在相关性,则采用单因素方差分析即可;如存在相关性,则需进行重复测量数据的方差分析[3]㊂(3)误用χ2检验处理有序的列联表资料:对于定性资料,很多医学生都会直接应用χ2检验来处理㊂实际上,因研究设计的不同,定性资料的列联表又分为双向无序的列联表㊁单向有序的列联表和双向有序的列联表等不同类型㊂对于双向无序的列联表,可采用χ2检验进行分析㊂但需注意的是在列联表的χ2检验中,若P<0.05,只能得出总的结论㊂如需进行两两比较时,因为重复多次的检验将使第一类错误扩大,因此需重新设定检验水准,通常采用αᶄ=α/N,其中N为所需检验的次数[4]㊂此外,医学研究中还经常将某种定性的测量指标分成若干个有序的等级,如疾病的不同严重程度和预后的不同水平等,然后分类计数各组研究对象的具体状态㊂这种资料属于有序的(等级的)列联表资料,看似可以用χ2检验处理,但χ2检验只能比较各组的构成,而与顺序或等级无关,因而此类资料应采用与分组顺序有关的检验方法,如秩和检验和Ridit分析等[5]㊂(4)将非同质的研究对象合并进行相关分析:临床研究中经常采用病例-对照研究的设计,如糖尿病患者和正常对照,有时还需按患者的不同特征分为多组,如血糖正常㊁空腹血糖受损㊁糖耐量减低和糖尿病四种情况㊂为了突出总样本量,有些医学生把所有研究对象合计在一起进行分析㊂事实上,由于各组研究对象在生物学特征上可能有明显差异,这种合并分析需特别谨慎㊂尤其是进行相关分析时,指标之间的关系在不同组之间可能完全不同,即研究对象不同质,因此不应合并在一起进行相关分析㊂(摘自‘心肺血管病杂志“2015年219页,作者:刘静)。
医学统计学在医学论文写作中的应用

假设与逻辑推理
1
定义假设
在研究中,假设是一个可测试的、明确
枚举假设
2
定义的陈述或预测。
为了确定统计学研究的假设,我们需要
通过逻辑推理来形成可能的假设列表。
3
验证假设
在完成实验后,可以使用统计学方法来 验证假设,并确定统计学显著性和实际 意义。
变量及其分类
定性变量
描述性质或特征,如性别、种族、信仰、疾病 状态等。
医学统计学在医学论文写 作中的应用
探索医学统计学在医学论文写作中的重要性,包括研究设计、数据采集、分 析和结果呈现。这是提高研究质量和可信度的必备工具。
为什么需要使用医学统计学?
1 提高研究质量
统计学方法可以减少实验误差和潜在偏见,提高研究的可靠性和有效性。
2 证明假设
通过统计分析,可以确定原始假设是否可以成立,并为决策提供依据。
3 调查研究的违背度
错误的逻辑推理会影响研究的结果,需要通过各种方法来避免。
总结与未来展望
医学统计学在医学研究中的应用是必不可少的。总的来说,建议研究人员通过统计学方法来提高其研究可靠性 和有效性。未来,医学统计学将继续推动医学研究的全面发展。
数据的可靠性与有效性
可靠性
用于描述测量工具和过程的一致 性。
有效性
描述结果是否真实反映了原来性误差的 影响。
统计学图表的意义
柱状图
用于比较数据量或占比。
折线图
用于描述变量随时间或其他量 的变化趋势。
雷达图
用于描述多个变量在同一标度 下的综合指标。
文献的引用和引用分析
引用
描述使用他人成果的方式。
参考文献
列出已引用的文献列表。
引用分析
从编辑角度谈医学论文写作中的统计学应用问题

关键词 : 角度 ; 编辑 医学论 文; 统计分析 中图分类号 :23 G 1 文献标识码 : A
医学科学工作者进行科学研究或撰写论文, 都要运用有关统计学的方法进行统计分析。判断医学研究可信性的基本条 件是 : 课题设计、 方法学和数据处理的科学性 , 这些在很大程度上均与统计学有关。统计表和统计指标可用于描述医学研究
究论文 中常 常忽略失访原 因,当随访率低于 7 %时 , 0 应怀疑 原始材料 的可靠性 。
2 统计对象 的选择不 当
选定统计对象 的标准要具有一致性 和可信性 , 如疾病 的诊断要根 据权 威标 准 , 诊要依赖 病理检查 或手术 观察 。不受主 确 观意愿影响 的特殊检查与实验室检查 也有较 大参 考 价值 。选 择受 试对 象 的标 准要严 格 、 信 , 则会 影响 实验 结果 的科 学 可 否 性 。例如某篇报道某种治疗方法对 胃癌病人疗效 的 文 , 者诊断“ 论 作 胃癌” 的主要依 据为对 部分病人进行 胃镜检 查 , 一例 且无 做 胃镜下取组织活检 , 而确诊“ 胃癌 ” 必须依 靠病理学 观察 。因此 , 文临床治疗 对象 ( 该论 即受试 对象 ) 以全部 确诊为“ 难 胃癌 ” 病人 , 作者据此评价所谓“ 疗效 ”无法令人信 服 , 可能产生误导作用 。在 医学论 文中应明确写 出统计对象 的种属 、 、 , 甚至 年龄 性
资料 的一 般情 况 , 表达实验结 果 、 观察结果 , 或分析结 果 , 在医学论文 中非常常见 。医学论 文统计学 处理 的意 义在于 :1完善 ()
或检验论文的科学性和可靠性 ; ) ( 如实反映数量资料的特征, 2 通过分析资料来揭示事物的本质{3排除偶然性对研究真实性 ()
的影 响 , 透过偶然பைடு நூலகம்资料来洞 察事物发展 的内在规律 。统 计分析必须有可靠 的前提 , 即在 周密设计 的基础 上收集准确 而完整
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学方法在医学论文中的正确应用来源:阅读人数:4203 添加时间:2010-12-18 【已有3条评论】我要评论更多0Tags:统计学医学科技论文,特别是高质量的原始论著及根据高质量原始论著产生的系统评价己不断地改进和规范着临床医疗实践活动。
因此,医学文献的质量高低与我们的临床医疗实践活动密切相关。
然而,如果统计学方法应用不当,不仅不能准确地反映科研结果,而且还可能带来错误的结沦[1]。
Rosenfeld 等[2]比较了不同年代发表的文章,在20 世纪90年代以后有更多的文章使用了统计推断,而且比较复杂的统计分析方法如多因素分析等也更多的应用于临床研究中,但同时也存在使用统计方法欠妥或叙述不清的情况[3]。
国内耳鼻咽喉科医学科技论文情况近似,熊国强[4]等分析了2000 年到2001 年“中国耳鼻咽喉颅底外科杂志”,在科研设计和统计分析方面的应用现状;胡良平等[5]抽查了“中华耳鼻咽喉科杂志”1998 年到2000 年发表的部分文献,发现统计学误用比较常见。
因此本文将对医学科技论文常见统计学方法的正确应用进行讨论,希望加强作者的统计思维,进而提高期刊论文的统计质量及学术水平。
1 统计学方法的内容统计软件包、统计分析方法及检验水准是统计学方法必须描述的3 方面内容。
SPSS (statistics package for social science) 和SAS(statistical analysis system ) 是全世界学术界公认且最常用的两大统计软件包[6]。
检验水准即A,表示组间实际无差别而统计结果判断为有差别,犯这类错误的概率[1]。
实际工作中常取A=0.05,表示本次研究计算所得P 值必须小于0.05,才能认为组间差异有统计学意义。
因而本刊对于检验水准的描述多简化为“P值< 0. 05 为有统计学意义”。
统计分析方法的准确描述是科技论文科学性的关键所在。
统计学方法一般包括统计描述和组间差异性检验(即:假设检验) 两部分内容。
现详细叙述如下:2 统计描述统计描述主要是根据资料类型及原始数据分布类型,选择正确的指标描述资料特征。
资料类型分为定量资料和定性资料,前者是指对每个观察对象测得的某个指标能够用具体数据表示,如:年龄、身高、每张切片的阳性细胞百分率等; 后者指对每个观察对象测得的某个指标不能用具体数值表示,仅反映观察对象的某一特征,如: 阳性、阴性,ABO 血型,治愈、显效、好转、无效等。
定量资料如果符合正态分布,统计描述指标可用均数及标准差,一般描述为“数据以均数±标准差表示”; 如果不符合正态分布,则统计描述指标选用中位数和级差(即: 最大值和最小值之差)。
区分资料是正态或偏态分布,可以通过SPSS、SA S 统计软件程序判断,也可以通过目测数据是否有"极端值",即特别大或特别小的数据,进行判断[7]。
定性资料的统计描述包括率、构成比及相对比。
率表示单位时间内某现象或事物发生的概率,如发病率、死亡率等;构成比指事物内部某一部分的个体数与该事物各部分个体数的总和之比,表示各构成部分在全体中所占的比重或分布,不能说明某现象发生的频率或强度,如性别构成、疾病构成、死亡构成等。
二者的区别从以下公式则一目了然。
然而,在实际应用中以构成比代替率很常见。
例如,某文分析240 例耳鼻咽喉科住院患者,鼻窦炎41 例,称发病率17. 08% ,文中“发病率”实际为鼻窦炎患者在该科所有患者中的构成比。
此外,还有将病死率误用为死亡率、患病率误用为发病率等,这些都需引起作者的注意。
某种疾病发病率= 某段时间内发生该疾病的人数/某段时间内可能发生该种疾病的总人数某种疾病构成比= 某段时间内发生该疾病的人数/某段时间内发生各种疾病的总人数3 假设检验科技论文中最常用的是组间差异性检验。
假设检验方法很多,不同的科研设计类型及资料类型适用的检验方法有所不同。
定量资料与定性资料常用的统计分析方法介绍如下。
3.1 定量资料定量资料的统计分析方法包括参数法和非参数法,前者如t检验、方差分析,后者如秩和检验。
选择的关键在于资料分布类型,如果资料符合正态分布且组间方差齐(即各组标准差彼此接近) 则选用参数法,不符合则选用非参数法[8]。
但在许多医学论文中经常忽略这两个条件,不考虑资料的分布直接采用t 检验或方差分析,由此得出的分析结果是不可信的,见例1。
例1 为研究TGF- β、CEA 肿瘤标志在喉癌患者手术前、后有无差异,分别检测了58 名患者前及术后TGF- β和CEA,经配对t 检验,TGF- β术前、后差异有统计学意义,结果见表1。
表1.肿瘤标记物术前术后的检测*组别 TGF- β(μg/l) CEA(μg/l)术前 19.0±26.3 34.0±79.0术后 4.8±7.5* 20.6±11.2与术前比较p 值﹤0.05表中两指标标准差均相差达2 倍以上,提示方差不齐,故不宜采用t 检验,而适合采用秩和检验。
t 检验用于两组均数间的比较,包括两独立样本t 检验、配对t 检验和样本均数与总体均数比较的t 检验;方差分析用于两组或两组以上均数的比较。
然而,在许多医学论文中,对于3 组或3 组以上均数的两两比较,常重复使用独立样本t 检验作比较,如例2。
这样会加大犯阳性错误的概率,即可能将无差别的两个总体均数判断为有差别。
这点尤其需引起作者的注意,这也是医学科技论文中t 检验滥用的重要表现之一。
此类资料正确的分析方法应是先进行方差分析,以确定这几组均数总体差异有无统计学意义;如果有统计学意义,则进一步采用q 检验(任意组间两两比较) 或Dunnett t 检验(每个实验组与对照组比较) 以确定哪些组间差异有统计学意义。
例2 为了解不同分化程度的下咽癌患者VEGFR- 3 表达阳性脉管的数目VEGFR- 3 表达阳性脉管差异,分别检测16 例高分化患者,15 例中分化者及13 例低分化者,作者采用独立样本t检验,结果见表2。
表2 下咽癌组织中VEGFR- 3 表达阳性脉管与病理分级的关系组别例数 VEGFR- 3 表达阳性脉管高分化组 16 14.29±6.50中分化组 15 15.65±5.84低分化组 13 16.16±4.75各组之间p 值﹥0.053.2 定性资料定性资料整理与归纳后,主要分为3 种类型,即四格表资料(只有2 组,且结果变量为2 分类变量,总络子数为4 见表3)、行×列表资料(总格子数> 4,见表4) 和列联表资料(又称双向有序资料,见表5)。
行×列表资料又包括单向有序资料(即等级资料,2 组或2 组以上,结果变量为有序多分类变量,见表6)。
不同资料类型采用的统计分析方法有所不同。
表3 四格表资料格式组别阴性阳性合计实验组 10 29 39对照组 24 11 35合计 34 40 74表4 行×列表资料格式组别阴性阳性合计实验1 组 10 29 39实验2 组 15 19 34对照组 24 11 35合计 49 59 108表5 列联表资料格式N 分期T 分期 N0 N1 N2 N3 合计T1 15 9 4 3 31T2 13 14 9 4 40T3 9 14 6 5 34T4 8 7 7 4 26合计 45 44 26 16 131表6 单向有序资料格式组别无效好转显效治愈合计实验组 3 9 11 19 42对照组 9 5 7 9 30合计 12 14 18 28 72四格表资料χ2 检验医学论文中,四格表资料χ2 检验的应用很常见,但使用时应注意具体的应用条件。
当总例数大于40,且每个格子的理论频数均不小于5 时,应用未校正的χ2检验;如果总例数大于40,有一个格子的理论频数小于5 但大于1,采用校正的χ2 检验; 如果总例数小于40,或有一个格子的理论频数小于1,则采用Fisher 确切概率法。
实际应用中,许多作者不考虑应用的前题条件,均使用未校正的χ2 检验,从而导致结果不可靠。
行×列表资料χ2 检验行×列表资料χ2 检验主要用于多个率或构成比的比较。
但此时要求所有格子中理论频数均大于等于5或1≦T<5 的格子数不超过总格子数的1/5。
如果大于1/5 或T<1时,则相邻格子应删除或合并后再计算。
此时若需了解具体那些率之间差异有统计学意义,就需进行χ2 分割来确定。
单向有序资料此类资料如果是比较组间治疗效果差异有无统计学意义,则应采用秩和检验。
如果采用χ2 检验,仅表明各组的疗效构成差异有无统计学意义,因为此时只利用了每组构成比提供的信息,损失了有序指标提供的“等级”信息。
这也是许多作者误用统计学方法的资料类型之一,需尤其注意。
列联表资料χ2 检验此类资料特征为对同一组观察对象,分别观察其两种有序分类变量的表现,归纳成双向交叉排列的统计表,分析两个分类变量是否有相关联系的假设检验,采用行×列表χ2 检验。
3.3 相关性分析如果需了解两变量有无相关性,或相关程度有多大,此时需作相关分析。
相关分析应报告相关系数及对该相关系数所作的假设检验P 值。
相关系数种类很多,选择时应根据指标类型来确定。
如果是计量指标,则应选择Pearson 相关系数; 如果是等级指标,则应选择Spearman 相关系数。
3.4 结论的表述首先要明确“P 值< 0.05”,习惯上称“显著”(significant) ,仅说明两组差异有统计学意义,并不能说明两组该指标相差很大,或在专业上有显著的(重要的)价值; 反之,P 值>0.05,习惯上称“不显著”(non significant) ,不应误解为相差不大,或一定相等,仅说明从统计角度考虑这两组差异无统计学意义[9]。
为了不与一般意义上的“显著”、“不显著”相混淆,许多统计学家主张作结论时不用“是否显著”一词,而用“差异有无统计学意义”。
此外,根据统计结果得出专业结论不能太绝对化,因为统计结论均是概率性的,不是绝对的肯定或否定,本次研究统计结果是阴性,如果增加样本含量,组间差异可能就有统计学意义了。
综上所述,不同的统计分析方法均有其应用条件和适用范围,实际应用时,必须根据科研设计类型及变量类型选择恰当的统计分析方法,同时注意检查结果解释和专业结论是否同时满足专业和统计学要求。
切忌将t 检验、χ2 检验视为分析资料的“万能工具”,盲目套用,导致文章的科学性降低。