统计学方法的正确抉择

合集下载

医学研究中统计学方法抉择

医学研究中统计学方法抉择

医学研究中统计学方法抉择医学研究中,统计学方法的选择对于研究结果的准确性和可靠性至关重要。

在医学研究中,统计学方法可以帮助研究者对数据进行分析和解释,从而使得研究结论更具说服力和可信度。

统计学方法的选择要根据研究设计、数据类型和研究问题的特点来决定。

本文将从几个方面介绍医学研究中的统计学方法的抉择。

首先,研究设计是决定统计学方法选择的关键因素之一、在医学研究中常见的研究设计包括观察研究和实验研究。

观察研究是通过观察已经发生的现象来推测其原因与结果之间的关系,而实验研究则是通过人为干预来观察其对结果的影响。

在观察研究中,常用的统计学方法包括相关分析和回归分析。

相关分析可以用来研究两个变量之间的关系,而回归分析可以用来预测一个变量对另一个变量的影响。

在实验研究中,常用的统计学方法包括方差分析和t检验。

方差分析可以用来比较多个组之间的差异,而t检验可以用来比较两个组之间的差异。

其次,数据类型也是决定统计学方法选择的重要因素之一、医学研究中的数据类型可以分为定量数据和定性数据。

定量数据是用数字表示的数据,可以进行数值计算和统计分析,如血压、体重等。

统计学方法选择包括描述统计和推断统计。

描述统计是用来描述和总结数据的方法,包括平均数、标准差、频率等指标。

推断统计是用来推断总体参数的方法,包括抽样分布、置信区间和假设检验等。

定性数据是用描述性词语表示的数据,通常不能进行数值计算和统计分析,如性别、疾病类型等。

对于定性数据的分析,常用的统计学方法包括卡方检验和Fisher精确检验。

最后,研究问题的特点也会影响统计学方法的选择。

在医学研究中,常见的研究问题包括比较两个或多个组之间的差异、关联性研究、预测模型建立等。

对于比较两个或多个组之间的差异的问题,可以使用方差分析、t检验、非参数检验等统计学方法。

对于关联性研究的问题,可以使用相关分析、回归分析等统计学方法。

对于预测模型建立的问题,可以使用Logistic回归、Cox回归等统计学方法。

统计学方法的分类和选择

统计学方法的分类和选择

统计学方法的分类和选择一、描述统计方法描述统计方法用于总结和概括数据的定量和定性特征,主要包括以下几种方法:1.频数统计:对数据进行分类,计算各类别的频数或频率。

2.平均数和标准差:计算数据的平均值和离均差的度量,用于描述数据的集中趋势和分散程度。

3.分位数和百分位数:计算数据按大小排序后的位置,用于描述数据的位置和分布。

4.统计图表:如直方图、饼图、散点图等,用于直观地展示数据的分布和关系。

二、推断统计方法推断统计方法用于从样本数据中推断总体的特征和进行假设检验,主要包括以下几种方法:1.参数估计:根据样本数据估计总体的参数,包括点估计和区间估计。

2.假设检验:根据样本数据判断总体参数的假设,包括一般假设检验和相关性检验。

3.方差分析:用于比较多个总体的均值是否有显著差异。

4.回归分析:建立变量之间的数学模型,用于预测因变量。

5.方差分析:用于比较多个总体的均值是否有显著差异。

三、统计学方法的选择选择适当的统计学方法应考虑以下几个方面:1.数据类型:根据数据的类型(定量或定性)选择合适的描述统计和推断统计方法。

2.研究目的:根据研究的目的和问题选择合适的统计学方法。

如果是描述总体特征,可以使用描述统计方法;如果需要推断总体特征或进行假设检验,则需要使用推断统计方法。

3.样本容量:样本容量的大小会影响统计学方法的选择。

当样本容量较大时,可以使用参数估计和假设检验方法;当样本容量较小时,可以使用非参数统计方法。

4.数据分布:数据的分布特征对统计学方法的选择也有影响。

当数据服从正态分布时,可以使用参数统计方法;当数据不服从正态分布时,可以使用非参数统计方法。

5.数据关系:如果数据之间存在关联或依赖关系,可以使用回归分析等方法来研究变量之间的影响。

总之,统计学方法的分类和选择应考虑数据的类型、研究目的、样本容量、数据分布和数据关系等因素。

选用合适的统计学方法能够提供准确的分析结果和科学的结论,从而对问题的解决和决策的制定有着重要的意义。

临床科研中正确抉择统计学方法

临床科研中正确抉择统计学方法
–在作出结论时,要避免使用绝对的或肯定的
语句
–当p≤ α时,只要p≠0,我们无法完全拒绝
无差别的假设,即不能肯定各总体间有差别
–当p> α时,只要p≠1,我们无法完全接受
无差别的假设,即不能肯定各总体间无差别

两组与多组比较
1. 两组比较:t检验、u检验、两组秩和检验、
四格表和较正四格表的X2检验等

表1 四格表的排列
金标准(诊断标准)
合计 有病 + 诊断性 试验 _ 合计 真阳性a 假阴性c a+c 无病 假阳性b 真阴性d b+d a+b a+c n




敏感度(sensitivity,SN)是正确诊断的真阳性病例在中风组中所占的百 分率,计算公式为:SN = a/(a+c)100% 特异度(specificity,SP) 是正确诊断的真阴性部分所占百分率,计算公 式为:SP = d/(b+d)100% 准确性 (accuracy,AC) 反映了诊断试验结果与金标准试验结果的符合 或一致程度,计算公式为:AC = (a+d)/N 阳性预测值(positive predictive value,PPV)是诊断试验为阳性结果中金 标 准 证 实 患 中 风 者 所 占 的 百 分 率 , 计 算 公 式 为 : PPV = a/(a+b)100% 阴性预测值(negative predictive value,NPV)是诊断试验为阴性结果中金 标准证实未患中风者所占的百分率,计算公式为:NPV = d/(c+d) 100% . 阳性似然比(positive likelihood ratio, LR+)为患中风组真阳性率和未患 中风组假阳性率的比值,计算公式为:LR+ =SN/(1-SP) ,表明诊断 性试验为阳性时患病于不患病的比值,比值越大则患病的概率越大. 阴性似然比(negative likelihood ratio, LR-)为患中风组假阴性率与未患 中风真阴性率的比值,计算公式为:LR- =(1-SN)/SP,表明诊断试验 为阴性时,患病与不患病时机会的比值.

临床统计分析第一讲_统计方法抉择

临床统计分析第一讲_统计方法抉择
特别是当出现阴性结果时,更应该注意, 因为可能有II型错误的存在,阴性结果可 能又包括两类:确实无统计学意义;或 者出现假阴性。 应重点考察样本含量及检验效能。
检测项目 患者组(32)
LAT-EF 57.2±13.3
INF-EF 76.8±15.2
SEPTAL-EF 37.4±12.6
ESV
29.3±8.5
需做而未做统计分析 统计分析方法不清,或未标明 应用条件不满足 错误选用统计方法: 结果解释不合理: 论文写作方面:结果表达不完整、不清楚。
(一)、统计方法选择不符合分析目的
2、重要性评价: 综合临床意义与统计学意义
临 床 意 义
统 计 学 意 义
ab
c
d
临床效应量
3、评价统计结果的适用性
• 统计分析结果实际上是基于个体的平均水平。 •将平均水平结果应用到个体水平,忌生搬硬套。
七、临床研究中常见统计问题
临床研究与统计方法的有机结合,两者 不能相互脱节。
公开发表论文中常见的统计学问题:
样本含量的估算需要得到以下信息:以 病死率为例:
– I型错误率:0.05 – II型错误率:0.1—0.2 –新方法达到的最小效应量:1%,5% –传统基线病死率:
根据课题设计方案和研究的主要内容, 实际上可简化为两组:传统手术组与微 创手术组,因此选用公式:
–其中:为I型错误率 为II型错误率 –p1为传统手术的病死率=25%; p2为微创手
实例 两组患者头孢唑啉钠药物动力学参数比较
组别 老年组(n=7)
(h-1) 0.62130.1177
k10(h-1) 0.28560.0427
60岁以下组(n=5)3.55053.5553 0.82573.5329

统计学方法的正确抉择

统计学方法的正确抉择

统计学方法的正确抉择一.统计方法抉择的条件在临床科研工作中,正确地抉择统计分析方法,应充分考虑科研工作者的分析目的、临床科研设计方法、搜集到的数据资料类型、数据资料的分布特征与所涉及的数理统计条件等。

其中任何一个问题没考虑到或考虑有误,都有可能导致统计分析方法的抉择失误。

此外,统计分析方法的抉择应在科研的设计阶段来完成,而不应该在临床试验结束或在数据的收集工作已完成之后。

对临床科研数据进行统计分析和进行统计方法抉择时,应考虑下列因素:1.分析目的对于临床医生及临床流行病医生来说,在进行统计分析前,一定要明确利用统计方法达到研究者的什么目的。

一般来说,统计方法可分为描述与推断两类方法。

一是统计描述(descriptive statistics),二是统计推断(inferential statistics)。

统计描述,即利用统计指标、统计图或统计表,对数据资料所进行的最基本的统计分析,使其能反映数据资料的基本特征,有利于研究者能准确、全面地了解数据资料所包涵的信息,以便做出科学的推断。

统计表,如频数表、四格表、列联表等;统计图,如直方图、饼图,散点图等;统计指标,如均数、标准差、率及构成比等。

统计推断,即利用样本所提供的信息对总体进行推断(估计或比较),其中包括参数估计和假设检验,如可信区间、t检验、方差分析、 2检验等,如要分析甲药治疗与乙药治疗两组的疗效是否不相同、不同地区某病的患病率有无差异等。

还有些统计方法,既包含了统计描述也包含了统计推断的内容,如不同变量间的关系分析。

相关分析,可用于研究某些因素间的相互联系,以相关系数来衡量各因素间相关的密切程度和方向,如高血脂与冠心病、慢性宫颈炎与宫颈癌等的相关分析;回归分析,可用于研究某个因素与另一因素(变量)的依存关系,即以一个变量去推测另一变量,如利用回归分析建立起来的回归方程,可由儿童的年龄推算其体重。

2.资料类型资料类型的划分现多采用国际通用的分类方法,将其分为两类:数值变量(numerical variable)资料和分类变量(categorical variable)资料。

统计方法选择

统计方法选择

统计方法选择统计方法选择选择一个恰当的统计方法,是解决问题的第一步,也是最重要的一步。

选对方向往往比走得快要重要下面是爱汇网店铺给大家整理的统计方法选择,供大家参阅!统计方法的选择编统计资料丰富且错综复杂,要想做到合理选用统计分析方法并非易事。

对于同一个资料,若选择不同的统计分析方法处理,有时其结论是截然不同的。

正确选择统计方法的依据是:①根据研究的目的,明确研究试验设计类型、研究因素与水平数;②确定数据特征(是否正态分布等)和样本量大小;③ 正确判断统计资料所对应的类型(计量、计数和等级资料),同时应根据统计方法的适宜条件进行正确的统计量值计算;最后,还要根据专业知识与资料的实际情况,结合统计学原则,灵活地选择统计分析方法。

1 计量资料的统计方法分析计量资料的统计分析方法可分为参数检验法和非参数检验法。

参数检验法主要为t检验和方差分析(ANOVN,即F检验)等,两组间均数比较时常用t检验和u检验,两组以上均数比较时常用方差分析;非参数检验法主要包括秩和检验等。

t检验可分为单组设计资料的.t 检验、配对设计资料的t检验和成组设计资料的t检验;当两个小样本比较时要求两总体分布为正态分布且方差齐性,若不能满足以上要求,宜用t 检验或非参数方法(秩和检验)。

方差分析可用于两个以上样本均数的比较,应用该方法时,要求各个样本是相互独立的随机样本,各样本来自正态总体且各处理组总体方差齐性。

根据设计类型不同,方差分析中又包含了多种不同的方法。

对于定量资料,应根据所采用的设计类型、资料所具备的条件和分析目的,选用合适的统计分析方法,不应盲目套用t检验和单因素方差分析。

2 计数资料的统计方法计数资料的统计方法主要针对四格表和R×C表利用检验进行分析。

四格表资料:组间比较用检验或u检验,若不能满足检验:当计数资料呈配对设计时,获得的四格表为配对四格表,其用到的检验公式和校正公式可参考书籍。

R×C表可以分为双向无序,单向有序、双向有序属性相同和双向有序属性不同四类,不同类的行列表根据其研究目的,其选择的方法也不一样,具体见表1。

如何选择合适的统计分析方法

如何选择合适的统计分析方法

如何选择合适的统计分析方法一、引言统计分析方法在各个领域中起着重要的作用,它可以帮助我们从大量的数据中找到规律和趋势。

然而,在面对众多的统计分析方法时,选择合适的方法变得尤为重要。

本文将介绍如何选择合适的统计分析方法,希望对读者在实际应用中起到一定的指导作用。

二、数据类型与研究目的在选择合适的统计分析方法之前,首先需要明确数据类型和研究目的。

通常,我们可以将数据类型分为定量数据和定性数据。

定量数据是指可用数字表示的数据,例如身高、体重等;定性数据是指描述性质的数据,例如性别、学历等。

在明确数据类型后,我们需要了解研究目的。

研究目的可以是刻画样本特征、比较不同样本或者探究因果关系等。

对于不同的研究目的,可能需要使用不同的统计分析方法。

三、描述性统计分析描述性统计分析是对数据特征进行概括和描述的方法,它可以帮助我们了解数据的分布、中心趋势和离散程度等。

常用的描述性统计分析方法包括频数分析、平均数、标准差、百分位数等。

对于定量数据,可以使用平均数和标准差来描述中心趋势和离散程度。

而对于定性数据,可以使用频数分析来描述样本中各类别的频率。

通过描述性统计分析,我们可以初步了解数据的特征,并为后续的分析提供参考。

四、推论统计分析推论统计分析是根据样本数据进行推断,以了解总体特征的方法。

推论统计分析主要涉及到参数估计和假设检验。

参数估计是使用样本数据对总体参数进行估计的方法。

根据数据类型的不同,可以使用不同的参数估计方法,例如若总体服从正态分布,可以使用样本均值和标准差进行参数估计。

通过参数估计,我们可以估计得到总体中的某个参数的取值范围。

假设检验是用来考察样本数据对于某个特定假设的支持程度的方法。

在假设检验中,我们需要制定原假设和备择假设,并使用统计检验方法来判断样本数据是否支持原假设。

假设检验的结果可以帮助我们做出科学的决策。

五、相关性分析在实际研究中,我们常常需要了解变量之间的相关性。

相关性分析可以帮助我们判断变量之间的线性关系强度和方向。

如何正确选择统计方法

如何正确选择统计方法

如何正确选择统计方法选择正确的统计方法对于进行准确的数据分析是至关重要的。

统计方法是根据所需数据的类型和实验设计来选择的,能够帮助我们回答研究问题,并得出有意义的结论。

本文将介绍如何正确选择统计方法。

首先,确定研究问题。

在选择统计方法之前,我们需要明确自己研究的问题是什么。

例如,我们是想了解两组数据之间的差异还是寻找数据之间的关联性。

基于问题的不同,我们可以选择不同的统计方法。

其次,了解数据类型。

了解数据的类型对于选择统计方法至关重要。

数据可以分为连续型和离散型两种类型。

连续型数据可以是像温度和身高这样的测量值,而离散型数据可以是像性别和是否患有其中一种疾病这样的分类变量。

对于连续型数据,我们通常会使用t检验、方差分析和回归分析等方法;对于离散型数据,我们可以使用卡方检验和逻辑回归等方法。

然后,分析样本大小。

样本大小是选择统计方法的重要考虑因素之一、当样本大小较小时,我们可能需要使用非参数方法,如 Mann-Whitney U检验和 Wilcoxon 符号秩和检验。

这些方法不要求样本满足正态分布假设。

当样本大小较大时,我们可以使用正态分布相关的参数方法,如 t 检验和方差分析。

在样本较大的情况下,参数方法通常比非参数方法更准确。

接下来,确定实验设计。

实验设计也是选择统计方法的一个重要因素。

常见的实验设计包括配对设计和独立设计。

对于配对设计,我们可以使用配对 t 检验或 McNemar 检验等方法;对于独立设计,我们可以使用独立样本 t 检验或卡方检验等方法。

此外,了解数据分布特征也是选择统计方法的关键。

如果我们的数据满足正态分布,我们可以使用参数方法,如 t 检验和方差分析。

如果数据不满足正态分布,我们可以使用非参数方法,如 Mann-Whitney U 检验和 Kruskal-Wallis 检验。

最后,借助统计软件进行分析。

在选择了合适的统计方法后,我们需要借助统计软件进行数据分析。

常见的统计软件如 SPSS、R 和 Python 等都具有丰富的功能和方法,能够帮助我们进行数据统计和分析。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计学方法的正确抉择一.统计方法抉择的条件在临床科研工作中,正确地抉择统计分析方法,应充分考虑科研工作者的分析目的、临床科研设计方法、搜集到的数据资料类型、数据资料的分布特征与所涉及的数理统计条件等。

其中任何一个问题没考虑到或考虑有误,都有可能导致统计分析方法的抉择失误。

此外,统计分析方法的抉择应在科研的设计阶段来完成,而不应该在临床试验结束或在数据的收集工作已完成之后。

对临床科研数据进行统计分析和进行统计方法抉择时,应考虑下列因素:1.分析目的对于临床医生及临床流行病医生来说,在进行统计分析前,一定要明确利用统计方法达到研究者的什么目的。

一般来说,统计方法可分为描述与推断两类方法。

一是统计描述(descriptive statistics),二是统计推断(inferential statistics)。

统计描述,即利用统计指标、统计图或统计表,对数据资料所进行的最基本的统计分析,使其能反映数据资料的基本特征,有利于研究者能准确、全面地了解数据资料所包涵的信息,以便做出科学的推断。

统计表,如频数表、四格表、列联表等;统计图,如直方图、饼图,散点图等;统计指标,如均数、标准差、率及构成比等。

统计推断,即利用样本所提供的信息对总体进行推断(估计或比较),其中包括参数估计和假设检验,如可信区间、t检验、方差分析、 2检验等,如要分析甲药治疗与乙药治疗两组的疗效是否不相同、不同地区某病的患病率有无差异等。

还有些统计方法,既包含了统计描述也包含了统计推断的内容,如不同变量间的关系分析。

相关分析,可用于研究某些因素间的相互联系,以相关系数来衡量各因素间相关的密切程度和方向,如高血脂与冠心病、慢性宫颈炎与宫颈癌等的相关分析;回归分析,可用于研究某个因素与另一因素(变量)的依存关系,即以一个变量去推测另一变量,如利用回归分析建立起来的回归方程,可由儿童的年龄推算其体重。

2.资料类型资料类型的划分现多采用国际通用的分类方法,将其分为两类:数值变量(numerical variable)资料和分类变量(categorical variable)资料。

数值变量是指其值是可以定量或准确测量的变量,其表现为数值大小的不同;而分类变量是指其值是无法定量或不能测量的变量,其表现没有数值的大小而只有互不相容的类别或属性。

分类变量又可分为无序分类变量和有序分类变量两小类,无序分类变量表现为没有大小之分的属性或类别,如:性别是两类无序分类变量,血型是四类无序分类变量;有序分类变量表现为各属性或类别间有程度之分,如:临床上某种疾病的“轻、中、重”,治疗结果的“无效、显效、好转、治愈”。

由此可见,数值变量资料、无序分类变量资料和有序分类变量资料又可叫做计量资料、计数资料和等级资料。

资料类型的划分与统计方法的抉择有关,在多数情况下不同的资料类型,选择的统计方法不一样。

如数值变量资料的比较可选用t检验、u检验等统计方法;而率的比较多用 2检验。

值得注意的是,有些临床科研工作者,常常人为地将数值变量的结果转化为分类变量的临床指标,然后参与统计分析,如患者的血红蛋白含量,研究者常用正常、轻度贫血、中度贫血和重度贫血来表示,这样虽然照顾了临床工作的习惯,却损失了资料所提供的信息量。

换言之,在多数情况下,数值变量资料提供的信息量最为充分,可进行统计分析的手段也较为丰富、经典和可靠,与之相比,分类变量在这些方面都不如数值变量资料。

因此,在临床实验中要尽可能选择量化的指标反映实验效应,若确实无法定量时,才选用分类数据,通常不宜将定量数据转变成分类数据。

3.设计方法在众多的临床科研设计方法中,每一种设计方法都有与之相适应的统计方法。

在统计方法的抉择时,必须根据不同的临床科研设计方法来选择相应的统计分析方法。

如果统计方法的抉择与设计方法不一致,统计分析得到的任何结论都是错误的。

在常用的科研设计方法中,有成组设计(完全随机设计)的t检验、配对t检验、成组设计(完全随机设计)的方差分析、配伍设计(随机区组设计)的方差分析等,都是统计方法与科研设计方法有关的佐证。

因此,应注意区分成组设计(完全随机设计)与配对和配伍设计(随机区组设计),在成组设计中又要注意区别两组与多组设计。

最常见的错误是将配对或配伍设计(随机区组设计)的资料当做成组设计(完全随机设计)来处理,如配对设计的资料使用成组t检验、配伍设计(随机区组设计)使用成组资料的方差分析;或将三组及三组以上的成组设计(完全随机设计)资料的比较采用多个t检验、三个或多个率的比较采用四格表的卡方检验来进行比较,都是典型的错误。

如下表:表1 常见与设计方法有关的统计方法抉择错误设计方法错误的统计方法正确统计方法两个均数的比较(成组设计、完全随机设计)成组设计的t检验、成组设计的秩和检验多个均数的比较(成组设计、完全随机设计)多个成组设计的t检验完全随机设计的方差分析及q检验、完全随机设计的秩和检验及两两比较数值变量的配对设计成组设计的t检验配对t检验、配对秩和检验随机区组设计(配伍设计)多个成组设计的t检验、完全随机设计的方差分析随机区组设计的方差分析及q 检验、随机区组设计的秩和检验及两两比较交叉设计成组设计的t检验、配对t检验、配对秩和检验交叉设计的方差分析、交叉设计的秩和检验4.分布特征及数理统计条件数理统计和概率论是统计的理论基础。

每种统计方法都要涉及数理统计公式,而这些数理统计公式都是在一定条件下推导和建立的。

也就是说,只有当某个或某些条件满足时,某个数理统计公式才成立,反之若不满足条件时,就不能使用某个数理统计公式。

在数理统计公式推导和建立的条件中,涉及最多的是数据的分布特征。

数据的分布特征是指数据的数理统计规律,许多数理统计公式都是在特定的分布下推导和建立的。

若实际资料服从(符合)某种分布,即可使用该分布所具有的数理统计规律来分析和处理该实际资料,反之则不能。

在临床资料的统计分析过程中,涉及得最多的分布有正态分布、偏态分布、二项分布等。

许多统计方法对资料的分布有要求,如:均数和标准差、t和u检验;方差分析都要求资料服从正态分布,而中位数和四分位数间距、秩和检验等,可用于不服从正态分布的资料。

所以,临床资料的统计分析过程中,应考虑资料的分布特征,最起码的要求是熟悉正态分布与偏态分布。

例如:在临床科研中,许多资料的描述不考虑资料的分布特征,而多选择均数与标准差。

如某妇科肿瘤化疗前的血象值,资料如下表:某妇科肿瘤化疗前的血象值指标名例数均数标准差偏度系数 P值峰度系数P值血红蛋白(g/L) 98 111.99 18.82 0.180 0.459 0.025 0.958 血小板(×109/L) 98 173.58 87.11 1.353 0.000 1.843 0.000 白细胞(×109/L) 98 6.7930 2.767 1.207 0.000 1.202 0.013从上结果可见,若只看三项指标的均数和标准差,临床医生也许不会怀疑有什么问题。

但是经正态性检验,病人的血红蛋白服从正态分布,而血小板和白细胞两项指标的偏度和峰度系数均不服从正态分布(P<0.05)。

因此,描述病人的血小板和白细胞平均水平正确的指标是中位数,而其变异程度应使用四分位数间距。

除了数据的分布特征外,有些数理统计公式还有其它一些的条件,如t检验和方差分析的方差齐性、卡方检验的理论数(T)大小等。

总之,对于临床科研工作者来说,为正确地进行统计方法的抉择,首先要掌握或熟悉上述影响统计方法抉择因素;其次,还应熟悉和了解常用统计方法的应用条件。

二.数据资料的描述统计描述的内容包括了统计指标、统计图和表,其目的是使数据资料的基本特征更加清晰地表达。

本节只讨论统计指标的正确选用,而统计图表的正确使用请参阅其他书籍。

1.数值变量资料的描述描述数值变量资料的基本特征有两类指标,一是描述集中趋势的指标,用以反映一组数据的平均水平;二是描述离散程度的指标,用以反映一组数据的变异大小。

各指标的名称及适用范围等见表2。

表2 描述数值变量资料的常用指标指标名称用途适用的资料均数(X-)描述一组数据的平均水平,集中位置正态分布或近似正态分布中位数(M)与均数相同偏态分布、分布未知、两端无界几何均数(G)与均数相同对数正态分布,等比资料标准差(S)描述一组数据的变异大小,离散程度正态分布或近似正态分布四分位数间距(Q U-Q L)与标准差相同偏态分布、分布未知、两端无界极差(R)与标准差相同观察例数相近的数值变量变异系数(CV)与标准差相同比较几组资料间的变异大小从表中可看出,均数与标准差联合使用描述正态分布或近似正态分布资料的基本特征;中位数与四分位数间距联合使用描述偏态分布或未知分布资料的基本特征。

这些描述指标应用时,最常见的错误是不考虑其应用条件的随意使用,如:用均数和标准差描述偏态分布、分布未知或两端无界的资料,这是目前在临床研究文献中较为普遍和典型的错误。

2.分类变量资料的描述描述分类变量资料常用的指标有死亡率、患病率、发病率等。

临床上,这类指标的应用较多,出现的错误也较多。

这些错误归纳起来大致有两类:一是以比代率,即误将构成比(proportion)当做率(rate)来描述某病发生的强度和频率,如用某病的病人数除以就诊人数(或人次)得到“某病患病率”或“某病发病率”,就是典型的以比代率的例子。

二是把各种不同的率相互混淆,如把患病率与发病率、死亡率与病死率等概念混同。

需要指出的是,单纯利用医院常规资料,最易得到的指标是构成比。

而描述疾病发生强度和频率的指标的率反映如患病率、发病率、死亡率等,很难利用医院的常规资料(如医院医院的病例档案)获得。

因为,医院常规资料无法得到计算这些率所需的分子和分母的资料。

所以,一旦研究者利用的是医院常规资料,则无法衡量疾病对人群的危害程度。

常用描述指标如表3。

表3 描述分类变量资料的常用指标指标名称计算公式意义率发生某现象的观察单位数可能发生某现象的观察单位总数×K 描述事件发生的强度和频率构成比AA+B+…×100% 事物内部各组成部分所占的比重相对比 ABA指标为B指标的若干倍或百分之几三.数据资料的比较在众多的科研研究方法中,归纳起来最基本的手段有两种,一是对研究对象的全体进行研究,在实际工作中往往难以实现;二是从总体中抽取一定数量的样本进行抽样研究,但要考虑抽样误差对结果的影响。

因此,若用样本信息去推断其所代表的总体间有无差别时,需要使用假设检验(hypothesis testing)或称显著性检验(significance test)。

1.假设检验的基本步骤(1)建立检验假设。

建立假设的过程应有三个内容。

即无效假设H0 (null hypothesis)、备择假设H1 (alternative hypothesis)和检验水准α (size of test)。

相关文档
最新文档