统计学方法的正确抉择

统计学方法的正确抉择
统计学方法的正确抉择

统计学方法的正确抉择

一.统计方法抉择的条件

在临床科研工作中,正确地抉择统计分析方法,应充分考虑科研工作者的分析目的、临床科研设计方法、搜集到的数据资料类型、数据资料的分布特征与所涉及的数理统计条件等。其中任何一个问题没考虑到或考虑有误,都有可能导致统计分析方法的抉择失误。

此外,统计分析方法的抉择应在科研的设计阶段来完成,而不应该在临床试验结束或在数据的收集工作已完成之后。

对临床科研数据进行统计分析和进行统计方法抉择时,应考虑下列因素:

1.分析目的

对于临床医生及临床流行病医生来说,在进行统计分析前,一定要明确利用统计方法达到研究者的什么目的。一般来说,统计方法可分为描述与推断两类方法。一是统计描述(descriptive statistics),二是统计推断(inferential statistics)。

统计描述,即利用统计指标、统计图或统计表,对数据资料所进行的最基本的统计分析,使其能反映数据资料的基本特征,有利于研究者能准确、全面地了解数据资料所包涵的信息,以便做出科学的推断。统计表,如频数表、四格表、列联表等;统计图,如直方图、饼图,散点图等;统计指标,如均数、标准差、率及构成比等。

统计推断,即利用样本所提供的信息对总体进行推断(估计或比较),其中包括参数估计和假设检验,如可信区间、t检验、方差分析、 2检验等,如要分析甲药治疗与乙药治疗两组的疗效是否不相同、不同地区某病的患病率有无差异等。

还有些统计方法,既包含了统计描述也包含了统计推断的内容,如不同变量间的关系分析。相关分析,可用于研究某些因素间的相互联系,以相关系数来衡量各因素间相关的密切程度和方向,如高血脂与冠心病、慢性宫颈炎与宫颈癌等的相关分析;回归分析,可用于研究某个因素与另一因素(变量)的依存关系,即以一个变量去推测另一变量,如利用回归分析建立起来的回归方程,可由儿童的年龄推算其体重。

2.资料类型

资料类型的划分现多采用国际通用的分类方法,将其分为两类:数值变量(numerical variable)资料和分类变量(categorical variable)资料。数值变量是指其值是可以定量或准确测量的变量,其表现为数值大小的不同;而分类变量是指其值是无法定量或不能测量的变量,其表现没有数值的大小而只有互不相容的类别或属性。分类变量又可分为无序分类变量和有序分类变量两小类,无序分类变量表现为没有大小之分的属性或类别,如:性别是两类无序分类变量,血型是四类无序分类变量;有序分类变量表现为各属性或类别间有程度之分,如:临床上某种疾病的“轻、中、重”,治疗结果的“无效、显效、好转、治愈”。由此可见,数值变量资料、无序分类变量资料和有序分类变量资料又可叫做计量资料、计数资料和等级资料。

资料类型的划分与统计方法的抉择有关,在多数情况下不同的资料类型,选择的统计方法不一样。如数值变量资料的比较可选用t检验、u检验等统计方法;而率的比较多用 2检验。

值得注意的是,有些临床科研工作者,常常人为地将数值变量的结果转化为分类变量的临床指标,然后参与统计分析,如患者的血红蛋白含量,研究者常用正常、轻度贫血、中度贫血和重度贫血来表示,这样虽然照顾了临床工作的习惯,却损失了资料所提供的信息量。换言之,在多数情况下,数值变量资料提供的信息量最为充分,可进行统计分析的手段也较为丰富、经典和可靠,与之相比,分类变量在这些方面都不如数值变量资料。因此,在临床实验中要尽可能选择量化的指标反映实验效应,若确实无法定量时,才选用分类数据,通常不宜将定量数据转变成分类数据。

3.设计方法

在众多的临床科研设计方法中,每一种设计方法都有与之相适应的统计方法。在统计方法的抉择时,必须根据不同的临床科研设计方法来选择相应的统计分析方法。如果统计方法的抉择与设计方法不一致,统计分析得到的任何结论都是错误的。

在常用的科研设计方法中,有成组设计(完全随机设计)的t检验、配对t检验、成组设计(完全随机设计)的方差分析、配伍设计(随机区组设计)的方差分析等,都是统计方法与科研设计方法有关的佐证。因此,应注意区分成组设计(完全随机设计)与配对和配伍设计(随机区组设计),在成组设计中又要注意区别两组与多组设计。最常见的错误是将配对或配伍设计(随机区组设计)的资料当做成组设计(完全随机设计)来处理,如配对设计的资料使用成组t检验、配伍设计(随机区组设计)使用成组资料的方差分析;或将三组及三组以上的成组设计(完全随机设计)资料的比较采用多个t检验、三个或多个率的比较采用四格表的卡方检验来进行比较,都是典型的错误。如下表:

表1 常见与设计方法有关的统计方法抉择错误

设计方法错误的统计方法正确统计方法

两个均数的比较(成组设计、完全随机设计)成组设计的t检验、成组设计的秩和检验

多个均数的比较(成组设计、完全随机设计)多个成组设计的t检验完全随机设计的方差分析及q

检验、完全随机设计的秩和检

验及两两比较

数值变量的配对设计成组设计的t检验配对t检验、配对秩和检验

随机区组设计(配伍设计)多个成组设计的t检验、

完全随机设计的方差分

析随机区组设计的方差分析及q 检验、随机区组设计的秩和检验及两两比较

交叉设计成组设计的t检验、配对

t检验、配对秩和检验

交叉设计的方差分析、交叉设

4.分布特征及数理统计条件

数理统计和概率论是统计的理论基础。每种统计方法都要涉及数理统计公式,而这些数理统计公式都是在一定条件下推导和建立的。也就是说,只有当某个或某些条件满足时,某个数理统计公式才成立,反之若不满足条件时,就不能使用某个数理统计公式。

在数理统计公式推导和建立的条件中,涉及最多的是数据的分布特征。数据的分布特征是指数据的数理统计规律,许多数理统计公式都是在特定的分布下推导和建立的。若实际资料服从(符合)某种分布,即可使用该分布所具有的数理统计规律来分析和处理该实际资料,反之则不能。在临床资料的统计分析过程中,涉及得最多的分布有正态分布、偏态分布、二项分布等。

许多统计方法对资料的分布有要求,如:均数和标准差、t和u检验;方差分析都要求资料服从正态分布,而中位数和四分位数间距、秩和检验等,可用于不服从正态分布的资料。所以,临床资料的统计分析过程中,应考虑资料的分布特征,最起码的要求是熟悉正态分布与偏态分布。

例如:在临床科研中,许多资料的描述不考虑资料的分布特征,而多选择均数与标准差。如某妇科肿瘤化疗前的血象值,资料如下表:

某妇科肿瘤化疗前的血象值

血红蛋白(g/L) 98 111.99 18.82 0.180 0.459 0.025 0.958 血小板(×109/L) 98 173.58 87.11 1.353 0.000 1.843 0.000 白细胞(×109/L) 98 6.7930 2.767 1.207 0.000 1.202 0.013

从上结果可见,若只看三项指标的均数和标准差,临床医生也许不会怀疑有什么问题。但是经正态性检验,病人的血红蛋白服从正态分布,而血小板和白细胞两项指标的偏度和峰度系数均不服从正态分布(P<0.05)。因此,描述病人的血小板和白细胞平均水平正确的指标是中位数,而其变异程度应使用四分位数间距。

除了数据的分布特征外,有些数理统计公式还有其它一些的条件,如t检验和方差分析的方差齐性、卡方检验的理论数(T)大小等。

总之,对于临床科研工作者来说,为正确地进行统计方法的抉择,首先要掌握或熟悉上述影响统计方法抉择因素;其次,还应熟悉和了解常用统计方法的应用条件。

二.数据资料的描述

统计描述的内容包括了统计指标、统计图和表,其目的是使数据资料的基本特征更加清晰地表达。本节只讨论统计指标的正确选用,而统计图表的正确使用请参阅其他书籍。

1.数值变量资料的描述

描述数值变量资料的基本特征有两类指标,一是描述集中趋势的指标,用以反映一组数据的平均水平;二是描述离散程度的指标,用以反映一组数据的变异大小。各指标的名称及适用范围等见表2。

表2 描述数值变量资料的常用指标

指标名称用途适用的资料

均数(X-)描述一组数据的平均水平,集中位置正态分布或近似正态分布

中位数(M)与均数相同偏态分布、分布未知、两端无界几何均数(G)与均数相同对数正态分布,等比资料

标准差(S)描述一组数据的变异大小,离散程度正态分布或近似正态分布

四分位数间距

(Q U-Q L)

与标准差相同偏态分布、分布未知、两端无界极差(R)与标准差相同观察例数相近的数值变量

变异系数(CV)与标准差相同比较几组资料间的变异大小从表中可看出,均数与标准差联合使用描述正态分布或近似正态分布资料的基本特征;中位数与四分位数间距联合使用描述偏态分布或未知分布资料的基本特征。

这些描述指标应用时,最常见的错误是不考虑其应用条件的随意使用,如:用均数和标准差描述偏态分布、分布未知或两端无界的资料,这是目前在临床研究文献中较为普遍和典型的错误。

2.分类变量资料的描述

描述分类变量资料常用的指标有死亡率、患病率、发病率等。

临床上,这类指标的应用较多,出现的错误也较多。这些错误归纳起来大致有两类:一是以比代率,即误将构成比(proportion)当做率(rate)来描述某病发生的强度和频率,如用某病的病人数除以就诊人数(或人次)得到“某病患病率”或“某病发病率”,就是典型的以比代率的例子。二是把各种不同的率相互混淆,如把患病率与发病率、死亡率与病死率等概念混同。

需要指出的是,单纯利用医院常规资料,最易得到的指标是构成比。而描述疾病发生强度和频率的指标的率反映如患病率、发病率、死亡率等,很难利用医院的常规资料(如医院医院的病例档案)获得。因为,医院常规资料无法得到计算这些率所需的分子和分母的资料。所以,一旦研究者利用的是医院常规资料,则无法衡量疾病对人群的危害程度。常用描述指标如表3。

表3 描述分类变量资料的常用指标

指标名称计算公式意义

发生某现象的观察单位数

可能发生某现象的观察单位总数

×K 描述事件发生的强度和频率

构成比

A

A+B+…

×100% 事物内部各组成部分所占的比重

相对比 A A指标为B指标的若干倍或百分之几三.数据资料的比较

在众多的科研研究方法中,归纳起来最基本的手段有两种,一是对研究对象的全体进行研究,在实际工作中往往难以实现;二是从总体中抽取一定数量的样本进行抽样研究,但要

考虑抽样误差对结果的影响。因此,若用样本信息去推断其所代表的总体间有无差别时,需要使用假设检验(hypothesis testing)或称显著性检验(significance test)。

1.假设检验的基本步骤

(1)建立检验假设。

建立假设的过程应有三个内容。即无效假设H0 (null hypothesis)、备择假设H1 (alternative hypothesis)和检验水准α (size of test)。无效假设H0是研究者想得到结论的对立事件的假设,对于差异性检验而言,研究者想得到的是“有差别”的结论,故首先应假设各总体间无差别;备择假设H1是其对立的假设,即是“有差别”的假设;此外,还应确定有统计意义的概率水平α,通常α取0.05。建立检验假设的通常格式为:

H0:多个样本来自同一总体,各样本间的差别是由于抽样误差所致

H1:多个样本来自不同的总体,各样本间的差别是由于不同总体所致

α =0.05

(2)计算统计量。

根据资料的类型、分布特征、科研设计方法等条件,选择不同的统计量计算方法,如t 检验、u检验等统计方法。

(3)根据统计量的值得到概率(P)值;再按概率(P)值的大小得出结论。其结论只有两种情况,若P≤α时,即概率小于我们事先确定好的检验水平概率(如P≤0.05),我们就拒绝其无差别假设H0,而接受H1,认为差别有统计学意义,各样本来自不同总体,样本间的差别是总体的不同所致;若P>α时,其概率大于我们事先确定好的检验水平(如P>0.05),我们就不拒绝其无差别的假设H0,还不能认为各总体间有差别,样本来自同一总体,即差别没有统计学意义。

2.假设检验结论的两类错误

在假设检验的两种结论中无论做出何种结论,都有可能犯错误。

当P≤α时,做出“拒绝其无差别的假设,可认为各总体间有差别”的结论时就有可能犯错误,这类错误称为第一类错误(Ⅰ型错误,type Ⅰerror),其犯错误的概率用α表示,若α取0.05,此时犯Ⅰ型错误的概率小于或等于0.05,若假设检验的P值比0.05越小,犯一类错误的概率就越小。

当P>α时,做出“不拒绝其无差别的假设,还不能认为各总体间有差别”的结论时,就有可能犯第二类错误(Ⅱ型错误,type Ⅱerror),其犯错误的概率用β表示,在通常情况下犯Ⅱ类错误的概率未知,虽然β是个未知数,但假设检验P值越大,犯二类错误的概率就越小。

表4 假设检验的两类错误

真实情况

假设检验结果

拒绝H0不拒绝H0

样本来自同一总体推断不正确(α)推断正确(1-α)样本来自不同总体推断正确(1-β)推断不正确(β)

3.假设检验的注意事项

(1)假设检验比较的对象是总体,而研究的方法是抽样研究,即通过对样本提供的信息去推断总体间有无差别。不能误认为假设检验是样本间的比较,更不能将此体现在结论中。如果研究方法是普查时,由于不存在抽样误差,也不存在用样本提供的信息去推断总体的问题。因此,在这种情况下也就不能使用假设检验的统计方法。

(2)当P≤α时,概率(P)越小,越有理由拒绝无差别的假设,即拒绝假设的可信程度就越大,这时概率(P)越小,其结论的可靠性就越好。当P>α时,概率(P)越大,越有理由不拒绝无差别的假设,即不拒绝无差别假设的可信程度就越大。这时概率(P)越大,其结论的可靠性就越好。因此,无论概率P≤α,还是P>α时,都不能说明组间差别的大小。

(3)假设检验的结论不能绝对化。假设检验的结论是根据概率(P)的大小得出的,事实上当P≤α时,我们拒绝其无差别的假设,可认为各总体间有差别,但是,只要P≠0,我们无法完全拒绝无差别的假设,即不能肯定各总体间有差别:同理,当P>α时,我们不拒绝其无差别的假设,还不能认为各总体间有差别,但是,只要P≠1,我们无法完全接受无差别的假设,即不能肯定各总体间无差别。因此,在做出统计结论时,要避免使用绝对的或肯定的语句,如当P≤α时,使用“拒绝假设,可认为各组间有差别”;而当P>α时,使用“不拒绝假设,还不能认为各组间有差别”的语言进行描述。

(4)假设检验的方法与设计方案和分布特征有关,如:两组比较的方法有t检验、u检验、两组秩和检验、四格表和校正四格表的χ2检验等,这些方法只能用于两组比较,而不能用于多组的比较。在实际工作中错误地使用两组比较的方法代替多组比较的情况并不少见,如,三个均数比较用三个t检验、四个均数比较用六个t检验等。多组比较可用方差分析、多组秩和检验、行乘列χ2检验等。t、u检验和方差分析用于正态分布的资料,不服从正态分布的资料可用秩和检验。

4.常用假设检验方法

(1)计量资料的假设检验

表5 常用计量资料假设检验方法

比较目的应用条件统计方法

样本与总体的比较例数(n)较大,(任意分布)u检验例数(n)较小,样本来自正态t检验

两组资料的比较(完全随机设计)例数(n)较大,(任意分布)u检验

例数(n)较小,来自正态且方差齐成组设计的t 检验

成组设计的秩和检验、

或成组设计的t’检验、

或成组设计的中位数检验例数(n)较小且非正态或方差不齐

配对资料的比较(配对设计)例数(n)较大,(任意分布)配对设计的u检验例数(n)较小,差值来自正态配对设计的t 检验例数(n)较小,差值为非正态配对设计的秩和检验

多组资料的比较(完全随机设计)各组均数来自正态且方差齐成组设计的方差分析各组为非正态或方差不齐成组设计的秩和检验

配伍资料的比较(配伍设计)各组均数来自正态且方差齐配伍设计的方差分析各组为非正态或方差不齐配伍设计的秩和检验

(2)计数资料的假设检验

表6 常用计数资料假设检验方法

比较目的应用条件统计方法

样本率与总体率

的比较N较小时二项分布的直接法np>5且n(1-p)>5 二项分布的u检验

两个率或构成比

的比较

(完全随机设计)np>5且n(1-p)>5 二项分布的u检验

N≥40且T≥5 四格表的χ2检验

N≥40且1≤T<5 校正四格表的χ2检验N<40或T<1 四格表的确切概率法

配对四格表比较(配对设计)B+c≥40 配对χ检验

B+c<40 校正配对χ2检验

多个率或构成比资料的比较(完全随机设计)全部格子T≥5或少于1/5

的格子1≤T<5

行×列表χ检验

(列联表χ2检验)

若有T<1或有多于1/5的

格子1≤T<5

行×列表的确切概率法

(列联表确切概率法)

注:n为例数;T为列联表中各格子的理论数;p为样本率

(3)等级资料的假设检验

表7 常用等级资料假设检验方法

比较目的统计方法

两组比较(完全随机设计)两组比较的秩和检验

多组比较(完全随机设计)多组比较的秩和检验

配对设计符号秩和检验

配伍设计配伍设计的秩和检验

四.变量间的相关分析

数据资料的比较,是同一指标的不同处理组间的比较。在临床研究工作中,常常涉及疾病危险因素的研究和疾病病因的探索,即分析某个因素与疾病间的关系,如口服女性素避孕药是否是宫内膜癌的危险因素;高血脂症是否是冠心病心肌梗塞的危险因素。如果研究结果证明了它们是某种疾病的危险因素或与某种疾病有相关关系的话,还不能肯定其是因果关系,只有当某个因素导致某个肯定的结果,若该因素消除后,其相应的结果也不复存时候,这时,因果关系才能被肯定。

1.数值变量(计量资料)的关系分析

表6 常用数值资料的关系分析方法

比较目的应用条件统计方法

两变量间的依存关系正态单变量资料* 直线回归(Ⅰ型)正态双变量资料** 直线回归(Ⅱ型)

两变量间的相互关系正态双变量资料直线相关两变量都不服从正态等级相关

注:*为两变量中有一个变量服从正态分布的资料;**为两变量都服从正态分布的资料。

2.无序分类变量(计数资料)的相关分析(1)前瞻性研究

相对危险度(RR)= 暴露于危险因素组的总体患病率未暴露于危险因素组的总体患病率

归因危险度(AR)= 暴露于危险因素组的患病率-未暴露于危险因素组的患病率

暴露于危险因素组的患病率

(2)回顾性研究

比值比(OR)=ad/bc

2×2表:列联系数和四格表的χ2检验

行×列表:列联系数和行乘列表的χ2检验3.有序分类变量(等级资料)等级相关

统计学测试题及答案.(DOC)

一、填空题 1、统计是 _________ 、 ____________ 和 __________ 的统一体。 2、统计学是一门研究现象总体 ______________ 方面的方法论科学。 3、要了解一个企业的产品生产情况, 总体是 ______________ ,总体单位是 _____________ 4、标志是说明 ___________ 特征的名称,它分为 ____________ 标志和 __________ 标志。 5、统计指标是反映 ____________ 的数量特征的,其数值来源于 ______________ 。 6、按反映的数量特征不同,统计指标可分为 ____________ 和 _________ 。 、单项选择题 1、统计学的研究对象是( ) A 现象总体的质量方面 B 现象总体的数量方面 C 现象总体的质量和数量方面 D 现象总体的质量或数量方面 2、要了解某市国有企业生产设备的使用情况,则统计总体是( ) A 该市所有的国有企业 B 该市国有企业的每台生产设备 C 该市每一个国有企业 D 该市国有企业的所有生产设备 3、要了解全国的人口情况,总体单位是( ) A 每个省的人口 B 每一户 C 每个人 D 全国总人口 4、反映总体单位属性和特征的是( ) A 指标 B 指标值 C 标志 D 标志值 5、某地四个工业企业的总产值分别为 20 万元、 50 万元、 65 万元、 100 万元。这里的 四个“工业总产值”数值是( ) A 指标 B 指标值 C 标志 D 标志表现 6、已知某企业产品单位成本为 25 元,这里的“单位成本”是( ) A 指标 B 指标名称 、多项选择题 C 标志 D 变量 1 、统计研究的基本方法有( ) A 大量观察法 B 统计分组法 C 综合指标法 D 回归分析法 E 因素分析法 2、统计是研究社会经济现象的数量方面的,其特点有( ) A 数量性 B 综合性 C 具体性 D 重复性 E 差异性 3、在全国人口普查中, ( ) A 全国人口数是总体 B 每个人是总体单位 C 人的年龄是变量 D 人口的性别是品质标志 E 全部男性人口数是统计指标 4、要了解某地区所有工业企业的产品生产情况,那么( ) A 总体单位是每个企业 B 总体单位是每件产品 C “产品总产量”是标志 D “总产量1000万件”是指标 E “产品等级”是标志 5、下列指标中,属于质量指标的是 ( A 资产负 债率 B 股价指数 D 人口密度 E 商品库存额 6、总体、总体单位、标志、这几个概念间的相互关系表现为( ) A 没有总体单位也就没有总体,总体单位也离不开总体而存在 B 总体单位是标志的承担者 C 统计指标的数值来源于标志 D 指标说明总体特征,标志说明总体单位特征 E 指标和标志都能用数值表现 四、简答题 1 、什么是统计?统计的职能有哪些? 2、 举例说明什么是总体和总体单位 ? 总体有哪些特征? 3、 什么是指标和标志?指标和标志的关系如何? ) C 人均粮食产量

统计学五几种常见的假设检验

定义 假设检验就是用来判断样本与样本,样本与总体的差异就是由抽样误差引起还就是本质差别造成的统计推断方法。其基本原理就是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还就是接受作出推断。 基本原理 (1)先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。 (2)它又不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而就是基于小概率原理:概率很小的事件在一次试验中几乎就是不可能发生的,若发生了,就就是不合理的。至于怎样才算就是“小概率”呢?通常可将概率不超过0、05的事件称为“小概率事件”,也可视具体情形而取0、1或0、01等。在假设检验中常记这个概率为α,称为显著性水平。而把原先设定的假设成为原假设,记作H0。把与H0相反的假设称为备择假设,它就是原假设被拒绝时而应接受的假设,记作H1。 假设的形式 H0——原假设, H1——备择假设 双侧检验:H0:μ = μ0 , 单侧检验: ,H1:μ < μ0 或, H1:μ > μ0假设检验就就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。 假设检验的种类 下面介绍几种常见的假设检验 1、T检验 亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。 目的:比较样本均数所代表的未知总体均数μ与已知总体均数μ0。 计算公式:统计量: 自由度:v=n - 1 适用条件: (1) 已知一个总体均数; (2) 可得到一个样本均数及该样本标准误; (3) 样本来自正态或近似正态总体。 T检验的步骤 1、建立虚无假设H0:μ1= μ2,即先假定两个总体平均数之间没有显著差异; 2、计算统计量T值,对于不同类型的问题选用不同的统计量计算方法; 1)如果要评断一个总体中的小样本平均数与总体平均值之间的差异程度,其统计量T值

统计学基本概念

基本概念 1、统计的含义:统计工作、统计资料、统计学 2、社会经济统计学的特点:数量性、社会性、综合性 3、统计工作的职能:统计信息职能、统计咨询职能、统计监督职能 4、统计工作过程:统计调查、统计整理、统计分析 5、统计调查的质量要求:准确性、全面性、及时性、有效性 6、专门调查的方法:普查、重点调查、典型调查、抽样调查 7、统计调查的方法:直接观察法、报告法、采访法、通讯法、实验调查法、网上调查法 8、次数分布的主要类型:钟型分布、U型分布、J型分布 9、统计表的结构,从组成要素看,由总标题、横行与纵栏标题、指标数值等三部分组成 10、统计表的结构,从内容上看,由主词、宾词两部分构成 11、统计分析方法:综合指标、动态数列、统计指数、相关回归、抽样推断 12、综合指标从它的作用和方法特点的角度可概括为三类:总量指标、相对指标、平均指标 13、相对指标的种类:计划完成相对指标、结构相对指标、比例相对指标、比较相对指标、强度相对指标、动态相对指标 14、平均指标的种类:算术平均数、调和平均数、几何平均数、众数、中位数 15、测定标志变动度的主要方法:全距、四分位差、平均差、标准差、离散系数 16、动态数列按构成其指标数值的性质不同分为:绝对数动态数列、相对数动态数列、平均数动态数列

17、动态数列的水平分析指标:发展水平、平均发展水平、增长量、平均增长量 18、动态数列的速度分析指标:发展速度、增长速度、平均发展速度、平均增长速度 19、测定长期趋势常用的主要方法:间隔扩大法、移动平均法、最小平方法 20、指数按其反映指标性质不同分为:数量指标指数和质量指标指数 21、指数按其表现形式不同分为:综合指数、平均指数、平均指标对比指数 22、相关关系按其方向不同分为:正相关和负相关 23、相关关系按其涉及因素多少分为:单相关和复相关 24、相关关系按其形式不同分为:直线相关和曲线相关 25、抽样调查的组织形式:简单随机抽样、类型抽样、等距抽样、整群抽样、多阶段抽样 26、总体参数的抽样估计方法为点估计和区间估计。 统计分析 1.某市某“五年计划”规定计划期最末一年甲产品产量应达到75万吨,假定每天产量相等,实际生产情况如下表所示(单位:万吨)。试计算该市甲产品产量五年计划完成程度和提前完成计划的时间。 第一年第二年第三年 56 58 62 第四年一季二季三季四季 16 17 18 18 第五年一季二季三季四季 19 19 20 23

卫生统计学选择题及答案

t分布与标准正态分布有一定的关系,下述错误的叙述是_____ A.参数数目不同 B.t分布中的自由度趋于无穷大时,曲线逼近标准正态分布 C.为单峰分布 D.对称轴位置在0 E.曲线下面积的分布规律相同 在抽样研究中,当样本例数逐渐增多时_____. A.标准误逐渐加大 B.标准差逐渐加大 C.标准差逐渐减小 D.标准误逐渐减小 E.标准差趋近于0 抽样误差是指。 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别(参数与统计量之间由于抽样而产生的差别) C.样本中每个个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 下面说法中不正确的是_____. A.没有个体差异就不会有抽样误差 B.抽样误差的大小一般用标准误来表示 C.好的抽样设计方法,可避免抽样误差的产生 D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等 E.抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别 t分布与正态分布存在如下哪一种关系。 A.二者均以0为中心,左右对称 B.曲线下中间95%面积对应的分位点均为±1.96 C.当样本含量无限大时,二都分布一致 D.当样本含量无限大时,t分布与标准正态分布一致 E.当总体均数增大时,分布曲线的中心位置均向右移 抽样研究中,适当增加观察单位数,可() A.减小Ⅰ型错误 B.减小Ⅱ型错误 C.减小抽样误差 D.提高检验效能 E.以上均正确

说明两个有关联的同类指标之比为。 A.率 B.构成比 C.频率 D.相对比 E.频数 构成比用来反映。 A.某现象发生的强度 B.表示两个同类指标的比 C.反映某事物内部各部分占全部的比重 D.表示某一现象在时间顺序的排列 E.上述A与C都对 以下属于分类变量的是___________. A.IQ得分 B.心率 C.住院天数 D.性别 E.胸围 计算麻疹疫苗接种后血清检查的阳转率,分母为______. A.麻疹易感人群 B.麻疹患者数 C.麻疹疫苗接种人数 D.麻疹疫苗接种后的阳转人数 E.麻疹疫苗接种后的阴性人数 关于构成比,不正确的是_____. A.构成比中某一部分比重的增减相应地会影响其他部分的比重 B.构成比说明某现象发生的强度大小 C.构成比说明某一事物内部各组成部分所占的分布 D.若内部构成不同,可对率进行标准化 E.构成比之和必为100% 甲乙两地某病的死亡率进行标准化计算时,其标准的选择______. A.不能用甲地的数据 B.不能用乙地的数据 C.不能用甲地和乙地的合并数据 D.可用甲地或乙地的数据 E.以上都不对 用均数与标准差可全面描述资料的分布特征() A.正态分布和近似正态分布 B.正偏态分布 C.负偏态分布 D.任意分布

医学统计学 检验方法

医学统计学检验方法(转) 医学论文中统计方法的正确应用 医用统计方法是医学科研和论文撰写的一个基本工具,但是不少医学科研及临床工作者对统计方法的正确应用缺乏足够的知识,在实际应用过程中常常出现一些不妥用法甚至误用现象。正确使用统计方法,能使研究结果具有科学性和说服力;反之,如果使用不当,不仅不能准确地反映科研结果,而且可能带来错误的结论。 1、所选统计方法脱离了资料的性质不同的资料类型和不同的研究目的采用不同的统计方法。按照资料的性质测定指标的多少,确定资料是计数资料还是计量资料,应用单因素分析还是多因素分析。 1.1 多因素资料是对每个研究对象测量的多个指标同时进行的综合分析,其分析计算过程相对复杂。常用的有回归分析;相关分析以及判别分析、聚类分析、主成分分析和因子分析等。多因素分析多用于计量资料。 1.2 单因素分析应用较多,按获取资料的方法,分计数资料和计量资料。首先,计数资料主要是针对要求某现象的频率和比例,利用率或比的相应计算方法。如做不同样本间的比较则采用计数资料的显著性检验,样本率与总体率的比较用u 检验;两个样本率的比较可用u 检验或四格表的x 检验,多个样本率的比较可用行乘列的卡方检验或2XC 表的卡方检验。其次,计量资料要结合研究目的确定相应的统计方法。对于显著性检验通常有T 检验和F 检验,T 检验是用于两个均数问的比较,按研究设计与比较内容的不同又分为样本均数和总体均数的比较,两个样本均数差别的检验,配对资料的显著性检验。F 检验用于多个样本均数的比较,按设计类型分完全随机设计的方差分析、随机区组设计的方差分析和组内分组资料的方差分析。 2、根据研究目的选用统计分析方法不同的统计方法说明不同的问题,同样不同的问题要应用不同的统计方法来分析和表达。研究者在做统计分析前,首先要明确资料分析的目的、意图是什么,通过分析最终达到什么样的期望,临床工作者科研通常的目的主要有: 2.1 某现象发生的频率或比例如人群中重复癌的发生率,采用频率指标,构成指标或相对比,可计算发病、患病、感染、阳性频率或构成等。

统计学测试题及答案

一、填空题 1、统计是__________、__________和___________的统一体。 2、统计学是一门研究现象总体_____________方面的方法论科学。 3、要了解一个企业的产品生产情况,总体是____________,总体单位是____________。 4、标志是说明___________特征的名称,它分为__________标志和__________标志。 5、统计指标是反映____________的数量特征的,其数值来源于___________。 6、按反映的数量特征不同,统计指标可分为_________和_________。 二、单项选择题 1、统计学的研究对象是() A 现象总体的质量方面 B 现象总体的数量方面 C 现象总体的质量和数量方面 D 现象总体的质量或数量方面 2、要了解某市国有企业生产设备的使用情况,则统计总体是() A 该市所有的国有企业 B 该市国有企业的每台生产设备 C 该市每一个国有企业 D 该市国有企业的所有生产设备 3、要了解全国的人口情况,总体单位是() A 每个省的人口B每一户 C 每个人 D 全国总人口 4、反映总体单位属性和特征的是() A 指标 B 指标值 C 标志 D 标志值 5、某地四个工业企业的总产值分别为20万元、50万元、65万元、100万元。这里的四个“工业总产值”数值是() A 指标 B 指标值 C 标志 D 标志表现 6、已知某企业产品单位成本为25元,这里的“单位成本”是() A 指标 B 指标名称 C 标志 D 变量 三、多项选择题 1、统计研究的基本方法有() A 大量观察法 B 统计分组法 C 综合指标法 D 回归分析法 E 因素分析法 2、统计是研究社会经济现象的数量方面的,其特点有() A 数量性 B 综合性 C 具体性 D 重复性 E 差异性 3、在全国人口普查中,() A 全国人口数是总体 B 每个人是总体单位 C 人的年龄是变量 D 人口的性别是品质标志 E 全部男性人口数是统计指标 4、要了解某地区所有工业企业的产品生产情况,那么() A 总体单位是每个企业 B 总体单位是每件产品 C “产品总产量”是标志D“总产量1000万件”是指标 E “产品等级”是标志 5、下列指标中,属于质量指标的是( ) A 资产负债率B股价指数 C 人均粮食产量 D人口密度E商品库存额 6、总体、总体单位、标志、这几个概念间的相互关系表现为() A 没有总体单位也就没有总体,总体单位也离不开总体而存在 B 总体单位是标志的承担者 C 统计指标的数值来源于标志 D 指标说明总体特征,标志说明总体单位特征 E 指标和标志都能用数值表现 四、简答题 1、什么是统计?统计的职能有哪些? 2、举例说明什么是总体和总体单位? 总体有哪些特征? 3、什么是指标和标志?指标和标志的关系如何?

医学统计学检验方法

医学统计学检验方法(转) 医学论文中统计方法的正确应用 医用统计方法是医学科研和论文撰写的一个基本工具,但是不少医学科研及临床工作者对统计方法的正确应用缺乏足够的知识,在实际应用过程中常常出现 一些不妥用法甚至误用现象。正确使用统计方法,能使研究结果具有科学性和说服力;反之,如果使用不当,不仅不能准确地反映科研结果,而且可能带来错误的结论。 1、所选统计方法脱离了资料的性质不同的资料类型和不同的研究目的采用不同的统计方法。按照资料的性质测定指标的多少,确定资料是计数资料还是计量资料,应用单因素分析还是多因素分析。 1.1多因素资料是对每个研究对象测量的多个指标同时进行的综合分析,其分析计算过程相对复杂。常用的有回归分析;相关分析以及判别分析、聚类分析、 主成分分析和因子分析等。多因素分析多用于计量资料。 1.2单因素分析应用较多,按获取资料的方法,分计数资料和计量资料。首 先,计数资料主要是针对要求某现象的频率和比例,利用率或比的相应计算方法。如做不同样本间的比较则采用计数资料的显著性检验,样本率与总体率的比较用 u检验;两个样本率的比较可用u检验或四格表的x检验,多个样本率的比较可用行乘列的卡方检验或2XC表的卡方检验。其次,计量资料要结合研究目的确定相应的统计方法。对于显著性检验通常有T检验和F检验,T检验是用于两个均数问的比较,按研究设计与比较内容的不同又分为样本均数和总体均数的比较,两个样本均数差别的检验,配对资料的显著性检验。F检验用于多个样本均数的比较,按设计类型分完全随机设计的方差分析、随机区组设计的方差分析和组内分组资料的方差分析。 2、根据研究目的选用统计分析方法不同的统计方法说明不同的问题,同样不同的问题要应用不同的统计方法来分析和表达。研究者在做统计分析前,首先要明确资料分析的目的、意图是什么,通过分析最终达到什么样的期望,临床工作者科研通常的目的主要有: 2.1某现象发生的频率或比例如人群中重复癌的发生率,采用频率指标,构成指标或相对比,可计算发病、患病、感染、阳性频率或构成等。

统计学常用检验方法

统计中经常会用到各种检验,如何知道何时用什么检验呢,根据结合自己的工 作来说一说: t检验有单样本t检验,配对t检验和两样本t检验。单样本t检验:是用样本均数代表的未知总体均数和已知总体均数进行比较,来观察此组样本与总体的差异性。配对t检验:是采用配对设计方法观察以下几种情形,1,两个同质受试对 象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同一受 试对象处理前后。 u检验:t检验和就是统计量为t,u的假设检验,两者均是常见的假设检验方法。当样本含量n较大时,样本均数符合正态分布,故可用u检验进行分析。当样 本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t 分布),当x为未知分布时应采用秩和检验。F检验又叫方差齐性检验。在两样本t检验中要用到F检验。从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。其中要判断两总体方差是否相等,就可以用F检验。 简单的说就是检验两个样本的方差是否有显著性差异这是选择何种T检验(等方差双样本检验,异方差双样本检验)的前提条件。 在t检验中,如果是比较大于小于之类的就用单侧检验,等于之类的问题就用双侧检验。 卡方检验 是对两个或两个以上率(构成比)进行比较的统计方法,在临床和医学实验中应用十分广泛,特别是临床科研中许多资料是记数资料,就需要用到卡方检验。 方差分析 用方差分析比较多个样本均数,可有效地控制第一类错误。方差分析(analysis of variance,ANOVA)由英国统计学家,以F命名其统计量,故方差分析又称F检验。其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。我们要学习的主要内容包括 单因素方差分析即完全随机设计或成组设计的方差分析(one-way ANOVA): 用途:用于完全随机设计的多个样本均数间的比较,其统计推断是推断各样本所代表的各总体均数是否相等。完全随机设计(completely random design)不考虑个体差异的影响,仅涉及一个处理因素,但可以有两个或多个水平,所以亦称单因素实验设计。在实验研究中按随机化原则将受试对象随机分配到一个处理因素的多个水平中去,然后观察各组的试验效应;在观察研究(调查)中按某个研究因素的不同水平分组,比较该因素的效应。 两因素方差分析即配伍组设计的方差分析(two-way ANOVA): 用途:用于随机区组设计的多个样本均数比较,其统计推断是推断各样本所代表的各总体均数是否相等。随机区组设计考虑了个体差异的影响,可分析处理因素和个体差异对实验效应的影响,所以又称两因素实验设计,比完全随机设计的检验效率高。该设计是将受试对象先按配比条件配成配伍组(如动物实验时,可按同窝别、同性别、体重相近进行配伍),每个配伍组有三个或三个以上受试对象,再按随机化原则分别将各配伍组中的受试对象分配到各个处理组。值得注意的是,同一受试对象不同时间(或部位)重复多次测量所得到的资料称为重复测量数据

统计学基本概念

日志吕品吕品的日志当前日志返回日志首页? 较新一篇/ 较旧一篇 分享 1. 统计学:收集处理分析解释数据并从数据中得出结论的科学。 2. 描述统计:研究数据收集处理汇总图表描述概括与分析等统计方法。 3. 推断统计:研究如何利用样本数据来推断总体特征的统计方法。 4. 分类数据:只能归于某一类别的非数字型数据。 5. 顺序数... 如果你也考统计学~~~~~网上搜索到的统计学基本概念~~~~~ 2011-05-28 12:06 | (分类:默认分类) 1. 统计学:收集处理分析解释数据并从数据中得出结论的科学。 2. 描述统计:研究数据收集处理汇总图表描述概括与分析等统计方法。 3. 推断统计:研究如何利用样本数据来推断总体特征的统计方法。 4. 分类数据:只能归于某一类别的非数字型数据。

5. 顺序数据:只能归于某一有序类别的非数字型数据。 6. 数值型数据:按数字尺度测量的观察值。 7. 观测数据:通过调查或观测而收集到的数据。 8. 实验数据:在实验中控制实验对象而收集到的数据。 9. 截面数据:在相同或近似相同的时间点上收集的数据。 10. 时间序列数据:在不同时间上收集到的数据,这类数据按时间顺序收集到的。 11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,根据样本调查结果来推断总体特征的数据收集方法。

12. 普查:为特定目的而专门组织的全面调查。 13. 总体:包含所研究的全部个体(数据)的集合。 14. 样本:从总体中抽取的一部分元素的集合。 15. 样本容量:也称样本量,是构成样本的元素数目。 16. 参数:用来描述总体特征的概括性数字度量。 17. 统计量:用来描述样本特征的概括性数字度量。 18. 变量:说明现象某种特征的概念。 19. 分类变量:说明事物类别的一个名称。 20. 顺序变量:说明事物有序类别的一个名称。

统计学练习题及答案

第一章导论练习题 1.单选题 (1)统计研究对象的特点包括(C)。 A、总体性 B、具体性 C 、总体性和具体性D、同一性 (2)下列指标中不属于质量指标的是( D )。 A、平均价格 B 、单位成本 C 、资产负债率 D 、利润总额 (3)下列指标中不属于数量指标的是(C)。 C 、资产报酬率D、A、资产总额 B 、总人口 人口增加数 (4)描述统计和推断统计的之间的关系是( A )。 A、前者是后者的基础 B、后者是前者的基础 C 、两者没有关系 两这互为基础(5)一个统计总体(D ) A、只能有一个标志 B 、只能有一个指标 C 、可以有多个标志 D 、可以有多个指标 (6)若要了解某市工业生产设备情况,则总体单位是该市(D) A每一个工业企业 B 每一台设备 C 每一台生产设备 D 每一台工业生产设备 (7)某班学生数学考试成绩分别为65 分71 分、80 分和87 分,这四个数字是(D) A指标 B 标志C变量 D 标志值 (8)下列属于品质标志的是(B) A 工人年龄 B 工人性别C工人体重 D 工人工资 9)现要了解某机床厂的生产经营情况,该厂的产量和利润是( D )A 连续变量B 离散变量C 前者是连续变量,后者是离散变量者是连续 变量(10)劳动生产率是(B ) A 动态指标 B 质量指标 C 流量指标 D 强度指标 (11)统计规律性主要是通过运用下述方法整理、分析后得出的结论( B )D、 D 前者是离散变量,后

欢迎下载 2 A 统计分组法 B 大量观察法 C 综合指标法 D 统计推断法 (12) (C ) 是统计的基础功能 A 管理功能 B 咨询功能 C 信息功能 D 监督功能 (13) ( A )是统计的根本准则,是统计的生命线 A 真实性 B 及时性 C 总体性 D 连续性 (14)统计研究的数量是( B ) A 抽象的量 B 具体的量 C 连续不断的量 D 可直接相加的量 C ) (15 )数量指标 般表现为( A 平均数 B 相对数 C 绝对数 D 众数 (16 )指标是说明总体特征的,标志是说明总体单位特征的,所以( A ) A 指标和标志之间在一定条件下可以相互转换 B 指标和标志都是可以用数值表示的 C 指标和标志之间是不存在关系的 D 指标和标志之间的关系是固定不变 的 2. 多选题 (1) 统计学发展过程中经历的主要学派有( ABCD )。 (2) 下列标志中属于品质标志的有 ( AC )。 (3) 下列指标中属于质量指标的有( ABD )。 (4) "统计”一词含义有( BCD )。 A 统计研究 B 统计工作 C 统计资料 3?判断题 1、 现代统计学的核心是描述统计学。 ( F ) 2、 描述统计学是推断统计学的基础。 ( T ) 3、 统计指标可以分成数量指标和质量指标。 ( T ) 4、 所有标志都可以用数量表现。 ( F ) A 政治算术学派 B 国势学派 C 数理统计学派 D 社会统计学派 A 企业的经济类型 B 劳动生产率 C 企业所属的行业 D 企业的负债总额 A 平均亩产 数 B 人均钢产量 C 国民生产总值 D 存货周转次 D 统计学

统计学分析方法

统计分析方法总结 分享 胡斌 00:06分享,并说:统计 1.连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni 法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。**绝不能对其中的两组直接采用t检验,这样即使得出结果也未必正确** (3)关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但不同设计会有差别。常用的设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。 2.分类资料

统计学题库及题库答案

统计学题库及题库答案 ) B 、进行调查的时间 D 、调查资料报送的时间 2、对某城市工业企业未安装设备进行普查,总体单位是( ) A 、工业企业全部未安装设备 B 、企业每一台未安装设备 C 、每个工业企业的未安装设备 D 、每一个工业企业 3、 对比分析不同性质的变量数列之间的变异程度时 ,应使用( )。 A 、全距 B 、平均差 C 、标准差 D 、变异系数 4、 在简单随机重复抽样条件下,若要求允许误差为原来的 2/3,则样本容量( ) A 、扩大为原来的 3倍 B 、扩大为原来的 2/3倍 C 、扩大为原来的 4/9倍 D 、扩大为原来的 2.25倍 5、 某地区组织职工家庭生活抽样调查 ,已知职工家庭平均每月每人生活费收入的标准差为 可靠程度为0.9545,极限误差为1元,在简单重复抽样条件下,应抽选( )。 A 、576 户 B 、144 户 C 、100 户 D 、288 户 6、当一组数据属于左偏分布时,则( ) A 、 平均数、中位数与众数是合而为一的 B 、 众数在左边、平均数在右边 C 、 众数的数值较小,平均数的数值较大 D 、众数在右边、平均数在左边 7、 某连续变量数列,其末组组限为 500以上,又知其邻组组中值为 480,则末组的组中值为( ) A 、 520 B 、 510 C 、 500 D 、 490 8、 用组中值代表组内变量值的一般水平有一定的假定性,即( ) A 、 各组的次数必须相等 B 、 变量值在本组内的分布是均匀的 C 、 组中值能取整数 D 、 各组必须是封闭组 9、 XjX 2’…,X n 是来自总体的样本,样本均值 X 服从( )分布 A 、N(F 2) B.、N(0,1) C 、 N(n 巴nb 2 ) N(=) D 、 n 10、测定变量之间相关密切程度的指标是( ) A 、估计标准误 B 、两个变量的协方差 C 、相关系数 D 、两个变量的标准差 二、多项选择题(每题 2分,共10分) 1、抽样推断中,样本容量的多少取决于( )。 A 、总体标准差的大小 B 、 允许误差的大小 c 、抽样估计的把握程度 D 、总体参 题库1 、单项选择题(每题 2分,共20分) 1、调查时间是指( A 、调查资料所属的时间 C 、调查工作的期限 12元,要求抽样调查的

统计学试题库及试题库答案解析

统计学题库及题库答案 题库1 一、单项选择题(每题2分,共20分) 1、调查时间就是指( ) A 、调查资料所属的时间 B 、进行调查的时间 C 、调查工作的期限 D 、调查资料报送的时间 2、对某城市工业企业未安装设备进行普查,总体单位就是( )。 A 、工业企业全部未安装设备 B 、企业每一台未安装设备 C 、每个工业企业的未安装设备 D 、每一个工业企业 3、对比分析不同性质的变量数列之间的变异程度时,应使用( )。 A 、全距 B 、平均差 C 、标准差 D 、变异系数 4、在简单随机重复抽样条件下,若要求允许误差为原来的2/3,则样本容量( ) A 、扩大为原来的3倍 B 、扩大为原来的2/3倍 C 、扩大为原来的4/9倍 D 、扩大为原来的2、25倍 5、某地区组织职工家庭生活抽样调查,已知职工家庭平均每月每人生活费收入的标准差为12元,要求抽样调查的可靠程度为0、9545,极限误差为1元,在简单重复抽样条件下,应抽选 ( )。 A 、576户 B 、144户 C 、100户 D 、288户 6、当一组数据属于左偏分布时,则( ) A 、平均数、中位数与众数就是合而为一的 B 、众数在左边、平均数在右边 C 、众数的数值较小,平均数的数值较大 D 、众数在右边、平均数在左边 7、某连续变量数列,其末组组限为500以上,又知其邻组组中值为480,则末组的组中值为 ( )。 A 、520 B 、 510 C 、 500 D 、490 8、用组中值代表组内变量值的一般水平有一定的假定性,即( ) A 、各组的次数必须相等 B 、变量值在本组内的分布就是均匀的 C 、组中值能取整数 D 、各组必须就是封闭组 9、n X X X ,,,21 就是来自总体 ),(2 N 的样本,样本均值X 服从( )分布 A 、),(2 N B 、、)1,0(N C 、、),(2 n n N D 、) ,(2n N 10、测定变量之间相关密切程度的指标就是( ) A 、估计标准误 B 、两个变量的协方差 C 、相关系数 D 、两个变量的标准差 二、多项选择题(每题2分,共10分)

统计学知识竞赛题目及答案

统计学知识竞赛题目 及答案 Revised on November 25, 2020

必答题 1. 欲研究广东省 6 岁儿童的身高情况, 在广东省随机抽取了 200 名 6 岁儿童进行调查,以此为例说明同质、变异、总体与样本这几个概念。 答:同质体现在同为广东省、同为 6 岁儿童,变异体现在 200 名儿童的身高不同。 总体是指所有广东省 6 岁儿童,样本为 200 名 6 岁儿童。 2.卫生统计工作中的统计资料主要的来源有哪些 答:①统计报表。②经常性工作记录。③专题调查或实验。 3.简述统计工作全过程的四个步骤。 答:研究设计、收集资料、整理资料、统计分析。 4.试举例说明常见的三种资料类型。 答:(1).计量或测量或数值资料,如身高、体重等。 (2).计数或分类资料,如性别、血型等。 (3).等级资料,如尿蛋白含量-、+、++、+++、…。 5. 统计学上的变异、变量、变量值是指什么 答:变异:每个观察个体之间的测量指标的差异称为变异。 变量: 表示个体某种变异特征的量为变量。 变量值:对变量的测得值为变量值。 6. 简述编制频数表的步骤与要点。 答:(1)找出最大和最小值,计算极差。 (2)确定组距和列出分组计划: 第一组应包括最小值;最末组应包括最大值,并闭口。 (3)将原始数据整理后,得到各组频数。

7.描述计量资料集中趋势(一般水平)的指标有哪些,各适用于什么情况 答:常用描述平均水平的平均数有算术均数、几何均数和中位数。 算术均数适合:对称资料,最好是近似正态分布资料。 几何均数适合:经对数转换后近似对称分布的原始变量,常用于微生物学和免疫学指标。中位数适合:数据非对称分布、分布不清楚或开口资料的情形。 8. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况 答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系数。 极差适合:数据分布非对称的情形。 四分位数差距适合:数据分布非对称的情形。 方差与标准差适合:对称分布或近似正态分布资料,能充分利用全部个体的信息。 变异系数适用:当比较两资料的变异程度大小时,如果变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。 9. 统计描述的基本方法有哪些,各自有何特点 答:统计描述的基本方法:用表、图和数字的形式概括原始资料的主要信息。 表:详细、精确。图:直观。指标:综合性好。 10.简述变异系数的适用条件。 答:变异系数适用于变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。 11. 怎样正确描述一组计量资料 答:(1).根据分布类型选择指标。 (2).正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般偏态分布资料

成绩统计流程图.doc

成绩统计流程图 成绩统计流程图 1.新建一张工作表,在表格中输入相应的数据,如学科、姓名、学号,学生成绩等,如下图;我们输入24个学生的成绩作为演示。下面的数据是我们最原始收集到的数据,我们现在就对这些数据进行处理。 2.在每个学科后面插入一列,在表头中输入学科排名,如语文课后面这一列输入语文排名在最后两列分别输入总分和总分排名;如下图所示; 3.在表格后面输入统计指标,如平均分,最高分,最低分,及格率,优秀率;我们计算时就可以计算出相应科目的指标。如下图所示; 4.我们一般喜欢把总分第一名的学生排到第一,所示,我们先求出学科的总分来。在O2单元格中输入公式=SUM(C2+E2+G2+I2+K2+M2),如下图,通过自动填充功能完成其他学生的总分计算。 5.对总分进行排序,我们把光标移动到总分列,点击数据- 排序,主要关键字我们选择总分,按降序的方式进行排序,如下图所示;设置好后点击确定; 6.这一步我们就可以来求学生的总分排名了,大家注意这一步不要用自动填充功能给总分编序号,因为可能会出现分数相同的情况,我们用公式来编写,如果出现分数相同,那么排名也将相同,名次自动往后推。我们在P2中输入公式=RANK(O2,$O$2:$O$25),大家一定要用上$ 符号引用,不然排名将会出错;自动完成数据填充。如下图 7.学会了上面这一步,我们对学科单科排名也就简单了,我们分别在D2,F2,H2,J2,L2,N2,中输入公式=RANK(C2,$C$2:$C$25),=RANK(E2,$E$2:$E$25),=RANK(G2,$G$2:$G$25),=RANK(I2,$I

$2:$I$25),=RANK(K2,$K$2:$K$25),=RANK(M2,$M$2:$M$25),可以求出第一条记录在所有记录中的排名。如下图; 8.我们用自动填充功能,完成所有单科成绩的排名,如下图,可以看出,分数相同的学生的排名也是相同。 9.下面我们来求学生的平均分,在c27单元格中输入=A VERAGE(C2:C25),如下图,我们用自动填充功能完成其它学科平均分的计算。 10.用同样的方法,使用MAX()计算最高分,MIN()计算最低分;countif()计算及格人数,这个函数的具体用法请大家百度找一下,这里只告诉大家用这个函数实现,我们在公式栏输入=COUNTIF(C2:C25, =60 ),在优秀人数中我们改为=COUNTIF(C2:C25, =90 ),之后用自动填充功能完成其它单元格的填充。 11.现在我们来计算及格率和优秀率,及格率(优秀率)=及格人数(优秀人数)/总人数,我们刚才计算的及格人数在C32单元格,学生总数为24,所以在公式中输入=C30/24,同理,在优秀率中输入=C32/24。自动完成后面学科的计算。 12.选择中c31:m31和c33:m33,设置数据以%显示;如图所示。接着我们删除排名列中的统计指标。因为这些数据是复制过来的,我们根本不需要它。 13.一张统计分析表格基本就制作完成了,我们只需要对表格进行一定的美化处理就可以了。 成绩一般却圆梦美国排名11WUSTL物理专University in

(完整版)统计方法的选择汇总

统计方法的选择 一、两组或多组计量资料的比较 1.两组资料: 1)大样本资料或服从正态分布的小样本资料 (1)若方差齐性,则作成组t检验 (2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验2.多组资料: 1)若大样本资料或服从正态分布,并且方差齐性,则作 完全随机的方差分析。如果方差分析的统计检验为有统 计学意义,则进一步作统计分析:选择合适的方法 (如:LSD检验,Bonferroni检验等)进行两两比较。 2)如果小样本的偏态分布资料或方差不齐,则作 Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适 的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。 二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料: (1)小样本时:用二项分布进行确切概率法检验;

(2)大样本时:用U检验。 2)多分类资料:用Pearson c2检验(又称拟合优度检验)。 2. 四格表资料 1)n>40并且所以理论数大于5,则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正 c2或用Fisher’s 确切概率法检验 3)n£40或存在理论数<1,则用Fisher’s 检验 3. 2×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验 2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量 (1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2 (2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验 4. R×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验

住院医师培训课程-常用医学科研中的统计学方法1

1、两组数据中的每个变量值减去同一常数后做两个样本均数差异的t检验() *c ? A.t值变小 ? B.t值变大 ? C.t值不变 ? D.t值变小或变大 2、作单组样本均数与一个已知的总体均数比较的t检验时,正确的理解是() *c ? A.A.统计量t越大,说明两总体均数差别越大 ? B.B.统计量t越大,说明两总体均数差别越小 ? C.C.统计量t越大,越有理由认为两总体均数不相等 ? D.D.P值就是αa 3、随机区组设计的方差分析用于() * ? A.多个样本均数间的两两比较 ? B.比较各个区组间的样本均数有无差别 ? C.比较各个区组间的总体均数有无差别 ? D.比较各个处理组间的样本均数有无差别 4、各组数据方差不齐时,可以做() *D ? A.近似检验 ? B.秩和检验 ? C.数据转换 ? D.ABC均可 5、第I类错误的概念是() *D ? A.H0是不对的,统计检验结果未拒绝H0 ? B.H0是对的,统计检验的结果未拒绝H0 ? C.H0是不对的,统计检验结果拒绝H0 ?

6、下列哪种说法是错误的() *B ? A.计算相对数尤其是率时应有足够数量的观察单位数或观察次数 ? B.分析大样本数据时可以构成代替率 ? C.应分别将分子和分母合计求合计率或平均率 ? D.相对数的比较应注意其可比性 7、配对计量资料进行假设检验时() *Dd ? A.仅能用配对t检验 ? B.仅能用成组t检验 ? C.仅能用随机区组设计的方差分析 ? D.用配比t检验和随机区组设计的方差分析均可 8、方差分析的前提条件是() *A ? A.计量资料非参数统计的 ? B.正态性 ? C.随机性 ? D.方差齐性 9、设配对设计资料的变量为X1与X2,则配对设计的符号的秩检验() *B ? A.把X1与X2的差数军队之从小到大编秩,排好后秩次保持原差数的正负号 ? B.把X1与X2的差数绝对值从小到大编秩,秩次不保存正负号 ? C.把X1与X2综合按绝对值从小到大编秩 ? D.把X1与X2的差数从小到大编秩 10、对于配对t检验和成组t检验,下列哪一种说法是错误的() *B ? A.对于配对设计资料应作配对t检验,如果作成组t检验,不但不合理,而且平均起来统计效率降低 ? B.成组设计的资料用配对t检验,不但合理,而且平均起来可以提高统计效率 ? C.成组设计的资料,无法用配对t配对t检验 ?

相关文档
最新文档