卫生统计学简答题汇总

卫生统计学简答题汇总
卫生统计学简答题汇总

统计学简答汇总

第一章:绪论(无)

第二章:定量变量的统计描述

1.均数﹑几何均数和中位数的适用范围有何异同?

答:相同点,均表示计量资料集中趋势的指标。

不同点:表2-5.

表2-5 均数,几何均数和中位数的相异点

平均数意义应用场合

均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布

几何均数平均增减倍数①等比资料;②对数正态分布资料

中位数位次居中的观①偏态资料;②分布不明资料;③分布一端或两

察值水平端出现不确定值

2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系?

答:

1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。

(2)计算:中位数和百分位数均可用同一公式计算,即

Px=L+(i/f x)(n·x%-Σf L)

可根据研究目的选择不同的百分位数代入公式进行计算分析。

(3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中

更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。

3.同一资料的标准差是否一定小于均数?

答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。

变异大,标准差就大,有时比均数大;变异小,标准差小。

4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?

(1)样本含量的大小,样本含量越大,标准差越稳定。

(2)分组的多少

(3)分布形状的影响,偏态分布的标准差较近似正态分布大

(4)随机测量误差大小的影响

(5)研究总体中观察值之间变异程度大小

5.标准差与变异系数的异同点有哪些?

答:标准差:是以算数平均数为中心,反映各观测值离散程度的一个绝对指标.当需要对同一总体不同时期或对不同总体进行对比时,缺乏可比性.当总体平均水平不同或计量单位不同时,用标准差是无法实现两组数据离散程度大小对比的.

变异系数:标准差与平均数的比值称为变异系数,记为C·V.变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。

6.如何表达一批计量数据的基本特征?

答:从集中趋势和离散趋势两方面回答。

7. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况?

答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系

数。

极差适合:数据分布非对称的情形。

四分位数差距适合:数据分布非对称的情形。

方差与标准差适合:对称分布或近似正态分布资料,能充分利用全部个体的信息。

变异系数适用:当比较两资料的变异程度大小时,如果变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。

8.标准差有何用途?

答:①描述正态分布的变异程度;②正态分布时,均数与标准差同时写出:X+S;③

计算变异系数;④用标准差估计变量值的频数分布;⑤用标准差计算标准误。

9. 统计描述的基本方法有哪些,各自有何特点?

答:统计描述的基本方法:用表、图和数字的形式概括原始资料的主要信息。

表:详细、精确。图:直观。指标:综合性好。

10.简述变异系数的实用时机。

答:变异系数适用于变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。

11. 怎样正确描述一组计量资料?

答:(1).根据分布类型选择指标。(2).正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般偏态分布资料选用中位数与四分位数间距。

12.原始数据单位变换后,对均数和方差有何影响?

答:均数和方差均改变。用实例说明。

13.列表的原则和基本要求是什么?

答:(1)列表的原则:重点突出,简单明了;主谓分明,层次清楚。

(2)列表的基本要求:

①应有简明扼要说明统计表内容的标题。既不能过与简略,也不呢能过于繁琐或不

确切。

②标目文字要简明,有单位的标目要注明,标目不宜过多,层次应清楚。

③线条不宜过多。除顶线、底线、纵标目下与合计行上面的线条外,其他线条一般

均应省去。表的左上角不宜有斜线。

④表内数字小数位数保留应一致,位次应对齐,不宜留空格。暂缺或未记录用“…”

表示,无数字用“—”表示,数字是“0”则应填写“0”。

⑤备注一般不列入表内,应用“*”号引出,写在表的下面。

14.常用的统计图有哪几种?他们的适用条件是什么?

答:常用的统计图有条图、百分条图、圆图、线图、半对数线图、直方图、散点图和统计地图等。

(1)直条图:用等宽直条的长短来表示相互独立的各项指标的数值大小,如发病率等。(2)百分条图、圆图:用长条各段的面积、圆的扇形面积来表示事物内部各构成部分的分布情况,即各构成比重的大小,如构成比。

(3)普通线图:用线段的升降来表示连续性资料随时间的变迁、某事物现象的动态及变化趋势。

(4)半对数线图:用线段的升降来表示连续性资料随时间的变迁和某事物现象发展变化的速度。

(5)直方图:用直方面积的大小表示数值变量资料频数分布的情况。

(6)散点图:用点的密集程度和趋势表示两变量间的相关关系。

(7)统计地图:用不同的纹线或颜色说明指标高低,描述某事物现象在行政区域上的分布情况。

15.半对数线图的图形如何做分析?

答:用于表示事物的发展速度(相对比)。其横轴为算数尺度,纵轴为对数尺度,在比较几组数据的变化速度(相对比)时,特别是两组数据相差悬殊时,宜用半对数线图。

第三章:定性变量的描述

1.为什么不能以构成比代率?

答:二者说明的问题不同。构成比只能说明某事物内部各组成部分在全体中所占的比重或分布,不能说明某现象发生的频率或强度。

2.简述相对数标准化的基本思想。

答:基本思想: 采用统一的标准人口年龄构成,以消除不同人口构成对两地死亡率的影响,使得到的标准化死亡率具有可比性。

3.解释在何种情况下应选用率的直接标化法,何种情况选用间接标化法?

答: 率的直接标化法:已知各组的年龄别死亡率pi。间接标化法:已知各组的死亡总数和各年龄组人口数.

4.率的直接标化法,与间接标化法有何不同?

答: (1)适用条件不同(见第上题);(2)“标准”不同:前者选定一个“标准人口”或“标准人口构成”。后者选定一套“标准年龄别死亡率”。

5.应用相对数时应注意哪些问题?

答:应用相对数指标的时候要注意:分母不宜过小;不要以比代率;资料的可比性;样本指标比较时应做假设检验。

6.常用相对数指标有哪些? 它们的意义上有何不同?

答:常用相对数指标:率、构成比、比。率又称频率指标或强度相对数。说明某现象发生的频率或强度。常用来表示某一事物发展的趋势或水平及特征。构成比又称构成指标或结构相对数。部分与全部之比,说明某事物内部各组成部分在全体中所占的比重或分布。常用来表示疾病或死亡的顺位、位次或所占比重。比(又称相对比)表示同类的或有联系的两个现象间的对比关系,常用倍数或百分数表示。

7.统计学上资料是否“具有可比性”指的是什么? 你能举出一些不可比的例子吗?

答:除研究因素外,其余重要影响因素应相同或相近。一般观察单位同质,研究方法相同,观察时间相等,以及地区、民族等客观条件一致。例如内科和外科的治愈率就无可比性。

8.何谓人口老龄化?请简述其影响因素。

答1:人口老龄化是指老年人口(65 岁及以上)在人口中所占的比重升高的现象。在没有迁移的情况下,人口老龄化的进程主要受生育率和死亡率两种因素的影响。生育率下降,使低年龄人口的比重降低,高年龄人口的比重相应增加;死亡率(主要是中老年人口的死亡率)降低,使寿命延长,老年人口比重增加。一般来说,人口老龄化的速度和程度主要取决于生育率的下降速度。当生育率水平下降达到很低的水平且很难再有较大程度的降低时,中老年人口死亡率的降低对人口老龄化的影响才比较明显。

9.发病率、时点患病率、时期患病率的区别。

答:(1)发病率是指观察期内,可能发生某病的人群中新发病例的频率,其观察期多为年、月、日等,急性常见病多计算发病率。

(2)时点患病率反映在检查或调查时点一定人群中某病的现患情况(包括该病的新旧病例数)。观察时点在理论上是无长度的,但实际上观察时间不宜过长,一般不超过个月。

(3)时期患病率反映在观察期间一定人群中存在或流行某病的频度,包括观察期间的新发病例和现患病例数,为慢性病的统计指标。

10.疾病统计的观察单位“病人”和“病例”的区别。

答:(1)一个人每次患病都可作为一个病例。以病例为单位的疾病统计,可研究居民各种疾病的频度、疾病的种类及疾病的变动,以获得居民患病的基本规律。

(2)病人是指一个有病的人。在观察期间内,观察对象患有疾病即算作一个病人,不管其患病的种类及患病次数的多少。以病人为单位的疾病统计,在一定程度上反映居民的患病频度,可找出具体的患病人群,便于开展对病人个人的防治工作。

11.病死率和死亡率的区别。

答:(1)某病病死率表示在规定的观察期内,某病患者中因该病而死亡的频率。它是反映疾病的严重程度的指标。在用病死率进行比较时应注意病情轻重等内部构成不同的影响。计算公式为:观察期内因某病死亡的人数某病病死率= 同期该病患者数×1000?

(2)某病死亡率表示在规定的观察期内,人群中因某病而死亡的频率。它可以反映不同地区或年代某种疾病的死亡水平。计算公式为:观察期内因某病死亡的人数某病死亡率= 同期平均人口数×1000?

12.简述婴儿死亡率指标的实际意义。

答:婴儿死亡率指某地某年不满一周岁婴儿的死亡数与同期活产总数的比值。

婴儿死亡率= 某年不满周岁婴儿死亡数×1000?/同期活产数

婴儿死亡率的高低对平均寿命有重要的影响,它是反映社会卫生状况和婴儿保健工作的重要指标,也是死亡统计指标中较为敏感的指标。婴儿死亡率不受年龄的影响,不同国家或地区之间可以相互比较。

13.请说明频率型指标与强度型指标的主要区别?

答:主要区别:指标的解释不同,频率型指标是表示事物内部某个组成部分所占的比重或分布,或指某现象发生的频率。强度型指标是指单位时间内某现象发生的频率。14.标准化法的基本思想?

答:采用统一标准构成以消除某因素的内部构成不同对总率的影响,使通过标准化后的标准化率具有可比性。

15.请比较发病率和患病率的不同。

答:发病率表示一定时期内,在可能发生某病的一定人群活过的总人年中,新发生的某病病历数,其分子是新病历数,分母是总人年数;患病率,又称现患率,指某时点上受检人数中先患某种病的人数,通常用于描述病程较长或发病时间不易明确的疾病的患病情况,其分子包括新旧病例数,分母是受检总人数。在一定的人群和时间内,发病率和患病率有密切关系,两者与病程(D)的关系是:PR=IR×D。

16.请比较死亡率与病死率的不同。

答:死亡率与病死率的分子是一样的,均表示因某病死亡的人数,但死亡率的分母是总人年数,侧重反映发生的强度,或单位时间内死亡的概率;病死率的分母是患某病的人数,反映疾病死亡的概率。

17.应用相对数应注意的事项。

答:1.理解相对数的含义不可望文生义;2.频率型指标的解释要紧扣总体和属性;3.

计算相对数时分母应有足够数量;4.正确地合并频率(强度)型指标;5.相对数间的比较要具备可比性;6.对相对数的统计推断。

18.应用标准化的注意事项。

答:1.标准化的应用范围很广,适用于“某事件的发生率”可以是治愈率,也可以是患病率,还可以是发病率、病死率等。当某个分类变量在两组中分布不同时,这个分类变

量就成为两组频率比较的混杂因素,标准化法的目的就是消除这个混杂因素的影响。19.疾病统计有几类指标,各有什么意义?

答:发病率、时点患病率、期间患病率、治愈率、生存率、残疾患病率。前3种详见上述简答题。治愈率:表示受治病人中治愈的频率。有效率表示受治病人中治疗有效的频率。两个率主要用于对急性病危害或防治效果的评价。但治愈和有效的标准要有明确而具体的规定,只有在标准相同的情况下才可以相互比较。生存率:病人能活到某一时点的概率。常用于对慢性病及心血管病等的治疗效果评价和预后评估。

20.反映疾病的预防效果和治疗效果的指标有哪些?各有什么特点?

答:①发病率:疾病防治效果;②患病率:慢性病预防效果;③治愈率:急性病防治效果;④生存率:慢性病的治疗效果。各指标含义详见上述简答题。

21.测量生育水平有几个指标?各指标有什么不同?

答:①粗生育率;②总生育率;③年龄别生育率;④总和生育率。各指标含义详见教材P41。

22.测量人口再生育水平有几个指标?各指标有什么不同?

答:①自然增长率;②粗再生育率;③净再生育率。各指标含义详见教材P42。

23.人口统计应包括哪几个方面?

答:医学人口统计是从卫生保健的角度研究和描述人口数量、分布、结构、变动及其规律,研究人口与卫生事业发展的相互关系,是卫生统计学的重要组成部分。包括描述人口学特征的指标,生育和人口死亡的指标。详见书本P40-44。

24.人口金字塔有几种典型的形状?各说明什么?

答:人口金字塔直观地表示了人口的年龄、性别结构。每一层代表一个年龄组的人口,上部代表老年人,下部代表少年儿童,左半部代表男性,右半部代表女性,水平方向的长度表示男性和女性人口的数量各在总人口中所占的百分比。人口金字塔一共分3种类型:①年轻型:下宽上窄,呈真正的金字塔形,表明少年儿童人口占总人口的比重大,预示着未来人口的发展趋势是增长的。其人口增长模式一般为“高-低-高”模式,主要存在有发展中国家;②成年型:底部与中部的宽窄基本相近,出生率、死亡率差不多,预示着未来人口的发展趋势是稳定的。其人口增长模式一般为“低-低-低”模式;③老年型:上宽下窄,表明少年儿童人口的比重缩小,老年人口比重增大,是出生率长期下降的结果。这种类型的人口问题主要是育龄人口比重低,如果生育水平不变,预示着未来人口的发展趋势是负增长的。其人口增长模式一般为“低-低-低”模式,一般存在于发达国家。

第四章:常用概率分布

1.正态分布﹑标准正态分布与对数正态分布在概念上和应用上有何异同?

答:概念上:①相同点:正态分布、标准正态分布与对数正态分布都是变量的连续型分布。其特征是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边对称,均数处最高,两边逐渐减小,向外延伸,不与横轴相交。②相异点:表示方法不同,正态分布用N(μ,σ2)表示,标准正态分布用N(0,1)表示,对数正态分布N(μlgX,σ2lgX)表示。

(1)应用上:①相同点:正态分布、对数正态分布都可以转换为标准正态分布。

②相异点:标准正态分布是标准正态变量u的分布,标准正态曲线下的面积唯一的由

u决定,给应用带来极大方便。对医学资料呈偏态分布的数据,有的经对数变换后服从正态分布。正态分布、对数正态分布可描述变量值的分布特征,可用于正常值范围估计和质量控制等。正态分布是很多统计方法的理论基础。

2.医学中参考值范围的含义是什么?确定的原则和方法是什么?

含义:参考值范围亦称正常值范围,它是指特定健康状况人群(排除了有关疾病

和因素对所研究指标有影响的所谓“正常人”不同于“健康人”概念)的解剖、生理、生化等数据绝大多数人的波动范围。

(2)原则:

① 抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得结果

越可靠。一般认为样本含量最好在100例以上,以能得到一个分布较为稳定

的样本为原则。

② 对选定的正常人进行准确而统一的测定,保证测定数据可靠是确定正常值范

围的前提。

③ 判定是否要分组(如男女、年龄、地区等) 确定正常值范围。

④ 决定取双侧范围值还是单侧范围值。

⑤ 选择适当的百分范围

⑥ 确定可疑范围

⑦ 估计界值

(3)方法:

① 百分位数法:P x =L+(i/f x )(n ·x%-Σf L )

② 正态分布法(对数正态分布):

()

X lg X lg 1S u X lg S

u X α-α±±双侧

百分位数法用于各种分布型(或分布不明)资料;正态分布法用于服从或近似正

态分布(服从对数正态分布)的资料。

3.对称分布资料在“均数±1.96倍标准差”的范围内,也包括95%的观察值吗?

答:不一定。均数±1.96倍标准差是正态分布的分布规律,对称分布不一定是正态分

布。

4.正态分布的主要特征有哪些?

答:(1)正态曲线在横轴上方均数处最高。

(2)正态分布以均数为中心,左右对称。

(3)正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)。

(4)正态曲线下的面积分布有一定规律。

5.参考值范围是指什么?

答:参考值范围又称正常值范围,即大多数正常人某指标值的范围。“正常人”是指排除了影响研究指标的疾病和有关因素的同质人群。

6.简述估计参考值范围的步骤与要点。

答:设计:①样本: “正常人” ,大样本 n ≥100。②单侧或双侧。③指标分布类型。 计算:①若直方图看来像正态分布,用正态分布法。②若直方图看来不像正态分布,用百分位数法。

7.简述正态分布的用途。

答:(1)估计频数分布。(2)制定参考值范围。(3)质量控制。(4)统计检验的理论基础。

8.简述可信区间在假设检验问题中的作用。

答:可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。可信区间只能在预先规定的概率即检验水准的前提下进行计算,而假设检验能够获得一个较为确切的

概率P 值。故将二者结合起来,才是对假设检验问题的完整分析。

9. 二项分布、Poisson分布各有哪些特征?

答:二项分布和Poisson 分布都是离散型分布。

二项分布的形状取决于π与n 的大小:π=0.5 时,不论n 大小,分布对称。π≠0.5时,图形呈偏态,随n 的增大,逐渐对称。当n足够大,π或1-π不太小,二项分布B(n,π)近似于正态分布N( nπ, nπ(1-π) )。

Poisson 分布:λ值愈小分布愈偏,λ愈大分布趋于对称,当λ足够大时,分布接近正态分布N(λ,λ)。

10.简述二项分布、Poisson分布、正态分布的关系。

答:当n 足够大,π或1-π不太小时,二项分布近似于正态分布。当n 足够大,π或1-π很小时,二项分布近似于Poisson分布。λ较大时,Poisson 分布近似于正态分布。11.二项分布的应用条件是什么?

答:⑴每次试验有且仅有两个互相排斥的结果(A或非A)。

⑵每次试验中,发生A的概率相同,均为π。

⑶各次试验独立,即n 次观察结果相互独立。

12.医学参考值范围确定的方法是什么?

答:百分位数法和正态分布法。

13.简述二项分布、Poisson分布、正态分布的区别与联系。

答:区别:二项分布、Poisson分布是离散型概率分布,用概率函数描述其分布状况,而正态分布是连续型概率分布,用密度函数和分布函数描述其分布状况。联系:Poisson 分布可以视为n很大而π很小的二项分布。当n很大而π和1—π都不是很小的时候二项分布渐近正态分布,当λ》=20的时候Poisson分布渐近正态分布。

14.控制图的基本原理。

答:当影响某一数值指标的随机因素很多,而每个因素所起的作用均不太大时,这个指标的随机波动属于随机误差,则往往服从正态分布。相反,如果除随机误差外,还存在某些影响较大的因素导致的误差,称为系统误差,这时指标的波动就不再服从正态分布。

15.二项分布的特征?

答:二项分布图的高峰在μ=nπ处或附近;π为0.5时,图形是对称的;当π不等于

0.5时,分布不对称,且对同一n,π离0.5愈远,对称性愈差。对同一π,随着n的

增大,分布趋于对称。当n→∞时,只要π不太靠近0或1,二项分布趋于对称。

16.Poisson分布的特征?

答:(1)Poisson分布的总体均数与总体方差相等,均为λ。(2)当λ较小时,图形呈偏态分布;当λ较大时,图形呈正态分布。(3)Poisson分布的观察结果具有可加性。

17.正态分布曲线的位置与形状的特点?

答:(1)关于χ=μ对称。(2)在χ=μ处取得该概率密度函数最大值,在χ=μ±σ处有拐点。(3)曲线下面积为1。(4)μ决定曲线在横轴上的位置,μ增大,曲线沿横轴向右移;反之,μ减小,曲线沿横轴向左移。(5)σ决定曲线的形状,当μ恒定时,σ越大,数据越分散,曲线越“矮胖”;σ越小,数据越集中,曲线越“瘦高”。

18.什么叫标准正态分布?

答:标准正态分布又称为u分布,是以0为均数、以1为标准差的正态分布,记为N(0,1)。标准正态分布曲线下面积分布规律是:在-1.96~+1.96范围内曲线下的面积等于

0.9500,在-2.58~+2.58范围内曲线下面积为0.9900。统计学家还制定了一张统计用表(自由度为∞时),借助该表就可以估计出某些特殊u1和u2值范围内的曲线下面积。

19.确定医学参考值范围的方法及特点?

答:①百分位数法:双侧95%医学参考值范围是(P2.5,P97.5),单侧范围是P95以下(人体有害物质如血铅、发汞等),或P5以上(如肺活量)。该法适用于任何分布类型的资料。

②正态分布法:若X服从正态分布,医学参考值范围还可以依正态分布的规律计算。

20.二项分布的定义是什么?二项分布有哪些基本性质?

答:定义:二项分布是n个独立的是/非实验中成功次数的离散概率分布,其中每次实验成功的概率均为p。基本性质:①图形特征:具体见15题简答题;②二项分布的均数和标准差:详见教材P66页公式。

21.二项分布原理可进行哪些统计分析?

答:资料需首先满足以下条件:①每次实验只能发生两种对立的可能结果之一,分别发生两种结果的概率之和恒等于1;②每次实验产生某种结果的概率π固定不变;③重复实验是相互独立的,任何一次实验结果的出现不会影响其他实验结果出现的概率。可做统计分析包括:①总体率的区间估计:n≦50时,用查表法;n≧50时,用正态近似法,(p-ZαSp,p+ZαSp);②样本率与总体率的比较:n≦50时,直接概率法;n≧50时,用正态近似法;③两样本率的比较。

22.二项分布的拟合优度检验有什么实际意义?

答:拟合优度检验,即依据总体分布状况,计算出分类变量中各类别的期望频数,与分布的观察频数进行对比,判断期望频数与观察频数是否有显著差异,从而达到从分类变量进行分析的目的。实际意义在于可以判断某些疾病是否具有家族聚集性等。

23.Poisson分布的定义?列举几个Poisson分布变量分布的实例?

答:Poisson分布属于离散型分布,用以描述单位时间、空间、面积等的罕见事件发生次数的概率分布。例如:每毫升水中的大肠杆菌数、每个立升空气中的粉尘计数等。

24.Poisson分布理论可进行哪些统计分析?

答:资料首先满足以下条件:①事件发生的概率π固定不变;②每个事件的发生相互独立。可做统计分析包括:①区间估计;②单样本资料Z检验;③两独立样本资料Z检验。

25.对数正态分布数据如何制定正常值范围?

答:log-1(Yba-1.96Sy)— log-1(Yba+1.96Sy);其中:Y=logX。

第五章:参数估计基础

1.标准差和标准误有何区别和联系?

表3-6 标准差与标准误的区别

x a或)

标准差(α或s)标准误(x s

意义上描述一组变量值之间的离散趋势描述样本均数间的离散趋势

应用上① s越小,表示变量值围绕①x s越小,表示样本均数与

均值分布越密集,说明均数 总体均数越接近,说明样本

的代表性越好。 均数推断总体均数可靠性越大。

② 可用s u X a ±估计变量值分 ② 可用x s t X v a ,±估计总体

布范围 均数可信区间

与n 的关系 n 越大,s 越趋于稳定 n 越大,x s 越小

(2)联系

① 二者均是表示变异度大小的统计指标。

② 标准误n /x σ=σ与标准差大小成正比,与抽样例数n 的平方根成反比。

③ 当n 一定时,同一份资料,标准差越大,标准误也越大。

2.可信区间和参考值范围有何不同?

参考值范围是指同质总体中个体变量值的分布范围,如X ±1.96s 说明有95%

的变量值分布在此范围内,它与标准差的大小有关,若个体变异越大,该范围

越宽,分布也就越散。而可信区间是指在可信度为(1-α)时,估计总体参数

可能存在的范围。即从同一总体中随机抽样,当n 一定时,每抽一次即可得一个样本均值,以x s t X v a ,±计算可信区间,如95%可信区间,类似的随机抽

样进行一百次,平均有95次,即有95个可信区间包括了总体均数,有5次没

有包括括总体均数,5%是小概率事件,实际发生的可能性很小,因此实际应用

中就认为总体均数在求得的可信区间。这种估计方法犯错误的可能性最大不超

过5%。可信区间与标准误大小有关,标准误越大,可信区间则越大。

3.t 分布图形的特征?

答:(1)单峰分布,以0为中心,左右对称;(2)ν越小,t 值越分散,曲线的峰部越矮,尾部越高;(3)随着ν逐渐增大,t 分布逐渐接近标准正态分布;(4)当ν趋向∞时,t 分布趋近标准正态分布。

4.总体分布的形态和样本含量对样本均数的抽样分布会产生何种影响?

答:无论原始数据的总体分布形态如何,即对于任意分布而言,在样本含量足够大时,其样本均数的分布近似于正态分布,且样本均数的均数等于原分布的均数,样本均数的标准误有公式(6-1)计算。

5.样本均数的标准误的意义是什么?与原变量的标准差有何区别与联系?

答:样本均数的标准误可以反映样本均数之间的离散程度及抽样误差的大小。标准误与标准差的区别:(1)前者表示均数变异的指标,后者是表示观察值变异的指标。(2)用途不同,标准差与均数结合估计参考值范围,计算变异系数,和标准误等;标准误用于估计参数的可信区间,进行假设检验等。(3)它们与样本含量n 的关系不同,当样本含量n 足够大时,标准差趋向稳定,而标准误随的增大而减小。联系:当样本量n 一定时,标准误随标准差的大小而变化。

6.用同一个样本统计量分别估计总体参数的95%置信区间和99%置信区间,哪一个估计的精度更好?为什么?

答:95%置信区间的精度要好于99%置信区间。因为置信度或置信水平有95%提高到99%时,置信区间由窄变宽,估计的精度下降。

7.满足什么条件时可以采取正态近似法估计总体概率的置信区间?

答:当n 足够大,且样本频率p 和1—p 均不太小时,如np 与n(1—p)均大于5时,可

用正态近似法求总体概率的置信区间。

8.什么是抽样误差?如何减少抽样误差?

答:抽样误差:从某一总体中随机抽取一个或多个样本,所得的样本统计量与相应的总体参数之间的差异,或者各个样本统计量之间的差异称为抽样误差。可通过增加样本量来减少抽样误差。

9.总体分布的形态和样本含量对样本均数的抽样误差分布会产生何种影响?

答:在服从正态分布的总体中进行随机抽样,样本均数呈近似正态分布。在非正态分布的总体中随机抽样,当样本量较小时,样本均数的分布呈非正态分布;当样本量足够大时(如n≧30),样本均数的分布近似服从正态分布。

10.样本均数的分布有哪些基本特征?

答:①样本均数恰好等于总体均数是极其罕见的;②样本均数之间存在差异;③样本均数围绕总体均数,中间多,两边少,左右基本对称,呈近似正态分布;④样本均数之间的变异明显小于原始变量之间的变异。

11.总体均数的可信区间中的可信度和区间的宽度各说明什么问题?

答:可信度:反映了估计准确度;区间宽度的一半:反映了估计的精度。

12.抽样误差的大小受哪些因素的影响?

答:①抽样单位的数目。在其他条件不变的情况下,抽样单位的数目越多,抽样误差越小;抽样单位数目越少,抽样误差越大。这是因为随着样本数目的增多,样本结构越接近总体。抽样调查也就越接近全面调查。当样本扩大到总体时,则为全面调查,也就不存在抽样误差了。②总体被研究标志的变异程度。在其他条件不变的情况下,总体标志的变异程度越小,抽样误差越小。总体标志的变异程度越大,抽样误差越大。抽样误差和总体标志的变异程度成正比变化。这是因为总体的变异程度小,表示吝惜体各单位标志值之间的差异小。则样本指标与总体指标之间的差异也可能小;如果总体各单位标志值相等,则标志变动度为零,样本指标等于总体指标,此时不存在抽样误差。③抽样方法的选择。重复抽样和不重复抽样的抽样误差的大小不同。采用不重复抽样比采用重复抽样的抽样误差小。④抽样组织方式不同。采用不同的组织方式,会有不同的抽样误差,这是因为不同的抽样组织所抽中的样本,对于总体的代表性也不同。通常,我们不常利用不同的抽样误差,做出判断各种抽样组织方式的比较标准。

13.可信区间的含义是什么?可信区间的准确度和精密度指的是什么?

答:可信区间:将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为总体参数的置信区间。准确度:即为置信度;精确度:置信区间宽度的一半。

第六章:假设检验基础

1.假设检验和区间估计有何联系?

假设检验和区间估计都属于统计推断的内容。假设检验用以推断总体参数间是

否有质的区别,并可获得样本统计量,以得到相对精确的概率值。而可信区间

用于推断总体参数的大小,它不仅可用以回答假设检验的问题,尚可比假设检

验提供更多的信息。但这并不意味着用可信区间代替假设检验,因为假设检验

可得到P值,比较精确地说明结论的概率保证,而可信区间只能告诉我们在某

α水准上有无统计意义,却不能像P那样提供精确的概率。因此,只有将二者

有机地结合起来,相互补充,才是完整的分析。

2.假设检验时,一般当P <0.05时,则拒绝H 0,理论依据是什么?

假设检验时,当P<0.05,则拒绝Ho,其理论依据是在Ho成立的条件下,

出现大于等于现有检验统计量的概率P<0.05,它是小概率事件,即在一次

抽样中得到这么小概率是事件是不大可能发生的,因而拒绝它。由此可见,

假设检验的结论是具有概率性的,它存在犯错误的可能性小于等于0.05。

3.t检验和方差分析的应用条件有何异同?

(1)相同点:在均数比较中,t检验和方差分析均要求各样本来自正态总体;各处理组总体方差齐且各随机样本间相互独立,尤在小样本时更需注意。

(1)不同点:t检验仅用于两组资料的比较,除双侧检验外,尚可

进行单侧检验,亦可计算一定可信度的可信区间,提示差别有无实际意义。而方

差分析用于两组及两组以上均数的比较,亦可用于两组资料的方差齐性检验。

4.怎样正确使用单侧检验和双侧检验?

根据专业知识推断两个总体是否有差别时,是甲高于乙,还是乙高于甲,两种可

能都存在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或研究者仅关心

其中一种可能时,可选用单侧。一般来讲,双侧检验较稳妥故较多用,在预实验有

探索性质时,应以专业知识为依据,它充分利用了另一侧的不可能性,故检出效率

高,但应慎用。

5.第一类错误与第二类错误的区别及联系何在?了解这两类错误有何实际意义?

(1)假设检验中Ⅰ、Ⅱ型错误的区别。

Ⅰ型错误是拒绝了实际上成立的Ho,也称为“弃真”错误,用α表示。

统计推断时,根据研究者的要求来确定。

Ⅱ型错误是不拒绝实际上不成立的Ho,也称为“存伪”错误,用β表示。

它只能与特定的H1结合起来才有意义,一般难以确切估计。

(2)Ⅰ、Ⅱ型错误的联系。

①当抽样例数一定时,α越大,β越小;反之,α越小,β越大。

②统计推断中,Ⅰ、Ⅱ型错误均有可能发生,若要使两者都减小,可适

当增加样本含量。

③根据研究者要求,n一定时,可通过确定α水平来控制β大小。

(3)了解两类错误的实际意义。

①可用于样本含量的估计。

②可用来计算可信度(1-α),表明统计推断可靠性的大小。

③可用于计算把握度(1-β),来评价检验方法的效能等。

④有助于研究者选择适当的检验水准。

⑤可以说明统计结论的概率保证。

6.简述可信区间在假设检验问题中的作用。

答:可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。可信区间只能在预先规定的概率即检验水准的前提下进行计算,而假设检验能够获得一个较为确切的概率P 值。故将二者结合起来,才是对假设检验问题的完整分析。

7.假设检验时,当P≤0.05,则拒绝H0,理论依据是什么?

答:P 值为H0成立的条件下,比检验统计量更极端的概率,即大于等于检验统计量的概率。当P≤0.05 时,说明在H0 成立的条件下,得到现有检验结果的概率小于0.05,因为小概率事件几乎不可能在一次试验中发生,所以拒绝H0。下差别“有统计学”意义的结论的同时,我们能够知道可能犯错误的概率不会大于0.05,也就是说,有了概率保证。

8.假设检验中α与P 的区别何在?

答:以t 检验为例,α与P 都可用t 分布尾部面积大小表示,所不同的是:α值是指在统计推断时预先设定的一个小概率值,就是说如果H0是真的,允许它错误的被拒绝的概率。

P 值是由实际样本获得的,是指在H0 成立的前提下,出现大于或等于现有检验统计量的概率。

9.什么叫两型错误?作统计学假设检验为什么要加以考虑?

答:如果H0 正确,检验结果却拒绝H0,而接受H1,则犯I型错误,记为α;

如果H0 错误,检验结果却不拒绝H0,未能接受H1,则犯II型错误,记为β。

一般情况下,α越大,β越小;α越小,β越大。如果要同时减少两类错误,则需最大样本含量。因为假设检验的结论都有犯错误的可能性,所以实验者在下假设检验有无统计学意义的结论时,都要考虑到两型错误。

10.配对比较是不是就比成组比较好?什么情况下用配对比较比较好?

答:配对比较可以控制实验单位个体间的变异,从而减少实验误差,提高检验性能。但这并不是说凡是配对试验就一定比成组比较好。实验是否应做配对比较,首先应根据业务知识判断,看配成对子的个体间是否比不配对的个体间相似程度更高。

11. t 检验有几种?各适用于哪些情况?

答:t 检验以t 分布为理论基础。小样本时要求假定条件:资料服从正态分布,方差齐同。一般分为三种:

一是样本均数与总体均数比较的t 检验。即将一个样本均数X与一已知的总体均数作比较;二是配对资料的t 检验。例如治疗前后的比较,或配成对子的实验动物之间的比较。

三是两个样本均数比较的t 检验;两组的样本量可以不相同。

此外尚有相关系数、回归系数的t 检验。

12.什么叫假设检验?医学研究中常用的假设检验有哪些?

答:判断总体与样本之间、样本与样本之间的差异有无统计学意义的统计分析方法,一般步骤是:①提出检验假设0 H ,确定单双侧与检验水准α;②计算检验统计量;③确定概率P 值;④判断结果。在医学研究中常用的显著性检验有u 检验、t 检验、F 检验、2 检验及非参数秩和检验等多种,不论那种检验均以假设成立时得到的统计量的概率来判断。

13.通过实例说明为什么假设检验的结论不能绝对化?

答:统计的结论为概率性的结论。拒绝H0 时,可能犯Ⅰ型错误。不拒绝H0 时,可能犯Ⅱ型错误。

14.假设检验的理论依据是什么?(或者问基本思想)

答:采用逻辑上的反证法,利用“小概率思想”。小概率思想是是指概率事件(p<0.05或p<0.01)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立;如可能性大,则还不能认为假设不成立。

15.假设检验的一般步骤。

答:(1)根据所讨论的实际问题建立原假设H0及备择假设H1;(2)选择合适的检验统计量,并明确其分布;(3)对预先给定的小概率α,由确定临界值;(4)由样本值具体计算统计量的观察值,并作出判断接受H0还是拒绝H0。

16.假设检验的两类错误之间的区别与联系是什么?

答:假设检验时,拒绝实际上成立的H0,犯第Ⅰ类错误,俗称“弃真”错误;不拒绝实际上并不成立的H0,范第Ⅱ类错误,俗称“存伪”错误。犯第Ⅰ类错误错误的概率用α表示,假设检验时,根据研究者的要求来确定;犯第二类错误的概率用β表示,它只有与特定的H1结合起来才有意义。对于某一具体的检验来说,当样本含量n一定时,α越小,β越大;α越大,β越小。

17.检验假设中P值的意义是什么?

答:如果总体状况与H0一致,统计量获得现有数值以及更不利于H0的数值的概率。

18.如何确定检验水准?

答:检验水准确定需根据研究设计的类型、研究目的、变量类型及变异水平、样本大小等诸多因素。

19.如何恰当地应用单侧与双侧检验?

答:单侧与双侧检验的应用首先应考虑所要解决问题的目的,根据专业知识来确定。若从专业知识判断一种方法的结果不可能低于或高于另一种方法的结果时,可用单侧检验;在尚不能从专业知识判断两种结果谁高谁低时,则用双侧检验。一般认为双侧检验较保守和稳妥。

20.t检验的应用条件是什么?

答:(1)随机事件,(2)来自正态分布总体,(3)均数比较时,要求两总体方差相等。

21.配对t检验与两样本t检验的基本原理有何不同?

答:①独立样本t检验:用于检验两个独立样本是否来自具有相同均值的总体,相当于两个正态分布总体的均值是否相等,即假设检验:H0:μ1=μ2是否成立,此检验以t分布为检验基础;②配对t检验:检验两个相关的样本是否来自具有相同均值的正态总体,即检验假设H0:d=0,实质就是检验差值的均值和零均值之间的显著性。

22.两样本均数比较时为什么要做假设检验?

答:因为要确定两样本所表现出来的差异是两个总体本质上不同导致的,还是在相同总体中抽样由抽样误差导致的。

23.在假设检验中,无效假设与备择假设的含义是什么?两种假设之间有何关系?

答:无效假设:研究者想收集证据予以反对的假设,又称“0假设”,总是有符号=、≧和≦,表示为H0。备择假设:研究者想收集证据予以支持的假设,也称“研究假设”,总是有符号≠,<或>,表示为H1。原假设和备择假设是一个完备事件组,并且相互对立;在一项假设检验中,原假设和备择假设有且仅有一个成立;先确定备择假设再确定原假设;等号“=”总是放在原假设上;因研究目的不同,对同一问题可能提出不同的假设。

24.样本均数与总体均数比较时,何时用t检验,何时用u检验?

答:t检验与u检验均可用于样本均数与总体均数的比较或两样本均数的比较。理论上要求样本来自正态分布总体。但在实际应用时,只要样本例数n≧50,或者n较小但总体标准差σ已知时,可用u检验。n小且总体标准差σ未知时,可用t检验,但要求样本来自正态分布总体。两样本均数比较时,还要求两总体方差齐。

25.什么是配对设计?如何使配对研究设计的更好?

答:配对设计:将起始条件一致的两个实验个体配成对,并设有多个配对,每对个体分别随机给予不同处理,即为配对设计,目的是提高同质性,减少误差。配对设计分为以下几种情形:①配对的两个受试对象分别接受两种不同的处理;②同一受试对象接受两种不同的处理;③同一受试对象处理前后的结果进行比较;④同一对象的两个部位给予不同的处理。正确应用配对设计:①实验对象的同质性欠佳时,采用配对设计可以提高处理组间的可比性和均衡性;②配对设计的成败取决于配对的条件,只有当两组观察值间的相关大于0时,配对才是成功的,且能提高检验效能;③当采用左右配对设计时,实验因素的效应必须是局部的,不可经过其他途径影响对侧;④采用自身前后配对设计时,应考虑到环境、气候或疾病的自然进程等引起的效应改变;⑤配对设计的资料结合相关或回归分析,有时能得到更丰富的结论。

26.方差不齐时,两样本均数比较应采取什么方法做假设检验?

答:①若两小样本,且来自正态总体,则用t,检验;②若两小样本,不来自正态总体,则用秩和检验;③若为两大样本,n均>50,则用u检验。

第七章:方差分析基础

1.方差分析的基本思想是什么?

答:方差分析的基本思想是把全部观察值间的变异按设计和需要分解成两个或多个组成部分,然后将各个部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。

2.方差分析的应用条件是什么?

答:(1)各样本是相互独立的随机样本,(2)都采自正态总体,(3)各个总体方差相等。

3.方差分析的检验假设(H0)是什么?

答:各总体均数相等

4.方差分析中,各离均差平方和之间有何联系?各自由度之间又有何联系?完全随机设计、随机区组设计的方差分析的离均差平方和与自由度分别如何分解?

答:总的离均差平方和等于各部分离均差平方和之和. 总的自由度等于各部分自由度之和. 完全随机设计: SS 总=SS 组内+SS 组间V 总=V 组内+V 组间

随机区组设计: SS 总=SS 组内+SS 处理组间+SS 区组间

V 总=V 组内+V 处理组间+ V 区组间

5.三组均数比较时,为什么不能直接作一般的两两均数比较的t 检验?

答:增大犯第一类错误的可能性.

6.两组均数差别的假设检验能否作方差分析,为什么?

答:可以.方差分析与t 检验关系:k=2 时,F=t 2, P 值相等,即两检验等价。

7.方差分析中,组间变异是来源于那些方面的变异?

答:该变异除随机原因的影响外,有可能存在处理因素的作用。

8.对多组均数作方差分析的主要步骤和结果有那些?

答:(1)建立检验假设和检验水准

(2)计算统计量 F 值(列出方差分析表)

(3)确定P 值和作出推断结论

(4)作两两均数之间的比较(若P>0.05 则可省略此步骤)。

9.方差分析是用于研究何种数据的统计方法?

答:用于定量变量资料,可以比较两个及两个以上均数的差别,并且应满足以下条件:

①各样本是相互独立的随机样本,均服从正态分布;②各样本的总体方差相等,即方差齐。

10.两独立样本t检验与完全随机设计资料的方差分析有何关系?配对样本t检验与随机区组设计资料的方差分析有何关系?

答:对同一资料而言,两独立样本t检验等价于完全随机设计资料的ANOVA,且有F=t2;对同一资料,配对样本t检验等价于随机区组设计资料的ANOVA,且有F=t2。

11.SNK-q检验Dunnett-t检验都可用于均数的多重比较,它们有何不同?

答:SNK-q检验和Dunnett-t检验虽然都可用于ANOVA得出多个总体均数不全等提示后的多重比较,但SNK-q检验常用于探索性研究,是对多个均数每两个均数间的比较;而Dunnett-t检验常用于事先有明确假设的证实性研究,用于在设计阶段就根据研究目的或专业知识而计划好的某些均数间的两两比较,如多个处理组与对照组的比较,某一对或某几对在专业上有特殊意义的均数间的比较等。

12.数据变换在资料处理中起到什么作用?

答:资料不满足方差分析条件时,处理方法之一是数据变换。对于明显偏离正态性和方差不齐的资料,通过适当的数据变换可以近似的满足假定条件,便于进行方差分析。

13.什么是方差分析?方差分析的主要用途是什么?

答:方差分析:又称F 检验,包括单因素方差分析和多因素方差分析。无论哪种方差分析都是通过对数据变异的分解,判断不同样本所代表的总体均数是否相同。用途:①均数差别的显著性检验;②分离各有关因素并估计其对总变异的作用;③分析因素间的交互作用;④方差齐性检验。

14.何为单因素方差分析和双因素方差分析,各适用于什么情况?

答:单因素方差分析:即影响样本的因素只有一个,用于完全随机设计的多个样本均数间的比较,其统计判断是判断各样本所代表的总体均数是否相等。双因素方差分析:影响样本的因素有两个,双因素方差分析是对影响因素进行检验,研究是一个因素在起作用,还是两个因素都起作用,或是两个因素的影响都不明显。

15.有人说,多个样本均数间的两两比较无非就是做若干次t 检验。您的看法如何?

答:不正确,多个样本均数间两两比较时,若采用t 检验的方法,则会增大第一类错误的概率,即拒绝实际上成立H 0,接受H 1,可能将实际上无差异的两个总体均数误判为有差异,造成了假阳性。应采用专用的两两比较的方法。

16.t 检验与方差分析的区别是什么?

答:t 检验只能用于两样本均数及样本均数与总体均数之间的比较;方差分析可以用于两样本及以上样本之间的比较。

17.t 检验和方差分析的应用条件有何异同?

答:相同点:①独立随机;②正态;③方差齐;④配伍组比较的方差分析是配对比较t 检验的推广,成组设计多个样本均数比较的方差分析是两样本均数比较t 检验的推广;

⑤对于两个样本之间的比较,方差分析和t 检验是等效的,F=t 2。不同点:t 检验只能用于

两样本均数的比较,而方差分析可以用于两样本及以上样本之间的比较。

第八章:χ2检验

1.X 2检验适用于解决那些问题?对资料的设计类型和应用条件有何不同要求?

(1)X 2检验适用于:① 两个及两个以上的率或构成比的比较;② 计数资料两因素

间的相关关系;③ 频数分布的拟合优度检验。

(2)对资料的设计类型和应用条件。

1)四格表的X 2检验:

基本公式T T A X 2

2

)(-= T >5且n >40 专用公式 ))()()(()(22

d b c a d c b a n bc ad X ++++-= 校正公式)

)()()(()2/(22d b c a d c b a n

n bc ad X ++++--= 1<T <5且n >40 或 T

T A X 2

2)5.0(--= 当T <1或n <40时,可使用确切概率计算法直接计算概率,应用时注意区分单、 双侧检验。双侧检验。双侧检验取两侧累积概率,单侧检验只取一侧累积概率。

2)行×列(R ×C )表资料的X 2检验:

基本公式与四格表基本公式相同。

专用公式:)1(2

2

-∑=C R n n A n X 可使用实际频数计算X 2。

适用条件① 行×列表不宜有1/5以上的格子的理论频数小于5,或有一格理 论频数小于1。② 当多个样本率(或构成比)比较的X 2检验,拒绝检验假设, 只能认为各总体率(或构成比)之间总的有差别,但不能说明彼此间都有差别 或某两者间有差别,若要进一步解决此问题,可用X 2分割法。③ 对单向有序列 联表,X 2检验只说明各处理组的效应在构成比上有无差别。

3)列联表资料的X 2检验:

R ×C 列联表公式:与R ×C (行×列)表相同,但检验假设不同,R ×C 列联

表用于检验有无关联,而R ×C (行×列)表用于多个率或构成比的比较。适用条件与行×列表适用条件①相同。

2×2列联表或配对资料X 2检验,检验两个处理有无差别。

c b c b X +-=2

2)( b+c >40

或校正公式 c b c b X +--=2

2)1( b+c <40

检验两种处理间有无相关,公式同四格表所用公式

4)频数分布拟合优度的X 2 公式T T A X 2

2

)(-= 适用条件遇有理论频数小于5时,可与相邻组合并。

2. X 2检验的基本思想是什么?

答:X 2检验的基本思想是实际数与理论编数的吻合程度,它是根据检验假设来确定的, 如作两样本率的比较,我们先假设两组的总体率相同,均等于两组合计的总率,如

果检验假设成立,则实际数与理论数之差一般不会很大。出现很大的X 2 值的概率是

很小的若PX 则没有理由 拒绝它

3.四表格资料在何种情况下需要进行校正?为什么?

在1≤T <5 n ≥40时,需要计算校正X 2

推断统计量X 2时是用一种连续概率分布(X 2分布)作为对观测频数概率分布的近似,

为改善此近似F.Yates 提出了一个修正,即取平方之前将正偏差(A-T )减0.5,负

偏差加0.5,这样使X 2值降低,校正后的概率更接近确切的概率。

4.行X 列表X 2检验的注意事项有哪些?

答:(1)X 2检验要求理论数不宜太小,否则将导致分析的偏性,一般认为行X 列表中不

宜有1/5以上格子的理论频数小于5,或有一个理论数小于1。对理论数频数大小有三种处理方法:

① 最好增加样本例数以增加理论频数

② 删去上述理论频数太小的行或列

③ 将太小理论频数所在行或列与性质相近的邻行邻列的实际频数合并。

后两法可能会损失信息,也会损失样本的随机性,不同的合并方式有可能影响推断结论,故不宜作常规方法。

(2)当多个样本率(或构成比)比较的X2检验,结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间总的来说有差别,但不能说明它们彼此见都有差别,或

某两个间有差别,实际工作中,常常还需要知道各组间比较的情况,若要进一步解

决此问题,不能采用一般四格表的X2检验进行两两比较,因为这会增大犯Ⅰ型错误的概率,可采用以下方法:

①改变显著水准后的两两比较法(Brunden法)

前已述及,若将多个样本两两构成四格表,用一般的四格表方法会增大Ⅰ型错误,

那么,一种自然的想法就是能否将显著水准适当降低,从而一方面相当于抵消Ⅰ型

误差的增加,一方面又可采用一般的四格表方法处理?改变显著性水准的方法正是

基于这种思想。Brunden法系将检验水准α调整为α

α’=α/2(K-1)(9.10)

式中K为样本数,然后用求得的各四格表的X2值与X2α值比较,从而作出推断,也

就是说,若取α=0.05,K=6(则α’=0.005),则不能用X20.05(1)=3.84为界值,而要

用X20.05(1)=7.88为界值。此外,也可用各四X2检验对应的P值与α’比较而得出结

论。

②改变显著界值的两两比较法:

该法类似于上法,但考虑到了处理组数a,因而更合理,处理组数a是各组按率的

大小排列后,欲比较的两组间包括的组数,表9.1列出了用蒙特卡洛模拟法求出K×2

表分割为非独立的四格表的显著界值。有了此显著界值后,只要用各四格表的X2值

与相应的界值相比即可作出结论。

χ检验的用途有哪些?

5.2

答:主要适用于计数资料,(1)两个及两个以上的率或构成比的比较(2)交叉分类资料两属性间的关联性检验(3)频数分布的拟合优度。

6.以下表资料说明χ 2 检验的基本思想。(不用计算)

答:基本思想:假设观察值来自理论分布,则观察值与理论值就不会差别太大,如果差距太大,则怀疑 H0 是否成立。完全符合则为 0 或特别小,x 2 值越小,越支持 H0。

χ检验的条件有哪些?

7.四格表资料2

答:T<1 或 n<40 确切概率法

n≥40 但有 1 T<5 要校正

n≥40 并且 T>5 不必校正

8.某病的发病率对全国人口来说是 8.72%,现在某县回顾一年,抽样调查了 120 人,有 16

χ检验,你人发病,如果要考察该县的发病率是否高于全国,请问可不可以对该份资料作2

认为应该用什么方法?

答:不能,用单样本率比较的u检验。

9.比较两个独立样本频率分布的χ2检验,和比较两个配对样本频率分布的χ2检验在设计方法、资料整理、假设检验等方面的差别是什么?

答:前面针对的是“两独立样本”,行合计是事先固定的;而后者实质上是一组样本,及时可以看成两个样本,也是“两个互不独立的样本”,样本含量都是n,是固定的,而行合计与列合计却是事先不确定的。

前者原始数据可以表示为教材中表9-3所示的四格表形式,而后者原始数据表示为表9-9所示的四格表形式。检验统计量,前者用教材中公式9-5和公式9-7,而后者用9-9和9-10。

10.如果实验效应应用等级资料表示,欲比较两组总体效应间差别是否有统计学意义,为什么不能用χ2检验?请举例说明。

答:关键在于此时χ2检验差别有统计意义,只能推断两频率分布不同,而频率分布不同不能说明两总体平均水平不同。

11.为什么有些四格表(或RXC表)必须要计算确切概率?

答:因为只有在大样本时检验统计量(那个公式)才近似地服从χ2分布;样本量不够大时,如果n>40,且T≧1尚可以校正;如果样本量更小,χ2检验就不适用了,只能计算确切概率。

12.行X列表资料做χ2检验的目的是什么?

答:①行X列表资料卡方检验用于多个率或多个构成比的比较;②行X列列联表卡方检验用于检验双向无序分类资料间有无关联。

13.配对χ2检验适用于什么情况?为什么要做四格表的配对设计?

答:有时对样本中各观察单位分别用两种方法处理,然后观察两种处理方法的某两分类变量的计数结果。两份样本实际上是一样的,不是相互独立的,比较的样本资料并非具有相互独立的条件,不能直接用单纯的行列表公式进行假设检验,此时配对卡方检验最为适用。用于检验两种处理有无差别。

14.四格表确切概率法检验的基本原理是什么?

答:在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率Pi,再按检验假设求得单侧或双侧的累计概率P,依据所取得检验水准α作出推断。

15.卡方检验的应用条件有哪些?

答:①随机样本数据;②卡方检验的理论频数不能太小。

两个独立样本比较可以分以下3种情况:

①所有的理论数T≥5并且总样本量n≥40,用Pearson卡方进行检验。

②如果理论数T<5但T≥1,并且n≥40,用连续性校正的卡方进行检验。

③如果有理论数T<1或n<40,则用Fisher’s检验。

上述是适用于四格表。

R×C表卡方检验应用条件:

①R×C表中理论数小于5的格子不能超过1/5;

②不能有小于1的理论数。如果实验中也不符合R×C表的卡方检验。可以通过增加样本数、列合并来实现。

16.四格表的u检验与卡方检验有何异同?

答:相同点:凡是能用u检验进行的两个率比较检验的资料,都可用卡方检验,二者是等价的:u2=χ2。不同点:①u检验可进行单侧检验;②满足四格表u检验的资料,计算两个率之差的可信区间,可从专业上判断两个率之差有无实际意义;②χ2检验可用于2X2列

联表资料有无关联的检验。

(有待补充)

第九章:基于秩次的非参数检验

1. 参数检验与非参数检验的区别何在?各有何优缺点?

答:(1)参数检验与非参数检验的区别。

1)参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。

2)非参数检验:不依赖总体分布的具体形式和检验分布(如位置)是否相同。

(2)参数检验与非参数检验的优缺点。

1)参数检验:优点是符合条件时,检验效率高;其缺点是对资料要求严格,如等级数据、非确定数据(>50mg)不能使用参数检验,而且要求资料的分布型已知和总体方差相等。

2)非参数检验:优点是应用范围广、简便、易掌握;缺点是若对符合参数检验条件的资料用非参数检验,则检验效率低于参数检验。如无效假设是正确的,非参数法与

参数法一样好,但如果无效假设是错误的,则非参数检验效果较差,如需检验出同

样大小的差异的差异往往需要较多的资料。另一点是非参数检验统计量是近似服从

某一部分,检验的界值表也是有近似的(如配对秩和检验)因此其结果有一定近似

性。

2.非参数检验适用那些情况?

答:(1)等级顺序资料。

(2)偏态资料。当观察资料呈偏态或极度偏态分布而有未经变量变换,或虽经变量变换但仍未达到正态或近似正态分布时,宜用非参数检验。

(3)未知分布型资料

(4)要比较的各组资料变异度相差较大,方差不齐,且不能变换达到齐性。

(5)初步分析。有些医学资料由于统计工作量过大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容)

(6)对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。

3.为什么秩和检验的编秩在不同对比组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次?

答:因为在不同对比组,不取平均秩次会加大或减小某一组的秩和;而在同一组

内,出现相同数据不编平均秩次,该组秩和不受影响。

4.两样本比较的秩和检验当n1>10,n2-n1>10时采用u检验,这时检验是属于参数检验还是非参数检验,为什么?

答:两组比较的秩和检验,当n大时,秩和分布近似正态分布,此时不必要再编制比n 更大的T检验界值表,而利用秩和分布随n增大渐近正态分布的性质,进行u检验,故仍属于非参数检。

5.秩和检验有哪些优缺点?

答:其主要的优点:(1)适用范围广:①等级资料。②偏态资料。当观察资料呈偏态或极度偏态分布而又未作变量交换,或虽经变量变换仍未达到正态或近似正态分布时,宜用非参数检验。③各组离散程度相差悬殊,即方差明显不齐,且不能通过变量变换达到齐性。④个体数据偏离过大,或资料为单侧或双侧没有上限或下限。⑤分布类型不明。

㈥初步分析。(有些医学资料由于统计工作量大,可采用非参数检验统计方法进行初步分析,挑选其中有意义者再进一步分析。)⑦对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布做出估计,在这种情况下可用非参数统计方法。(2)

方法简便、易于理解和掌握。主要缺点:损失信息量,适用于参数检验条件的资料用非参数检验,检验效能降低。

6.两组或多组有序分类资料的比较,为什么宜用秩和检验而不是χ2检验?

答:指标为等级资料,宜用多组有序变量资料的秩和检验;若采用列联表χ2检验进行分析,其比较的就不再是实验效应,而是几组资料的间的分布有无差别,即比较几类资料构成比总体上有无不同,所以不能用χ2检验。

7.两独立样本比较的Wilcoxon秩和检验,当n1>10或n2—n1>10时用Z检验,这时检验是属于参数检验还是非参数检验,为什么?

答:属于非参数检验,因为这时的Z检验是比较例数较小组秩和与其总体均数n(N+1)/2的差别。

8.请指出非参数检验与参数检验相比的优、缺点。

答:非参数检验适用范围广,收集资料、统计分析也比较方便。但检验效率没有参数检验高,犯第二类错误的概率较大。

9.简述参数检验与非参数检验的定义及两者的区别。

答:参数统计是总体的分布类型是已知的,对其中某些未知的参数进行估计和检验的统计方法。特点:依赖于特定的分布类型,比较的是参数。非参数统计是不依赖于总体分布具体形式的统计方法。特点:不受总体参数的影响,比较的是分布或分布位置,而不是参数。10.简述配对比较秩和检验的编秩方法。

答:求差值,差值编秩;差值0 删去,相同值取平均秩次。

11.配对设计差值的符号秩和检验步骤。

答:(1)H0:差值的总体中位数Md=0;H1:Md≠0; =0.05

(2)求差值

(3)编秩:依差值的绝对值从小到大秩次。绝对值相等者,若符号不同取平均秩次;零差值不参与编秩,同时样本数-1;将差值的正负标在秩次之前。

(4)求秩和确定检验统计量:分别求正、负秩次之和,任取T+ 或T—作检验统计量T,(5)确定P 值,作推断结论。

12.两组比较的秩和检验的编秩方法。

答:将两样本混合编秩次。若有“相同数据”,处于不同组,便取平均秩次;处于同一组,不必取平均秩次。

13.对同一资料,又出自同一研究目的,用参数检验和非参检验结果不一致时,宜以何为准?答:当资料满足参数检验方法的条件时,应使用参数检验方法;当资料不满足参数检验方法的条件时,必须采用非参数检验方法。

14.非参数检验的适用范围。

答:①各种资料的初步分析;

②等级资料:某种标志不便准确测定,只能以严重程度、优劣等级、成效大小、名次先

后或综合判断等方式定出次序;

③资料分布类型不能确定或偏态分布;

④综合分析同质性较差的资料,如不同地点、不同年份的某种实验结果;

⑤组内个别数据偏离过大,或各组内相差悬殊。

第十、十一章:两变量关联性分析,简单线性回归(回归与相关)

1.应用直线回归和相关分析时应注意那些问题?

答:(1)作回归分析和相关分析时要有实际意义,不能把毫无关联的两种现象作回归、相关分析,必须对两种现象间的内在联系有所认识。

卫生统计学简答题

卫生统计学简答题 方差分析的基本思想和应用条件是什么? 答:方差分析的基本思想是,对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较。不同之处在于变异分解的项目因设计不同而异。具体来讲,根据试验设计的类型和研究目的,将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,从而推论各种研究因素对试验结果有无影响。其应用条件是,①各样本是相互独立的随机样本,均服从正态分布;②各样本的总体方差相等,即方差齐性。 多组定量资料比较时,统计处理的基本流程是什么? 答:多组定量资料比较时首先应考虑用方差分析,对其应用条件进行检验,即方差齐性及各样本的正态性检验。若方差齐性,且各样本均服从正态分布,选单因素方差分析。若方差不齐,或某样本不服从正态分布,选Kruskal-Wallis秩和检验,或通过某种形式的数据变换使其满足方差分析的条件。若方差分析或秩和检验结果有统计学意义,则需选择合适的方法(如Bonferonni、LSD法等)进行两两比较。 简述秩和检验的优缺点 秩和检验的优点是(1)不受总体分布限制,适用面广;(2)适用于等级资料及两端无确定值的资料;(3)易于理解,易于计算。缺点是符合参数检验的资料,用秩和检验,则不能充分利用信息,检验效能低。 试述假设检验与置信区间的联系与区别。 答:区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法。置信区间用于说明量的大小,即推断总体参数的置信范围;而假设检验用于推断质的不同,即判断两总体参数是否不等。 试述两类错误的意义及其关系。 答:Ⅰ类错误(typeⅠerror):如果检验假设0H实际是正确的,由样本数据计算获得的检验统计量得出拒绝0H的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设0H(弃真)的错误称为Ⅰ类错误。Ⅱ类错误(type Ⅱerror):假设检验的另一类错误称为Ⅱ类错误(type Ⅱerror),即检验假设0H原本不正确(1H正确),由样本数据计算获得的检验统计量得出不拒绝0H(纳伪)的结论,此时就犯了Ⅱ类错误。Ⅱ类错误的概率用β表示。在假设检验时,应兼顾犯Ⅰ类错误的概率(α)和犯Ⅱ类错误的概率(β)。犯Ⅰ类错误的概率(α)和犯Ⅱ类错误的概率(β)成反比。如果把Ⅰ类错误的概率定得很小,势必增加犯Ⅱ类错误的概率,从而降低检验效能;反之,如果把Ⅱ类错误的概率定得很小,势必增加犯Ⅰ类错误的概率,从而降低了置信度。为了同时减小α和β,只有通过增加样本含量,减少抽样误差大小来实现。 什么资料适合用秩和检验进行检验?简述秩和检验步骤。 答:提示:进行有序资料的比较时宜采用秩和检验。 (1)等级资料;(2)偏态资料;(3)分布不明的资料;(4)资料中各组方差不齐,且转换后不能达到方差齐性;(5)一端或两端无界。 秩和检验步骤为:①建立假设H0和H1,并确定检验水准α;②根据不同的设计类型对

统计学简答题及答案

统计学简答题及参考答案 1.简述描述统计学的概念、研究容与目的。 概念:它是研究数据收集、整理和描述的统计学分支。 研究容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。 研究目的:描述数据的特征;找出数据的基本数量规律。 2.简述推断统计学的概念、研究容与目的。 概念:它是研究如何利用样本数据来推断总体特征的统计学分支。 研究容:参数估计和假设检验的理论与方法。 研究目的:对总体特征作出统计推断。 3.什么是总体和样本? 总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。 可分为有限总体和无限总体: ?有限总体的围能够明确确定,且元素的数目是有限的,可数的。 ?无限总体所包括的元素数目是无限的,不可数的。 总体单位数可用N表示。 样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量,记为n。 4.什么是普查?它有哪些特点? 普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。它有以下的特点: 1)通常是一次性或周期性的 2)一般需要规定统一的标准调查时间 3)数据的规化程度较高 4)应用围比较狭窄。 5.什么是抽样调查?它有哪些特点? 抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。 它具有经济性好、时效性强、适应面广、准确性高等特点。 6.简述统计调查方案的概念及应包括的基本容。 答:统计调查方案就是统计调查前所制订的实施计划,它是指导整个调查过程的纲领性文件,是保证调查工作有计划、有组织、有系统地进行的计划书。 它应包括的基本容有: 〈1〉明确调查目的; 〈2〉确定调查对象和调查单位; 〈3〉设计调查项目; 〈4〉设计调查表格和问卷; 〈5〉确定调查时间; 〈6〉组织实施调查计划; 〈7〉调查报告的撰写,等等。 7.简述统计分组的概念、原则和具体方法。 答:(1)概念

卫生统计学考试重点总结复习

一、绪论 1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。 2.样本:从总体中随机抽取部分观察单位所组成的集合。 3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。 4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。 5.变量的类型及其转换: ①定性变量:a.分类变量(计数资料)i.二分类变量 ii.多项无序分类 b.有序变量(等级资料) ②定量变量:a.连续型变量 b.离散型变量 变量只能由“高级”向“低级”转化:定量→有序→分类→二值。 6.概率:是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象:有变异的事物。 10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。 11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。 13.误差可分为:系统误差、随机测量误差、抽样误差。 14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。 二、定量资料的统计描述 1.频率分布表的编制步骤: ①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。 2.频率分布表的用途: ①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时,可用各组段的频率作为概率的估计值。 3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。 4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。 5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离散度大,标准差小,则离散度小。 6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。 三、定性资料的统计描述 1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型:

统计学原理简答题答案

《统计学原理》简答题答案 第一章总论 1.统计一词有几种含义?它们之间的关系? 答:三种。统计工作、统计资料、统计学。 (1)统计工作:即统计实践活动,是指从事统计业务的机关、单位利用科学的统计方法,搜集、整理分析和提供有关客观现象的数据资料、研究数据的内在特征,并预测事物的发展方向等一系列工作过程的总称。 (2)统计资料:是统计实践过程的取得的各项数据资料以及和它相联系的其他资料的总称。 (3)统计学:统计工作和统计资料的关系是统计活动即过程和统计成果的关系,统计工作和统计学的关系是统计实践和统计理论的关系 2.社会经济统计的特点有哪些? 答:社会经济统计是社会现象的一种调查分析活动,它具有以下特点: a)数量性 b)总体性 c)变异性 d)社会性 3.什么是统计总体、统计单位、标志、变异、变量和变量值?并举例说明。答:(1)统计总体,简称总体,是指客观存在的在同一性质基础上结合起来的许多个别事物的整体。例如,研究某班学生的情况时,该班全体学生就是一个统计总体。 (2)统计单位,是指构成统计总体的个别事物。例如,以我国全部普通高等院校为总体,每一个普通高等院校就是总体单位。 (3)标志,是指总体单位所共同具有的某种属性或特征。例如,工人作为总体单位,他们都具备性别、工种、文化程度、工会、工资等属性或特征。 (4)变异是变动的标志,具体表现在各个单位的差异,包括量(数值)的变异和质(性质、属性)的变异。如:性别表现为男、女,这是属性变异;年龄表现为18岁、25岁、28岁等这是数值上的变异。 (5)变量,就是可变的数量标志。例如,商业企业的职工人数、商品流转额、流动资金占用额等数量标志,在各个商业企业的具体表现都是不尽相同的,是一个变动的量,这些变动的数量标志就称作变量。 (6)变量值,就是变量的具体表现,也就是变动的数量标志的具体表现。例如,企业的职工人数是一个变量,甲企业职工人数100人,乙企业职工人数150人,丙企业职工人数200人等等,100人、150人、200人都是职工人数这个变量的变量值(标志值)。 4.总体好和总体单位有什么关系? 答:总体和总体单位是相对而言的。随着研究目的和范围的变化,同一事物在不同的情况下可以是总体单位,也可以转化为总体

卫生统计学简答题汇总

统计学简答汇总 第一章:绪论(无) 第二章:定量变量的统计描述 1.均数﹑几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。 不同点:表2-5. 表2-5 均数,几何均数和中位数的相异点 平均数意义应用场合 均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布 几何均数平均增减倍数①等比资料;②对数正态分布资料 中位数位次居中的观①偏态资料;②分布不明资料;③分布一端或两 察值水平端出现不确定值 2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系? 答: 1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。 (2)计算:中位数和百分位数均可用同一公式计算,即 Px=L+(i/f x)(n·x%-Σf L) 可根据研究目的选择不同的百分位数代入公式进行计算分析。 (3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中 更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。 3.同一资料的标准差是否一定小于均数? 答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。 变异大,标准差就大,有时比均数大;变异小,标准差小。 4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些? (1)样本含量的大小,样本含量越大,标准差越稳定。 (2)分组的多少 (3)分布形状的影响,偏态分布的标准差较近似正态分布大 (4)随机测量误差大小的影响 (5)研究总体中观察值之间变异程度大小 5.标准差与变异系数的异同点有哪些? 答:标准差:是以算数平均数为中心,反映各观测值离散程度的一个绝对指标.当需要对同一总体不同时期或对不同总体进行对比时,缺乏可比性.当总体平均水平不同或计量单位不同时,用标准差是无法实现两组数据离散程度大小对比的. 变异系数:标准差与平均数的比值称为变异系数,记为C·V.变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。 6.如何表达一批计量数据的基本特征? 答:从集中趋势和离散趋势两方面回答。 7. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况? 答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系

统计学简答题答案资料讲解

1、什么是统计学,有哪些特点? 统计学是收集、整理、分析、解释数据并从数据中得到结论的学科。 特点:客观性~~相关性~~实用性~~科学性~~严谨性~~逻辑性~~~ 2、何谓标志,按能否用数量表示可以分为哪两种类型,分别举例说明 标志是指说明总体单位属性或特征的名称。可以分为数量标志和质量标志 品质标志:说明总体单位属性特征的名称,用文字描述。Ex:性别,名族,工种,籍贯数量标志:说明总体单位数量特征的名称,用数量表示。数量标志的具体表现称标志值。 Ex:工人的年龄,工资,工龄 3、什么是离散型变量,连续性变量?举例说明 变量:可变的数量标志和指标; 离散型变量:指变量的数值只能以计数的方法取得,(变量值只能取整数); 连续型变量:指变量的取值连续不断,(变量值能取小数)。 4、简述品质标志和数量标志的区别,并举例说明。 区别:数量标志说明的是总体的数量特征,而品质标志说明的是总体的属性特征。 5、什么是数量指标和质量指标?二者有何关系? 统计指标:反映总体数量特征的科学概念和具体数值。 注意:从理论上讲,一个完整的统计指标由两部分构成:指标名称+指标数值 例如:某地区2009年完成利税总额(指标名称)为1500(指标数值)亿元。 数量指标:用来反映现象的总规模、总水平、或工作总量的指标。其数值大小随总体的研究范围的大小而增减。 质量指标:反映客观现象的劳动效果或工作质量等事物内部数量关系的指标,其数值的大小与总体的研究范围大小无直接联系。 6、统计标志和统计指标有和联系与区别? 区别:1、标志是反映总体单位特征;指标反映总体特征。 2、指标都能用数量表示,标志只有数量标志能用数量表示; 3、标志是一个理论概念,实际应用中只有指标。 联系:1、标志与指标可以相互转化,随研究目的的转化而改变; 2、指标值一般是标志值汇总来的; 3、标志的名称常常就是指标名称。 7、制定一份完整的统计调查方案,应包括哪些内容? 1)明确调查的目的和任务 2)确定调查的对象和调查单位、 3)确定带调查项目、设计调查表或问卷 4)确定调查时间、调查地点和调查方式方法 5)制定调查的组织实施计划 8、举例说明重点调查的概念和特点 重点调查:是在调查对象范围内部选择部分重点调查单位进行的调查。 特点:调查单位少、适用于调查对象的标志值比较集中于某些单位的场合、重点调查的调查方式主要采取专门调查的组织形式(一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。);有点在于花费较少的人力物力和时间就可以获得总体的基本情况资料。 9、简述重点调查、典型调查、抽样调查的联系与区别P31 抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来进行观测研究,以抽样样本的指标去推算总体指标的一种调查。

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

厦门大学统计学原理期末试题与答案完整版

厦门大学网络教育 2013-2014学年第一学期 《统计学原理》复习题 、单选题 1、统计调查方法体系中,作为“主体”的是( A ) A .经常性抽样调查 B.必要的统计报表 2、考虑全国的工业企业的情况时,以下标志中属于不变标志的有( A .产业分类 B.职工人数 C.劳动生产率 3、某地区抽取3个大型钢铁企业对钢铁行业的经营状况进行调查,这种调查是 4、下列这组数列15,17,17,18,22,24,50,62的中位数是(C )。 现象之间的相关程度越低,贝刑关系数越( 接近+1 B 接近-1 接近0 8、假定其他变量不改变,研究一个变量和另一个变量间的相关关系的是( 9、已知两个同类型企业职工平均工资的标准差分别为 8元,12元,则两个企业职 工平均工资的代表性是(A ) 10、( C 。是标志的承担者。 C.重点调查及估计推算 D.周期性普查 D.所有制 A .普查 B .典型调查 C.重点调查 D .抽样调查 A.17 B.18 C.20 5、标志变异指标中最容易受极端值影响的是( A.极差 B.平均差 &简单分组与复合分组的区别在于( 总体的复杂程度不同 选择分组标志的性质不同 A. C. D.22 C. B. D. 标准差 D.标准差系数 ) 组数多少不同 选择的分组标志的数量不同 7、 A.偏相关 B.正相关 C.完全相关 D.复相关 A.甲大于乙 B.乙大于甲 C. 一样的 D.无法判断

11、 下列各项中属于数量标志的是(A ) A.年龄 B.学历 C.民族 D.性别 12、 某商品价格上涨了 5%,销售额增加了 10%,则销售量增加了( C ) A. 15% B. 5.2 % C. 4.8 % D. 2 % 13、某变量数列末组为开口组,下限是 500;又知其邻组的组中值是 480,则该组 的组 中值应为(D )0 B.时间和指标数值 C.时间和次数 20、现象总体中最普遍出现的标志值是( A ) A.变量 B.总体 C.总体单位 D.指标 A. 490 B. 500 C. 510 D. 520 14、根据最小二乘法原理所配合的一元线性回归方程,是使( B )0 无 (Y -Y?)2 为最小 送(Y -Y?) = 0 A S (Y -Y ) = 0 C 送(Y -Y )为最小 15、 以下不是统计量特点的是( A.不确定 B.已知 16、 不属于专门调查的有(A A.统计年报 B.抽样调查 C.未知 C 普查 17、 今有N 辆汽车在同一距离的公路上行驶的速度资料, Z xf B. ----- Z f C 旦 C 7 x D.不唯一 D.典型调查 m 表示路程,x 表示速度, ) D. 18、 抽样推断的特点有(B )0 A.事先人为确定好样本 C.缺乏一定的科学性和可靠性 19、 时间数列的构成要素是( B.按随机原则抽取样本 D.事先无法计算和控制抽样误差 A.变量和次数 D.主词和宾词 A.众数 B.中位数 C.平均数 D.频数 21、定基发展速度等于相应的各环比发展速度(C A.之和 B.之差 C.之积 D.之商 22、平均指标不包括(A ) 0 A.标准差 B.调和平均数

统计学简答题参考答案

统计学简答题参考答案 第一章绪论 1.什么是统计学?怎样理解统计学和统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学和统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。2.简要说明统计数据的来源。 答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。 3.简要说明抽样误差和非抽样误差。 答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。 4.解释描述统计和推断统计的概念?(P5) 答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。第二章统计数据的描述 1描述次数分配表的编制过程。 答:分二个步骤: (1)按照统计研究的目的,将数据按分组标志进行分组。 按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。 按数量标志进行分组,可分为单项式分组和组距式分组 单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。 统计分组应遵循“不重不漏”原则 (2)将数据分配到各个组,统计各组的次数,编制次数分配表。 2. 一组数据的分布特征可以从哪几个方面进行测度? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。 3.怎样理解均值在统计中的地位? 答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。 4. 简述众数、中位数和均值的特点和使用场合。 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,使用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。5.为什么要计算离散系数?

卫生统计学知识点

卫生统计学考点整理(一) 2017年11月24日 一、绪论: 1、什么是卫生统计学: 卫生统计学是运用数理统计的基本原理和方法对预防医学和公共卫生领域中的科学研究进行 设计,以及研究资料的收集、整理和分析的一门应用科室。 2、卫生统计学的基本内容包括哪些? ①卫生统计学的基本理论和方法,包括研究设计和数据分析中的统计理论和方法。 ②健康统计,包括医学人口统计、疾病统计和生长发育统计等。 ③卫生服务统计,包括卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理等的统计 问题。 3、什么是计量资料? 用度量衡的方法测定每个观察单位的某项研究指标量的大小,所得到的数据(即测量值)成为 计量资料(计量资料含有单位) 4、什么是计数资料? 将全体观察单位按照某种性质或类别进行分组,然后分别清点各组中的例数,这样得到的数据 成为计数资料(也称分类资料)(不含单位) 5、什么是等级资料? 将全体观察单位按照某种性质的不同程度分为若干组,分别清点各组中观察单位的个数。 6、什么是总体? 根据研究目的的确定的同质观察单位的全体。(是同质的所有观察单位某种变量值的集合) 7、什么是同质? 研究对象具有相同的背景、条件、属性 8、什么是变异? 同一性质的事物,其个体观察值(变量值)之间的差异。 9、什么是样本? 从总体中随机抽取具有代表性的一部分个体,其测量值(或观察值)的集体成为样本。 10、什么是抽样研究? 对从所研究的总体中随机抽取有代表性的一部分个体构成的样本进行研究。 11、抽样研究的目的是什么? 通过用样本资料计算的指标去推论总体。 12、什么是参数? 参数是指总体指标。(如:总体均数μ、总体率π、总体标准差σ等) 13、什么是统计量? 统计量是指样本指标。(如:样本均数、样本率p、样本标准差S等) 14、什么是统计描述? 用统计图或计算统计指标的方法表达一个指定群体的某种现象或特征 15、什么是统计推断? 根据样本资料的特性对总体的特性作估计或者推论的方法。(常用方法是参数估计和假设检验)16、什么是系统误差? 不是偶然机遇造成的,而是某种必然因素所致,具有一定的倾向性。 常见情况:①操作方法不正确或对调查问卷理解有误;②医生掌握疗效标准偏高或偏低。③周 围环境的改进。④仪器不准或试剂不合格。 17、什么是随机测量误差? 偶然机遇所致,无方向性,不可避免的。

卫生统计学考试试题及答案(附解释)题库

卫生统计学试题及答案(一) 1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图 【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布) 直方图(适用于数值变量,连续性资料的频数表变量) 直条图(适用于彼此独立的资料) 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标,两个分组变量) 【答案】E ? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______. A.直方图 B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势) C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度) D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______.

统计学简答题整理精编版

统计学简答题整理 GE GROUP system office room 【GEIHUA16H-GEIHUA GEIHUA8Q8-

统计学简答题整理第一章P11 1.获取直接统计数据的渠道主要有哪些及区别在于 普查、抽样调查 普查是为某一特定目的,专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。花费的时间、人力、财力和物力都较大,间隔的时间较长。而两次普查之间的年份以抽样调查方法获得连续的统计数据。 抽样调查是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法。存在着由样本推断总体产生的抽样误差,但统计方法可以估计出误差的大小进一步控制误差;节省人力、财力、物力,又能保证实效性 2.简要说明抽样误差和非抽样误差。 非抽样误差是由于调查过程中各有关环节工作失误造成的。(它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差,还有一种人为干扰造成的误差即有意瞒报或低报数据等)。非抽样误差在普查、抽样调查中都有可能发生,但可以避免。

抽样误差是利用样本推断总体时产生的误差。(由于样本只是总体的一部分,用样本的信息去推断总体,或多或少总会存在误差,因而抽样误差对任何一个随机样本来讲都是不可避免的。但可计量、可控制)。抽样误差与样本量的平方根成反比关系。 第二章P51 1.统计的计量尺度 ①列名尺度(定类尺度):是按照某一品质标志将总体分组之后,对属性相同的单位进行计量的方法。各组之间的关系是并列的,没有大小、高低、先后之别。 ②顺序尺度(定序尺度):是按照某一品质标志将总体分组,对等级相同的单位进行计量的方法。各组之间的关系是有顺序的,可以进行排序。 ③间隔尺度(也称定距尺度):是按某一数量标志将总体分组,对相同数量或相同数量范围的单位或其标志值进行计量的方法。其特点是不仅可以进行排序,还可以计算不同数值之间的绝对差距。 ④比例尺度(也称定比尺度):是类似于间隔尺度,又高于间隔尺度的计量方法。其特点是不仅可计算数值的绝对差异,还可以计算数值的相对差异。 2.简述统计分组的概念和作用。 概念:统计分组是根据统计研究目的,选择一定的分组标志,将总体划分为若干组的统计方法。其目的是使组与组有明显差别,同一组中具有相对的同质性。(例:人口按性别、年龄、民族、职业分组;企业按规模分为大型、中型和小型。)

卫生统计学知识点总结

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利 用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2常用相对数类型:频率型、强度型和相对比型指标。 指标频率型指标强度型指标相对比型指标 两个有关联的指标A和B之比概念近似反映某一时间出现概单位时间内某现象的 生频率 计算 A/B 公式 无有可有、可无 有无 量纲 【0,1】可大于1无限制 取值 范围

统计学原理第三章习题答案

第三章统计资料整理 一.判断题部分 1:对统计资料进行分组的目的就是为了区分各组单位之间质的不同。(×) 2:统计分组的关键问题是确定组距和组数。(×) 3:组中值是根据各组上限和下限计算的平均值,所以它代表了每一组的平均分配次数。(×) 3:分配数列的实质是把总体单位总量按照总体所分的组进行分配。(∨) 4:次数分配数列中的次数,也称为频数。频数的大小反映了它所对应的标志值在总体中所起的作用程度。(∨) 5:某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。(×) 6:连续型变量和离散型变量在进行组距式分组时,均可采用相邻组组距重叠的方法确定组限。(∨) 7:对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所以这种分组会使资料的真实性受到损害。(∨) 8:任何一个分布都必须满足:各组的频率大于零,各组的频数总和等于1 或100%。(×) 9:按数量标志分组形成的分配数列和按品质标志分组形成的分配数列,都可称为次数分布。( ∨ ) 10:按数量标志分组的目的,就是要区分各组在数量上的差异。(×) 11:统计分组以后,掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。(∨) 12:分组以后,各组的频数越大,则组的标志值对于全体标志水平所起的作

用也越大;而各组的频率越大,则组的标志值对全体标志水平所起的作用越小。(×) 二.单项选择题部分 1:统计整理的关键在( B )。 A、对调查资料进行审核 B、对调查资料进行统计分组 C、对调查资料进行汇总 D、编制统计表 2:在组距分组时,对于连续型变量,相邻两组的组限( A )。 A、必须是重叠的 B、必须是间断的 C、可以是重叠的,也可以是间断的 D、必须取整数 3:下列分组中属于按品质标志分组的是( B )。 A、学生按考试分数分组 B、产品按品种分组 C、企业按计划完成程度分组 D、家庭按年收入分组 4:有一个学生考试成绩为70分,在统计分组中,这个变量值应归入( B )。 A、60---70分这一组 B、70---80分这一组 C、60—70或70—80两组都可以 D、作为上限的那一组 5:某主管局将下属企业先按轻、重工业分类,再按企业规模分组,这样的分组属于( B )。 A、简单分组 B、复合分组 C、分析分组 D、结构分组 6:简单分组和复合分组的区别在于( B )。 A、选择的分组标志的性质不同 B、选择的分组标志多少不同

卫生统计学试题汇总

医学统计学复习题 一、名词解释 1、总体 2、样本 3、随机抽样 4、变异 5、概率 6、随机误差(偶然误差) 7、参数 8、统计量 9、算术均数 10、中位数 11、百分位数 12、频数分布表 13、几何均数 14、四分位数间距 15、方差 16、标准差 17、变异系数 18、标准正态分布 19、医学参考值范围 20、可信区间 21、统计推断 22、参数估计 23、标准误及 24、检验水准 25、检验效能 26、率 27、直线相关 28、直线回归 29、实验研究 30、回归系数 二、单项选择 1.观察单位为研究中的()。 A.样本 B.全部对象 C.影响因素 D.个体 E.观察指标 2.总体是由( )组成。 A.部分个体 B.全部对象 C.全部个体 D.同质个体的所有观察值 E.相同的观察指标 3.抽样的目的是()。 A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例 D.研究总体统计量 E.研究特殊个体的特征 4.参数是指( ) 。 A.参与个体数 B.总体中研究对象的总和 C.样本的统计指标 D.样本的总和 E.总体的统计指标 5.关于随机抽样,下列哪一项说法是正确的()。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随机抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 E.选择符合研究者意愿的样本 6.反映计量资料平均的指标是()。 A.频数 B.参数 C.百分位数 D.平均数 E.统计量 7.表示总体均数的符号是( ) 。 A.σ B.μ C.X D. S E. M 8.下列指标中,不属于集中趋势指标的是()。 A.均数 B.中位数 C.百分位数 D.几何均数 E.众数 9. ( )分布的资料,均数等于中位数。 A.对称分布 B.正偏态分布 C.负偏态分布 D.对数正态分布 E.正态分布 10.一组某病患者的潜伏期(天)分别是:2、5、4、6、9、7、10和18,其平均水平的指标该选()。 A.中位数 B.算术均数 C.几何均数 D.平均数 E.百分位数末端有确定数据

统计学简答题答案修订

统计学简答答案 1.一组数据的分布特征可以从哪几个方面进行描述? 数据分布的特征可以从三个方面进行测度和描述: (1)分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度; (2)分布的离散程度,反映各数据远离其中心值的趋势; (3)分布的形状,反映数据分布的偏态和峰态。 2.影响样本量大小的因素有哪些?简述这些因素与样本量的关系。 (1)影响样本量大小的因素有:所要求的置信水平、总体方差和估计时所希望的估计误差。 (2)关系:其他条件不变的情况下: 1)样本量的大小与置信水平成正比。置信水平越大,所需样本量也就越大; 2)样本量与总体方差成正比。总体的差异越大,所要求的样本量也越大; 3)样本量与估计误差的平方成反比,即允许的估计误差的平方越大,所需的样本量就越小。 3.简述统计数据的类型和特点。 类型:(1)按计量尺度:分类数据、顺序数据和数值型数据; (2)按收集方法:观测数据和实验数据; (3)按被描述的现象与时间的关系:截面数据和时间序列数据。 特点:(1)按计量尺度分时:分类数据中各类别间是平等的并列关系,各类别间的顺序是可任意改变的;顺序数据的类别间是可以比较顺序的;数值型数据其结果表现为具体的数值。 (2)按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。 (3)按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。 4.在假设检验中,当不拒绝原假设时,为什么不采取“接受原假设”的表示方式? (1)在假设检验时,当拒绝原假设时,表明样本提供的证据证明它是错误的;当没有拒绝原假设时,也没法证明它是正确的。 (2)采用“接受”原假设的说法,意味着样本提供的证据证明了原假设是正确的。但由于原假设的真实值是什么并不知道,没有足够的证据拒绝原假设并不等于能够证明原假设是真的,它仅仅意味着目前我们还没有足够的证据拒绝原假设,只表示手头上这个样本提供的证据还不足以拒绝原假设。5.什么是判定系数?它在回归分析中的主要作用是什么? (1)判定系数:回归平方和占总平方和的比例。记为R2,公式为:R2,=SSR/SST. (2)在回归分析中,R2,主要是用于测度回归直线对观测数据的拟合程度。取值范围是[0,1]。R2,越接近于1,回归直线的拟合程度就越好;R2,越接近于0,回归直线的拟合程度就越差。若所有观测点都落在直线上,R2,=1,拟合是完全的;如果R2,=0,回归直线对数据完全没有拟合。 6.解释95%的置信区间 如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。 7.说明区间估计的基本原理 区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。与点估计不同,进行区间估计时,根据样本统计量的抽样分布,可以对统计量与总体参数的接近程度给出一个概率度量。 8.测度两个分类变量相关性的统计量有哪些?他们有什么不同? 测度两个分类变量相关性的统计量有以下几个: Φ相关系数、列联相关系数(c系数)、v相关系数 (1)Φ相关系数:描述2×2列联表数据相关程度最常用的一种相关系数且Φ系数没有上限。 (2)列联相关系数(c系数):主要用于大于2×2列联表的情况且c系数小于1.

卫生统计学-重点整理资料东大

卫生统计学 第一章绪论 1、卫生统计学的概念(P1) 卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。 2、卫生统计学的4个基本步骤(P3): 设计、收集资料、整理资料、分析资料 3、卫生统计学的几个基本概念(P4): ⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称 之为同质,或具有同质性。 ⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差 异。 ⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值 的集合。 ⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集 合。样本中 包含的观察单位个数成为样本含量。 ⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表 示,如总 体均数μ、总体率π等。 ⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表 示,如样本 均数x 、样本率等。

⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属 性称为变 量;变量值的集合成为资料。 ⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大 小,一般 有度、量、衡单位。 ⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相 容的类别 或属性,一般无度、量、衡单位。可细分为:①计数资料; ②等级资料 第二章调查研究设计 ★1、调查研究的特点(P7): ①不能人为施加干预措施;②不能随机分组; ③很难控制干扰因素;④一般不能下因果结论 2、常用抽样方法(名称、原理): ⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后 采用随机数字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n个编号所对应的n个观察单位构成研究样本。 ⑵系统抽样:又称机械抽样或等距抽样。事先将总体内全部观察 单位按某一顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i 号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。 ⑶分层抽样:先按对观察指标影响较大的某项或某几项特征,将 总体分成若干层,该特征的测定值在层内变异较小,层间变异

相关文档
最新文档