(完整版)医学统计学实习册第7版武汉大学答案

(完整版)医学统计学实习册第7版武汉大学答案
(完整版)医学统计学实习册第7版武汉大学答案

实习一

1 总体:根据研究目的所确定的同质观察单位的全体。

2 样本:从总体中随机抽取的部分个体。

3 参数:总体的统计指标或特征值。

4 统计量:由样本所算出的统计指标或特征值。

5 概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,

这个常数p就称为事件A出现的概率,记作P(A)或P。

6 频率:在n次随机试验中,事件A发生了m次,则比值f=m/n=A发生的试验次数/试验的

总次数称为A在n次试验中出现的频率。

7 变异:同质事物间的差别。

8 指标:说明总体综合数量特征和数量关系的数字资料。

简答与思考题

1 什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别?医学统计学:是应用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科。

统计学:是研究数据的收集、整理、分析与推断的科学

卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。

生物统计学:是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计、取样、分析、资料整理与推论的科学。

2 医学统计资料主要来源于哪些方面?有何要求?

医学统计资料主要有实验数据和现场调查资料、医疗卫生工作记录、报表和报告卡等。实验数据是指在试验过程中活的数据;现场调查资料主要来源于大规模的流行病调查获取的资料;医疗卫生工作记录有门诊病历卡、住院病历卡、化验报告等;报表有卫生工作基本情况年报表、传染年(月、日)报表、疫情旬(年、月、日)报表等;报表卡有传染病发病报告卡、出生报告卡、死亡报告卡等等。

这些资料的收集过程中,必须进行治疗控制,包括它的统一性、确切性、可重复性。这些原始数据的精度和偏差应用明确的范围。

3 当今医学研究的趋势和特点如何?医学统计方法主要有哪些?

医学统计学在本世纪二十年代以后才逐渐形成为一门学科。解放前,我国学者即致力于把统计方法应用到医学中去,但人力有限、范围较窄。解放后,随着医学科研工作的发展,本学科得到迅速普及与提高,通过大量实践,在不少方面积累了自己的经验,丰富了医学统计学的内容,而电子计算机的作用,更促进了多变量分析等统计方法在医学研究中的应用。

4 医学统计资料的类型有哪些?

(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得资料称为计量资料。计量资料也称定量资料、测量资料,其变量值是定量的,表现为数值大小,一般有质量衡单位。如某一患者的身高(cm)、体重(kg)脉搏(次/分)等

(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位称为计数资料。计数资料也称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性,如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数。

(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。等级资料又称为有序变量。如患者的治疗结果可分为治愈、好转、有效、死亡。

5 误差、系统误差、随机测量误差、抽样误差有何区别?对误差的控制各有何要求?如何控制?

误差:一个量的观测值或计算值与其真值之差,即一个量在测量、计算或观察过程中由于某些错误或通常由于某些不可控制的因素的影响而造成的变化偏离标准值或规定值的数量,误差是不可避免的。

系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差,要尽量查明原因,必须克服。

随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作技术不稳定,不同实验操作员之间的操作差异,电压不稳定及环境温度差异等因素造成测量结果的误差,对于这种误差应采取相应的措施加以控制,至少应控制

在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。

抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是有抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。

实习二

平均数:也叫平均值,是一组数据典型或有代表性的值,这个值倾向于落在根据数据大小排列的数据的中心,包括算术平均值、几何平均数、中位数等。

均数:指在一组数据中所有数据之和再除以数据的个数,是反应数据集中趋势的一个指标。

几何均数:是用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平

中位数:将一组观察值按升序或降序排列,位次居中的数,常用M表示

百分位数:是一种位置指标,以Px表示,一个百分位数Px将全部观察值分为两个部分,理论上有x%的观察值小于Px小,有(1-x%)的观察值大于Px

全距(极差):最大与最小观察值之差。

标准差:是描述个体值变异程度的指标,为方差的算术平方根。

变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较,用CV表示。

计算:标准差/均数*100%。

简答与思考题

1 试诉频数表的要素与用途?

要素:组段、频距。

用途:①描述资料的分布特征和分布类型。频数分布有两个重要特征:集中趋势和离散趋势。大部分观察值向某一数值集中的趋势称为集中趋势,常用平均数指标来表示,各观察值之间大小参差不齐。频数由中央位置向两侧逐渐减少,成离散趋势,是个体差异所致,可用一系列的变异指标来反映。

②便于进一步计算有关指标或进行统计分析。当数据较多且需手工计算时,常先编制频数表,

再进行统计计算

③发现特大、特小的可疑值。如果频数表的一端或两端出现连续几个组段的频数为零后,又出现少数几个特大值或特小值,使人怀疑其是否准确,需进一步检查和核对并做相应处理。

④当样本含量比较大时,可用各组段的频率作为概率的估计值。

2 描述单变量资料的统计指标分哪两大类,分别是什么指标?

分类:①描述数据分布集中趋势的指标:算术均数、几何均数、中位数

②描述数据分布离散程度的指标:极差、四分位数间距、方差、标准差、变异系数。

3 试诉平均数、标准差、差异系数的含义与用途、

平均数的指标的概念和作用:

概念:平均数表示一组同质计量数据集中趋势的位置和平均水平。

作用:是一组计量数据平均水平的代表值,可作为不同组间的比较值。

标准差:反映数据的离散程度,反映一组数据变量值的变异程度,组间单位相同时,S越小,表示数据的变异程度越小。

变异系数:标准差和平均数的比值,即s/a。应用:1)组间单位不同时变异程度的比较。2)比较组单位相同,但均数相差悬殊的组间变异程度。

4 什么对象可以作为医学正常参考值的正常人?如何制定95%正常参考值范围?

所谓正常人不是指机体任何器官、组织的形态和机能都正常的而是符合特定水平的人

1)确定诊断指标为“定性”或“定量”

2)计量数据要确定其分布(正态或偏态)

3)计量资料考虑制定单侧诊断界值还是双侧诊断界值。

4)有足够的样本例数(一般不低于100例)

5 标准正态分布曲线下面积有何分布规律?

所有的正态分布曲线,在v左右的相同倍数的标准差范围内的面积相同。并且,在v±σ范围内的面积约为68.3%;在v±1.96σ范围内的面积约为95%;在v±2.58σ范围内面积约为99%。

6 同一资料的标准差是否一定小于均数?

均数和标准差是两类不同性质的统计指标,标准差用于描述数据的变异程度,变异程度大,则该值大,变异程度小,则该值小,标准差可大于均数,也可小于均数。

实习三:

抽样误差:在同一总体中随机抽取样本含量相同的若干样本,是样本指标之间的差异以及样本指标与总体指标的差异。

标准误:表示样本均数间的变异程度。

可信区间:按一定的概率或可信度(1-α)用一个区间估计总体参数所以范围,这个范围称作可信度1-α的可信区间,又称置信区间。

假设检验:用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。

第一类误差:统计学上规定,拒绝了实际上成立的H0,这类“弃真”的错误称为Ⅰ型错误或第一类错误,Ⅰ型错误的概率用α表示

第二类误差:统计学上规定,不拒绝实际上不成立的H0,这类“存伪”的错误称为Ⅱ型错误或第二类错误,Ⅱ型错误的概率用β表示。

t分布:在总体均数为u,总体标准差为σ的正态总体中随机抽取n相等的许多样本,分别算出样本均数,这些样本均数呈正态分布,而当样本含量n不太小时,即使总体不呈正态分布,样布均数的分布也接近正态。

思考题

1 标准差和标准误有何区别与联系

区别:(1)含义不用①s描述个体变量值(x)之间的变异度大小,s越大,变量值(x)越分散;反之变量值越集中,均数打代表性就越强②标准误是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小

(2)与n的关系不同:n增大时,①s→σ(恒定)②标准误减少并趋于0(不存在抽样误差)

(3)用途不同①s:表示x的变异度大小,计算cv,估计正常值范围,计算标准误等②x:参数估计和假设检验

联系:二者均为变异度指标,样本均数的标准差及为标准误,标准差与标准误成正比

2 统计描述与统计推断分别应掌握哪些要点

1)研究特点不同:描述统计学研究如何简缩数据并描述这些数据的方法,一般包括:统计调查方法,分类原理,汇总,统计表,统计图,频数分配,时间数列,指数,相关,估计推算等。推断统计学研究如何在随机抽样的基础上推论有关总体数量特征的方法,一般包括:统计推断原上推论有关总体数量特征的方法,一般包括:统计推断原理,实验设计,估计理论,抽样调查,复变数分析,序列分析,误差理论,假设检验,决策理论等。

2)研究样本不同:描述统计学研究大样本理论,所谓大样本即包括多数个体或多数数值的样本;推断统计学肝究小样本理论,所谓小样本即包括少数个体或少数数恼的样本。

3)应用统计的性质不完全相同。描述统计学派在应用统计——生物统计、经济统计等方面,仍残留者凯特勒的实质科学的影响;推断统计学在应用统计——物理统计、田间设计、质量管理、经济预测等方面,基本上已转变为通用的方法论科学。

3 t检验、z检验的公式有哪些类型,在应用上有何异同

t检验:当样本例数n较小时,要求样本取自正态总体。

t检验的类型:单样本t检验,独立t检验,配对t检验

z检验:样本例数较大,或n虽小而总体标准差已知。

相同点:集中位置都为0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)

不同点:t分布是一簇分布曲线,t 分布的曲线的形状是随自由度的变化而变化,标准正态分布的曲线的形状不变,是固定不变的,因为它的形状参数为1。

4 在统计推断过程中,如何区别单侧检验与双侧检验

如果将拒绝性概率平分于理论抽样分布的两侧,称为双侧检验。例如选定显著性水平α= 0.05,双侧检验就是将α概率所规定的拒绝区域平分为两部分而置于概率分布的两边,每边占有 =0.025。双侧检验只强调差异是否显著而不强调方向性。

如果将拒绝性概率置于理论抽样分布的一侧(左侧或右侧),称为单侧检验(右侧检验或左

侧检验)。单侧检验强调差异的方向性。

在具体的假设检验中,选择双侧检验或单侧检验可分为以下三种情况:

第一种:H0:μ=μ0:μ≠μ0双侧

第二种:H0:μ≥μ0 :μ<μ0单侧(左侧)

第三种:H0:μ≤μ0:μ>μ0 单侧(右侧)

5 总体可信区间与正常值范围有何不同

应注意:可信区间与参考值范围的意义、计算公式和用途均不同。

1.从意义和用途来看

95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指按95%可信度估计的总体均数的所在范围。可信区间用于估计总体参数,总体参数只有一个。参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限。

2.从计算公式看:

若指标服从正态分布,95%参考值范围的公式是:±1.96s。

总体均数95%可信区间的公式是:。

前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。

6 假设检验和总体均数区间估计有何联系

假设检验:是对总体做出某种假定,然后根据样本信息推断总体是否成立的一类统计学方法总称。假设检验有三个基本步骤:①建立假设和确定检验水准;②选择检验方法和计算检验统计量;③确定P值和做出统计推断结论。

总体均数的估计:1、点估计:样本统计量直接作为总体指标的估计值。它未考虑抽样误差的大小。

2、区间估计:按预先给定的概率(1-α)确定的包含未知总体参数的可能范围。

7 简述第1类错误与第2类错误的区别与联系

区别:

Ⅰ型错误(弃真):拒绝实际成立的H0,型错误的概率记为α。(1-a)即置信度:重复抽样时,样本区间包含总体参数(μ)的百分数。当p≤α而拒绝H0时,只能犯Ⅰ型错误,不可能犯Ⅱ型错误。

Ⅱ型错误(存伪):不拒绝实际不成立的H0,Ⅱ型错误的概率记为β。(1-β)即把握度(或检验效能:两总体确有差别,被检出有差别的能力。当p≥α而拒绝H0时,只能犯Ⅱ型错误,不可能犯Ⅰ型错误。

联系:对同一资料,α与β反方向变化,若要同时减小α与β,唯一的办法是增加样本含量。

实习四

1 方差分析的基本思想是什么

方差分析的基本思想就是按研究目的和设计类型,将总变异的离均差平方和SS和自由度v 分别分解成若干部分,并求得各相应部分的变异;其中的组内变异或误差主要反映个体差异或抽样误差,其它部分的变异与之比较得出统计量F值,由F值的大小确定P值,并做出推断。

2 方差分析有何特性

1)各样本是相互独立的随机样本

2)各样本来自正态分布

3)各处理组总体方差相等,及方差齐

3 t检验与F检验的适用条件和应用范围有何异同

t检验适用于两个样本均数的比较,F检验适用于多个样本的比较。

t检验的应用条件:要求各样本来自相互独立的正态总体且各总体方差齐。

方差分析的应用条件(1)各样本是相互独立的随机样本,且来自正态分布总体。(2)各样本的总体方差相等,即方差齐性。

4 配对比较的t检验与配伍组比较的方差分析之间有何关系?两独立样本均数比较的t检验与两独立样本均数比较F检验之间有何联系

1)两者都要求比较的资料服从正态分布;

2)而且两样本均数的比较及方差分析均要求比较组有相同的总体方差;

3)配伍组比较的方差分析是配对比较t检验的推广,成组设计多个样本均数比较的方差分析是两样本均数比较t检验的推广;

4)对于两个样本之间的比较,方差分析和t检验效果是相同的,

两独立样本均数比较应用t检验的条件之一就是方差齐性,其中要判断两总体方差是否相等,就可以用F检验。简单的说就是检验两个样本的方差是否有显著性差异,这是选择何种T检验(等方差双样本检验,异方差双样本检验)的前提条件。

5 多个样本均数比较方差分析的获得组间差异有统计意义(P<0.05),问是否已完成该资料的分析?为什么?

没有。拒绝H0 ,接受H1 ,表示总体均数不全相等,而要知道哪两两均数不相等和哪两辆均数不等,还需要进一步作多重比较。

实习五

1 常用相对数指标有哪些?它们在计算和意义上有何不同?

率(强度相对数,频率相对数)、构成比、相对比

应用相对数时应注意的问题:⑴计算相对数的分母一般不宜过小。⑵分析时不能以构成比代替率。⑶不能用构成比的动态分析代替率的动态分析。⑷对观察单位数不等的几个率,不能直接相加求其总率。⑸在比较相对数时应注意可比性。⑹对样本率(或构成比)的比较应随机抽样,并做假设检验。

2 率的标准化的意义及基本思想是什么?

当比较的两组资料内部各小组率明显不同,且各小组观测例数的构成比也明显不同时,直接比较两个合计率是不合理的。因为期内部构成比不同,往往影响合计率的大小,需要统一的内部构成进行调整后计算标准化率,使其具有可比性,这种方法称为率的标准化。

率的标准化的基本思想:要比较两个总率时,发现两组资料的内部构成(如年龄、性别构成

等)存在明显不同,而且影响到了总率的结果,这时就不宜再直接比较总率,而应考虑采用标准化法。标准化法的基本思想,就是采用统一的标准(统一的内部构成)计算出消除内部构成不同影响后的标准化率(调整率),然后再进行比较。

3 两组计数资料比较可否用z检验?如可以,有何适用条件?

如果总体为正态而方差又已知,使用Z检验就可以了;

如果总体并非正态而总体方差也是未知的,在样本容量大于30时,可以用Z检验

如果总体非正态而样本容量又小于30,既不能用Z检验也不能用t检验,需要使用非参数检验。

4 卡方检验的适用范围和各个公式的适用条件是什么?

卡方检验用于:推断两个及两个以上总体率或构成比是否有差别,两个分类变量间有无相关关系,多个率的趋势检验,以及两个率的等效检验等。此外,也用于频数分布的拟合优度检验。

对不同的设计类型的资料,检验的应用条件不同:

(1) 完全随机设计两样本率的比较

1) 当n>40,且T≥5时,用非连续性校正值;

若所得P≈α,则改用四格表的确切概率法。

2) 当n≥40,且有1≤T<5时,用连续性校正值。

3) n<40,或有T<1时,不能用检验,应当用四格表的确切概率法。

(2) 配对设计四格表

1) 当b+c≥40,

2) 当b+c<40,需作连续性校正,

(3) 行列表资料

1) 不宜有1/5以上格子的理论频数小于5,或有1个格子的理论频数小于1;

2) 单向有序行列表,在比较各处理组的效应有无差别时,应该用秩和检验或Ridit 检验;

3) 多个样本率(或构成比)比较的检验时,结论为拒绝无效假设时,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说明它们彼此之间都有差别,或某两者间

有差别。若想进一步了解哪两者的差别有统计学意义,可用分割法。

5 率的标准误的意义和用途?

意义:由于抽样的原因所造成的样本率与总体率的不一致就是率的抽样误差。率的抽样误差的大小是用率的标准误来表示。

用途:①表示抽样误差的大小,说明样本率的代表性、可靠性。②对总体率的可信区间进行估计。

6 以样本总体率估计的条件与z检验的适用条件有联系吗?

Z检验的步骤适用条件:

(1) 已知一个总体均数;

(2) 可得到一个样本均数及该样本标准误;

(3) 样本来自正态或近似正态总体。

样本含量n足够大, np与n(1-p)均≥5 ,此时,样本率p也是以总体率为中心呈正态分布或近似正态分布的

实习六

1 简述非参数统计方法的概念及适用范围

概念:样本所来自的总体分布难以用某种函数式来表达,还有一些资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,解决这类问题的一种不依赖总体分布的具体形式的统计方法。由于这类方法不受总体参数的限制,故称非参数统计法,或称为不拘分布的统计分析方法,又称为无分布型式假定的统计分析方法。它检验的是分布,而不是参数。非参数统计不需对总体分布(总体参数)作出特殊假设。

适用范围:(1)等级资料。(2)偏态分布资料。当观察资料呈偏态或极度偏态分布而又未作变量变换,或虽经变量变换仍未达到正态或近似正态分布时,宜用非参数检验。(3)各组离散程度相差悬殊,即方差明显不齐,且不能变换达到齐性。(4)个别数据偏离过大,

或资料为单侧或双侧没有上限或下限值。(5)分布类型不明。(6)初步分析。有些医学资料由于统计工作量大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容)。(7)对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。

2 非参数统计方法有何优缺点

优点:①非参数统计方法要求的假定条件比较少,因而它的适用范围比较广泛。②多数非参数统计方法要求的运算比较简单,可以迅速完成计算取得结果,因而比较节约时间。③大多数非参数统计方法在直观上比较容易理解,不需要太多的数学基础知识和统计学知识。

④大多数非参数统计方法可用来分析如象由等级构成的数据资料,而对计量水准较低的数据资料,参数统计方法却不适用。⑤当推论多达3个以上时,非参数统计方法尤具优越性。缺点:①由于方法简单,用的计量水准较低,因此,如果能与参数统计方法同时使用时,就不如参数统计方法敏感。若为追求简单而使用非参数统计方法,其检验功效就要差些。这就是说,在给定的显著性水平下进行检验时,非参数统计方法与参数统计方法相比,第Ⅱ类错误的概率β要大些。②对于大样本,如不采用适当的近似,计算可能变得十分复杂。

注意: 凡符合或经过变换后符合参数检验条件的资料,最好用参数检验。当资料不具备参数检验的条件时,非参数检验是一种有效的分析方法。

3 对同一资料,又出自同一研究目的,用参数检验和非参数检验所得结果不一致时,宜以何为准

两者各有使用条件,究竟取哪种结论,要根据资料是否满足该种检验方法的应用条件进行选择。在符合参数检验的条件时,可接受参数检验的结论,而资料不符合参数检验的条件时,应以非参数检验的结论为佳。如总体分布为极度偏态或其他非正态分布,或者两总体方差不齐时,此时宜采用秩和检验的结果

4 配对比较的假设检验,符合参数检验条件,能否出现t检验结果P>0.05,而非参数检验结果P<0.05?如果出现上述情况,此时应怎样解释检验结果

能。

采用秩和检验。

实习七

1 相关与回归的区别与联系

区别:

意义:相关反映两变量的相互关系,即在两个变量中,任何一个的变化都会引起另一个的变化,是一种双向变化的关系。回归是反映两个变量的依存关系,一个变量的改变会引起另一个变量的变化,是一种单向的关系。

应用:研究两个变量的相互关系用相关分析。研究两个变量的依存关系用回归分析。

研究性质:相关是对两个变量之间的关系进行描述,看两个变量是否有关,关系是否密切,关系的性质是什么,是正相关还是负相关。回归是对两个变量做定量描述,研究两个变量的数量关系,已知一个变量值可以预测出另一个变量值,可以得到定量结果。

相关系数r与回归系数b :r与b的绝对值反映的意义不同。r的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度越高。b的绝对值越大,回归直线越陡,说明当X变化一个单位时,Y的平均变化就越大。反之也是一样。

联系:r与b值可相互换算;r与b正负号一致;r与b的假设检验等价;回归可解释相关。相关系数的平方r2(又称决定系数)是回归平方和与总的离均差平方和之比,故回归平方和是引入相关变量后总平方和减少的部分。

2 直线相关与等级相关有何区别

区别:(1)资料要求不同:直线相关要求x、y是来自双变量正态总体的随机变量;秩相关适用于不服从双变量正态分布或总体分布类型未知以及用等级表示的原始数据。(2)相关意义不同:直线相关表示两变量的直线相关关系存在,秩相关表示两变量的相关关系。

联系:相关系数的取值范围相同;秩相关将原始数据进行秩变换,以秩次计算直线相关系数。

实习八

1 统计表、图的表达资料中有何特殊作用

统计工作中,用统计表和统计图的形式说明资料在数量方面的大小、变动趋势、分布情况以及相互关系,以代替冗长的文字叙述,使结果一目了然,便于阅读,便于分析和比较

2 绘制统计表及统计图的原则和要求是什么

统计表:

(1) 统计表的制表原则

1) 应重点突出,即一张表一般只包括一个中心内容,内容较多时可以用多个表格表达不同指标和内容。

2) 统计表要层次清楚,即标目的安排及分组符合逻辑,便于分析比较。主谓分明,通常主语放在表的左边,作为横标目;谓语放在右边,作为纵标目。由左向右读,构成完整的一句话。但若统计表的主语项目少而谓语项目多或主语项目多而谓语只有一项,亦可将纵标目作主语、横标目作谓语,阅读时从上至下。

3) 统计表应简单明了,一切文字、数字和线条都应尽量从简。

(2) 制表要求:统计表通常由标题、标目、线条、数字4部分组成。表中数字区不插入文字,也不列备注项。必须说明者标“*”号等,在表下方说明。

1) 标题:应高度概括表的主要内容,一般包括研究的时间、地点和研究内容,左侧加表号,置于表的上方。

2) 标目:有横标目和纵标目,分别说明表格每行和每列数字的意义。横标目位于表头的左侧,代表研究的对象;纵标目位于表头右侧,表达研究对象的指标。注意标明指标的单位。

3) 线条:力求简洁,多采用三条线,即顶线、底线、纵标目下横线。部分表格可再用短横线将“合计”分隔开,或用短横线将两重纵标目分割开。其它竖线和斜线一概省去。

4) 数字:用阿拉伯数字表示。同一指标小数点位数一致,位次对齐。表内不留空项,无数字用“—”表示,缺失数字用“”表示,数值为0者记为“0”。

统计图:①根据资料性质和分析目的正确选用适当的统计图。②除圆图外,一般用直角坐标系的第一象限的位置表示图域(制图空间),或者用长方形的框架表示。③绘制图形应注意准确、美观,给人以清晰的印象。

3 常见的统计图有哪几种?它们的适用条件各是什么

常用的统计图有直条图、直方图、百分比条图和圆图、线图、散点图、统计地图、箱式图等。直条图:适用于比较、分析独立的或离散变量的多个组或多个类别的统计指标。指标既可以是绝对数,也可以是相对数。

直方图:主要应用于频数分布资料,描述连续变量的频数分布。

百分比条图和圆图:表示事物内部各构成部分所占的比重,适合描述分类变量的各类别所占

的构成比。其中,百分比条图特别适合作多个构成比的比较。

线图:适合于描述某统计量随另一连续性数值变量的变化而变化的趋势,常用于描述统计量随时间变化而变化的趋势。普通线图描述的是绝对变化趋势,半对数线图描述的是相对变化趋势,特别适宜作不同指标或相同指标不同组别的变化速度的比较。

散点图:以直角坐标上点的密集程度和趋势来表示两个变量间的相关关系。

统计地图:以不同的颜色和花纹表示统计量的值在地理分布上的变化,适宜描述研究指标的地理分布。

箱式图:通过使用5个统计量(数据分布的中心位置、分布、偏度、变异范围和异常值)来反映原始数据的分布特征。特别适合多组数据分布的比较。

4 普通历史线图与半对数线图的统计分析应用上有何区别和联系

从形式上看,二者的不同点在于纵坐标的尺度不同,普通线图的纵坐标为算术尺度,而半对数线图的纵坐标为对数尺度。从用途上看,普通线图描述的是统计量的绝对变化趋势,半对数线图描述的是相对变化趋势,特别适宜作不同指标或相同指标不同组别的变化速度的比较。

实习九

1 试比较配伍设计与完全随机设计在设计方案和检验效能方面有何异同

完全随机设计

此种设计的优点是设计和统计分析比较简单。缺点是试验效率较低,且只能分析一个因素。两处理组

1.大样本(当nl及n2均大于50时) 当资料为计量时可用u检验,当资料为计数时可用χ2检验。

2.小样本计量资料:当服从正态分布且方差齐时,采用t检验;当服从正态分布但方差不齐时,采用t′检验,当不服从正态分布或分布未知时,采用秩和检验;当资料为计数时可用确切概率法。

多个处理组

为计量资料时:当服从正态分布且方差齐时,采用方差分析;当不服从正态分布或分布未知时,采用秩和检验。当资料为计数时采用χ2检验。

配伍设计

配对设计的优点:比较理想地控制了非处理因素的影响,均衡性较好,减少抽样误差。缺点:观察对象要经过挑选,特别是临床试验中病例较少时,样本含量较少。

当服从正态分布时,用配对比较的t检验;当不服从正态分布或分布未知时,用配对符号秩和检验。

2 何谓调查研究和实验研究?各自的特点是什么

调查研究:是指研究者通过客观地观察、描述调查对象来搜集资料,未加任何的干预措施。实验研究:是指研究者根据研究假设主动地对研究对象加以干预措施,并观察总结其结果,回答研究假设所提出的问题。

3 四种基本抽样方法的概念、优缺点和应用条件是什么

(1) 单纯随机抽样:是在总体中以完全随机的方法抽取一部分观察单位组成样本,其整个抽样过程,都体现了随机化的原则。

单纯随机抽样的优点:简单直观,是最基本的概率抽样方法,也是其他概率抽样方法的基础。单纯随机抽样的缺点:当总体例数较多时,编号麻烦,实际工作中难以实施;样本分散,组织困难。

单纯随机抽样方法多用于总体例数较少的情况。

(2) 系统抽样:是将总体的观察单位,按一定顺序号平均分成n个部分,每一部分抽取第k 号观察单位组成样本,这里的k是随机确定的,其体现了系统抽样中的随机性。

系统抽样的优点是:1) 易于理解,简便易行;2) 容易得到一个按比例分配的样本;3) 一般情况下样本的观察单位在总体中分布均匀,其抽样误差小于单纯随机抽样。

系统抽样的缺点是如果总体中观察单位按顺序有周期趋势或单调递增(减)趋势时,采用系统抽样可能产生明显的系统误差。

系统抽样方法多用于观察单位具有现成且与试验无关的自然编号,同时观察单位在总体中分布均匀。

(3) 整群抽样:是先将总体按照某种与主要研究指标无关的特征划分为K个“群”,每个群包含若干观察单位,然后再随机抽取k个“群”,由抽取的各个群的全部观察单位组成样本。其随机性主要体现在“群”的抽取过程。

整群抽样的优点是便于组织调查、易于质量控制和节省调查成本。

整群抽样的缺点是当样本含量一定时,因为样本观察单位并非广泛散布于总体中,整群抽样的抽样误差一般大于单纯随机抽样。

整群抽样较为常用,尤其当“群”间的个体变异较小时。

(4) 分层抽样:是先按对主要研究指标影响较大的某种特征,将总体分为若干类别(统计上称之为“层”),再从每一层内随机抽取一定数量的观察单位,合起来组成样本。其随机性体现在层内的抽样过程。

分层抽样的优点是:1) 由于分层后增加了层内的同质性,观察指标变异减小,各层的抽样误差减小。2) 分层抽样便于对不同层采用不同的抽样方法。3) 分层抽样便于对各层独立进行分析。

分层抽样的缺点是:层间变异较大,抽样误差较小;如果分层特征选择不当,层内变异较大,层间变异较小,抽样误差仍然较大,分层抽样就失去了意义。

一般情况下,当样本含量一定,几种方法抽样误差大小的排序为:分层抽样≤系统抽样≤单纯随机抽样≤整群抽样。

4 何谓实验效应,对实验效应指标的要求是什么

实验效应:指处理作用于实验对象的反应,一般是通过某些观察指标,定量或定性地反映实验效应。

选择观察指标的基本原则:

指标的选择必须与研究目的密切关联

客观性尽可能选择客观指标,避免一些笼统的、不确切的指标。

准确性选用的指标应尽量精确。

灵敏性和特异性实验效应指标应当同时兼顾其灵敏性和特异性,尽量使灵敏性和特异性都高。

5 实验研究中为什么设立对照,常见的对照有几种,各自有何特点

设立对照组的目的是衬托处理因素的效应。

对照原则:所设立的对照组必须与实验组达到均衡可比。除干预措施外,组间其他影响结果的非处理因素等尽可能相同。对所研究疾病的易感度及发病机会相等。检测和观察方法及诊断标准必须一致。

自身对照对照与实验在同一受试者身上进行,如用药前后作为对比。

空白对照对照组不施加任何处理因素。

安慰剂对照主要目的是为了平衡对照组病人心理因素的影响。

实验对照(阳性对照)对照组不施加处理因素,但施加某种实验因素。

标准对照不设立专门的对照组,而是用现有标准值或正常值做对照。

历史对照

6 实验设计为什么要遵循重复原则,影响重复性的因素有哪些

重复原则包含重现性和观察单位数量两方面的含义。

可靠的实验结果应能在相同的条件下重现;

可靠的实验结论也不能凭一次实验或3~5例结果获得,一定要有足够量的观察单位数。

7 常用的实验设计方法有哪几种,各自的优缺点,适用条件及可采用的相应统计方法是什么

完全随机设计

此种设计的优点是设计和统计分析比较简单。缺点是试验效率较低,且只能分析一个因素。两处理组

1.大样本(当nl及n2均大于50时) 当资料为计量时可用u检验,当资料为计数时可用χ2检验。

2.小样本计量资料:当服从正态分布且方差齐时,采用t检验;当服从正态分布但方差不齐时,采用t′检验,当不服从正态分布或分布未知时,采用秩和检验;当资料为计数时可用确切概率法。

多个处理组

为计量资料时:当服从正态分布且方差齐时,采用方差分析;当不服从正态分布或分布未知时,采用秩和检验。当资料为计数时采用χ2检验。

配对设计

配对设计的优点:比较理想地控制了非处理因素的影响,均衡性较好,减少抽样误差。缺点:观察对象要经过挑选,特别是临床试验中病例较少时,样本含量较少。

当服从正态分布时,用配对比较的t检验;当不服从正态分布或分布未知时,用配对符号秩和检验。

随机区组设计

各个处理组中的受试对象不仅数量相同,而且比较均衡。这种试验设计,既减小了抽样误差,还可以分析出处理组及配伍组两个因素的影响。其缺点和配对设计相同,受试对象要经过挑选。

交叉设计

交叉设计的优点是节省样本数,且均衡性较好。但要求两种观察时间不能过长,处理没有持久效果,使两种处理能够很快区分开。

析因设计

析因设计是多因素的交叉分组设计,即各个因素的所有水平相互组合在一起,形成多个交叉分组。交叉组组数是各因素水平数的乘积。析因设计不仅可以对每个因数各水平间进行比较,还可以分析因素间的交互作用

序贯试验

医学科研设计一般都是预先确定样本含量,结果分析在全部试验完成后作出。序贯实验预先不需要确定试验例数。事先根据实验标准绘好序贯实验图。将每次试验结果的数据点到图上,当达到要求的检验界限,便可停止试验,作出判断。

武大医学统计学 期末题

医学统计学试题(A )卷(闭卷) 2009--2010学年第一学期 学号: 姓名: 一、A型题:请从备选答案中选出1个最佳答案并填在后面得括号里(每小题1分,共30分)。 1、流行病学研究内容得三个层次就是指( ) A.疾病、伤害与健康 B.传染病、寄生虫病与地方病 C.传染性疾病、非传染病疾病与意外伤害 D.疾病分布、危险因素与预防控制措施 E.人群分布、时间分布与地区分布 2、提出由于维生素C缺乏引起身体虚弱得坏血病病因假说并开创了流行病学临床试验先河得医生就是:( ) A、希波克拉底(Hippocrates) B、詹姆士·林德(James Lind) C、约翰斯诺(John Snow) D、路易斯(PCA Louis) E、葛郎特(John Graunt) 3、流行病学研究方法得核心思想就是( ) A.预防为主得思想 B.研究对象为人群 C.对比思想 D.社会医学观念 E.生态学思想 4、流行病学任务得三个阶段就是( ) A.观察性研究、实验性研究与理论性研究 B.揭示现象、找出原因与提供措施 C.描述分布、提出假设与验证假设 D.整理资料、分析资料与得出结论 E.早期发现、早期诊断与早期恰当治疗 5、关于率与比得描述,下列哪项就是不正确得( ) A.大多数率就是构成比,分子就是分母得一部分 B.比表示分子与分母得数量关系,而不考虑分子与分母所来自得总体如何 C.比得分子就是分母得一部分 D.率也就是比,但比不一定就是率 E.率就是用来描述变量随时间变化得动态指标 6、某单位发生一起食物中毒,为尽快查明原因,调查中应该使用得主要指标就是( ) A.发病率 B.患病率 C.罹患率 D.病死率 E.期间患病率 7、关于发病率得描述,下列哪项就是不正确得( ) A.发病率可用来描述疾病得分布 B.发病率得变化意味着并因因素得变化 C.发病率得高低取决于疾病报告、登记制度以及诊断得正确 D.发病率得准确性取决于疾病报告、登记制度以及诊断得正确 E.发病率可用来探讨发病因素,提出病因假设,评价防治措施效果

医学统计学(第六版)期末复习

统计 一绪论 第一节: 统计学: 重要作用:在于能够透过偶然现象来探测其规律性。 研究对象:具有不确定性结果的事物。 第二节: 基本内容: 1 .统计设计 2 .数据整理 3.统计描述 4.统计推断 第三节: 统计学的基本概念 同质:根据研究目的所确定的观察单位其性质大致相同。变异:各观察单位存在差异,这种差异称为变异。

变量与数据类型 总体和样本 总体:根据研究目的所确定的同质观察单位的全体。 参数:μ率:μ/π 样本:从研究总体中抽取部分有代表性的观察单位。 统计量:率/ P X X 第二章 第一节频数分布 频数表 1.求全距:max—min=R 2.确定组数:1/10*全距 3.确定组距:

4.确定组限: 第一组下限≤min 最后一组上限≥max 偶数比奇数好 5.确定频数 6.归纳分析 第二节 一、算术均数 适用:正态分布 用于说明一组观察值的平均水平或集中趋势。 (一)直接法(小样本) = / :样本均数 n :样本观察例数 (二)加权法 (大样本) n ∑= X f X =(各组中值*组频数)/n 组中值=1.(本组下限+第二组下限)/2 2.本组下限值+组距/2 二、几何均数 适用:1.等比资料 2.对数正态分布 小样本:n ∑-= X lg lg G 1 X X X

大样本:n ∑-=M 1 X lg f lg G 三、中位数 小样本:奇数:M=X (N+1)/2 偶数:M=1/2[X n /2+X (n/2+1)] 大样本:i f f n 5.0L M M L M ?-+=)( M :中位数; L M :M 所在组的上限; f L :M 所在组之前积累的频数 ;f M :M 所在组的频数; i :组距。 四、百分位数 i f f x%n L P x L x X ?-?+=)( L x :X 所在组的上限; f X :X 所在组之前积累的频数 ;f L :X 所在组的频数; i :组距 第三节变异程度的统计指标 一、极差 极差(R ):即全距=max –min 二、四分位数间距 (越大则数据变异越大。适用于偏态分布。) Q=P 75 - P 25 三、方差

武汉大学考研报录比(2017-2005)历年报录情况统计汇总

报考武汉大学硕士研究生考试的同学,都比较关注武汉大学各学院各专业历年的报考和录取人数基本情况。新祥旭考研收集整理了武汉大学2004年开始的历年分专业报录比数据以供报考武汉大学的同学参考。 在此首先对武汉大学近几年的硕士研究生招生情况大概梳理下: 武汉大学2017年计划招收硕士研究生9300多名(含拟接收推荐免试生2700名)。其中:全日制硕士研究生约5410(学术学位硕士研究生约3700名,专业学位硕士研究生约1710名),非全日制硕士研究生3900多名。各培养单位招生人数将在录取时根据国家下达的正式招生计划和报名考试情况做适当调整。另外,我校“国家少数民族高层次骨干人才培养计划”招收硕士研究生68名(限报专业学位专业),“高层次人才强军计划”招收硕士研究生60名(限报专业学位专业)、“退役大学生士兵专项硕士招生计划”招收硕士研究生40名(限报专业学位专业)。 2016年武汉大学计划招收硕士研究生约5800 名(含拟接收推荐免试生2400名)。其中:学术学位硕士研究生约3350 名,专业学位硕士研究生约2450 名,各培养单位招生人数将在录取时根据国家下达的正式招生计划和报名考试情况做适当调整。另外,我校“国家少数民族高层次骨干人才培养计划”招收硕士研究生70 名(限报专业学位专业),“高层次人才强军计划”招收硕士研究生60名(限报专业学位专业)、“退役大学生士兵专项硕士招生计划”招收硕士研究生40名(限报专业学位专业)。 2015年武汉大学计划招收硕士研究生约5900 名(含拟接收推荐免试生2100名)。其中:学术学位硕士研究生约3300 名,专业学位硕士研究生约2600 名,各培养单位招生人数将在录取时根据国家下达的正式招生计划和报名考试情况做适当调整。另外,我校“国家少数民族高层次骨干人才培养计划”招收硕士研究生70 名(限报专业学位专业),“高层次人才强军计划”招收硕士研究生60名(限报专业学位专业)。 2014年武汉大学计划招收硕士研究生约6000 名(含拟接收推荐免试生1550名)。其中:学术学位硕士研究生约3400 名,专业学位硕士研究生约2600 名,各培养单位招生人数将在录取时根据国家下达的正式招生计划和报名考试情况做适当调整。另外,我校“国家少数民族高层次骨干人才培养计划”招收硕士研究生70 名(专业不限),“高层次人才强军计划”招收硕士研究生60名。 2013年武汉大学计划招收硕士研究生约6000 名(含拟接收推荐免试生1500名),其中:学术学位硕士研究生约3300 名,专业学位硕士研究生约2700 名,各培养单位招生人数将在录取时根据国家下达的正式招生计划和考试情况做适当调整。另外,我校“国家少数民族高层次骨干人才培养计划”招收硕士研究生70 名(专业不限),“高层次人才强军计划”招收硕士研究生60名。 武汉大学2017年的招生人数达到9300人,增加的部分基本上是非全日制录取人数。全日制硕士学位中学硕和专硕招生情况武大跟国家整体方针保持一致,专业硕士学位在招生中所占的比例有所提高。请报考的同学注意这一点。

《医学统计学》期末模拟考试题(四)

《医学统计学》期末模拟考试题(四) 一、是非题(每题1分,共20分) 1. 预试验的样本标准差s越小,所需样本含量越大。() 2. 等级相关系数的大小不可以反映两个现象间关系的密切程度。() 3. 在配对资料秩和检验中,两组数据统一从小到大编秩次。() 4. 对3个地区居民的血型构成作抽样调查后研究其差别,若有一个理论数小于5大于1,其余都大于5,可直接作χ2检验。() 5. 总例数等于60,理论数都大于5的四格表,对两个比例的差别作统计检验,不可用确切概率法。() 6. 双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。() 7. 随机区组方差分析中,只有当区组间差别的F检验结果P>0.05时,处理组间差别的F检验才是真正有意义的。() 8. 完全随机设计资料方差分析中要求各组均数相差不大。() 9. 两次t检验都是对两样本均数的差别作统计检验,一次P<0.01,另一次P<0.05,就表明前者两样本均数差别大,后者两样本均数相差小。() 10. 如果把随机区组设计资料用完全随机设计方差分析法作分析,前者的区组SS+误差SS等于后者的组内SS。() 11. 两分类Logistic回归模型的一般定义中,因变量(Y)是0~1变量。()

12. 作两样本均数差别的比较,当P<0.01时,统计上认为两总体均数不同,此时推断错误的可能性小于0.01。()<0.01时,统计上认为两总体均数不同,此时推断错误的可能性小于0.01。() 13. 方差分析的目的是分析各组总体方差是否不同。() 14. 在两组资料比较的秩和检验中,T值在界值范围内则P值小于相应的概率。()值在界值范围内则P值小于相应的概率。() 15. 无论什么资料,秩和检验的检验效率均低于t检验。()检验。() 16. 分类资料的相关分析中,检验的P值越小,说明两变量的关联性越强。() 17. 析因设计既可以研究各因素的主效应作用,又可以研究各因素间的交互作用。( ) 18. 当Logistic回归系数为正值时,说明该因素是保护因素;为负值时,说明该因素是危险因素。() 19. 常见病是指发病率高的疾病。( ) 20. 用某新药治疗高血压病,治疗前与治疗后病人的收缩压之差的平均数,经t检验,P<0.01。按a=0.05水准,可以认为该药治疗高血压病有效,可以推广应用。( ) 二、选择题(每题1分,共20分) 1.多重回归中要很好地考虑各因素的交互作用,最好选用________。 a. 最优子集法 b. 逐步法 c. 前进法 d. 后退法 e. 强制法 2.t r

医学统计学课后习题答案

医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本 是从总体中随机抽取的部分观察单位。 (3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误 差。 (5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%

武汉大学专业排名一览

2015武汉大学专业排名一览武汉大学专业排名,武汉大学各专业排名,武汉大学全国排名,这些问题肯定是考生们当下最关注的焦点,查字典学校大全为您整理关于武汉大学专业排名的内容,希望对您有帮助。 (一)自然科学 武汉大学自然科学总分列全国高校第11名,A+/538。在自然科学的4个学科门中,理学第10名,A/445;工学第13名,A/469;医学第15名,B+/162。武汉大学没有农学本科专业。 1、理学:A第10名/445。10个学科类17个本科专业。 数学类:数学与应用数学:A 第11名/249;信息与计算科学:A+ 第8名/249。物理学类:物理学:B+ 第13名/176;应用物理学:B+ 第15名/93。化学类:化学:A 第9名/170;应用化学:B+ 第33名/188。生物科学类:生物科学:A 第8名/143;生物技术:A+ 第7名/151。地理科学类:地理科学/82;资源环境与城乡规划管理:A++ 第3名/82;地理信息系 统:A++ 第2名/70。地球物理学类:地球物理学:B+ 第3名/10。电子信息科学类:电子信息科学与技术:A 第8名/127。材料科学类:材料物理:A 第8名/44。环境科学类:环境科学:A 第6名/112;生态学:C+ 第14名/30。统计学类:统计学:A 第7名/106。

2、工学:A第13名/469。11个学科类20个本科专业。 材料类:金属材料工程:C+ 第28名/62。机械类:机械设计制造及其自动化:B 第31名/214;材料成型及控制工程:B 第27名/90。仪器仪表类:测控技术与仪器:B 第27名/126。能源动力类:热能与动力工程:B 第18名/102。电气信息类:电气工程及其自动化:A 第5名/166;自动化:A 第15名/206;电子信息工程:B+ 第15名/256;通信工程:A 第13名/177;计算机科学与技术:A+ 第7名/415;电子科学与技术:C+ 第21名/83。土建类:建筑学:B+ 第15名/96;城市规划:A 第13 名/77;土木工程:A 第9名/184。水利类:水利水电工程:A++ 第1名/39;水文与水资源工程:A+ 第2名/25。测绘类:测绘工程:A++ 第1名/39。环境与安全类:环境工程:B 第39名/187。工程力学类:工程力学:C/51。农业工程类:农业水利工程:A++ 第1名/27。 3、医学:B+第15名/162。4个学科类6个本科专业。 预防医学类:预防医学:C+ 第23名/49。临床医学与医学技术类:临床医学:B 第16名/101;医学影像学:B+ 第16 名/52;医学检验:A 第11名/53。口腔医学类:口腔医学:A 第4名/47。药学类:药学:B 第20名/79。 (二)社会科学 武汉大学社会科学居全国高校第5名,A++/557。在社会科学的7个学科门中,哲学第4名,A+/43;经济学第11

武汉大学统计学复习题

第一章 绪论 思考题: 1. 医药统计研究的过程是什么? 2. 统计资料主要分为哪几种类型? 3. 什么是总体;什么是样本。 4. 概率与常用概率分布 练习与思考 1.瓶中装有100片药片,其中有5片次品,从中任取10片,求: (1)10片全是正品的概率; (2)恰有2片次品的概率。 2.10把钥匙中有3把能打开锁,任取2把,求能打开锁的概率。 3.设A ,B ,C 是三个随机事件,试用A ,B ,C 表示下列事件: (1)A 不发生而B ,C 都发生; (2)A 不发生而B ,C 中至少有一个发生; (3)A ,B ,C 中至少有两个发生; (4)A ,B ,C 中恰有两个发生。 4.某药厂的针剂车间灌注一批注射液,需4道工序,已知由于割瓶时掉入玻璃屑而成废品的概率为0.5,由于安瓿洗涤不洁而造成废品的概率为0.2,由于灌药时污染而成废品的概率为0.1,由于封口不严而成废品的概率为0.8,试求产品合格的概率。 5.甲乙两个反应罐在1小时内需要工人照顾的概率分别为0.1和0.2。求在1小时内: (1)甲乙两罐都需要照顾的概率; (2)甲乙两罐都不需要照顾的概率; (3)一罐需要照顾而一罐不需要照顾的概率。 6.设()0.2, ()0.3, (/)0.3,P A P B P A B ===试求: (1)()P AB ; (2)(/)P B A ; (3)()P AB ; (4)()P A B +。 7.三个射手向一敌机射击,射中的概率分别为0.4,0.6,0.7。如果一人射中,敌机被击落的概率为0.2;二人射中,敌机被击落的概率为0.6;三人射中则必被击落。已知敌机被击中,求该机是三人击中的概率? 8.已知X 的可能取值为0,±1,±2,且 }1|{|}2{,6.0}1|{|,3.0}0{,4.0}21{==≥=≤===<<-X P X P X P X P X P 试求:X 的概率分布? 9.已知在8次独立试验中,事件A 至少发生一次的概率为0.57,试求在一次试验中事件A 发生的概率? 10.当投掷五枚分币时,已知至少出现两个正面,问:正面数刚好是三个的条件概率? 11.设X 服从泊松分布,且已知{}{}12P X P X ===,求{}4P X =。 12.设k 在[0,5]上服从均匀分布,求方程02442 =+++k kx x 有实根的概率? 13.设随机变量X 的概率密度函数为

南医大医学统计学期末题目

1.下列变量中,不属于数值变量的是____ A .坐高 B .胸围 C .血型 D .身高 2.正态分布曲线下,横轴上从均数到(μ + 1.96σ)的面积为:_____ A .95% B .45% C .47.5% D .90% 3.5人的血清滴度为:1:2,1:4,1:8,1:16,1:32,平均滴度为_____ A .1:8 B .1:lg8 C .lg (1/8) D .1:12.4 4.为了比较一组乳腺癌患者化疗后血清肌酐和血清尿素氮两指标的变异程度,可选用____ A. 标准差 B. 标准误 C. 变异系数 D. 极差 5.在同一总体随机抽样,其他条件不变,样本含量越大,则_____ A. 样本标准差越大 B. 样本标准差越小 C. 总体均数的95%可性区间越窄 D. 总体均数的95%可性区间越宽 6.连续性变量x 呈偏态分布,从该总体中反复随机抽样,随样本含量n 增大,下列哪个选项将趋向正态分布_____ A. x x μ σ- B. C. x x x s - D. x s μ- 7.下面关于标准误的四种说法中,哪一种最不正确?________ A. 标准误是样本统计量的标准差 B. 标准误反映重复试验准确度的高低 C. 标准误反映总体参数的波动大小 D. 标准误反映抽样误差的大小 8.统计推断的主要内容为_____ A. 统计描述与统计图表 B. 参数估计和假设检验 C. 区间估计和点估计 D. 统计预测与统计控制 9. 有两个独立随机样本,样本含量分别为n 1和n 2,在进行成组设计资料的t σ μ -x

检验时,自由度是_______ A .n 1+ n 2 B .(n 1+ n 2)-1 C .(n 1-1)+( n 2-1)-1 D .(n 1-1)+( n 2-1) 10.样本均数比较的t 检验,差别有统计学意义时,P 值越小说明______ A .两样本均数差别越大 B .越有理由认为两总体均数不同 C .两总体均数差别越大 D .越有理由认为两样本均数不同 11.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小_______ A. α=0.05 B. α=0.01 C. α=0.10 D. α=0.20 12. 各观察值均加(或减)同一数后,_____ A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均改变 D.两者均不变 13. 在假设检验中,P 值和α的关系为 _______ A. P 值越大,α值就越大 B. P 值越大,α值就越小 C. P 值和α值由研究者事先设定 D. P 值与α值的大小无关 14 . 作两均数比较,已知n 1、n 2均小于30,总体方差不齐且分布呈极度偏态,宜用______ A. t 检验 B. 秩和检验 C. F 检验 D. 2χ检验 15. 三个率的比较的卡方检验,P 值小于0.01,则结论为_____ A.三个总体率均不相等; B.三个样本率均不相等; C.三个总体率之间肯定不等或不全相等; D.三个总体率之间不等或不全相等。 16.配对设计的目的是_____ A.提高测量精度 B.操作方便 C.为使用t 检验 D.提高组间可比性 17 . 从文献中得到同类研究的两个率比较的四格表资料,其2 χ检验结果为:甲 文 ) 1(01.02χχ>,乙文 2 ) 1(05.02χχ>,可认为______ A. 两文结果有矛盾 B.两文结果基本一致 C.甲文结果更可信 D.乙文结果更可信

2017年人民大学统计学生物医学统计学考研参考书

2017年人民大学统计学生物医学统计学考研参考书 统计学:生物医学统计学 风险管理与精算学: 《概率论》,李贤平,高等教育出版社 《数理统计基础》,陆璇,清华大学出版社 《概率论与数理统计》,茆诗松、周纪芗,中国统计出版社 《应用回归分析》,何晓群等编,中国人民大学出版社 《统计学》,贾俊平等编,中国人民大学出版社 概率论与数理统计: 《数学分析》上、下册复旦大学数学系陈传璋、金福临等编高等教育出版社《高等代数》北京大学出版社 《概率论》李贤平高等教育出版社 《数理统计基础》陆璇清华大学出版社 《概率论与数理统计》茆诗松、周纪芗中国统计出版社 流行病与卫生统计学: 《流行病学》詹思延人民卫生出版社 《卫生统计学》方积乾、徐勇勇、陈峰编人民卫生出版社 (专业学位)应用统计: 《统计学》第四版贾俊平中国人民大学出版社配套习题 《应用回归分析》何晓群等编中国人民大学出版社 《多元回归分析》何晓群等编中国人民大学出版社 《抽样技术》金勇进等编中国人民大学出版社 《时间序列分析》易丹辉中国人民大学出版社 《概率论与数理统计》第三版刘次华高等教育出版社配套习题 2017年新祥旭考研全程复习计划

一、英语全程规划 基础阶段(3月-6月) 1.学习目标:完成至少1轮的单词背诵,巩固语法基础 2.阶段重点:英语单词、语法 3.复习建议: (1)英语每天抽空背背单词,建议时长0.5-1h;不管是用单词软件还是传统词书,不管是用词根词缀还是死记硬背,最重要的是每天都背。积累到某一天时,你会发现好多文章都看得懂了。 (2)英语基础不牢的童鞋,应该花点时间复习语法。语法知识能帮助你在读文章和翻译时更加流畅、对文章意思把握得更准确。 (3)多看看新闻,关注时事热点。近年来的英语作文和阅读都是涉及到热点话题的。 (4)不建议大家在这个阶段做习题集。 强化阶段(7月-10月) 1.学习目标:熟读并详细分析近10年真题 2.阶段重点:真题真题真题,重点是阅读 3.复习建议: (1)单词记忆每天进行,不间断。 (2)定时做真题阅读,做完后详细分析。 ①利用早上整段的时间做真题(作文可以不写),不要查单词,完全自己做,然后对答案,之后看一下答案分析。 ②每天分析2-3篇,分析包括:第一遍分析正确选项,第二遍分析错误选项的设置,第三遍在原位中找对应的句子,是每个选项对应的句子哟,分析为什么这样出题,第四遍,了解文章的背景,作者的情感。 ③此阶段不建议专门建立单词笔记本,重要的单词在分析时顺便查一下就好。 ④时间比较充足的童鞋可以全文翻译阅读原文。 (3)完成阅读后,用同样的方法完型、翻译和新题型。完型和新题型这两类题型不用全文

(完整版)医学统计学实习册第7版武汉大学答案

实习一 1 总体:根据研究目的所确定的同质观察单位的全体。 2 样本:从总体中随机抽取的部分个体。 3 参数:总体的统计指标或特征值。 4 统计量:由样本所算出的统计指标或特征值。 5 概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p, 这个常数p就称为事件A出现的概率,记作P(A)或P。 6 频率:在n次随机试验中,事件A发生了m次,则比值f=m/n=A发生的试验次数/试验的 总次数称为A在n次试验中出现的频率。 7 变异:同质事物间的差别。 8 指标:说明总体综合数量特征和数量关系的数字资料。 简答与思考题 1 什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别?医学统计学:是应用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科。 统计学:是研究数据的收集、整理、分析与推断的科学 卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。 生物统计学:是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计、取样、分析、资料整理与推论的科学。 2 医学统计资料主要来源于哪些方面?有何要求? 医学统计资料主要有实验数据和现场调查资料、医疗卫生工作记录、报表和报告卡等。实验数据是指在试验过程中活的数据;现场调查资料主要来源于大规模的流行病调查获取的资料;医疗卫生工作记录有门诊病历卡、住院病历卡、化验报告等;报表有卫生工作基本情况年报表、传染年(月、日)报表、疫情旬(年、月、日)报表等;报表卡有传染病发病报告卡、出生报告卡、死亡报告卡等等。 这些资料的收集过程中,必须进行治疗控制,包括它的统一性、确切性、可重复性。这些原始数据的精度和偏差应用明确的范围。

武大医学统计学期末题

医学统计学试题(A )卷(闭卷) 2009--2010学年第一学期 学号:姓名: 一、A型题:请从备选答案中选出1个最佳答案并填在后面的括号里(每小题1分,共30分)。 1.流行病学研究内容的三个层次是指() A.疾病、伤害和健康 B.传染病、寄生虫病和地方病 C.传染性疾病、非传染病疾病和意外伤害 D.疾病分布、危险因素和预防控制措施 E.人群分布、时间分布和地区分布 2.提出由于维生素C缺乏引起身体虚弱的坏血病病因假说并开创了流行病学临床试验先河的医生是:() A.希波克拉底(Hippocrates) B.詹姆士·林德(James Lind) C.约翰斯诺(John Snow) D.路易斯(PCA Louis) E.葛郎特(John Graunt) 3.流行病学研究方法的核心思想是() A.预防为主的思想 B.研究对象为人群 C.对比思想 D.社会医学观念 E.生态学思想 4.流行病学任务的三个阶段是() A.观察性研究、实验性研究和理论性研究 B.揭示现象、找出原因和提供措施 C.描述分布、提出假设和验证假设 D.整理资料、分析资料和得出结论 E.早期发现、早期诊断和早期恰当治疗 5.关于率和比的描述,下列哪项是不正确的() A.大多数率是构成比,分子是分母的一部分 B.比表示分子和分母的数量关系,而不考虑分子和分母所来自的总体如何C.比的分子是分母的一部分 D.率也是比,但比不一定是率 E.率是用来描述变量随时间变化的动态指标 6.某单位发生一起食物中毒,为尽快查明原因,调查中应该使用的主要指标是() A.发病率 B.患病率C.罹患率D.病死率E.期间患病率 7.关于发病率的描述,下列哪项是不正确的() A.发病率可用来描述疾病的分布

医学统计学问答题(含答案)

简答题 0. 算术均数、几何均数和中位数各有什么适用条件? 答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。 (2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。 (3)中位数:适用各种类型的资料,尤其以下情况: A 资料分布呈明显偏态; B 资料一端或两端存在不确定数值(开口资料或无界资料); C 资料分布不明。 1.对于一组近似正态分布的资料,除样本含量n 外,还可计算S X ,和S X 96.1±,问各说明什么? (1)X 为算数均数,说明正态分布或近似正态分布资料的集中趋势 (2)S 为标准差,说明正态分布或近似正态分布的离散趋势 (3)S X 96.1±可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含95%的个体值。 2.试述正态分布、标准正态分布的联系和区别。 正态分布 标准正态分布

原始值X无需转换作u=(X-μ)/σ转换 分布类型对称对称 集中趋势μμ=0 均数与中位数的关系μ=Mμ=M 参考:标准正态分布的均数为0,标准差为1;正态分布的均数则为μ,标准差为σ(μ为任意数,而σ为大于0的任意数)。标准正态分布的曲线只有一条,而正态分布曲线是一簇。任何正态分布都可以通过标准正态变换转换成标准正态分布。标准正态分布是正态分布的特例。 3.说明频数分布表的用途。 1)描述频数分布的类型2)描述频数分布的特征3)便于发现一些特大或特小的可疑值4)便于进一步做统计分析和处理 4.变异系数的用途是什么? 多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。 5.试述正态分布的面积分布规律。 (1)X轴与正态曲线所夹的面积恒等于1或100%;

医学统计学第三版第四章课后习题答案

2. ANOVA 实验结果 Sum of Squares df Mean Square F Sig. Between Groups 43.194 3 14.398 13.697 .000 Within Groups 37.842 36 1.051 Total 81.036 39 Multiple Comparisons Dependent Variable: 实验结果 Dunnett t (2-sided)a (I) 分组(J) 分组Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval Lower Bound Upper Bound 0.5 对照组-2.15000*.45851 .000 -3.2743 -1.0257 1.0 对照组- 2.27000*.45851 .000 - 3.3943 -1.1457 1.5 对照组-2.66000*.45851 .000 -3.7843 -1.5357 F=13.697 P=0.000004 P A=0.000113 P B=0.000051 P C=0.000004均小于0.001 根据完全随机资料的方差分析,按α=0.05水准,拒绝H0,接受H1,认为四组治疗组小白鼠的肿瘤重量总体均数不全相等,即不同剂量药物注射液的抑癌作用有差别。 3. Tests of Between-Subjects Effects Dependent Variable: 重量 Source Type III Sum of Squares df Mean Square F Sig. Hypothesis 99736.333 1 99736.333 58.489 .005 Error 5115.667 3 1705.222a 治疗 Hypothesis 6503.167 2 3251.583 44.867 .000 Error 434.833 6 72.472b 分组 Hypothesis 5115.667 3 1705.222 23.529 .001 Error 434.833 6 72.472b F:44.867 23.529 P:0.000246 0.001020<0.01 根据随机区组资料的方差分析,按α=0.05水准,拒绝H0,接受H1,三组注射不同剂量雌激素的大白鼠子宫重量总体均数不全相等,即注射不同剂量的雌激素对大白鼠子宫重量有影响 5.

武大医学统计学期末复习总结(名解和简答)

医学统计学期末复习总结 名词解释 参数Patameter:是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可以通过随机抽样抽取具有代表性的样本,用算得的样本统计量估计未知的总体参数。 统计量statistic:是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量实在总体参数附近波动的随机变量。 系统误差systematic error:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是克制的或可能掌握的。 随机误差random error:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。I型错误type I error:拒绝了实际上成立的H0,这类“弃真”的错误称为I型错误,其概率大小用α来表示。 II型错误type II error:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误,其概率大小用β来表示。 P值P-value:在H0成立的前提下,用样本数据获得的样本统计量及比样本统计量总计更极端的区间下的面积。 置信区间confidence bound / confidence interval, CI:按预先给定的概率(1-α)所确定的包含未知总体参数的一个范围。 多重共线性Multicollinearity:是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。 哑变量dummy variable:如果是多分类指标,假定有g类,则用g-1个取值为0,1或-1的变量,称为哑变量。 偏相关系数partial correletion coefficient:表示在一组变量中,任一两个变量在其它变量固定不变时,他们之间相关的密切程度和方向。或者说,扣除其它变量对它们的影响后,两个变量之间的线性相关情况。 决定系数coefficient of determination:回归平方与总平方和之比,其数值反映了回归贡献的相对程度,其值约接近1,说明模型对数据的拟合程度越好。 随机对照试验Randomized Controlled Trial,RCT:将研究对象随机分组,对不同组实施不同的干预,以对照效果的不同。 接受者工作特征曲线receiver operator characteristic,ROC曲线:以不同截断点时的(1-特异度)为横轴,灵敏度为纵轴,作的真阳性率与假阳性率曲线。 简答题: 1. 标准差与标准误的区别与联系。√ 区别:(1)含义不同:①标准差描述个体变量值x之间变异度的大小,S越大,变量值x 越分散;反之变量越集中,均数的代表性就越强;②标准误是描述样本均数之间变异度的大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。 (2)与n关系不同:n增大时,①S-σ(恒定);②标准误减少并趋于0(不存在抽样误差); (3)用途不同:①标准差表示x变异度的大小,计算CV,估计正常值范围,计算标准误

武汉大学报录比(包含推免生)

近三年硕士研究生各专业报考录取情况 培养单位名称专业 代码 专业名称 2012年2013年2014年 报考数录取数推免数报考数录取数推免数报考数录取数推免数 外国语言文学学院050201 英语语言文学247 28 11 188 29 11 109 20 3 050202 俄语语言文学20 6 3 10 6 4 23 6 4 050203 法语语言文学70 17 6 71 18 4 76 17 5 050204 德语语言文学17 3 2 14 4 2 14 4 0 050205 日语语言文学108 16 1 123 11 1 77 7 3 050211 外国语言学及应用语言学98 16 3 86 10 2 65 10 2 0502Z1 翻译学0 0 0 0 0 0 43 6 1 045108 学科教学(英语)22 6 3 52 8 2 70 9 3 055101 英语笔译111 16 3 179 19 3 186 14 3 055102 英语口译128 16 8 159 27 3 156 27 7 新闻与传播学院050301 新闻学449 72 14 374 35 12 300 35 11 050302 传播学852 104 24 766 91 30 582 70 29 050323 ★数字媒介21 6 1 11 0 0 0 0 0 0503J1 数字媒介0 0 0 0 0 0 24 3 1

0503J2 广播电视艺术理论0 0 0 0 0 0 18 6 2 055200 新闻与传播113 40 9 252 78 10 333 78 12 信息管理学院120100 管理科学与工程78 16 0 63 19 1 84 19 3 120120 ★电子商务93 26 5 76 17 2 0 0 0 1201Z1 电子商务0 0 0 0 0 0 67 22 5 120501 图书馆学48 15 4 41 13 6 39 14 5 120502 情报学110 31 6 80 26 5 83 24 10 120503 档案学73 17 4 60 13 4 52 21 8 120520 ★出版发行学127 25 9 115 31 8 0 0 0 120521 ★信息资源管理46 8 0 41 8 2 0 0 0 1205Z1 出版发行学0 0 0 0 0 0 95 30 12 1205Z2 信息资源管理0 0 0 0 0 0 29 3 0 055300 出版12 3 1 19 9 2 26 8 2 085239 项目管理 3 0 0 0 0 0 0 0 0 125500 图书情报116 32 7 78 36 9 246 50 13 125600 工程管理 4 0 0 0 0 0 0 0 0 经济与020101 政治经济学16 4 3 15 3 2 15 2 2

医学统计学期末重点总结

误差:观测值与真实值、样本计量与总体参数之间的差别。 相对数:两个有关的绝对数之比,也可以是两个有关联统计指标之比。 相对比:相对比是A、B两个有关联指标值之比,用以描述两者的对比水平,说明A是B 的若干倍或百分之几。 统计描述:描述及总结一组数据的重要特征,目的是使实验或观察得到的数据表达清楚并便于分析。 统计推断:指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 同质:指根据研究目的所确定的观察单位其性质应大致相同。 变量:反映实验或观察对象生理、生化、解剖等特征的指标,变量的观测值称为数据。 定量数据:也称计量资料。变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低,一般有计量单位。根据变量的取值特征可分为连续型数据和离散型数据。 有序数据:也称半定量数据或等级资料。变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别。 总体:根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。样本:从研究总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据。 参数:描述总体特征的指标称为参数。 统计量:描述样本特征的指标称为统计量。 概率:描述某事件发生可能性大小的度量。 小概率事件:习惯上将P≤0.05的事件称为小概率事件。 平均数:是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。 率:率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比。 构成比:表示某事物内部各组成部分在整体中所占的比重,常以百分数表示,计算公式为区间估计:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。 线性相关的概念:研究两个变量之间是否具有直线相关关系。 相关系数:是说明具有线性相关关系的两个数值变量间相关的密切程度与相关方向的统计量。 研究对象:根据研究目的而确定的观察总体,也可称为受试对象或实验对象。 处理因素:根据研究目而欲施研究对象的干预措施。 处理水平:处理因素在实验中所处的状态称为因素的水平(level),亦称处理水平。 对照:指在实验中应设立对照组,其目的是通过与对照组效应对比鉴别出实验组的效应大小。随机化:是指每个受试对象有相同的概率或机会被分配到不同的处理组。 重复:是指在相同实验条件下重复进行多次观察。 统计学的基本内容:统计设计,数据整理,统计描述,统计判断 数据类型:定量数据,定性数据,有序数据 误差的类型:系统误差,随机测量误差,抽样误差 配对样本t检验配对设计:同源配对,异源配对,自身配对 方差分析的基本思想:将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上,计算假设检验的统计量F 值,实现对总体均数是否有差别的推断。 非参数检验的适用范围:①总体分布类型未知或非正态分布数据;②有序或半定量资料;③数据两端无确定的数值。 标准差与标准误的区别与联系:区别:标准差:意义,描述个体观察值变异程度的大小,标准差越小,均数对一组观察值的代表性越好。应用,与X拔结合,用以描述个体观察值的

预防医学考试重点完整最新版

预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1

相关文档
最新文档