医学统计学简答题

医学统计学简答题
医学统计学简答题

医学统计学简答题

1.简述标准差、标准误得区别与联系?

区别:(1)含义不同:标准差S表示观察值得变异程度,描述个体变量值(X)之间得变异度大小,S越大,变量值(X)越分散;反之变量值越集

中,均数得代表性越强。标准误、、估计均数得抽样误差得大小,就是描述样本均数之间得变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。(2)与n得关系不同:n增大时,S趋于。(恒定),标准误减少并趋于

0(不存在抽样误差)。

(3)用途不同:标准差表示X得变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间与假设检验。联系:二者均为变异度指标,样本均数得标准差即为标准误,标准差与标准误成正比。

2.简述假设检验得基本步骤。

1.建立假设,确定检验水准。

2.选择适当得假设检验方法,计算相应得检验统计量。

3、确定P值,下结论3.正态分布得特点与应用:

特点:1、集中性:正态曲线得高峰位于正中央,即均数所在得位置;

2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交;

3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均

匀下降;

4、正态分布有两个参数,即均数》与标准差0 ,可记作N(?,。):均数卩决定正态曲线得中心位置;标准差。决定正态曲线得陡峭或扁平程度。0越小,

曲线越陡峭;0越大,曲线越扁平;

5、U变换:为了便于描述与应用,常将正态变量作数据转换;

应用:1、估计医学参考值范围2、质量控制3、正态分布就是许多统计方法得理论基础

4.简述参考值范围与均数得可信区间得区别与联系

可信区间与参考值范围得意义、计算公式与用途均不同。

1、从意义来瞧95%参考值范围就是指同质总体内包括95%个体值得估计范围,而总体均数95%可信区间就是指95%可信度估计得总体均数得所在范围

2、从计算公式瞧若指标服从正态分布,95%参考值范围得公式就是: ±l、96s。总体均数95%可信区间得公式就是:前者用标准差,后者用标准误。前者用1、96,后者用a为0、05,自由度为V得t界值。

5.频数表得用途与基本步骤。

用途:(1)揭示资料得分布特征与分布类型;(2)便于进一步计算指标与分析处理;(3)便于发现某些特大或特小可疑值。

基本步骤:(1)求出极差;(2)确定组段,一般设8~15个组段;(3)确定组距;组距二R/组段数,但一般取一方便计算得数字;(4)列出各个组段并确定每一组段频数。

6.非参数统计检验得适用条件。

(1)资料不符合参数统计法得应用条件(总体为正态分布、且方差相等)或总体分布类型未知:(2)等级资料:(3)分布呈明显偏态又无适当得变量转换方法使之满足参数统计条件;(4)在资料满足参数检验得要

求时,应首选参数法,以免降低检验效能

7.线性回归得主要用途。

1、研究因素间得依存关系,自变量与应变量之间就是否存在线性关系, 即研究一个或多个自变量对应变量得作用,或者应变量依赖自变量变化而变化得规律。

2、利用直线回归方程可进行预测估计。

3、用容易测量得指标估计

不易测量得指标。4、获得精确度更高得医学参考值范围。

8.简述检验假设与可信区间得联系与区别。

(1)可信区间用于推断总体参数所在得范围,假设检验用于推断总体参数就是否不同。前者估计总体参数得大小,后者推断总体参数有无质得不同。(2)可信区间也可回答假设检验得问题。但可信区间不能提供确切得P值范围,只能给出在。水准上有无统计意义。(3)可信区间还可提示差别有无实际意义。

9.简述直线回归与直线相关得区别与联系。

区别:(1)资料要求不同:直线回归中应变量y就是来自正态总体得随机变量,而X既可以就是来自正态总体中得随机变量,也可以就是严密控制、精确测量得变量;相关分析则要求x,y就是来自双变量正态分布总体得随机变量。(2)回归反映得就是两个变量得依存关系,取值范围就是(-8,8)°相关反应两个变量得相互关系,取值范围就是(-1,1);(3)回归有单位,相关无单位。

联系:统一资料r与b符号相同,即方向一致性,r与b假设检验结果等价M 与b可互相换算,有相关不一定有回归,有回归一定有相关(回归可用来解释相关)

W.标准差得实际应用。

1表示数据分布得离散程度2常用“x±s”作为计量资料得数字特征描述得专用符号3计算临床上得各种生化、生理指标得参考范围4在单纯随机抽样中,就是计量资料估计样本量不可缺少得重要依据之一

5可用来计算均数得抽样误差大小。

相对数得注意事项p33

医学统计学名词解释

*总体:根据研究目得确定得同质得全部研究单位得观测值,即某个随机变量X可取值得全体。

衬^本:总体中随机抽取得有代表性得部分观察单位其实测量值得集合。

变量:观察对象个体得特征或测量得结果。由于个体得特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量,简称变量。

统计量:由样本所算出得统计指标或特征值。

*=抽样误差:由个体变异产生得,随机抽样引起得样本统计量之间以及样本统计量与总体参数之间得差异。(由于样本得随机性引起得统计量与参数得差别,或同一总体相同统计量之间得差别成为抽样误差) 标准差:就是描述个体值变异程度得指标,为方差得算术平方根。

标准误(SE):统计学上通常把统计量得标准差称为标准误,就是员映样本均数抽样误差大小得指标。

系统误差:就是指在同一条件下,多次测量时,误差得大小与符号均保持不变,或当条件改变时,按某一确定得已知规律而变化得误差。

*1类错误:拒绝了实际上成立得H0,这类弃真得错误称为I类错误。

*11类错误:指接受了实际上不成立得H0,这类存伪得错误称为II类错误。参数:反应总体统计学特征得数字。

斜+数资料:将研究对象按照某种属性得不同程度进行分组,然后计数每组里得观察系数。

未医学参考值范围:绝大多数正常人(正常人得90%,95%,99%,尤其最常用95%)得某一指标都在一定得范围内,则这个范围为医学参考值范围。

参考值:临床上应用得参考值就是指包括绝大部分正常人得人体形态、机能与代谢产物等各种生理及生化指标。

*计董资料:用定量得方法测量某项指标得大小所得得资料。(用仪器、工具或其她定量方法准确获得得定量结果,一般带有计量单位)树ft率:描述随机事件发生得可能性大小得数值。

P值:在Ho规定得总体中进行随机抽样,得到得等于及大于或等于及小于现有样本统计率,或说就是比现有实验结果更极端得样本统计量出现得概率,P值越小越不利于接受Ho。

线性相关得情况:正相关、负相关、零相关、非线性相关正态分布:又称高斯分布,就是一种概率分布。

标准正态分布:当u=0,。2 =1时,称为标准正态分布,记为N(0,l)。U维随机向量具有类似得概率规律时,称此随机向量遵从多维正态分布。(线性)相关系数r:用以描述两个随机变量之间相关关系得密切程度与相关方向得统计指标。

回归:分析两个变量或多个变量之间某种数量依存关系得一类统计方法直线回归:统计学上将分析某变量随另一变量变化而变化依存关系得方法称为直线回归

*回归系数b:即回归直线得斜率,统计学意义就是自变量X改变一个单位时,应变量Y平均改变b个单位。

离散系数(变异系数):标准差与均叔之比。

统计量:用样本观察值确定得,反应总体统计学特征且不依赖于未知参数得数字。

假设检验:用样本统计量对总体参数或分布得特征假设进行检验,进而对该假设就是否成立作出判断。

假设检验得步骤:1、建立假设确定检验水平(显著性水平)2、选择适当得假设检验得方法,记录相应得检验统计量3、确定P值下结论。

林检验效能:即1-P,指两总体确有差异,按规定得检验水平a所能发现该差异得能力。

*中位数(median):将一组观察值按大小顺序排列后,位次居中得观察值。直线回归:统计学上将分析某变量随另一变量变化而变化依存关系得方法成为直线回归。

方差分析:就是检验多个总体均值就是否相等得统计方法。它就是通过检验各总体得均值就是否相等来判断分类型自变量对数值型自变量就是否有显著影响。

区间估计:总体得区间估计就是利用样本信息给出一个区间并同时给出重复试验时该区间包含总体均数得概率。

可信区间(CI):按一定概率100(l-a)%(即可信度)估计总体均数得所在范围,得到得范围就是可信区间。

统计表:统计表就就是以表格得形式,表达被研究对象得特征、内部构成及研究项目分组之间得数量关系。

统计图:用点得位置、线段得升降、直条得长短及面积得大小等几何图形表达事物得统计指标大小、对比关系及变化趋势。

非参数检验

最小二乘法

相关系数(r)

决定系数(r2)

医学统计学填空题

统计表结构:标题标目线条数字备注

*2. 统计图结构:标题图域标目尺度图例

?3. 统计工作得基本步骤:设计收集资料整理资料分析资料

9、影响检验效能得四个因素:1、总体参数得差异越大,检验效能越

大2、个体差异越小,检验效能越大3、样本量越大,检验效能越大4、检验水准a定得越宽,检验效能越大

10、编秩号注意:1、方差为0得数据忽略2、余下得n个差数按绝

对值由小到大排秩号3求秩与即将正负秩号分别相加4、检验统计量R取较小一个秩

11、正态分布得特点:1、集中性,正态分布曲线得髙峰位于正中央, 即均数所在位置2、对称性,以X二U为中心,左右对称,X轴为渐近线3均匀变动性,正态分布曲线由均数所在处开始分别向左右两侧逐渐均匀下降4、两个参数:均数U与标准差6,记作N(u, 6),均数U决定正态曲线得中心位置,标准差6决定正态曲线得陡峭或扁平程度。6 越大,曲线越扁平,6越小曲线越陡峭5、U变换

*12、正态分布应用:1、估计医学参考值范围2、质量控制3、正

态分布就是许多统计学方法得理论基础

*13、离散趋势指标:极差方差标准差四分位数间距变异系数

集中趋势指标:

14、标准差应用:1、表示数据分布得离散程度2常用x±s作为计量资料得数字特征描述得专用符号3、计算临床上得各种生化、生理指标得参考范围

4、在单纯随机抽样中,就是计量资料估计样本量不可缺少得重要依据之一

5、可用来计算均数得抽样误差大小。

15、检验水准与两类误差:I型误差:当H0为真时,假设检验结论拒绝

H0接受H1,II型错误,当真实情况H0不成立H1成立时。

16、随即完全区组设计资料得方差分析特点:1分析两个因素(处理因素与区组因素)2两个因素相互独立无交换作用3分析效率髙节约样本4设计要求严格。。原则:1区组划分2受试单位数量恒定3完全随机化得分组17、医学测量结果按其数源类型分为计量资料、计数资料。

18卡方检验得基本思想:检验实际频数与理论频数分布得符合程度, 若原假设成立,卡方值不会太大,反之若A与T得差值大,卡方值也越大,当卡方值超出一定范围时,就有理由认为原假设不成立。

19方差分析又称变异数分析,完全随机设计得方差可比较一个因素得两个或多个水平得效应。

方差分析得应用条件来自正态总体、各组方程差相等、各组样本为相互独立得随机样本。

方差分析就是检验多个总体均值就是否相等得统计方法。它就是通过检验各总体得均值就是否相等来判断分类型自变量对数值型自变量就是否有显著影响。

方差分析得基本思想:根据研究目得与设计类型,将总体变异分解为若干部分,每个部分都由特定因素相联系。将某因素与随机因素得均方比构成统计

量F,通过与F界值得比较做出统计推断方差分析得应用条件:1各组样本就是互相独立得随机样本且来自正态总体2各组总体方差相等,即方差齐性。

(完整版)医学统计学第六版课后答案

第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制(B ) A 条图 B 百分条图或圆图 C 线图 D 直方图 2、均数和标准差可全面描述D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5 岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95% 或99% 正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99% 的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是(A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6.男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为(D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A 和B 均不是 D. A 和B 均是 8、两样本均数比较用t 检验,其目的是检验(C ) A 两样本均数是否不同 B 两总体均数是否不同 C 两个总体均数是否相同 D 两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B 总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t 值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A 各总体率不同或不全相同 B 各总体率均不相同 C 各样本率均不相同 D 各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8 人。该资料宜选用的统计方法为(A ) A.四格表检验B. 四格表校正检验C t 检验D U 检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

医学统计学各种资料比较_选择方法小结

医学统计学各种资料比较选择方法小结 一、两组或多组计量资料的比较 1.两组资料: 1)大样本资料或服从正态分布的小样本资料 (1)若方差齐性,则作成组t检验 (2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料: 1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。 2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。 二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料: (1)小样本时:用二项分布进行确切概率法检验; (2)大样本时:用U检验。

2)多分类资料:用Pearson c2检验(又称拟合优度检验)。 2. 四格表资料 1)n>40并且所以理论数大于5,则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正c2或用Fisher’s 确切概率法检验 3)n£40或存在理论数<1,则用Fisher’s 检验 3. 2×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验 2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量 (1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2 (2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验 4. R×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验 2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2 3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析

医学统计学题库完整

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体内部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计

硕士医学统计学知识点总结汇总

第2章统计描述 1.对定量资料进行统计描述时,如何选择适宜的指标? 定量资料统计描述常用的统计指标及其适用场合描述内容指 标 意义适用场合 平均水平均 数 个体的平均值对称分布 几何均数平均倍数取对数后对称分布 中位数位次居中的观察值 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 众 数 频数最多的观察值不拘分布形式,概略分析 调和均数基于倒数变换的平均值正偏峰分布资料 变异度全 距 观察值取值范围不拘分布形式,概略分析 标准 差 (方差) 观察值平均离开均数的 程度对称分布,特别是正态分布资料 四分位数 间距 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开口 资料;④分布不明 变异系数标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但 数量级相差悬殊的变量间比较 定性资料:阳性事件的概率,概率分布,强度和相对比。 2. 应用相对数时应注意哪些问题? 答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。 (2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。 3. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图形适用资料实施方法 条图组间数量对比用直条高度表示数量大小 直方图定量资料的分布用直条的面积表示各组段的频数或频率 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系 箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形,叶片为个体值,叶长为频数

医学统计学选择题大全

医学统计学常见考题 1. 要反映某市连续5年甲肝发病率的变化情况,宜选用C A.直条图B.直方图C.线图D.百分直条图 2. 下列哪种统计图纵坐标必须从0开始,D A. 普通线图 B.散点图 C.百分分直条图 D.直条图 3. 关于统计表的列表要求,下列哪项是错误的?A A.横标目是研究对象,列在表的右侧;纵标目是分析指标,列在表的左侧 B.线条主要有顶线、底线及纵标目下面的横线,不宜有斜线和竖线 C.数字右对齐,同一指标小数位数一致,表内不宜有空格 D.备注用“*”标出,写在表的下面 4. 医学统计工作的基本步骤是C A.统计资料收集、整理资料、统计描述、统计推断 B.调查、搜集资料、整理资料、分折资料 C.设计、搜集资料、整理资料、分析资料 D.设计、统计描述、统计推断、统计图表 5. 统计分析的主要内容有B A. 描述性统计和统计学检验 B.统计描述和统计推断 C.统计图表和统计报告 D.描述性统计和分析性统计 6 制作统计图时要求D A.纵横两轴应有标目。一般不注明单位 B. 纵轴尺度必须从0开始 C.标题应注明图的主要内容,一般应写在图的上方 D. 在制作直条图和线图时,纵横两轴长度的比例一般取5:7 7. 痊愈、显效、好转、无效属于C A. 计数资料 B. 计量资料 C. 等级资料 D.以上均不是 8. 均数和标准差的关系是D A.愈大,s愈大B.愈大,s愈小 C.s愈大,对各变量值的代表性愈好D.s愈小,对各变量值的代表性愈好 9. 对于均数为,标准差为的正态分布,95%的变量值分布范围为B A. - ~ + B. -1.96~ +1.96 C. -2.58 ~ +2.58 D. 0 ~ +1.96 10. 从一个数值变量资料的总体中抽样,产生抽样误差的原因是A A.总体中的个体值存在差别B.样本中的个体值存在差别 C.总体均数不等于0 D.样本均数不等于0 11 从偏态总体抽样,当n足够大时(比如n > 60),样本均数的分布C 。 A. 仍为偏态分布 B. 近似对称分布 C. 近似正态分布 D. 近似对数正态分布 12 某市250名8岁男孩体重有95%的人在18~30kg范围内,由此可推知此250名男孩体重的标准差大约为C A.2.0kg B.2.3kg C.3.1kg D.6.0kg 13. 单因素方差分析中,造成各组均数不等的原因是D

医学统计学第七版课后解析

医学统计学第七版课后解析 1、同质:是指观察单位或观察指标受共同因素制约的部分 2、观察单位:亦称个体,是统计研究中最基本的单位 3、变异:在同质的基础上个体间的差距 4、总体:根据研究目的所确定的同质观察单位的全体,既是同质的所有观察单位某项观察值的集合 5、有限总体:总体若受一定的时间和空间控制,其观察单位数是有限的,称为有限总体 无限总体:理论上其观察单位数是无法穷尽的 6、样本:是指从总体中随机抽取部分观察单位其某项指标实测值的集合 7、抽样:从总体中抽取部分个体的过程称为抽样 8、抽样必须遵循随机化原则,即总体中每一个体都有同等的机会被

抽取到 9、抽样研究的方法,利用样本的信息推论总体的特征来达到研究目的 10、参数:描述总体特征的量 11、统计量:根据样本个体值计算得到的描述样本特征的量 12、总体参数是常数,而样本统计量可随样本不同而不同 13、随机误差:指一类不恒定、随机变化的误差,有多种尚无法控制的因素所引起 14、抽样误差:指抽样引起的样本统计量与总体参数之间的差异 15、系统误差:在实际观测过程中,由于仪器未校正、观测者感官的某种倾向、研究者掌握的标准偏高或偏低等原因,使观察值不是随机分散在真值两侧,而是具有方向性、系统性或周期性的偏离真值,这类误差称为系统误差

16、过失误差:指各种失误所导致的误差 17、随机事件:在一定条件下某一现象可能发生也可能不发生的事件 18、概率:反映某一随机事件发生可能性大小的量,用符号P表示 19、小概率事件:统计学上一般把P≤0.05的事件称为小概率事件,表示某事件发生的可能性很小 20、变量:观察单位的某个特征 21、变量值:变量的观察结果或测定值 22、按变量值是定性的还是定量的,可将变量分为数值变量和分类变量 23、数值变量又称定量变量,其变量值是用定量方法测得的,所的资料是计量资料 24、分类变量又称定性变量,其变量值是用定性方法测得的

(完整word版)医学统计学公式整理

集中趋势的描述 算术均数: 频数表资料(X0为各组段组中值) n fX f fX x O O ∑∑∑== 几何均数: n n X X X G ...21= 或 ) log ( log 1n X G ∑-= 频数表资料: ? ?????=????????=∑∑∑--n X f f X f G log lg log log 11 中位数:(1)* 2 1 +=n X M (2) ) (21* 12*2++= n n X X M 百分位数 ?? ? ??-?+ =L X X f n X f i L P 100其中:L 为欲求的百分位 数所在组段的下限 , i 为该组段的组距 , n 为总频数 , X f 为 该组段的的频数 , L f 为该组段之前的累计频数 方差: 总体方差为:式(1); 样本方差为 式(2) (1) N X 2 2 )(μσ-∑= (2) 1)(2 2--∑= n X X S 标准差: 1 )(2 --∑= n X X S 或 1/)(22-∑-∑= n n X X S 频数表资料计算标准差的公式为 1/)(22-∑∑∑-∑= f f fx fx S 变异系数:当两组资料单位不同或均数相差较大时,对变异 大小进行比较,应计算变异系数 % 100?=X S CV 常用的相对数指标 (一)率 (二)相对比(三)构成比 1.直接法标准化 N p N p i i ∑= ' ∑=i i p N N p )( ' 2.间接法标准化 预期人数实际人数= SMR ∑=i i P n r SMR S M R P P ?=' 正态分布:密度函数: )2/()(2221)(σμπ σ--= X e X f 分布函数: 小于X 值的概率,即该点正态曲线下左侧面积 )()(x X P x F <= 特征:(1)关于x=μ对称。(2)在x=μ处取得该概率密度函数的最大值,在σμ±=x 处有拐点,表现为钟形曲线。(3)曲线下面积为1。(4)μ决定曲线在横轴上的位置,σ决定曲线的形状 。(5)曲线下面积分布有一定规律 标准正态分布:对任意一个服从正态分布的随机变量,作如下标准化变换 σ μ-= X u ,u 服从总体均数为0、总体标准 差为1的正态分布。 u 值左侧标准正态曲线下面积为标准正态分布函数,记作 )(u Φ 医学参考值的确定方法:(1)百分位法:双侧(P 25,P 975),单侧P 95以下或P 5以上,该法适用于任何分布型的资料。(2)正态分布法:若X 服从正态分布,双侧医学参考值范围为 S X 96.1± 样本均数标准误的估计值为 X s = t 分布的概念:小样本总体标准差未知时,服从自由度为n-1 的t 分布 X X X t s μ-= 总体均数可信区间的计算: 大样本或总体标准差已知:式(1); 小样本:式(2) (1) n S X ?±96.1 (2)n S n t t ?±-)1(,05.0 单样本t 检验:检验统计量:式(1);样本例数估计:式(2) (1) n S X t /0μ-= 自由度为 n-1;(2)2 2/] )([δσβαZ Z N += 配对样本t 检验: 检验统计量: n S d t d /0-= 样本量计算同前 两样本t 检验:检验统计量: ) 11(2 12 1n n S X X t c +-= (错) 2 )()(2)1()1(21222211212222112-+-+-= -+-+-=∑∑n n X X X X n n S n S n S c 随机分组方法: 样本例数估计) (])([ 1 21122/--++=Q Q Z Z N δ σ βα 方差不齐的近似t 检验 检验统计量:式(1) ;校正自由度为:式(2) (1) 2 2 2 1212 1' n S n S X X t +-= (2) 11)(24142222 1 21-+-+= n s n s s s x x x x ν 方差齐性检验:H 0:两总体方差齐,H 1:两总体方差不齐,α=0.1 检验统计量:(较小)(较大)2 2 2 1 S S F =分子自由度为n1-1,分母自由度为n2-1 方差分析的基本思想: 1、总变异:总离均差平方和: 2() 1 T ij i j SS SS X X N νν=-==-∑∑总总= ∑∑-=n X X /)(2 2 2. 组间变异:组间变异反映了处理因素的影响(如处理确实有作用),同时也包括了随机误差(含个体差异和测量误差)。 21() 1 B i i i SS SS n X X k νν-==-∑组间组间== = C n X i i ij -∑ ∑2 )( 3. 组内变异:组内变异仅反映随机误差(含个体差异和测量误差),故又称误差变异。 222()(1) W E ij i i i i j i SS SS SS X X n S N k νν===-=-==-∑∑∑ 组内组内 2()(1) W E ij i i i i j i SS SS SS X X n S N k νν===-=-==-∑∑∑组内组内 1(1)()N k N k ννν=-=-+-=+总组间组内 组间均方与组内均方比值一般地服从分子自由度为ν1,分母 自由度为ν2的F 分布 12 1 MS F k N k MS νννν= ==-==-组间 组间组内组内 , 多个样本间的多重比较 Dunnett 检验:用于各实验组与对照组比 i X X i S X X t --= )(误差i x x n n MS S i 11+= - 查dunnett 界值表,确定P ,自由度等于方差分析中ν误差 SNK-q 检验:用于各组间全面的两两比较 Q= )11(2/ )(B A B A X X B A n n MS X X S X X B A +-=--误差 查q 界值表确定相应的概率P ,自由度等于方差分析中ν 误差,表中a 为按均值大小排序,两对比组所包含的组数。 二项分布的概率函数P (X ): X n X X n C X P --=)1()(ππ; )! (!!X n X n C X n -= 二项分布的均数和标准差 :进行n 次独立重复试验,出现X 次阳性结果 X 的总体均数为πμn = 总体方差为)1(2ππσ-=n 总体标准差为)1(ππσ -=n 如果将阳性结果用频率表示n X p = 率的总体均数 π μ=p 标准差 n p ) 1(ππσ-= n p p n p p S p )1(1 ) 1(-≈--= 又称率的标准误它反映率的抽样误差的大小。 单侧累积概率计算:出现阳性的次数至多为k 次的概率为 ∑∑ ==---==≤k X k X X n X X n X n X P k X P 0 0)1()! (!! )()(ππ 出现阳性的次数至少为k 次的概率 ∑∑ ==---==≥n k X n k X X n X X n X n X P k X P )1()! (!! )()(ππ 率的可信区间的估计 正态近似法:当)1(,p n np -均大于等于5时 n p p p n p p P )1(96.1,)1(96.1-+-? - 样本率与总体率的比较: 检验假设H 0:π=π0,H 1:π≠π0 1 . 满足正态近似时,计算检验统计量 ) 1(000 πππ--= n n X Z 或 n p Z ) 1(000 πππ--= 2. 不满足正态近似时用直接概率计算法 两样本率的比较:H0:π1=π2,H1:π1≠π2, 检验统计量: ) 1 1)(1(| |2 121n n p p p p Z c c +--= 2 121n n X X p c ++= Poisson 分布的概率函数为 ! )(X e X P X λλ -= POISSON 分布的应用: 单侧累计概率计算:稀有事件发生次数至多为k 次的概率

医学统计学试题及答案

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制(B) A 条图B百分条图或圆图C线图D直方图 2、均数和标准差可全面描述D资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评 价某市一名 5 岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A用该市五岁男孩的身高的 95%或 99%正常值范围来评价 B用身高差别的假设检验来评价 C用身高均数的 95%或 99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用(A) A变异系数B方差C标准差D四分位间距 5、产生均数有抽样误差的根本原因是(A) A. 个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的 10 倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为(D) A. 用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A 和 B均不是 D. A和 B均是 8、两样本均数比较用 t检验,其目的是检验( C ) A 两样本均数是否不同B两总体均数是否不同 C 两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1 和 n2,在进行成组设计资料的 t检验时,自由度是( D) (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映( A) A 抽样误差的大小B总体参数的波动大小 C 重复实验准确度的高低D数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料, 既作直线回归分析 , 又作直线相关分析。令对相关系数检验的 t 值为 tr ,对回归系数检验的 t 值为 tb ,二者之间具有什么关系?( C) A tr>tb B tr

相关文档
最新文档