武大医学统计学期末复习总结(名解和简答)

武大医学统计学期末复习总结(名解和简答)
武大医学统计学期末复习总结(名解和简答)

医学统计学期末复习总结

名词解释

参数Patameter:是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可以通过随机抽样抽取具有代表性的样本,用算得的样本统计量估计未知的总体参数。

统计量statistic:是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量实在总体参数附近波动的随机变量。

系统误差systematic error:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是克制的或可能掌握的。

随机误差random error:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。I型错误type I error:拒绝了实际上成立的H0,这类“弃真”的错误称为I型错误,其概率大小用α来表示。

II型错误type II error:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误,其概率大小用β来表示。

P值P-value:在H0成立的前提下,用样本数据获得的样本统计量及比样本统计量总计更极端的区间下的面积。

置信区间confidence bound / confidence interval, CI:按预先给定的概率(1-α)所确定的包含未知总体参数的一个范围。

多重共线性Multicollinearity:是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。

哑变量dummy variable:如果是多分类指标,假定有g类,则用g-1个取值为0,1或-1的变量,称为哑变量。

偏相关系数partial correletion coefficient:表示在一组变量中,任一两个变量在其它变量固定不变时,他们之间相关的密切程度和方向。或者说,扣除其它变量对它们的影响后,两个变量之间的线性相关情况。

决定系数coefficient of determination:回归平方与总平方和之比,其数值反映了回归贡献的相对程度,其值约接近1,说明模型对数据的拟合程度越好。

随机对照试验Randomized Controlled Trial,RCT:将研究对象随机分组,对不同组实施不同的干预,以对照效果的不同。

接受者工作特征曲线receiver operator characteristic,ROC曲线:以不同截断点时的(1-特异度)为横轴,灵敏度为纵轴,作的真阳性率与假阳性率曲线。

简答题:

1. 标准差与标准误的区别与联系。√

区别:(1)含义不同:①标准差描述个体变量值x之间变异度的大小,S越大,变量值x 越分散;反之变量越集中,均数的代表性就越强;②标准误是描述样本均数之间变异度的大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。

(2)与n关系不同:n增大时,①S-σ(恒定);②标准误减少并趋于0(不存在抽样误差);

(3)用途不同:①标准差表示x变异度的大小,计算CV,估计正常值范围,计算标准误

等;②标准误:参数估计和假设检验。

联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。

2. 数据的分类及统计学方法处理(描述、推断)√

数据分类:计数资料(定性资料)、计量资料(定量资料)、等级资料。

统计描述:计数资料——相对数(率),结构相对数(构成比)、百分比相对比(OR、RR);计量资料——均数±标准差;等级资料:中位数、四分位数间距等。

统计推断:计数资料——卡方检验;计量资料——t检验、方差分析;等级资料——非参数检验。

3. 样本含量与那些因素有关,是怎样影响的?

样本含量的估计取决于:

①假设检验的Ⅰ型错误概率α大小:Ⅰ型错误概率α越小,所需样本含量越多。对于相同α,双侧检验比单侧检验所需样本含量多;

②假设检验的Ⅱ型错误概率β或检验效能(1-β)的大小:Ⅱ型错误概率β愈小或检验效能(1-β)愈大,所需样本含量愈多;

③容许误差δ的大小:容许误差δ愈大,所需样本含量愈小;

④总体的相关信息:总体标准差σ愈大,所需样本含量愈多;总体率π越接近0.05,所需样本含量越多;总体相关系数ρ愈小,所需样本含量愈多;变异指标CV愈大,所需样本含量愈多。

4. 多重回归、logistic回归、Cox回归的区别与联系√

多元线性回归、logistic回归、Cox回归的联系:①自变量可以是连续变量、有序分类变量和无序分类变量,为了将无序分类变量代入回归模型,需要进行哑变量彼岸花,哑变量在回归模型中是一个整体,必须同时引入模型或同时从模型中剔除;②当自变量之间存在较强相关关系可能会导致共线性现象;③自变量之间可能会存在交互作用,通常采用两个或两个以上自变量相乘的积作为交互作用项;④均可采用逐步回归筛选变量,其思路均是先考虑单变量分析再进行多元回归分析;⑤均可进行影响因素的分析、混杂因素的校正、预测分析等。

5. 相关与回归的区别与联系

区别:①资料要求上:回归要求变量Y服从正态,X可精确测定和严格控制;相关要求两变量X、Y均服从双变量正态分布。②应用上:回归说明两变量依存关系(单向);相关说明两变量相关关系(双向)。

联系:对同一资料进行相关与回归分析,则得相关系数r与回归方程中的b正负相同。r 为正表示两变量间的相互关关系是同向变化;b为正表示X每增/减一个单位,Y平均增/减b个单位。

6. 非参数检验的适用条件与优缺点

使用条件:①总体分布为偏态分布或未知的计量资料;②数据两端出现不确定值;③等级资料;④各组离散程度相差悬殊,总体方差不齐。

优点:不受总体分布的限制,适用范围广。

缺点:结果对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。增加犯II类错误的概率。

7. 应用相对数的注意事项

①结构相对数不能代替强度相对数;②计算相对数应有足够数量;③正确计算合计率;

④注意资料的可比性:观察对象是否同质、内部结构是否相同;⑤对比不同时期资料应注意客观条件是否相同;⑥样本率(或构成比)的抽样误差。

8. 生存资料的特点,包括那些统计学方法?√

特点:至少15~20倍的自变量个数个数①同时考虑生存时间和生存结局;②通常含有删失数据;③生存时间的分布通常不服从正态分布。

统计学方法:①描述分析:常用Kaplan-Meier法(也叫乘积极限法、KM法),计算生存率需要考虑生存时间的顺序,属于非参数统计方法;②比较分析:常用log-rank检验与Breslow检验,检验无效假设是两组或多组总体生存时间分布相同,而不对其具体的分布形式做要求,所以也属于非参数统计方法;③影响因素分析:常用的半参数法为Cox比例风险模型,常用参数法为指数分布法、Weibull分布法、Gompertz分布法和对数logistic分布法等。

9. 置信区间与参考值范围的区别与联系

总体均数的可信区间与个体值的参考值范围无论在含义、用途还是计算上均不相同。①含义上:置信区间是总体均数的可能范围,参考值范围是指个体值的波动范围。②计算公式上:

置信区间——σ未知:σ已知或σ未知但n>60:

参考值范围——正态分布:偏态分布:

③用途上:可信区间用于总体均数的区间估计,也可间接进行假设检验;参考值范围用于绝大多数(如95%)观察对象某项指标的分布范围。

10. 统计表绘制注意事项√

制表的基本要求:①标题:概括表的主要内容,包括研究时间、地点、研究内容,放在表的上方。如果整个表的指标统一时,可以将研究指标的单位标在标题后面。表的序号后面应该空一格全角格再加题目;②标目:分别用横标目和纵标目来说明表格每行和每列内容或数

字的意义,注意标明指标的单位;③线条:至少用三条线,表哥的顶线和底线将表格与文章的其他部分分割开来,纵标目下横线将标目的文字区与表格的数字区分割开来,其它竖线和斜线一概省去;④数字:用阿拉伯数字表示,无数字用“—”表示,缺失数字用“…”表示,数值为0者记为“0”,不留空项。数字按小数点对齐,小数位数相同;⑤表中数字区不要插入文字,必须说明者用“*”,在表下方以备注形式说明。

制表的注意事项:不要将太多内容放在一个表里,特别是两种不同类型的资料(定量资料和定性资料)的统计量放在同一表中;纵标目由左到右排序应为主、谓、宾,左边通常为分类变量,纵列为统计数指标;每一列中间应该隔开,不能连起来。

武大医学统计学 期末题

医学统计学试题(A )卷(闭卷) 2009--2010学年第一学期 学号: 姓名: 一、A型题:请从备选答案中选出1个最佳答案并填在后面得括号里(每小题1分,共30分)。 1、流行病学研究内容得三个层次就是指( ) A.疾病、伤害与健康 B.传染病、寄生虫病与地方病 C.传染性疾病、非传染病疾病与意外伤害 D.疾病分布、危险因素与预防控制措施 E.人群分布、时间分布与地区分布 2、提出由于维生素C缺乏引起身体虚弱得坏血病病因假说并开创了流行病学临床试验先河得医生就是:( ) A、希波克拉底(Hippocrates) B、詹姆士·林德(James Lind) C、约翰斯诺(John Snow) D、路易斯(PCA Louis) E、葛郎特(John Graunt) 3、流行病学研究方法得核心思想就是( ) A.预防为主得思想 B.研究对象为人群 C.对比思想 D.社会医学观念 E.生态学思想 4、流行病学任务得三个阶段就是( ) A.观察性研究、实验性研究与理论性研究 B.揭示现象、找出原因与提供措施 C.描述分布、提出假设与验证假设 D.整理资料、分析资料与得出结论 E.早期发现、早期诊断与早期恰当治疗 5、关于率与比得描述,下列哪项就是不正确得( ) A.大多数率就是构成比,分子就是分母得一部分 B.比表示分子与分母得数量关系,而不考虑分子与分母所来自得总体如何 C.比得分子就是分母得一部分 D.率也就是比,但比不一定就是率 E.率就是用来描述变量随时间变化得动态指标 6、某单位发生一起食物中毒,为尽快查明原因,调查中应该使用得主要指标就是( ) A.发病率 B.患病率 C.罹患率 D.病死率 E.期间患病率 7、关于发病率得描述,下列哪项就是不正确得( ) A.发病率可用来描述疾病得分布 B.发病率得变化意味着并因因素得变化 C.发病率得高低取决于疾病报告、登记制度以及诊断得正确 D.发病率得准确性取决于疾病报告、登记制度以及诊断得正确 E.发病率可用来探讨发病因素,提出病因假设,评价防治措施效果

医学统计学简答题35506

医学统计学简答题 1.简述标准差、标准误的区别与联系? 区别:(1)含义不同:标准差S表示观察值的变异程度,描述个体变量值(x)之间的变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。标准误..估计均数的抽样误差的大小,是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。 (2)与n的关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。 (3)用途不同:标准差表示x的变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间和假设检验。 联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。 2.简述假设检验的基本步骤。 1.建立假设,确定检验水准。 2.选择适当的假设检验方法,计算相应的检验统计量。 3.确定P值,下结论 3.正态分布的特点和应用: 特点:1、集中性:正态曲线的高峰位于正中央,即均数所在的位置; 2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交; 3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均

匀下降; 4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平; 5、u变换:为了便于描述和应用,常将正态变量作数据转换; 应用: 1.估计医学参考值范围 2.质量控制 3.正态分布是许多统计方法的理论基础 4.简述参考值范围与均数的可信区间的区别和联系 可信区间与参考值范围的意义、计算公式和用途均不同。 1.从意义来看95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指95%可信度估计的总体均数的所在范围 2.从计算公式看若指标服从正态分布,95%参考值范围的公式是:±1.96s。总体均数95%可信区间的公式是:前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。 5.频数表的用途和基本步骤。 用途:(1)揭示资料的分布特征和分布类型;(2)便于进一步计算指标和分析处理;(3)便于发现某些特大或特小可疑值。 基本步骤:(1)求出极差;(2)确定组段,一般设8~15个组段;(3)确定组距;组距=R/组段数,但一般取一方便计算的数字;(4)列出各个组段并确定每一组段频数。 6.非参数统计检验的适用条件。 (1)资料不符合参数统计法的应用条件(总体为正态分布、且方差相等)或总体分布类型未知;(2)等级资料;(3)分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件;(4)在资料满足参数检验的要求时,应首选参数法,以免降低检验效能

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

数值分析总复习提纲教材

数值分析总复习提纲 数值分析课程学习的内容看上去比较庞杂,不同的教程也给出了不同的概括,但总的来说无非是误差分析与算法分析、基本计算与基本算法、数值计算与数值分析三个基本内容。在实际的分析计算中,所采用的方法也无非是递推与迭代、泰勒展开、待定系数法、基函数法等几个基本方法。 一、误差分析与算法分析 误差分析与算法设计包括这样几个方面: (一)误差计算 1、截断误差的计算 截断误差根据泰勒余项进行计算。 基本的问题是 (1)1 ()(01)(1)! n n f x x n θεθ++<<<+,已知ε求n 。 例1.1:计算e 的近似值,使其误差不超过10-6。 解:令f(x)=e x ,而f (k)(x)=e x ,f (k)(0)=e 0=1。由麦克劳林公式,可知 211(01)2!!(1)! n x x n x x e e x x n n θθ+=+++++<<+ 当x=1时,1 111(01)2! !(1)! e e n n θθ=+++ ++ <<+ 故3 (1)(1)!(1)! n e R n n θ=<++。 当n =9时,R n (1)<10-6,符合要求。此时, e≈2.718 285。 2、绝对误差、相对误差及误差限计算 绝对误差、相对误差和误差限的计算直接利用公式即可。 基本的计算公式是: ①e(x)=x *-x =△x =dx ② *()()()ln r e x e x dx e x d x x x x ==== ③(())()()()e f x f x dx f x e x ''== ④(())(ln ())r e f x d f x = ⑤121212121122121122((,))(,)(,)(,)()(,)()x x x x e f x x f x x dx f x x dx f x x e x f x x e x ''''=+=+ ⑥121212((,)) ((,))(,) f x x f x x f x x εδ=

医学统计学(第六版)期末复习

统计 一绪论 第一节: 统计学: 重要作用:在于能够透过偶然现象来探测其规律性。 研究对象:具有不确定性结果的事物。 第二节: 基本内容: 1 .统计设计 2 .数据整理 3.统计描述 4.统计推断 第三节: 统计学的基本概念 同质:根据研究目的所确定的观察单位其性质大致相同。变异:各观察单位存在差异,这种差异称为变异。

变量与数据类型 总体和样本 总体:根据研究目的所确定的同质观察单位的全体。 参数:μ率:μ/π 样本:从研究总体中抽取部分有代表性的观察单位。 统计量:率/ P X X 第二章 第一节频数分布 频数表 1.求全距:max—min=R 2.确定组数:1/10*全距 3.确定组距:

4.确定组限: 第一组下限≤min 最后一组上限≥max 偶数比奇数好 5.确定频数 6.归纳分析 第二节 一、算术均数 适用:正态分布 用于说明一组观察值的平均水平或集中趋势。 (一)直接法(小样本) = / :样本均数 n :样本观察例数 (二)加权法 (大样本) n ∑= X f X =(各组中值*组频数)/n 组中值=1.(本组下限+第二组下限)/2 2.本组下限值+组距/2 二、几何均数 适用:1.等比资料 2.对数正态分布 小样本:n ∑-= X lg lg G 1 X X X

大样本:n ∑-=M 1 X lg f lg G 三、中位数 小样本:奇数:M=X (N+1)/2 偶数:M=1/2[X n /2+X (n/2+1)] 大样本:i f f n 5.0L M M L M ?-+=)( M :中位数; L M :M 所在组的上限; f L :M 所在组之前积累的频数 ;f M :M 所在组的频数; i :组距。 四、百分位数 i f f x%n L P x L x X ?-?+=)( L x :X 所在组的上限; f X :X 所在组之前积累的频数 ;f L :X 所在组的频数; i :组距 第三节变异程度的统计指标 一、极差 极差(R ):即全距=max –min 二、四分位数间距 (越大则数据变异越大。适用于偏态分布。) Q=P 75 - P 25 三、方差

医学统计学章节重点归纳

医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。

数值分析报告报告材料期末复习资料

数值分析期末复习 题型:一、填空 二、判断 三、解答(计算) 四、证明 第一章 误差与有效数字 一、有效数字 1、 定义:若近似值x*的误差限是某一位的半个单位,该位到x*的第一位非零数字共有n 位,就说 x*有n 位有效数字。 2、 两点理解: (1) 四舍五入的一定是有效数字 (2) 绝对误差不会超过末位数字的半个单位eg. 3、 定理1(P6):若x*具有n 位有效数字,则其相对误差限为 4、 考点: (1)计算有效数字位数:一个根据定义理解,一个根据定理1(P7例题3) 二、避免误差危害原则 1、 原则: (1) 避免大数吃小数(方法:从小到大相加;利用韦达定理:x1*x2= c / a ) (2) 避免相近数相减(方法:有理化)eg. 或 (3) 减少运算次数(方法:秦九韶算法)eg.P20习题14 *(1)1 1 102n r a ε--≤ ?; x εx ε x εx ++=-+();1ln ln ln ???? ? ?+=-+x εx εx x cos 1-2sin 22x =

三、数值运算的误差估计 1、 公式: (1) 一元函数:|ε*( f (x *))| ≈ | f ’(x *)|·|ε*(x )|或其变形公式求相对误差(两边同时除以f (x *)) eg.P19习题1、2、5 (2) 多元函数(P8)eg. P8例4,P19习题4 第二章 插值法 一、 插值条件 1、 定义:在区间[a,b]上,给定n+1个点,a ≤x 0<x 1<…<x n ≤b 的函数值 yi=f(xi),求次数不超过n 的多项式P(x),使 2、 定理:满足插值条件、n+1个点、点互异、多项式次数≤n 的P(x)存在且唯一 n i y x P i i n ,,2,1,0)(Λ==

《医学统计学》期末模拟考试题(四)

《医学统计学》期末模拟考试题(四) 一、是非题(每题1分,共20分) 1. 预试验的样本标准差s越小,所需样本含量越大。() 2. 等级相关系数的大小不可以反映两个现象间关系的密切程度。() 3. 在配对资料秩和检验中,两组数据统一从小到大编秩次。() 4. 对3个地区居民的血型构成作抽样调查后研究其差别,若有一个理论数小于5大于1,其余都大于5,可直接作χ2检验。() 5. 总例数等于60,理论数都大于5的四格表,对两个比例的差别作统计检验,不可用确切概率法。() 6. 双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。() 7. 随机区组方差分析中,只有当区组间差别的F检验结果P>0.05时,处理组间差别的F检验才是真正有意义的。() 8. 完全随机设计资料方差分析中要求各组均数相差不大。() 9. 两次t检验都是对两样本均数的差别作统计检验,一次P<0.01,另一次P<0.05,就表明前者两样本均数差别大,后者两样本均数相差小。() 10. 如果把随机区组设计资料用完全随机设计方差分析法作分析,前者的区组SS+误差SS等于后者的组内SS。() 11. 两分类Logistic回归模型的一般定义中,因变量(Y)是0~1变量。()

12. 作两样本均数差别的比较,当P<0.01时,统计上认为两总体均数不同,此时推断错误的可能性小于0.01。()<0.01时,统计上认为两总体均数不同,此时推断错误的可能性小于0.01。() 13. 方差分析的目的是分析各组总体方差是否不同。() 14. 在两组资料比较的秩和检验中,T值在界值范围内则P值小于相应的概率。()值在界值范围内则P值小于相应的概率。() 15. 无论什么资料,秩和检验的检验效率均低于t检验。()检验。() 16. 分类资料的相关分析中,检验的P值越小,说明两变量的关联性越强。() 17. 析因设计既可以研究各因素的主效应作用,又可以研究各因素间的交互作用。( ) 18. 当Logistic回归系数为正值时,说明该因素是保护因素;为负值时,说明该因素是危险因素。() 19. 常见病是指发病率高的疾病。( ) 20. 用某新药治疗高血压病,治疗前与治疗后病人的收缩压之差的平均数,经t检验,P<0.01。按a=0.05水准,可以认为该药治疗高血压病有效,可以推广应用。( ) 二、选择题(每题1分,共20分) 1.多重回归中要很好地考虑各因素的交互作用,最好选用________。 a. 最优子集法 b. 逐步法 c. 前进法 d. 后退法 e. 强制法 2.t r

医学统计学第七版课后答案及解析

练习题答案 第一章医学统计中的基本概念 练习题 一、单向选择题 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 A.收缩压测量值 B.脉搏数 C.住院天数 D.病情程度 E.四种血型 4. 随机误差指的是 A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. 系统误差 C. 过失误差 D. 记录误差 E.仪器故障误差 答案: E E D E A 二、简答题 1.常见的三类误差是什么?应采取什么措施和方法加以控制? [参考答案] 常见的三类误差是:

(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校 正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。 (2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正, 但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素 造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳 压器、恒温装置等措施,从而达到控制的目的。 (3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本 均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引 起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。 2.抽样中要求每一个样本应该具有哪三性? [参考答案] 从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。 (1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。 (2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。 (3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测 总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出 其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生 困难,所以应以“足够”为准。需要作“样本例数估计”。 3.什么是两个样本之间的可比性? [参考答案] 可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。 (马斌荣) 第二章集中趋势的统计描述 练习题 一、单项选择题 1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是

医学统计学知识点范文.doc

第一章绪论 1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象:具有不确定性结果的事物。 3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。 4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。 5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异 同质,指根据研究目的所确定的观察单位其性质应大致相同。 变异,指总体内的个体间存在的、绝对的差异。 统计学通过对变异的研究来探索事物。 (2) 变量与数据类型 变量,是反映实验或观察对象生理、生化、解剖等特征的指标。 变量的观测值,称为数据 分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等) 定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等) 有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。 统计方法的选用与数据类型有密切的关系。 (3)总体与样本 总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。 样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。 参数,指描述总体特征的指标。 统计量,指描述样本特征的指标。 (4)误差 误差,指观测值与真实值、统计量与参数之间的差别。 可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。 随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。 抽样误差,是抽样引起的统计量与参数间的差异。 抽样误差主要来源于个体的变异。 统计学主要研究抽样误差。 (5)概率 概率,是描述某事件发生可能性大小的量度。 必然事件,事件肯定发生,概率P(U)=1; 随机事件,事件可能发生,可能不发生,概率介于0≤P(A)≤ 1; 不可能事件,事件肯定不发生,概率P(∮)=0; 小概率事件,事件发生的可能性很小,概率P(A)≤ 0.05、或P(A)≤ 0.01。 医学科研中,P(A)≤0.05作为事物差别有统计意义,P(A)≤ 0.01作为事物差别有高度统

南医大医学统计学期末题目

1.下列变量中,不属于数值变量的是____ A .坐高 B .胸围 C .血型 D .身高 2.正态分布曲线下,横轴上从均数到(μ + 1.96σ)的面积为:_____ A .95% B .45% C .47.5% D .90% 3.5人的血清滴度为:1:2,1:4,1:8,1:16,1:32,平均滴度为_____ A .1:8 B .1:lg8 C .lg (1/8) D .1:12.4 4.为了比较一组乳腺癌患者化疗后血清肌酐和血清尿素氮两指标的变异程度,可选用____ A. 标准差 B. 标准误 C. 变异系数 D. 极差 5.在同一总体随机抽样,其他条件不变,样本含量越大,则_____ A. 样本标准差越大 B. 样本标准差越小 C. 总体均数的95%可性区间越窄 D. 总体均数的95%可性区间越宽 6.连续性变量x 呈偏态分布,从该总体中反复随机抽样,随样本含量n 增大,下列哪个选项将趋向正态分布_____ A. x x μ σ- B. C. x x x s - D. x s μ- 7.下面关于标准误的四种说法中,哪一种最不正确?________ A. 标准误是样本统计量的标准差 B. 标准误反映重复试验准确度的高低 C. 标准误反映总体参数的波动大小 D. 标准误反映抽样误差的大小 8.统计推断的主要内容为_____ A. 统计描述与统计图表 B. 参数估计和假设检验 C. 区间估计和点估计 D. 统计预测与统计控制 9. 有两个独立随机样本,样本含量分别为n 1和n 2,在进行成组设计资料的t σ μ -x

检验时,自由度是_______ A .n 1+ n 2 B .(n 1+ n 2)-1 C .(n 1-1)+( n 2-1)-1 D .(n 1-1)+( n 2-1) 10.样本均数比较的t 检验,差别有统计学意义时,P 值越小说明______ A .两样本均数差别越大 B .越有理由认为两总体均数不同 C .两总体均数差别越大 D .越有理由认为两样本均数不同 11.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小_______ A. α=0.05 B. α=0.01 C. α=0.10 D. α=0.20 12. 各观察值均加(或减)同一数后,_____ A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均改变 D.两者均不变 13. 在假设检验中,P 值和α的关系为 _______ A. P 值越大,α值就越大 B. P 值越大,α值就越小 C. P 值和α值由研究者事先设定 D. P 值与α值的大小无关 14 . 作两均数比较,已知n 1、n 2均小于30,总体方差不齐且分布呈极度偏态,宜用______ A. t 检验 B. 秩和检验 C. F 检验 D. 2χ检验 15. 三个率的比较的卡方检验,P 值小于0.01,则结论为_____ A.三个总体率均不相等; B.三个样本率均不相等; C.三个总体率之间肯定不等或不全相等; D.三个总体率之间不等或不全相等。 16.配对设计的目的是_____ A.提高测量精度 B.操作方便 C.为使用t 检验 D.提高组间可比性 17 . 从文献中得到同类研究的两个率比较的四格表资料,其2 χ检验结果为:甲 文 ) 1(01.02χχ>,乙文 2 ) 1(05.02χχ>,可认为______ A. 两文结果有矛盾 B.两文结果基本一致 C.甲文结果更可信 D.乙文结果更可信

医学统计学简答题

医学统计学简答题 1.简述标准差、标准误得区别与联系? 区别:(1)含义不同:标准差S表示观察值得变异程度,描述个体变量值(X)之间得变异度大小,S越大,变量值(X)越分散;反之变量值越集 中,均数得代表性越强。标准误、、估计均数得抽样误差得大小,就是描述样本均数之间得变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。(2)与n得关系不同:n增大时,S趋于。(恒定),标准误减少并趋于 0(不存在抽样误差)。 (3)用途不同:标准差表示X得变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间与假设检验。联系:二者均为变异度指标,样本均数得标准差即为标准误,标准差与标准误成正比。 2.简述假设检验得基本步骤。 1.建立假设,确定检验水准。 2.选择适当得假设检验方法,计算相应得检验统计量。 3、确定P值,下结论3.正态分布得特点与应用: 特点:1、集中性:正态曲线得高峰位于正中央,即均数所在得位置; 2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交; 3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均 匀下降; 4、正态分布有两个参数,即均数》与标准差0 ,可记作N(?,。):均数卩决定正态曲线得中心位置;标准差。决定正态曲线得陡峭或扁平程度。0越小,

曲线越陡峭;0越大,曲线越扁平; 5、U变换:为了便于描述与应用,常将正态变量作数据转换; 应用:1、估计医学参考值范围2、质量控制3、正态分布就是许多统计方法得理论基础 4.简述参考值范围与均数得可信区间得区别与联系 可信区间与参考值范围得意义、计算公式与用途均不同。 1、从意义来瞧95%参考值范围就是指同质总体内包括95%个体值得估计范围,而总体均数95%可信区间就是指95%可信度估计得总体均数得所在范围 2、从计算公式瞧若指标服从正态分布,95%参考值范围得公式就是: ±l、96s。总体均数95%可信区间得公式就是:前者用标准差,后者用标准误。前者用1、96,后者用a为0、05,自由度为V得t界值。 5.频数表得用途与基本步骤。 用途:(1)揭示资料得分布特征与分布类型;(2)便于进一步计算指标与分析处理;(3)便于发现某些特大或特小可疑值。 基本步骤:(1)求出极差;(2)确定组段,一般设8~15个组段;(3)确定组距;组距二R/组段数,但一般取一方便计算得数字;(4)列出各个组段并确定每一组段频数。 6.非参数统计检验得适用条件。 (1)资料不符合参数统计法得应用条件(总体为正态分布、且方差相等)或总体分布类型未知:(2)等级资料:(3)分布呈明显偏态又无适当得变量转换方法使之满足参数统计条件;(4)在资料满足参数检验得要 求时,应首选参数法,以免降低检验效能 7.线性回归得主要用途。

医学统计学知识点总结

医学统计学 1. 对定量资料进行统计描述时,如何选择适宜的指标 定量资料统计描述常用的统计指标及其适用场合描述内容指 标 意义适用场合 平均水平;均 数 个体的平均值· 对称分布 几何均数平均倍数取对数后对称分布 中位数[ 位次居中的观察值 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 众 数 频数最多的观察值不拘分布形式,概略分析 ? 调和均数 基于倒数变换的平均值正偏峰分布资料 变异度全 距 观察值取值范围不拘分布形式,概略分析 标准差 (方差) 观察值平均离开均数的 程度对称分布,特别是正态分布资料 四分位数 间距 ? 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但 数量级相差悬殊的变量间比较 定性资料:阳性事件的概率,概率分布,强度和相对比。 ¥ 2. 应用相对数时应注意哪些问题 答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。 (2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。 3. 常用统计图有哪些分别适用于什么分析目的 常用统计图的适用资料及实施方法 < 图形 适用资料实施方法 条图组间数量对比用直条高度表示数量大小 直方图用直条的面积表示各组段的频数或频率

( 定量资料的分布 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 、 线图 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标 系 散点图} 双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布' 用茎表示组段的设置情形,叶片为个体值,叶长为频数 第3章概率分布(连续随机变量的正态分布;离散随机变量的二项分布及Poisson分布)1. 服从二项分布及Poisson分布的条件分别是什么 二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。 Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数n很大,而所关心的事件发生的概率 很小。 、 2. 二项分布、Poisson分布分别有什么特征 ①二项分布、Poisson分布都是离散型分布。 ②二项分布的形状取决于π与n的大小。π=时,不论n大小,对称分布。π≠时,图形呈偏态,随n增大而逐渐对称。当n足够大,π或1-π不太小,二项分布近似正态。 ③Poisson分布μ越小,分布越偏。μ越大,分布越对称。当n足够大时,分布接近正态。 4、正态分布应用 ①估计变量值的频数分布 《 ②制定参考值范围 ③质量控制 ④正态分布是很多统计方法的基础 5. 正态分布特征 ①以均数为中心,左右对称 ②正态曲线在横轴上方均数处取得最高点 ~ ③正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)(μ,σ2 ;标准0,1)

学习数值分析的经验

数值分析实验的经验、感受、收获、建议班级:计算131 学号:2012014302 姓名:曾欢欢数值分析实验主要就是学习MATLAB的使用以及对数值分析类容的应用,可以使学生更加理解和记忆数值分析学得类容,也巩固了MATLAB的学习,有利于以后这个软件我们的使用。在做实验中,我们需要具备较好的编程能力、明白MATLAB软件的使用以及掌握数值分析的思想,才能让我们独立自主的完成该作业,如果是上述能力有限的同学,需要借助MATLAB的书以及网络来完成实验。 数值分析实验对于我来说还是有一定难度,所以我课下先复习了MATLAB的使用方法以及编写程序的基本类容,借助互联网和同学老师资源完成了数值分析得实验的内容。在实验书写中,我复习了各种知识,所以我认为这门课程是有必要且是有用处的,特别是需要处理大量实验数据的人员,很有必要深入了解学习它,这样在以后的工作学习里面就减少了很多计算问题也提高了实验结果的精确度。 学习数值分析的经验、感受、收获、建议 数值分析的内容包括插值与逼近,数值微分与数值积分,非线性方程与线性方程组的数值解法,矩阵的特征值与特征向量计算,常微分方程数值解等。 首先我们必须明白数值分析的用途。通常所学的其他数学类学科都是由公式定理开始,从研究他们的定义,性质再到证明与应用。但实际上,尤其是工程,物理,化学等其它具体的学科。往往我们拿到

手的只是通过实验得到的数据。如果是验证性试验,需要代回到公式进行分析,验证。但往往更多面对的是研究性或试探性试验,无具体公式定理可代。那就必须通过插值,拟合等计算方法进行数据处理以得到一个相对可用的一般公式。还有许多计算公式理论上非常复杂,在工程中不实用,所以必须根据实际情况把它转化成多项式近似表示。学习数值分析,不应盲目记公式,因为公事通常很长且很乏味。 其次,应从公式所面临的问题以及用途出发。比如插值方法,就是就是把实验所得的数据看成是公式的解,由这些解反推出一个近似公式,可以具有局部一般性。再比如说拟合,在插值的基础上考虑实验误差,通过拟合能将误差尽可能缩小,之后目的也是得到一个具有一定条件下的一般性的公式。。 建议学习本门课程要结合知识与实际,比如在物理实验里面很多地方有用到线性拟合的知识,这样我们可以对数值分析得类容加以巩固,在学习中不能死记硬背,应该理解记忆,以及结合列题加以记忆和应用,只能在题里面我们才能去应用它。对于本学期的期末考试,由于本人注重了理论知识的记忆和应用,但是在复习过程中自己没有亲自去导致计算能力较弱,在考试过程中一道大题的计算耗费了大量的时间且错了,虽然解答题目的步骤和思想应该是没有问题的,所以同学们除了掌握基本的理论知识以外,得加强计算能力的锻炼,避免不必要的浪费时间以及精力,导致不愉快的结果。

武大医学统计学期末题

医学统计学试题(A )卷(闭卷) 2009--2010学年第一学期 学号:姓名: 一、A型题:请从备选答案中选出1个最佳答案并填在后面的括号里(每小题1分,共30分)。 1.流行病学研究内容的三个层次是指() A.疾病、伤害和健康 B.传染病、寄生虫病和地方病 C.传染性疾病、非传染病疾病和意外伤害 D.疾病分布、危险因素和预防控制措施 E.人群分布、时间分布和地区分布 2.提出由于维生素C缺乏引起身体虚弱的坏血病病因假说并开创了流行病学临床试验先河的医生是:() A.希波克拉底(Hippocrates) B.詹姆士·林德(James Lind) C.约翰斯诺(John Snow) D.路易斯(PCA Louis) E.葛郎特(John Graunt) 3.流行病学研究方法的核心思想是() A.预防为主的思想 B.研究对象为人群 C.对比思想 D.社会医学观念 E.生态学思想 4.流行病学任务的三个阶段是() A.观察性研究、实验性研究和理论性研究 B.揭示现象、找出原因和提供措施 C.描述分布、提出假设和验证假设 D.整理资料、分析资料和得出结论 E.早期发现、早期诊断和早期恰当治疗 5.关于率和比的描述,下列哪项是不正确的() A.大多数率是构成比,分子是分母的一部分 B.比表示分子和分母的数量关系,而不考虑分子和分母所来自的总体如何C.比的分子是分母的一部分 D.率也是比,但比不一定是率 E.率是用来描述变量随时间变化的动态指标 6.某单位发生一起食物中毒,为尽快查明原因,调查中应该使用的主要指标是() A.发病率 B.患病率C.罹患率D.病死率E.期间患病率 7.关于发病率的描述,下列哪项是不正确的() A.发病率可用来描述疾病的分布

《医学统计学》样题一

《医学统计学》样题一 选择题答案表(涂黑所选答案,未填此表者不给分) 一、单选题(每题2分,共40分) 1. 样本率与总体率差别的假设检验可用。 A 四格表直接概率法计算 B 四格表χ2检验 C 不能检验 D 由样本率制定总体率的可信区间来判断 E 以上都不是 2.在抽样研究中,当样本例数逐渐增多时_____。 A 标准误逐渐加大 B 标准差逐渐加大 C 标准差逐渐减小 D 标准误逐渐减小 E 标准差趋近于0 3.2008年某乡卫生院接诊结核病患者100人,其中男性76人,女性24人,分别占76%和24%,则可以推断出的结论为。 A 该病男性易患 B 该病男女患病率不同 C该病女性易患 D 该病男女发病率不同 E 尚不能得出男女间患病率孰高孰低的结论 4.要减少抽样误差,通常的做法是_____。 A 适当增加样本例数 B 将个体变异控制在一个范围内 C 减少样本例数 D 增加抽样次数 E 减小系统误差 5. 同样性质的两项研究工作中,都作两样本均数差别的假设检验,结果均为P<0.05 P值越小,则获得的结论是。

A 两样本均数差别越大 B 两总体均数差别越大 C 越有理由说两总体均数不同 D 越有理由说两样本均数不同 E 越有理由说两总体均数差别很大 6 在两样本均数比较的t检验中,无效假设是_____。 A两样本均数不等 B 两样本均数相等 C 两总体均数不等 D两总体均数相等 E样本均数等于总体均数 7.要评价某市一名12岁男孩的身高是否偏高或偏矮,应选用的统计方法是。 A 用该市8岁女孩身高的95%或99%正常值范围来评价????????? B 作身高差别的假设检验来评价 C 用身高均数的95%或99%可信区间来评价 D 不能作评价 E 以上都不是 H是_____。 8.两个独立样本秩和检验时的 A 两样本秩和相等 B 两总体秩和相等 C 两总体均数相等 D 两总体分布相同 E 两总体分布没有关联 9.在配对设计数值变量资料的对比分析中,配对的目的是为了。 A 提高测量精度 B 操作方便 C 应用t检验 D 提高组间可比性 E 减少实验误差 10.配对t检验中,用药前的数据减去用药后的数据与用药后的数据减去用药前的数据,两次t检验的结果_____。 A t值符号相反,但结论相同 B t值符号相反,结论相反 C t值符号相同,但大小不同,结论相反 D t值符号相同,结论相同 E 结论可能相同或相反 11. 总体是由组成的。 A 部分个体 B 全部个体 C 相同的观察指标 D 全部研究对象 E 同质个体的所有观察值 12.关于构成比,不正确的是。 A 构成比中某一部分比重的增减相应地会影响其他部分的比重 B 构成比说明某现象发生的强度大小

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

相关文档
最新文档