医学统计学重点概述

最新资料推荐

医学统计学重点概述

1 一、名词解释1.总体：

就是根据研究目的确定的同质观察单位的全体，确切的说，是

同质的所有观察单位某种变量值的集合 2.样本：

就是从总体中随机抽取部分观察单位，其实测值的集合3.系统

误差：

是指数据搜集和测量过程中由于仪器不准确、标准不规范等人为原因，造成观察结果偏大或偏小的一种误差，是由确定原因造成的误差。

4. 随机误差：

是由一些非人为的偶然因素，使得结果或大或小，是不确定、

不可预知的一种误差，分为随机测量误差和抽样误差 5.抽样误差：由于随机抽样所引起的样本统计量与总体参数之间的差异以及

样本统计量之间的差别称为抽样误差 6.定量资料：

亦称计量资料，是用定量的方法测定观察单位（个体）某项指标数值的大小，所得的资料称定量资料如身高（cm）、体重（kg）. 脉搏（次/分）、血压（kPa）等7.定性资料：

亦称计数资料或分类资料，是将观察单位按某种属性或类别分组，清点各组的观察单位的个数，所得的资料称定性资料8.等级资料：

亦称有序分类资料，是将观察单位按属性的等级分组，清点各

组的观察单位数，所得的资料为等级资料9?小概率事件（原理）：

1 / 18

统计学上一般把P0.05或P0.01的事件称为小概率事件；小概率事件在一次试验中几乎不可能发生，利用该原理可对科研资料

进行假设检验10.率：

是某现象实际发生的观察单位数与可能发生该现象的观察单位

总数之比，用以说明某现象发生的频率或强度11.构成比：说明某一事物内部各组成部分所占的比重或分布，等于某一组成部分的观察单位数/同一事物各组成部分的观察单位总数100% 12. 医学参考值范围：

指医学领域中特定的正常人群（即排除了对所研究指标有影响的疾病和相关因素的特定人群）的解剖、生理、生化指标及组织代谢产物含量等数据的大多数个体（一般为95%）的取值范围13. 置信区间：是对这个样本的某个总体参数的区间估计，置信区间展现的是

这个参数的真实值有一定概率落在测量结果的周围的程度，给出的是被测量参数的测量值的可信程度14.标准误：

是反映均数抽样误差大小的指标，15.P 值：

指H0成立，从所规定的总体中随机抽样，所获得等于及大于（或等于及小于）现有样本计算获得的检验统计量值的概率16.第

I类错误：

拒绝了实际上是成立的H0,用来控制以真作假（漏诊）17.

第H类错误：

不拒绝实际上是不成立的H0,用来控制论假成真（误诊）18. 配对

最新资料推荐

设计：

配对设计是将受试对象按配对条件配成对子，每对中的个体接

受不同的处理，配对设计一般以主要的非实验因素作为配比条件，而不以实验因素作为配比条件19.完全随机设计：

又称单因素方差分析，是将受试对象随机分配到不同处理组的单因素设计方法；此设计只考虑一个处理因素，通过该处理因素不同水平组均值的比较，推断该处理因素水平组之间的差异有无统计

学意义20.随机区组设计：

又称双因素方差分析，该设计可以分析两个因素：

一个为处理因素，也称为列因素；一个为区组因素，也称为

行因素nX= 221.析因设计：

当两个因素或多个因素之间存在相互影响或交互作用时，可用该设计来进行分析。

该设计不仅可以分析多个因素的独立作用，也可以分析多个因

素间的交互作用，是一种高效率的方差分析方法22.卡方值：通过计算实际频数与理论频数的吻合程度来判断所给的处理因素是否有效23.非参数统计：

不依赖于总体分布类型，也不对总体参数进行统计推断的假设检验的方法，原来的数据并不参加运算，而是变成符号、顺序号, 然后比较符号、顺序号的位置24.相关系数：

是说明两变量间线性关系的密切程度和相关方向的一个统计指标，样本的相关系数用r表示，总体的相关系数用表示25.回归系数：

3 / 18

在回归方程中表示自变量x对因变量y影响大小的参数，正回归系数表示y随x增大而增大，负回归系数表示y随x增大而减小二、简答题1.简述频数表的绘制方法（1）找出最大值、最小值和极差：极差二最大值最小值（2）确定组距、组段、组数：

频数表一般设8-15个组段，常用极差的1/10取整作组距，第一组段包括最小值，最后一个组段要包括最大值并写出其下限上限（3）列表划记：

把确定的组段序列制成表的形式，得出各组段频数2.简述应用相对数的注意事项（1）计算相对数时分母一般不宜过小，只有当观察单位足够多时，计算出的相对数才比较稳定，且能正确反映实际情况。

（2）分析时注意构成比和率的区别：

构成比说明事物内部各组成部分所占的比重，即只能说明分布，不能说明某现象发生的频率或强度。

（3）合计率的计算：

对观察单位不等的几个率，不能直接相加求其平均率，而应用合计的数据来计算。

（4）比较相对数时应注意资料的可比性:

除了研究因素以外，其他影响因素应尽可能相近或相同比较才有意义。

（5）对样本率、构成比的比较应作假设检验，不能凭表面

数值大小下结论。

3. 简述假设检验应用的注意事项（1）假设检验的前体是要有严密

最新资料推荐

的抽样研究设计：

应尽量从同质总体中随机抽取，尽量保证组间均衡性，以确保资料具有可比性。

（2）正确选定假设检验方法：

资料性质、分布类型、设计类型、样本大小等不同，以及分析的目的不同，适用的假设检验的方法也不同。

（3）正确理解差异无统计学意义：

H0成立可能性是小概率，也就是说两者差异存在的可能性较大，差异统计学意义也不一定具有临床意义。

（4）结论不能绝对化：

是否拒绝H0取决于研究对象有无本质差异和抽样误差大小，以及检验水准的高低，而检验水准与实验设计密切相关。

（5）报告结论时应注意：

应列出样本计算的检验统计量值，注明采用的是单侧检验还是

双侧检验，写出P值。

4. 简述秩和检验的优缺点及应用（1）优点：

计算简单便于掌握、应用范围广、收集资料方便（2）缺点：损失信息、检验效率低（3）应用：

①分布型未知，②能以严重程度、优劣等级、效果大小和名次先后3等等级资料，③分布极度偏态，④本组内个别变量值偏离过大，远离本组其它变量值，⑤方差不齐时，⑥筛选或只需获得初步结果。

5 / 18

5. 简述应用线性相关分析的注意事项（1）绘散点图了解线性趋势，样本的相关系数接近零时并不意味着两变量间一定无相关性

（2）线性相关分析要求两个变量都是随机变量，且仅适用于二元

正态分布资料（3）作相关分析时，应该剔除离群值，出现异常点时慎用相关（4）相关要有实际意义，两变量相关并不代表两变量间一定存在内在联系（5）r=0表明无相关或非线性相关（6）分层资料盲目合并易出假象6.简述应用线性回归的注意事项（1）进行线性回归分析时，应先绘散点图，提示有直线趋势存在时，可作线性回归分析（2）进行线性回归分析时，一般要求因变量Y是来自正态总体的随机变量，自变量X可以是正态随机变量，也可以是精确测量和严密控制的值（3）进行线性回归分析要有实际意义，不能把毫无关联的两个事物或现象进行进行线性回归分析（4）进行线性回归分析必须进行假设检验，以推断两变量间的线性关系

是否存在（5）回归直线不能外延，以自变量取值范围为限7.简述线性回归与相关的区别及联系（1）区别：

①资料不同:

相关分析要求两个变量均为随机变量，并服从双变量正态分布；回归分析只要求因变量Y服从正态分布，而自变量X可以是正态随机变量，也可以是精确测量和严密控制的值。

②统计意义不同：

相关反映两变量之间的相互关系，这种关系是对等的；回归则反

最新资料推荐

映两变量间的依存关系，有自变量因变量之分，因变量随自变量的变化而变化。

③分析目的的不同：

相关分析表明两变量间线性关系的密切程度及相关方向；回归分析则用函数公式定量表达因变量随自变量变化的关系。

（2）联系：

①变量间关系的方向一致：

对同一资料其相关系数r与回归系数b的正负号一致。

②假设检验等价：

实际分析中常以r的假设检验代替对b的检验③r与b值可相互换算。

④用回归解释相关：

r2 称决定系数，r2越接近1，回归效果越好。

三、填空题1.统计学的研究对象是变异2.医学统计学工作的基本步骤是设计、搜集资料、整理资料、分析资料，其中最重要的步骤是科研设计3.等比资料的集中趋势常用的描述方法是几何均

数4.偏态分布的集中趋势常用的描述方法是中位数；偏态分布的离散趋势常用的描述方法是四分位间距 5.单位不同或均数相差较大的

多组资料常用的描述方法是变异系数 6.参数是指总体的统计指标；

统计量是指样本的统计指标7.标准正态分布是一种特殊的正态分

布，标准正态分布的=0, 2=1 ，通常用u （或Z）表示服从标准正态分

7 / 18