第五章第2节医学统计学基本知识

医学统计学基本知识

一、基本概念

（一）医学统计学定义和对象

1.医学统计学

·根据统计学的原理和方法，研究医学数据收集、表达和分析的一门应用各学科。

2.研究对象

·医学数据

（二）医学统计学定义和对象

1.统计设计：调查设计和实验设计

·保证设计描述和统计推断正确的基础

2.统计描述：均数、率

3.统计推断：对统计指标的差别和关联性进行分析和推断

（三）医学统计资料类型

变量（variable):观察对象的特征或指标称为变量。

1.数值变量（计量资料）：变量值师定量的，表现为数值的大小，有度量衡单位，如：身高（cm)、体重（kg）

2.分类变量：变量值是定性的，表现为互不相容的类别或属性。

1）无序分类变量（计数资料）：各类别间无程度上的差别，如：性别分男女两类。

·二分类

·多分类

2）有序分类变量（等级资料）：各类别间有程度上的差别，如：临床疗效可分为治愈、显效、好转、无效四级。

3.三类资料类型

1）计量资料（quantitative data）

2）计数资料（qualitative data）

3）等级资料（ranked data）

（四）统计工作的基本步骤

1.研究设计（统计工作最关键的一步）

根据研究者是否对研究对象施加干预分为：

1）调查设计

·了解客观实际情况的现场工作

2）实验设计

·实验研究

·动物实验

2.收集资料

1）统计资料的来源

·经常性资料

·一时性资料

2）统计资料的要求

·资料的完整、正确、及时

·样本量足够

·资料的代表性和可比性

3.整理资料

1）原始资料的检查与核对

·统计数据的常规检查

·数据的取值范围检错

·数据间的逻辑关系检错

2）数据的分组设计和归纳汇总

·按资料的性质分组：分类变量，如性别、疗效等

·按资料的数量特征分组：数值变量，如年龄等

4.分析资料

1）描述资料的数量特征和分布规律

·统计指标·统计图表

2）用样本信息推断总体特征

·参数估计·假设检验

（五）统计学中的几个基本概念

1.同质和变异（homogeneity and variation）

1）同质：研究对象具有相同的背景、条件、属性称为同质。

2）变异：同一性质的事物，个体观察值（变量值）之间的差异，称为变异。

※同质是研究的前提

如同性别、同年龄、同地区、同体重儿童的肺活量有大有小，并不完全相同。

2.总体和样本（population and sample）

根据研究目的确定的、同质的全部研究对象称作总体。

1）有限总体：总体中的个体数科数（有限的）

2）无限总体：总体中的个体数不可数（无限）（或假设总体，或虚拟总体）

如：某地2007年45岁以上健康男性的血清总胆固醇含量，测定值的全部构成了一个总体。

如：研究糖尿病人的空腹血糖测定值，由于对时间和空间未加限制，全部糖尿病人的空腹血糖测定值则是一个无限总体。

从总体中随机抽取有代表性的一部分观察单位，其测量值（或观察值）的集合称为样本（sample）·来自总体

·随机：机会均等≠随便

·有代表性

·样本含量是指样本中观察单位数，常用n表示

·抽样研究的目的：用样本信息推论总体特征

3.参数和统计量（parameter and statistic）

1.参数：指总体的统计指标

·一般用希腊字母表示，如总体均数μ、总体标注差σ、总体率π

2.统计量：指样本的统计指标

·一般用拉丁字母表示，如：样本均数X 、样本标准差s 。

3.参数估计：用样本统计量推论总体参数。

·参数估计

·参数检验（假设检验）

4.误差（error):测量值与真值之差。

包括：

1）系统误差——非随机误差

3）抽样误差

·抽样误差：样本指标与总体指标只差，被称为随机抽样误差，简称抽样误差。

·抽样误差是客观存在，不可避免的，但有一定的规律性

√可通过统计方法估计

√可通过增大样本量使其减小

5.概率（probability)与频率（freguency ）

1）概率：描述随机事件发生可能性大小的度量，常用P 表示。是对总体而言。

·P 值的范围在0和1之间

·P 值越接近1，表明某事件发生的可能性越大

·P 值越接近0，表明某事件发生的可能性越小

2）频率：指一次实验结果计算得到的样本率。是对样本而言。

3）小概率事件：P ≤0.05或P≤0.01的随机事件

·表示某事件发生的可能性很小，进而统计学上认为其在一次抽样中是不可能发生的。

二、统计描述

（一）数值变量资料的统计描述

1.频数表

·相同观察结果出现的次数称为频数。

·将所有观察结果的频数按一定的顺序排列在一起就是频数表。

·用统计表的形式将互不相容的各情形列出，就是频数表。

1）目的：

·简化数据

2.频数分布图

·以组段为横轴（底），以相应频数为纵轴（高）作系列密闭的矩形。又称直方图。

·用途：反映计量资料的分布特点（连续变量各种取值出现的机会）

3.描述集中趋势的指标

1）算数平均数（均数）

·适用条件：资料呈正态分布（或近似正态或对称分布）

·μ：表示总体均数

·X：表示样本均数

2）中位数

·把一组观察值，按从小到大的顺序排列，位置居中的变量值（n奇数）或位置居中的两个变量值的均值（n偶数）。

·M：表示中位数

·中位数是位次平均指标，以中位数为界，将观察值分为左右两半。

·适用情况：

√当资料呈明显的偏态分布；

√资料一端或两端无确定数值（如大于或小于某数值）；

√资料的分布情况不清楚。

√例如，某些传染病或食物中毒的潜伏期、人体的某些特殊测定指标（如发汞、尿铅等），集中趋势多用中位数来表示。

3）几何平均数

·是将n个观察值x的乘积再开n次方的方根（或各观察值x对数值均值的反对数）

·G：表示几何均数

·适用条件

①等比资料

√抗体的平均滴度

√药物的平均效价

√人口几何增长资料

②对数正态分布资料（偏态分布资料经过对数转换后服从正态分布）

4.描述离散趋势的指标

1）方差和标准差

·描述对称分布离散趋势的重要指标

·值越大，离散程度越大，数据越分散，均数的代表性越差。

·σ2：表示总体方差

·S2:表示样本方差

2）全距

·用R 表示，又称作极差

·是一组资料的最大与最小值之差

·全距越大，说明资料的离散程度越大

·缺点：

√仅考虑两端数值之间的差异，未考虑其它其他数据的变异情况，不能全面反映一组资料的离散程度。

√易受个别特大值、特小值的影响，不稳定

3）百分位数（percentile ，X P ）：是把一组数据从小到大排列，分成100等份，各等份含1%的观察值，分割界限上的数值就是百分位数。

·位置指标

·中位数是第50百分位数，用50P 表示

·常用于描述偏态分布资料在某百分位置上的水平及确定偏态分布资料医学参考值范围。 ·四分位数间距：25P 75P

√中位数：描述集中趋势

√四分位数间距：描述离散趋势

4）变异系数

·用CV 表示：CV=S/X ×100%

（二）分类资料的统计描述

1.频数表

2.相对数（见流行病学，本章第一节）

三、统计表和统计图

（一）统计表

以表格的形式，表述被研究对象的特征、内部构成及研究项目分组之间的数量关系。

原则：统计表要重点突出，简单明了。

1. 标题：描述表格内容，包括研究对象和统计分析指标；

2. 标目：

·横标目：指研究对象（主语），一个横标目对应一横行的内容；

·纵标目：统计分析指标（谓语或宾语），一个纵标目对应一纵列的内容；

3. 线条：最简单的统计表为“三横线”，不允许有竖线和斜线；

4. 数字：阿拉伯数字，同一指标的小数位数一致，位次对齐；

5. 备注：在表的下方，补充说明表格的内容。

（二）统计图

是通过点的位置、线段的升降、直条的长短和面积的大小来表现事物的数量关系。

特点：

直观、形象、利于对比

1.制图的基本要求

1）根据资料的性质和分析目的，选择合适的图形。

2）基本结构：标题、标目、刻度、图例4部分组成。

·标题：一般放在图的下方，左侧加图号

·标目：分为横标目和纵标目，分别表示横轴和纵轴数字刻度的意义，纵横轴的比例5：7 （标注原点、尺度、单位等）

·图例：说明统计图中各种图形所代表的事物。放在右上角或下方中间。

2.常用统计图类型

1）直方图：适用于表示数值变量的频数分布

·社区194名老年人跌倒风险评分频数分布

2）折线图：适用于描述某统计量随另一连续性数值变量变化而变化的趋势，常用于描述统计量随时间变化而变化的趋势

·纵横轴的刻度可以不从0开始

·不应将折线绘制成光滑曲线

3）误差条图：适用于比较多组连续变量的均值和标准差（或可信区间）。

4）箱式图：适用于连续变量的偏态分布资料。

·箱体：25P ~75P ;

T 型图标：最大值，最小值

5）直条图：适用于比较、分析独立的或离散变量的多个组或多个类别的统计指标（绝对数、相对数）。

6）百分条图和圆图：适用于描述分类变量的各类别所占的构成比。

四、统计推断

1.统计推断：用样本信息推断总体信息→统计学的核心内容

·总体参数估计

·假设检验→也称作显著性检验，是统计推断的核心

数值变量资料的统计推断

·总体均数估计

·t 检验

·方差分析

·数值变量的秩和检验（非参数检验）

分类变量资料的统计推断

·总体率的估计

·分类变量的z 检验

·卡方检验

·秩和检验（非参数检验）

2.假设检验的基本原理

1）统计假设（简称假设）：指推断的总体特征

·指用样本信息判断假设是否成立的统计方法

2）参数检验

·假定总体分布类型已知，对其参数进行假设检验

·如：t 检验，z 检验，方差分析

3）非参数假设检验

·不对总体分布类型进行假设

·若总体分布类型未知，或偏态分布资料

·假设检验不是对总体参数进行检验

·如：秩和检验

3.假设检验的基本步骤

1）建立检验假设，设定检验水准

·推断样本所代表的总体是否相同

①无效假设，或称为零假设，记作0H 。

假设差异是由于抽样误差所致，总体参数相同

0H ：总体参数相同（μ=0u ）

②备择假设，记作1H

差异不是由于抽样误差所致，总体参数不相同

1H ：总体参数不同（μ≠0u 或μ> 0u 或μ< 0u ）

·检验水准（size of a test ）亦称显著性水准（signnifcance level ），用表示，通常取0.05，或0.01。 ·检验水准的含义：指无效假设0H 实际上成立，但样本信息不支持

0H ，统计上拒绝无效假设0H 可能

性大小的度量。事先确定的I 类错误的概率。

2）选定检验方法，计算检验统计量

·根据统计推断的目的、研究设计类型、资料的分布、样本量大小、公式的适用条件计算相应的统计量。 ·t 值、P 值、2x 值

3）确定概率（P 值），作出统计推断

·用算得的统计量与相应的界值作比较确定P 值

·P 值：是指从0

H 所规定的总体进行随机抽样，获得等于及大于（或等于及小于）现有杨版本统计量的概率。

·根据P 值大小，做出拒绝或不拒绝0H 的统计推断。

·当P>a 时，按a 检验水准，不拒绝

0H ，差异无统计学意义，不能认为两总体均数不相等； ·若P ≤a,按a 检验水准，拒绝0H ，接受1H ，差异有统计学意义，两总体均数不相等。

4）假设检验的基本思想

·总体假设成立

·计算样本统计量

·判断抽到目前样本的可能性是否为小概率事件

·若为小概率事件，则拒绝0H ；否则，不拒绝0H 。

3.计量资料的检验方法

1）参数检验

·t检验：两个独立样本均数的比较

·P分析：多个独立样本均数的比较

·配对设计t检验：配对设计资料

·随机区组设计的方差分析：随机区组资料

2）非参数检验

·计量资料不符合参数检验条件

·秩和检验

4.案例

某新进口的抗高血压药（加高）组1000例与传统的复方降压片（价廉）组1000例的临床试验结果显示：新药组比传统药组的降压幅度提高了1mmHg,是否有实际意义？

·样本量大，所以差异有统计学意义

·但提高临床疗效的作用不明显，没有临床意义。

医学统计知识点整理(1)

医学统计学知识点整理第一节统计学中基本概念一、同质与变异同质：统计研究中，给观察单位规定一些相同的因素情况。如儿童的生长发育，规定同性别、同年龄、健康的儿童即为同质的儿童。变异：同质的基础上个体间的差异。 “同质”是相对的，是客观事物在特定条件下的相对一致性，而“变异”则是绝对的二、总体与样本 1、总体：是根据研究目的所确定的，同质观察对象（个体）所构成的全体。 2、样本：是从总体中随机抽取的部分观察单位变量值的集合。三、参数与统计量总体参数：根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量：根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的，抽样研究的目的就是用样本统计量来推断总体参数，包括区间估计和假设检验四、误差：实测值与真值之差★ 1.随机误差：是一类不恒定的、随机变化的误差，由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差：是一类恒定不变或遵循一定变化规律的误差，其产生原因往往是可知的或可能掌握的。 3.非系统误差：过失误差，可以避免或清除。五、概率是用来描述事件发生可能性大小的一个量值，常用P表示。概率取值0~1。统计上一般将P≤0.05或P≤0.01的事件称为小概率事件，表示其发生的概率很小，可以认为在一次抽样中不会发生。第二节统计资料的类型★

变量：确定总体之后，研究者应对每个观察单位的某项特征进行观察或测量，这种特征能表现观察单位的变异性，称为变量。一、数值变量资料又称为计量资料、定量资料：观测每个观察单位某项指标的大小而获得的资料。表现为数值大小，带有度、量、衡单位。如身高（cm）、体重(kg)、血红蛋白（g）等。二、无序分类变量资料又称为定性资料或计数资料：将观察对象按观察对象的某种类别或属性进行分组计数，分组汇总各组观察单位后得到的资料。分类：二分类：+ -；有效，无效；多分类：ABO血型系统特点：没有度量衡单位，多为间断性资料【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料，又称为计数资料。因为是按照变量的血型分类，血型表现为互不相容的属性。所以本题选C。【例题单选】测量正常人的脉搏数所得的变量是（） A.二分类变量 B.多分类变量 C.定量变量 D.定性变量【答案】C 【解析】脉搏数有数值大小，有度量衡，所以这个资料属于定量资料。本题选C。三、有序分类变量资料半定量资料或等级资料：将观察对象按观察对象的某种属性的不同程度分成等级后分组计数，分组汇总各组观察单位后得到的资料。特点：每一个观察单位没有确切值，各组之间有性质上的差别或程度上的不同举例：- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学基本概念

习题-医学统计学基本概念选择题： 1. 若以舒张期血压大于等于1 2.7kPa 为为高血压，调查某地1000 人，记录每人是否患有高血压。最后清点结果，其中有10 名高血压患者，有990 名非高血压患者。（） A.这是计量数据 B.这是等级数据 C.还看不出是记数还是计量数据 D.这是连续型数据 E.这是计数数据 2、统计学中所说的样本是指（） A.随意抽取的总体中任意的部分 B.有意识的选择总体中的典型部分 C.依照研究者要求选取总体中有意义的一部分 D.依照随机原则抽取总体中有代表性的一部分 E.按研究目的随意抽取有代表性的一部分 3、下列资料属等级资料的是（） A.白细胞计数 B.住院天数 C.门、急症就诊人数 D.病人的病情分级（轻、中、重） E.疾病疗效（有效、无效） 4、总体是由（） A.个体组成 B.研究对象组成 C.同质个体组成 D.研究指标组成 E.观察单位组成 5、抽样的目的是（） A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例研究误差 D.研究总体参数 E.研究样本特征 6、参数是（） A.参与个体数 B.总体的统计指标 C.样本的统计指标 D.样本的总和 E.参考值范围 7、关于随机抽样，下列哪一项说法是正确的（） A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体，以使样本更能代表总体 C.随机抽样即随意抽样个体 D.为确保样本具有更好的代表性，样本量应越大越好 E.以上均不对 8、统计工作各个步骤的首要基础是（） A.收集资料 B.整理资料 C.核对资料 D.分析资料 E.医学研究设计 9、统计工作的基本步骤是：() A.调查资料、核对资料、整理资料 B调查资料、归纳资料、整理资料 C收集资料、核对资料、整理资料

医学统计学知识点总结

医学统计学 1. 对定量资料进行统计描述时，如何选择适宜的指标定量资料统计描述常用的统计指标及其适用场合描述内容指标意义适用场合平均水平；均数个体的平均值· 对称分布几何均数平均倍数取对数后对称分布中位数[ 位次居中的观察值 ①非对称分布；②半定量资料；③末端开口资料；④分布不明众数频数最多的观察值不拘分布形式，概略分析 ? 调和均数基于倒数变换的平均值正偏峰分布资料变异度全距观察值取值范围不拘分布形式，概略分析标准差（方差）观察值平均离开均数的程度对称分布，特别是正态分布资料四分位数间距？居中半数观察值的全距 ①非对称分布；②半定量资料；③末端开口资料；④分布不明变异系数标准差与均数的相对比①不同量纲的变量间比较；②量纲相同但数量级相差悬殊的变量间比较定性资料：阳性事件的概率，概率分布，强度和相对比。￥ 2. 应用相对数时应注意哪些问题答：（1）防止概念混淆相对数的计算是两部分观察结果的比值，根据这两部分观察结果的特点，就可以判断所计算的相对数属于前述何种指标。（2）计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。（3）观察单位数不等的几个相对数，不能直接相加求其平均水平。（4）相对数间的比较须注意可比性，有时需分组讨论或计算标准化率。 3. 常用统计图有哪些分别适用于什么分析目的常用统计图的适用资料及实施方法 < 图形适用资料实施方法条图组间数量对比用直条高度表示数量大小直方图用直条的面积表示各组段的频数或频率

( 定量资料的分布百分条图构成比用直条分段的长度表示全体中各部分的构成比饼图构成比用圆饼的扇形面积表示全体中各部分的构成比定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系、线图半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图} 双变量间的关联点的密集程度和形成的趋势，表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布' 用茎表示组段的设置情形，叶片为个体值，叶长为频数第3章概率分布（连续随机变量的正态分布；离散随机变量的二项分布及Poisson分布）1. 服从二项分布及Poisson分布的条件分别是什么二项分布成立的条件：①每次试验只能是互斥的两个结果之一；②每次试验的条件不变；③各次试验独立。 Poisson分布成立的条件：除二项分布成立的三个条件外，还要求试验次数n很大，而所关心的事件发生的概率很小。、 2. 二项分布、Poisson分布分别有什么特征 ①二项分布、Poisson分布都是离散型分布。 ②二项分布的形状取决于π与n的大小。π=时，不论n大小，对称分布。π≠时，图形呈偏态，随n增大而逐渐对称。当n足够大，π或1-π不太小，二项分布近似正态。 ③Poisson分布μ越小，分布越偏。μ越大，分布越对称。当n足够大时，分布接近正态。 4、正态分布应用 ①估计变量值的频数分布《 ②制定参考值范围 ③质量控制 ④正态分布是很多统计方法的基础 5. 正态分布特征 ①以均数为中心，左右对称 ②正态曲线在横轴上方均数处取得最高点 ~ ③正态分布有两个参数，即均数（位置参数）和标准差（变异度参数）（μ,σ2 ;标准0,1）

医学统计学知识点范文.doc

第一章绪论 1、统计学，是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象：具有不确定性结果的事物。 3、统计学作用：能够透过偶然现象来探测其规律性，使研究结论具有科学性。 4、统计分析要点：正确选用统计分析方法，结合专业知识作出科学的结论。 5、医学统计学基本内容：统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异同质，指根据研究目的所确定的观察单位其性质应大致相同。变异，指总体内的个体间存在的、绝对的差异。统计学通过对变异的研究来探索事物。 (2) 变量与数据类型变量，是反映实验或观察对象生理、生化、解剖等特征的指标。变量的观测值，称为数据分为三种类型：定量数据，也称计量资料，指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。（如身高、体重、血压、温度等）定性数据，也称计数资料，指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。（进一步分为二分类和多分类，如性别分为男和女，血型分为A、B、O、AB等）有序数据，也称半定量数据或等级资料，指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果，具有半定量性质。统计方法的选用与数据类型有密切的关系。（3）总体与样本总体，指根据研究目的确定的所有同质观察单位的全体，包括所有定义范围内的个体变量值。样本，是从研究总体中随机抽取部分有代表性的观察单位，对变量进行观测得到的数据。抽样，是从研究总体中随机抽取部分有代表性的观察单位。参数，指描述总体特征的指标。统计量，指描述样本特征的指标。（4）误差误差，指观测值与真实值、统计量与参数之间的差别。可分为三种：系统误差，也称统计偏倚，是某种必然因素所致，不是偶然机遇造成的，误差的大小通常恒定，具有明确的方向性。随机测量误差，是偶然机遇所致，误差没有固定的大小和方向。抽样误差，是抽样引起的统计量与参数间的差异。抽样误差主要来源于个体的变异。统计学主要研究抽样误差。（5）概率概率，是描述某事件发生可能性大小的量度。必然事件，事件肯定发生，概率P(U)＝1；随机事件，事件可能发生，可能不发生，概率介于0≤P(A)≤ 1；不可能事件，事件肯定不发生，概率P(∮)＝0；小概率事件，事件发生的可能性很小，概率P(A)≤ 0.05、或P(A)≤ 0.01。医学科研中，P(A)≤0.05作为事物差别有统计意义，P(A)≤ 0.01作为事物差别有高度统

医学统计学知识点汇总(精华)

医学统计学知识点汇总(精华) 一.概论 1，医学统计学：运用概率论和数理统计学的原理和方法，研究医学领域中随机现象有关数据的搜集、整理、分析和推断，进而阐明其客观规律性的一门应用科学。 2，医学统计学的主要内容： 1）统计研究设计调查研究设计和实验研究设计 2）医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。 A：资料的搜集与整理 B：常用统计描述，集中趋势和离散趋势，相对数，相关系数，回归系数，统计表，统计图 C：统计推断，如参数估计和假设检验。 3）医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3，统计工作步骤： 1）设计明确研究目的和研究假说，确定观察对象与观察单位，样本含量和抽样方法，拟定研究方案，预期分析指标，误差控制措施，进度与费用。 2）搜集材料 A，搜集材料的原则及时、准确、完整 B，统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表，二是经常性工作记录，三是专题调查或专题实验。 C，资料贮存 3）整理资料 a检查核对b设计分组c拟定整理表d归表 4）分析资料统计分析包括统计描述和统计推断

4，同质（homogeneity）：指被研究指标的影响因素相同。变异(variation)：同质基础上的各观察单位间的差异。变量(variable)：收集资料过程中，根据研究目的确定同质观察单位，再对每个观察单位的某项特征进行测量或观察，这种特征称为变量变量值：变量的观察结果或测量值。 5，总体（population）根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总体具有的基本特征是：同质性样本（sample）从总体中随机抽取部分观察单位，其变量值的集合构成样本。样本必须具有代表性。代表性是指样本来自同质总体，足够的样本含量和随机抽样的前提。

医学统计学-知识梳理

均数±2.58标准差：表示集中位置、离散程度均数±2.58标准误：表示平均水平、抽样误差大小P75 一、标准差的主要作用是估计正常值的范围实际应用中，估计观察值正常值范围应该用标准差（s），表示为“Mean±SD”。此写法综合表达一组观察值的集中和离散特征的变异情况，说明样本平均数对观察值的代表性。s 的大或小说明数据取值的分散或集中。s与样本均数合用, 主要是在大样本调查研究中, 对正态或近似正态分布的总体正常值范围进行估计。如果不是为了正常值范围估计，一般不用。当数据与正态分布相差很大，或者虽为正态分布, 但样本容量太小(小于30 或100)，也不宜用估计正常值范围。二、标准差还可用来计算变异系数（CV）当两组观察值单位不同, 或两均数相差较大时，不能直接用标准差比较其变异程度的大小, 须用变异系数系数来做比较。： 2.2 标准误的正确使用一、标准误用来衡量抽样误差的大小和了解用样本平均数来推论总体平均数的可靠程度。在抽样调查中，往往通过样本平均数来推论总体平均数，样本标准误适用于正态或近似正态分布的数据, 是主要描述小样本试验中，样本容量相同的同质的多个样本平均均数间的变异程度的统计量。即如果多次重复同一个试验, 它们之间的变异程度用。显然它越小，样本平均数变异越小，越稳定，用样本平均数估计总体均数越可靠。因此，为说明它的稳定性、可靠性或通过几个对几组数据进行比较(这是科研论文中最常见的)，应当用描述数据。实际应用中应该写成“平均数±标准误”或而英文表示为“Mean±SE”的形式。二、标准误还可以进行总体平均数的区间估计与点估计（置信区间）。根据正态分布原理，与合用还可以给出正态总体平均数的可信区间估计即推论总体平均数的可靠区间，例如常用（其中t0.05 (n-1) 为样本容量是n的t界值）表示总体均值的95%可信区间, 意指总体平均数有95%的把握在所给范围内。三、标准误还可用来进行平均数间的显著性检验，从而判断平均数间的差别是否是由抽样误差引起的。例如：某当地小麦良种的千粒重=34克，现在从外地引入一新品种，通过多小区的田间试验得到千粒重的平均数=35.2克，问新引进品种千粒重与当地良种有无显著差异？新引进品种千粒重与当地良种有无显著差异实质是判断与的差别是否是有田间试验是抽样误差引起，所以要进行显著性检验，这里用t测验进行检验，而，由于，故，所以认为新引进品种千粒重与当地良种千粒重的不同是由于田间试验是抽样误差引起，因此他们之间无显著差异。所以在进行平均数间的显著性检验是必须用到。总之，标准差和标准误最常用的统计量，二者都是衡量样本变量(观察值) 随机性的指标，只是从不同角度来反映误差，二者在统计推断和误差分析中都有重要的应用。如果没有标准差，人们就无法看出一组观察值间变异程度有多大，这些数字到底有无代表性，如果没有标准误又很难看出我们的样本平均数是否可以代表总体平均数。所以二者都非常重要。

第二节医学统计学的基础知识习题及答案

【单项选择题】 1. 医学统计学的主要内容不包括（）。 A. 变量计算 B. 统计设计 C. 统计描述 D. 统计推断【答案】A 【解析】P111；医学统计学的主要内容; 1）统计设计； 2）统计描述； 3）统计推断。 2. 医学统计工作的基本步骤不包括（）。 A. 研究设计

B. 健康教育 C. 收集资料 D. 整理资料【答案】B 【解析】P112；医学统计工作的基本步骤：研究设计、收集资料、整理资料和分析资料是统计工作的4个基本步骤。这4个步骤是紧密联系不可分割的，某一环节发生问题，都将影响最终的统计分析结果。 3. 描述集中趋势的指标有（）。 A. 算数均数 B. 方差与标准差 C. 极差 D. 百分位数【答案】：A 【解析】：P115；描述集中趋势的指标：

1)算术均数，简称均数； 2)中位数(median)； 3)几何均数(geometry mean)。 4. 统计学中的总体是指（）。 A. 根据研究目的确定的同质观察单位的全体 B. 根据地区划分的研究对象的全体 C. 根据时间划分的研究对象的全体 D. 根据人群划分的研究对象的全体【答案】A 【解析】P114;总体( population)是根据研究目的确定的同质观察单位的全体，更确切地说，是同质的所有观察单位某种变量值的集合。 5. 下列不属于离散趋势的描述指标是（）。 A. 极差

B. 百分位数 C. 方差与标准差 D. 几何均数【答案】D 【解析】P116；描述离散趋势的指标； 1）方差与标准差； 2）极差：亦称全距(range)，用符号R表示； 3）百分位数(percentile):是一个位置指标，用符号Px表示；4）变异系数(coefficient of variation):用符号CV表。而几何均数是描述集中趋势的指标。 6. 血清学滴度资料最常用来表示其平均水平的指标是（）。 A. 算术平均数 B. 中位数

医学统计学考试重点

医学统计学考试重点Prepared on 21 November 2021

一、基本概念 1.总体与样本总体：所有同质观察单位某种观察值（即变量值）的全体样本：是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查普查：就是全面调查，即调查目标总体中全部观察对象抽样调查：是一种非全面调查，即从总体中抽取一定数量的观察单位组成样本，对样本进行调查 3.参数与统计量参数：总体的某些数值特征统计量：根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误假设检验的结论不真实情况拒绝H 拒绝H 正确Ⅰ型错误(ɑ) 推 H 断正确(1ɑ) 不正确推断正确(1β) Ⅱ型 H 错误(β) 为真时却被拒绝，弃真错误 Ⅰ型错误（ɑ错误）: H Ⅱ型错误（β错误）: H 为假时却被接受，取伪错误 5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组，使每个研究对象都有同等机会被分配到各组中去，以平衡两组中已知和未知的混杂因素，从而提高两组的可比性，避免造成偏倚。（意义: ①是提高组间均衡性的重要设计方法；②避免有意扩大或缩小组间差别导致的偏倚；③各种统计学方法均建立在随机化基础上）安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物，是一种无药理作用的制剂，不含试验药物的有效成分，但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样，不能被受试对象和研究者所识别。（安慰剂对照主要用于临床试验，其目的在于控制研究者和受试对象的心理因素导致的偏倚，并提高依从性。安慰剂对照还可以控制疾病自然进程的影响，显示试验药物的效应） 6.误差与标准误（区分率与均数）㈠均数抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。标准误：是指样本均数的标准差，反映抽样误差大小的定量指标，其公式表示为S =S/√n x ㈡样本率率的抽样误差:样本率p和总体率π的差异

医学统计学知识点梳理图文稿

医学统计学知识点梳理集团文件版本号：（M928-T898-M248-WU2669-I2896-DQ586-M1988）

随机抽样：随机抽样（random sampling）是指按照随机化的原则（总体中每一个观察单位都有同等的机会被选入到样本中），从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。变异：在自然状态下，个体间测量结果的差异称为变异（variation）。变异是生物医学研究领域普遍存在的现象。严格的说，在自然状态下，任何两个患者或研究群体间都存在差异，其表现为各种生理测量值的参差不齐。（1）计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。计量资料亦称定量资料、测量资料。.其变量值是定量的，表现为数值大小，一般有度量衡单位。（2）计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。（3）等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。概率：概率(probability)又称几率，是度量某一随机事件A发生可能性大小的一个数值，记为P（A），P（A）越大，说明A事件发生的可能性越大。0﹤P（A）﹤1。

医学统计学知识点

实用标准文档大全第一章绪论 1、统计学，是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象：具有不确定性结果的事物。 3、统计学作用：能够透过偶然现象来探测其规律性，使研究结论具有科学性。 4、统计分析要点：正确选用统计分析方法，结合专业知识作出科学的结论。 5、医学统计学基本内容：统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异同质，指根据研究目的所确定的观察单位其性质应大致相同。变异，指总体内的个体间存在的、绝对的差异。统计学通过对变异的研究来探索事物。 (2) 变量与数据类型变量，是反映实验或观察对象生理、生化、解剖等特征的指标。变量的观测值，称为数据分为三种类型：定量数据，也称计量资料，指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。（如身高、体重、血压、温度等）定性数据，也称计数资料，指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。（进一步分为二分类和多分类，如性别分为男和女，血型分为A、B、O、AB 等）有序数据，也称半定量数据或等级资料，指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果，具有半定量性质。统计方法的选用与数据类型有密切的关系。（3）总体与样本总体，指根据研究目的确定的所有同质观察单位的全体，包括所有定义范围内的个体变量值。样本，是从研究总体中随机抽取部分有代表性的观察单位，对变量进行观测得到的数据。抽样，是从研究总体中随机抽取部分有代表性的观察单位。参数，指描述总体特征的指标。统计量，指描述样本特征的指标。（4）误差误差，指观测值与真实值、统计量与参数之间的差别。可分为三种：系统误差，也称统计偏倚，是某种必然因素所致，不是偶然机遇造成的，误差的大小通常恒定，具有明确的方向性。随机测量误差，是偶然机遇所致，误差没有固定的大小和方向。抽样误差，是抽样引起的统计量与参数间的差异。抽样误差主要来源于个体的变异。统计学主要研究抽样误差。（5）概率概率，是描述某事件发生可能性大小的量度。必然事件，事件肯定发生，概率P(U)＝1；随机事件，事件可能发生，可能不发生，概率介于0≤P(A)≤ 1；不可能事件，事件肯定不发生，概率P(∮)＝0；小概率事件，事件发生的可能性很小，概率P(A)≤ 0.05、或P(A)≤ 0.01。

医学统计学知识点梳理

医学统计学知识点梳理 Revised as of 23 November 2020

医学统计学知识点梳理医学统计学:是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。统计描述：用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。统计推断：在一定的置信度和概率保证下，用样本信息推断总体特征： ①参数估计：用样本的指标去推断总体相应的指标 ②假设检验：由样本的差异推断总体之间是否可能存在的差异同质：一个总体中有许多个体，他们之所以共同成为人们研究的对象，必定存在共性，我们说一些个体处于同一总体，就是指他们大同小异，具有同质性。总体（population）是根据研究目的确定的同质的观察单位的全体，更确切的说，是同质的所有观察单位某种观察值（变量值）的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体，反之为无限总体。样本：从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample）。样本应具有代表性。所谓有代表性的样本，是指用随机抽样方法获得的样本。随机抽样：随机抽样（random sampling）是指按照随机化的原则（总体中每一个观察单位都有同等的机会被选入到样本中），从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。变异：在自然状态下，个体间测量结果的差异称为变异（variation）。变异是生物医学研究领域普遍存在的现象。严格的说，在自然状态下，任何两个患者或研究群体间都存在差异，其表现为各种生理测量值的参差不齐。（1）计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。计量资料亦称定量资料、测量资料。.其变量值是定量的，表现为数值大小，一般有度量衡单位。（2）计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。（3）等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。

流行病学和医学统计学基础知识答案及解析

第五章流行病学和医学统计学基础知识一、单选题 1、以下对流行病学的任务，表述错误的是（）。 A. 流行病学第二阶段的任务是“找出原因、影响或决定因素” B. “健康风险评估”对应流行病学第一阶段的任务 C. “健康危险因素干预”对应流行病学第三阶段的任务 D. 流行病学第一阶段的任务是“揭示现象” E. 流行病学第三阶段的任务是“提供措施” 网校答案：B 网校解析：流行病学的任务大体上可以分为三个阶段第一阶段的任务是“揭示现象”，即揭示流行（主要是传染病）或分布（其他疾病、伤害与健康）的现象。第二阶段为“找出原因、影响或决定因素”，即从分析现象入手找出流行与分布的规律、原因或影响因素。第三阶段为“提供措施”，即合理利用前两个阶段的结果，找出预防或干预的策略与措施。结合健康管理的实际，流行病学第一、二和三阶段的任务分别对应的是“健康信息收集”“健康风险评估”“健康指导和健康危险因素干预”。 2、流行病学主要研究（）。 A. 医院内的患者及患病有关因素 B. 正常人群的健康水平 C. 亚健康人群的健康水平 D. 人群中疾病与健康状况的分布及其影响因素 E. 社区内高危人群及其健康水平网校答案：D 网校解析：流行病学的主要研究内容如下： ①疾病分布及影响分布的原因：即“揭示现象”。 ②研究疾病的流行因素和病因：即“找出原因”。 ③研究与制定预防对策和措施：即“提供措施”。 ④评价策略和措施的效果：即“评价效果”。 3、下列关于流行病学，说法错误的是（）。 A. 流行病学是从群体角度研究疾病与健康 B. 流行病学研究的病种仅限于传染病 C. 流行病学属于预防医学的范畴 D. 流行病学已深入临床医学的研究中 E. 流行病学是从疾病分布入手探讨疾病的流行因素网校答案：B 网校解析：流行病学是研究疾病、健康状态和事件在人群中的分布、影响和决定因素，用以预防和控制疾病、促进健康的学科。该定义的基本内涵有四点： ①它的研究对象是人群，是研究所关注的具有某种特征的人群； ②它不仅研究各种疾病，而且研究健康状态和事件； ③它的重点是研究疾病、健康状态和事件的分布、影响和决定因素；

重点医学统计学试题及答案

（一）单项选择题 3．抽样的目的是（b ）。 A．研究样本统计量 B. 由样本统计量推断总体参数 C．研究典型案例研究误差 D. 研究总体统计量 4．参数是指（b ）。 A．参与个体数 B. 总体的统计指标C．样本的统计指标 D. 样本的总和 5．关于随机抽样，下列那一项说法是正确的（ a ）。 A．抽样时应使得总体中的每一个个体都有同等的机会被抽取 B．研究者在抽样时应精心挑选个体，以使样本更能代表总体 C．随机抽样即随意抽取个体 D．为确保样本具有更好的代表性，样本量应越大越好 6.各观察值均加（或减）同一数后（ b ）。 A.均数不变，标准差改变 B.均数改变，标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用（ a ）。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中（d）可用来描述计量资料的离散程度。 A.算术均数 B.几何均数

C.中位数 D.标准差 9.偏态分布宜用（c）描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后，（b）不变。A．算术均数 B.标准差 C.几何均数 D.中位数 11.（ a ）分布的资料，均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种（ c ）分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料，可用（ c ）描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.（ c ）小，表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是（ c ）。 A. 算术平均数 B.中位数

医学统计学知识点梳理

变异：在自然状态下，个体间测量结果的差异称为变异（variation）。变异是生物医学研究领域普遍存在的现象。严格的说，在自然状态下，任何两个患者或研究群体间都存在差异，其表现为各种生理测量值的参差不齐。（1）计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。计量资料亦称定量资料、测量资料。.其变量值是定量的，表现为数值大小，一般有度量衡单位。（2）计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。（3）等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。概率：概率(probability)又称几率，是度量某一随机事件A发生可能性大小的一个数值，记为P（A），P（A）越大，说明A事件发生的可能性越大。0﹤P（A）﹤1。频率：在相同的条件下，独立重复做n 次试验，事件A 出现了m 次，则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P（A）= m/n。随机误差（random error）又称偶然误差，是指排除了系统误差后尚存的误差。它受多种因素的影响，使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。

医学统计学知识点梳理

医学统计学知识点梳理公司内部编号：（GOOD-TMMT-MMUT-UUPTY-UUYY-DTTI-

变异：在自然状态下，个体间测量结果的差异称为变异（variation）。变异是生物医学研究领域普遍存在的现象。严格的说，在自然状态下，任何两个患者或研究群体间都存在差异，其表现为各种生理测量值的参差不齐。（1）计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。计量资料亦称定量资料、测量资料。.其变量值是定量的，表现为数值大小，一般有度量衡单位。（2）计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。（3）等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。概率：概率(probability)又称几率，是度量某一随机事件A发生可能性大小的一个数值，记为P（A），P（A）越大，说明A事件发生的可能性越大。0﹤P（A）﹤1。频率：在相同的条件下，独立重复做n 次试验，事件A 出现了m 次，则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P （A）= m/n。随机误差（random error）又称偶然误差，是指排除了系统误差后尚存的误差。它受多种因素的影响，使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。

医学统计学考试重点整理

H 正确Ⅰ型错误(ɑ) 0 推断正确(1?ɑ) 不正确推断正确(1?β) H Ⅱ型错误(β) 为真时却被拒绝，弃真错误 Ⅰ型错误（ɑ错误）: H 为假时却被接受，取伪错误 Ⅱ型错误（β错误）: H 5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组，使每个研究对象都有同等机会被分配到各组中去，以平衡两组中已知和未知的混杂因素，从而提高两组的可比性，避免造成偏倚。（意义: ①是提高组间均衡性的重要设计方法；②避免有意扩大或缩小组间差别导致的偏倚；③各种统计学方法均建立在随机化基础上）安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物，是一种无药理作用的制剂，不含试验药物的有效成分，但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样，不能被受试对象和研究者所识别。（安慰剂对照主要用于临床试验，其目的在于控制研究者和受试对象的心理因素导致的偏倚，并提高依从性。安慰剂对照还可以控制疾病自然进程的影响，显示试验药物的效应） 6.误差与标准误（区分率与均数）

㈠均数抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。标准误：是指样本均数的标准差，反映抽样误差大小的定量指标，其公式表示 =S/√n 为S x ㈡样本率率的抽样误差:样本率p和总体率π的差异率的标准误:样本率的标准差,公式为σp=√π（1-π）/n 7.方差分析方差分析：又称F检验，是通过对数据变异按设计类型的不同，分解成两个或多个样本均数所代表总体均数是否有差别的一种统计学方法。（方差分析的基本思想:把全部观察值间的变异按设计类型的不同，分解成两个或多个组成部分，然后将各部分的变异与随机误差进行比较，以判断各部分的变异是否具有统计学意义）二、问题 1.集中趋势与离散趋势描述的常用指标、适用范围与优缺点㈠描述集中趋势的常用指标：

第五章-医学统计学的基本知识(五)

第五章医学统计学的基本知识第二节医学统计学的基本知识一、基本概念（一）医学统计学的定义和研究对象 1.医学统计学定义：根据统计学的原理和方法，研究医学数据收集、表达和分析的一门应用学科。 2. 医学统计学研究对象：是具有不确定性的医学数据，其基本的研究方法是通过收集大量资料，通常是人、动物或生物材料的测量值，发现蕴含其中的统计学规律。（二）医学统计学的主要内容 1.统计设计 2.统计描述 3.统计推断（三）医学统计资料的类型计量资料、计数资料和等级资料三类。 1.计量资料——数值变量：为定量测量的结果，通常用专用仪器测量，并有计量单位，如身髙（cm）、体重（kg）等。 2.计数资料——定性观察的结果。二分类：两种相互对立的属性如：阳性/阴性、正常/异常多分类：定性观察结果有两种以上互不包含的属性，如新生儿出生缺陷、某病患者的死亡原因等。这类资料之所以称为计数资料，因为在统计时通常将各种观察结果按属性分类计数，如阳性人数、阴性人数、死于某病的人数等。 3.等级资料：介于定量测量和定性观察之间的半定性观察结果，通常有两个以上等级，如阴性、阳性、强阳性，治愈、好转、有效、无效等。（四）医学统计工作的基本步骤研究设计、收集资料、整理资料和分析资料是统计工作的4个基本步骤。（五）统计学的几个重要概念 1.同质与变异同质：研究对象具有相同的背景、条件、属性称为同质。变异：同一性质的事物，其个体观察值（变量值）之间的差异，在统计学上称为变异。统计学所研究的对象是以同质为基础，并具有变异的事物或现象。

2.总体与样本总体：是根据研究目的确定的同质观察单位的全体，更确切地说，是同质的所有观察单位某种变量值的集合。观察单位——个体，是统计研究中最基本的单位。样本：即从总体中随机抽取有代表性的一部分观察单位，其测量值（或观察值）的集合称为样本（sample）。抽样研究的目的是用样本信息推论总体特征。 3.参数与统计量参数：指总体指标，如总体均数、总体率、总体标准差等。统计量：指样本指标，如样本均数、样本率、样本标准差等。 4.误差医学科学研究中的误差：通常指测量值与真实值之差，其中包括系统误差和随机测量误差；以及样本指标与总体指标之差，即抽样误差。 5.概率与频率概率是对总体而言，频率是对样本而言。概率：指某随机事件发生的可能性大小的数值，常用符号P来表示。随机事件的概率在0与1之间，即0≤P≤1，常用小数或百分数表示。P越接近1，表明某事件发生的可能性越大，P越接近0，表明某事件发生的可能性越小。频率：指一次实验结果计算得到的样本率。二、统计描述（一）数值变量资料的统计描述 1.频数表：最小值、最大值、组段之间首尾相接。 2.频数分布图：直接反映连续变量各种取值出现的机会。 3.描述离散趋势的指标：方差与标准差、极差、百分位数、变异系数。 4.描述集中趋势的指标：算数均数、中位数、几何均数。（二）分类资料的统计描述 1.频数表：表5-4 108例患者随访方式频数表。 2.相对数：比和率（见本章第一节）。

医学统计学基本概念[资料]

医学统计学基本概念 1.医学统计学是以医学理论为指导，应用概率论与数理统计的有关原理和方法，研究医学资料的搜集、整理、分析和推断的一门应用科学。 2.统计工作的步骤：（1）设计（2）收集资料（3）整理资料（4）分析资料；或者分三步：（1）研究设计（2）资料分析（3）结论。 3.定量资料：又称为数值变量资料，特点：（1）各观察值之间有量的差别；（2）数据间有连续性。它是指变量的取值不止是可列个，而是可取某区间[a,b]，（-oo,oo）上的一切值。 4.定性资料：又称为分类资料、分类变量资料（包括二项分类、多项分类资料），特点：（1）各观察值之间有质的差别；（2）数据间有离散性。它是指变量的取值有限的，至多是可列多个。附：无序分类：二项分类、多项分类 5.等级资料：又称为半定量资料，有序分类，指各类之间有程度的差别。特点：（）各观察单位间或者相同，或者存在质的差别；（2）各等级间只有顺序，而无数值大小，故等级之间不可度量。 6.个体individual：即每个观察单位。 7.总体population：根据研究目的确定的同质观察单位的全体。 8.样本：是从总体中随机抽取部分观察单位，其实测值的集合。样本包含的观察单位数称为样本含量或样本大小。 9.参数parameters：描述某总体特征的统计指标称为总体参数，简称参数。如总体均数、总体标准差等。特点：参数是未知的，固有的，不变的！ 10.统计量：描述某样本特征的的统计指标称为样本统计量，简称统计量。特点：统计量是已知的，变化的，有误差的！ 11.概率probability：是描述随机事件发生的可能性大小的数值。常用P表示。它的大小界于0和1之间。 12.随机事件：（1）可重复性：相同条件下可重复进行；（2）随机性：出现两种机两种以上结果；（3）偶然性：实验前不能肯定将出现哪种结果。 13.频率的稳定性：在重复试验中，事件A的频率随着试验次数的不断增加将愈来愈接近一个常数p，频率的这一特性称为频率的稳定性。 14.概率的统计定义：频率的稳定性充分说明随机事件出现的可能是事物本身固有的一种客观属性，因而是可以被认识和度量的。这个常数p就称为事件A出现的概率(probability)，记作P(A) 或P。这一定义称为概率的统计定义。它是事件A发生的可能性大小的一个度量。容易看出，频率为一变量，是样本统计量，而概率为常数，是一总体参数。实践中，当试验次数足够多时，可以近似地将频率作为概率的一个估计。 15.小概率原理：当某事件发生的概率小于或等于0.05时，统计学通常称该事件为小概率事件，其涵义为该事件发生的可能性很小，进而认为其在一次抽样中不可能发生，此即为小概率原理。 16.同质（homogeneity）：性质相同的事物称为同质的。 17.变异(variation)：同质的事物内个体之间或同一个体重复测量间的差别称为变异。 18.参考值范围(reference interval)又称正常值范围(normal range)。由于正常人的形态、功能、生化等各种指标的数据因人而异，而且同一个人的某些指标还会随着时间、机体内外环境的改变而变化，因此需要确定其波动范围，即正常值范围，简称正常值(normal value)。 19.正常值范围(normal ranges)，是指绝大多数正常人的某指标范围。 20.抽样误差(sampling error):由于抽样造成的样本统计量和总体参数之间的差异。 21.标准误(standard error)：样本统计量的标准差称为标准误。样本均数的标准差称为均数的标准误。 22.参数估计：由样本信息估计总体参数称为参数估计，包括点估计和区间估计。 23.点估计(point estimation) ：直接用样本统计量作为总体参数的估计值。这种估计方法简单，但未考虑抽样误差的大小。 24.区间估计(interval estimation) ：按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围，这个范围称作可信度为1-α的可信区间(confidence interval, CI)，又称置信区间。这种估计方法称为区间估计。 25.可信度为1-α的可信区间的确切涵义是：每100个样本所算得的100(1-α)％可信区间，平均有100(1-α)个包含了总体参数。如取α=0.05，则每100个样本所算得的100个95％可信区间，平均有95个包含总体参数在内，有5个不包含总体参数。 26.可信区间的两个要素：第一个要素是可靠性，常用可信度1-α的大小表示；第二个要素是精确性，常用可信区间的长度CU-CL衡量。 27.均数95%可信区间，其涵义是：如果重复100次抽样，每次样本含量均为n，每个样本均按（见课本P42）构建可信区间，则在此100个可信区间内，理论上有95个包含总体均数，而有5个不包含总体均数。 28.可信度为95%的CI的涵义：每100个样本，按同样方法计算95%的CI，平均有95%的CI包含了总体参数。这里的95%，指的是方法本身！而不是某个区间！ 29.第一类错误（I型错误）：拒绝了实际上成立的H0假设，称为“假阳性”, 用α来表示。 30.第二类错误（II型错误）：不拒绝实际上不成立的H0，称为“假阴性”,用β来表示。 31.检验效能(power of a test)或检验功效：1-β称检验效能(power of a test)，过去称把握度。为当两总体确有差异，按检验水准α所能发现该差异的能力。1-β只取单尾。 32.完全随机设计：根据某一试验因素，将试验对象完全按随机设计分为若干个组，每个组的样本例数可以相等，也可以不等，分别求出各组试验结果的均数，即为单因素多个样本均数，单个因素可以有多个水平，R>2 33.随机区组设计又称配伍组设计(Random Block Design)：即两因素多个样本均数的比较(或称两因素方差分析，two way analysis of variance）。 34.绝对数：在计数资料中，各组的观察数称绝对数。 35.相对数：是两个有联系的指标的比，计数资料的统计描述主要是相对数（relative number）。 36.率（rate）：说明某现象发生的频率或强度，常用%、‰、1/万、1/10万等作单位，表示在一定范围内,某现象的发生数与可能发生某现象的总数之比。率的结果常以保留1-2位整数为宜。

第五章第2节医学统计学基本知识

医学统计知识点整理(1)

医学统计学基本概念

医学统计学知识点总结

医学统计学知识点范文.doc

医学统计学知识点汇总(精华)

医学统计学-知识梳理

第二节 医学统计学的基础知识习题及答案

医学统计学考试重点

医学统计学知识点梳理图文稿

医学统计学知识点

医学统计学知识点梳理

流行病学和医学统计学基础知识答案及解析

重点医学统计学试题及答案

医学统计学知识点梳理

医学统计学知识点梳理

医学统计学考试重点整理

第五章-医学统计学的基本知识(五)

医学统计学基本概念[资料]

第二节医学统计学的基础知识习题及答案