医学统计学概述数值变量
医学统计学名词解释名解复习资料

1. 总体(population):根据研究目的所确定的同质观察单位的全体。
只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体(finite population)。
假想的,无时间和空间概念的,称为无限总体(infinite population)。
2. (总体)参数(parameter):总体的统计指标或特征值。
总体参数是事物本身固有的、不变的。
3. 样本(sample):从总体中随机抽取的部分个体。
4. 样本含量(sample size):样本中所包含的个体数。
5. 变量(variable):观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。
变量的取值称为变量值或观察值(observation)。
根据变量的取值特性,分为数值变量和分类变量。
6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。
对每个观察单位用定量的方法测定某项指标的数值,组成的资料。
7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
分类变量(categorical variable):或称定性变量,其取值是定性的,表现为互不相容的类别或或属性,有两种情况:1)无序分类(unordered categories):包括①二项分类,如上述“性别”变量,表现为互相对立的结果;②多项分类,如上述“血型”变量,表现为互不相容的多类结果。
2)有序分类(ordered categories):各类之间有程度上的差别,或等级顺序关系,有“半定量”的意义,亦称等级变量。
等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。
8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。
医学统计学——数值变量资料的统计描述

血糖 频数f 组中值X f X (4)
f X2 (5)
(1) (2) (3)
=(2)×(3) =(3)×(4)
3.60~ 3
3.7
3.80~ 3
3.9
4.00~ 8
4.1
4.20~ 23
4.3
4.40~ 24
4.5
4.60~ 25
4.7
4.80~ 20
4.9
5.00~ 12
5.1
5.20~ 10
5.3
0~
5
5
0.42
10~
12
17
1.41
20~
15
32
2.66
30~
76
108
8.98
40~
189
297
24.69
50~
234
531
44.14
60~
386
917
76.23
70~
286
1203
100.00
8
病例数
频数
人数
25
正态分布:中间高、
20
两边低、左右对称
15
10
5
0
0.50 0.70 0.90 1.10 1.30 1.50 1.70 1.90
﹡表示符号: 总体均数 (μ) 样本均数 (x )
﹡应 用: 对称分布资料,尤其是正态或近似正 态分布资料
﹡计算方法:
直接法 x=
1+ 2+……+ n n
=
∑
n
加权法 x=
f 1x1 + f 2x2 + ……+f kxk f 1 +f 2+……+f k
研究生-医学统计学基本概念

研究⽣-医学统计学基本概念医学统计学基本概念⼀.医学统计学运⽤概率论和数理统计等数学的原理和⽅法,研究医学领域中资料的搜集、整理、分析和推断的⼀门学科。
⼆、统计学中的基本概念总体和样本参数与统计量随机同质与变异抽样误差概率⼩概率原理1.变量(variable)(1)变量:收集资料中确定了的观察单位称为个体,在统计⼯作中反映个体的特征称为变量。
(2)随机变量:由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,简称变量.变量的观察值(观察结果)可以是定量的也可以是定性的,可分为:数值变量:可以度量⼤⼩,如⾎压等分类变量:⽆序变量:⾎型、性别有序变量:如测定某⼈群⾎清反应分-、+、++、+++四级2.总体和样本(population and sample)总体(population):是根据研究⽬的确定的研究对象中所有同质观察单位某项指标取值的集合。
?样本(sample):是从总体中随机抽取的具有代表性的部分观察单位某项指标取值的集合。
个体:构成总体的最基本的观察单位。
样本含量:样本中所包含的最基本的个体数,常⽤n表⽰。
统计推断就是要从样本信息去推断总体特征样本要具代表性,须:①随机抽取②例数⾜够多。
3、参数与统计量( parameter and statistic )参数parameter:描述总体的统计指标或特征值,是事物本⾝固有的、不变的,为常数,常⽤希腊字母表⽰。
统计量statistic:描述某样本特征的统计指标或特征值,随试验不同⽽不同,其分布是有规律的、变化的,常⽤拉丁字母表⽰。
4. 同质与变异(homogeneity and variation)同⼀总体或其样本中的观察单位在所取指标⽅⾯必须具有相同的性质,称为同质性(homogeneity),与之相反的是异质性或间杂性(heterogeneity).同质(homogeneity):观察单位具有相的性质;异质(heterogeneity):性质不同。
公卫执业医师考点:数值变量概述

公卫执业医师考点:数值变量概述公卫执业医师考点:数值变量概述数值变量概述:其变量值是定量的,表现为数值大小,可经测量取得数值,多有度量衡单位。
如身高(cm)、体重(kg)、血压(mmHgkPa)、脉搏(次/min)和白细胞计数(×109/L)等。
这种由数值变量的测量值构成的资料称为数值变量资料,亦称为定量资料。
大多数的数值变量为连续型变量,如身高、体重、血压等;而有的数值变量的测定值只能是正整数,如脉搏、白细胞计数等,在医学统计学中把它们也视为连续型变量。
数值变量和计数资料的区别:计量资料是由数值变量组成的、通过测定观察指标数值大小所获得的资料。
一般都有单位。
在临床科研中,收集的数据中往往包含了很多数值变量。
由这些变量组成的计量资料必须根据资料设计的特点,采取相应的'统计分析方法。
计量资料统计分析主要分为统计描述和统计推断。
统计描述主要描述资料的分布规律及其数量特征,如对资料进行集中趋势和离散趋势的描述,可以计算均数和标准差等。
统计推断主要是估计均数的可信限以及作假设检验,如均数95%可信区间的估计以及进行t检验、方差分析等。
计数资料是由分类变量组成的,是研究不同类别或属性中频数的多少或频率大小所获得的资料。
在临床科研中,收集的数据中往往包含了一些分类变量。
由这些变量组成的计数资料必须根据资料设计的特点,进行相应的统计学分析。
计数资料的统计分析主要分为统计描述和统计推断。
统计描述主要指可以计算相对数的指标,如率、构成比和相对比。
统计推断主要是估计相对数指标的可信限以及做假设检验,如率的95%可信区间的估计以及进行卡方检验等。
医学统计学的基本内容

医学统计学的基本内容
1
统计学是一门运用概率论和数理 统计的基本原理研究数据收集、整理 和分析的方法学,医学统计学方法是
统计学在医学领域中的应用。
2
主要内容
医学统计学的基本概念 统计资料的类型 医学统计工作的基本步骤 统计表与统计图
3
第一节
医学统计学的基本概念
一、同质和变异 二、总体与样本
Quantitative data 计量资料
Qualitative data 计数资料
等级资料 Rank data
变量的转化 不同类型的变量其统计处理方法 不同。在实际工作中,根据统计分析
的具体要求和研究目的,各种不同的
变量间可以互相转化。
23
三类资料间关系
例:一组2040岁成年人的血压(舒张压)
12
四、误差
误差(error):泛指观测值与真值之差。 随机误差:
在随机误差中,最重要的是抽样误差 ( sampling error )。抽样误差是抽样引起的样本 统计量与总体参数之间的差异。抽样误差有规律可 循,样本越大,抽样误差越小。
系统误差
过失误差
13
五、概率
概率 (probability):是描述某一随机事件发 生可能性大小的指标,常用P表示,取值范 围0≤P≤1。 小概率事件:统计学上把概率 P≤0.05 的事 件称为小概率事件。
所有观察单位某项观察值的集合。
分为有限总体和无限总体两类。
8
样本(sample): 是指从总体中随机抽取部分观察单位某 项指标实测值的集合。 由于直接研究总体通常是不可能的,故 一般采用抽样研究。 抽样(sampling): 从总体中抽取部分个体的过程称为抽样
卫生统计学数值变量资料的统计描述

加权法(weight method)
组段 (1) 99~ 102~ 105~ 108~ 111~ 114~ 117~ 120~ 123~ 126~ 129~ 合计
X=fXfX f n
表 3-3 某市 120 名 6 岁女孩身高(cm)均数的计算(加权法)
频数 f (2)
组中值 X (3)
fx (4)=(2)×(3)
求全距(range,R) ,R=129.5— 101.2=28.30(cm)
划分组段 确定组数 确定组距 确定各组段的上下限
列出频数表
组段 (1) 99~ 102~ 105~ 108~ 111~ 114~ 117~ 120~ 123~ 126~ 129~132 合计
表 3-2 频数 f (2)
100.00 -
30
身身
高
频
高 20
数
频
数
10
0
99 102 105 108 111114
117 120 123 126 129
身高(cm)
图3-2 某市120名6岁女孩的身高分布
频数分布两个重要特征
30
身
高
集中趋势
频
20
数
离散趋势 频数分布类型
10
0 99 102 105 108 111114 117 120 123 126 129 身高(cm)
乳牙数 (1)
频数 f (2)
频率(%) (3)
累计频数 (4)
0
2
1.67
2
1
4
3.33
6
2
7
5.83
13
3
9
7.50
22
4
14
医学统计学名词解释

医学统计学1、Medical Statistics(医学统计学):是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。
2、Variable(变量):是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示。
3、Numerical/Quantitative/Measurement date/variable数值变量/定量变量/计量资料/定量资料:是以定量的方式来表示观察单位某项观察指标的大小,所得的资料称之为~,有度量单位。
4、Unordered categorical/Qualitative/Enumeration date/variable无序分类变量/定性变量/计数资料/定性资料:是以定性的方式来表示观察单位某项观察指标,所得的资料称之为~,无固有度量单位。
5、Ordinal categorical/Semi-quantitative/Ranked date/variable有序分类变量/半定量资料/等级资料:是以等级的方式来表示观察单位某项观察指标,所得的资料称之为~,为半定量的观察结果,有大小顺序。
6、Homogeneity(同质):是指事物的性质、影响条件或背景相同或相近。
7、Variation(变异):是指同质的个体之间的差异。
8、Population(总体):是根据研究目的所确定的同质观察单位的全体或集合,分为有限总体和无限总体。
9、Sample(样本):是从总体中随机抽取的一部分观察单位所组成的集合。
10、Random variable(随机变量):是指取值不能事先确定的观察结果。
11、Parameter(参数):是总体特征的统计指标,采用小写的希腊字母,为固定的常数。
12、Statistic(统计量):是样本特征的统计指标,采用拉丁字母表示,由样本信息推算而得,是参数附近波动的随机变量。
13、Random Sampling(随机抽样):为了保证样本的可靠性和代表性,需要采用随机的抽样方法,使总体中每个个体均有相同的机会被抽到。
医学统计学概述数值变量

fX
f1 f2 ...... fm
f
式中f为各组的频数,x为各组的组中值。
二、几何均数 (geometric mean,G)
几何均数用G表示。适用于对数正态分布资料或 等比资料,例如抗体的平均滴度和平均效价。
计算方法: – 直接法:样本含量n较小时,选用此法。有n个观察
值X1, X2,……Xn,几何均数的计算公式为:
P≤0.05 小概率事件 发生的可能性很小
六、统计量与参数,statistic & parameter
–统计量:依据样本观察值所定出的量。如:样本均数、 样本标准差 、 样本率。
–参数:总体的统计指标数值。如:总体均数、总体标 准差、 总体率。
统计描述
数值变量的统计描述
频数与频数分布表 (frequency distribution)
计算方法
– 直接法:样本含量n较小时,可根据下式计算:
M X n1 2
M
X
n 2
X
n 2
1
2
n为奇数时
n为偶数时
某病患者5人潜伏期分别为2,4,6,7, 20,求中位数。本例n=5,为奇数
M X n1 X3 6 天 2
若上例在第25天又发现一例患者,患者数
增加为6名
M
X
(X )2
为了消除观察值的总个数 N的影响,将离均差平方 和除以N,这就是总体方 差,用σ2表示。
方差(variance)
2 (X )2
N
标准差
方差的单位是原度量单位(standard deviation)
(如kg)的平方,把总体方
差开平方,这就是总体标 准差,度量单位与原始观 察值一致,即
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学概述数值变量
医学统计学是医学领域中的重要学科,它为医学研究提供了有力的
工具和方法。
在医学统计学中,数值变量是一种常见的数据类型,用
于描述和分析各种医学现象和指标。
本文将概述医学统计学中的数值
变量概念、分类、测量和分析方法等内容。
一、数值变量的概念
数值变量是指在统计分析中,用数值表示且具有可比性的变量。
它
可以分为连续变量和离散变量两种类型。
连续变量是指取值可以是任意实数的变量,通常用于描述血压、体重、身高等连续性的生理指标。
这些指标可以在一定范围内连续变动,其取值可以是小数或整数。
离散变量是指取值只能是整数的变量,通常用于描述计数或计算次
数的指标,比如病例数、手术次数等。
离散变量的取值通常是有限的,而且不可分割。
二、数值变量的测量
为了能够准确地描述和分析数值变量,需要采用相应的测量方法。
数值变量的测量方法包括直接测量和间接测量。
直接测量是指通过测量工具直接获得变量的数值,比如使用体重秤
来测量体重、使用血压计来测量血压等。
直接测量可以精确地得到数
值变量的具体数值。
间接测量是指通过其他指标或计算方法得到数值变量的数值,比如通过身高和体重计算体质指数(BMI)。
间接测量可以在一定程度上估计数值变量的数值,但精确度不如直接测量高。
三、数值变量的描述统计分析
在医学统计学中,常用的数值变量的描述统计方法包括均值、中位数、标准差和百分位数等。
均值是指将所有观察值相加后除以观察次数,用来表示数值变量的平均水平。
均值可以反映一组数据的集中趋势,但容易受到极端值的影响。
中位数是指将一组数据按大小顺序排列后的中间值,用来表示数值变量的中间位置。
中位数不容易受到极端值的影响,更适合用于描绘有偏分布的数据。
标准差是指一组数据与其均值的偏离程度,用来表示数值变量的离散程度。
标准差越大,数据的离散程度越大。
百分位数是指将一组数据按大小顺序排列后,某一特定百分比所对应的数值。
常用的百分位数有25%分位数(第一四分位数)、50%分位数(中位数)和75%分位数(第三四分位数)等。
以上描述统计方法可以帮助研究者更好地理解和描述数值变量的特征和分布情况,为进一步的数据分析提供依据。
四、数值变量的推断统计分析
在医学研究中,常常需要根据样本数据推断总体的特征,这就需要
使用到推断统计分析方法。
常用的数值变量的推断统计分析方法包括
假设检验和置信区间估计等。
假设检验是指根据样本数据对总体的某个假设进行检验的方法。
通
过构建一个关于总体特征的假设,并计算观察到的样本统计量的概率,从而判断该假设是否成立。
置信区间估计是指根据样本数据给出总体特征的一个区间估计的方法。
通过计算观察到的样本统计量的可信区间,可以估计总体特征的
范围。
通过推断统计分析,能够对数值变量的总体特征进行推断,从而为
医学决策和研究提供科学依据。
五、结论
在医学统计学中,数值变量是一种常用的数据类型。
了解数值变量
的概念、测量和分析方法,能够更好地理解和分析医学数据。
通过数
值变量的描述统计和推断统计分析,可以揭示医学现象的规律和特征,为医学研究和临床实践提供科学依据。