描述性统计
描述性统计分析

一、什么是描述统计分析(Descriptive Analysis)概念:使用几个关键数据来描述整体的情况描述性数据分析属于比较初级的数据分析,常见的分析方法包括对比分析法、平均分析法、交叉分析法等。
描述性统计分析要对调查总体所有变量的有关数据做统计性描述,主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布、以及一些基本的统计图形。
Excel里的分析工具库里的数据分析可以实现描述性统计分析的功能。
描述性统计分析即是对数据源最初的认知,包括数据的集中趋势、分散程度以及频数分布等,了解了这些后才能去做进一步的分析。
二、常用指标均值、中位数、众数体现了数据的集中趋势。
极差、方差、标准差体现了数据的离散程度。
偏度、峰度体现了数据的分布形状。
1、均值。
均值容易受极值的影响,当数据集中出现极值时,所得到的的均值结果将会出现较大的偏差。
2、中位数:数据按照从小到大的顺序排列时,最中间的数据即为中位数。
当数据个数为奇数时,中位数即最中间的数,如果有N个数,则中间数的位置为(N+1)/2;当数据个数为偶数时,中位数为中间两个数的平均值,中间位置的算法是(N+1)/2。
中位数不受极值影响,因此对极值缺乏敏感性。
3、众数:数据中出现次数最多的数字,即频数最大的数值。
众数可能不止一个,众数不能能用于数值型数据,还可用于非数值型数据,不受极值影响。
4、极差:=最大值-最小值,是描述数据分散程度的量,极差描述了数据的范围,但无法描述其分布状态。
且对异常值敏感,异常值的出现使得数据集的极差有很强的误导性。
5、四分位数:数据从小到大排列并分成四等份,处于三个分割点位置的数值,即为四分位数,四分位数分为上四分位数(数据从小到大排列排在第75%的数字,即最大的四分位数)、下四分位数(数据从小到大排列排在第25%位置的数字,即最小的四分位数)、中间的四分位数即为中位数。
四分位数可以很容易地识别异常值。
箱线图就是根据四分位数做的图。
临床试验中常用统计分析方法

临床试验中常用统计分析方法在临床试验中,常用的统计分析方法有很多。
下面将介绍一些常见的统计学方法及其作用。
1.描述性统计:描述性统计是对试验数据进行整理和总结,以描述试验样本的特征和分布情况。
它包括了均值、标准差、中位数、百分位数、频率等指标的计算和展示。
2. 整体效应分析:整体效应分析用于评估治疗措施的总体效果。
其中,使用t检验可以比较两个样本的均值差异,配对t检验可以比较同一组样本在不同时间点的均值差异,方差分析可用于比较三个或三个以上组别的均值差异。
此外,如果存在荟萃分析(meta-analysis)数据,可以使用统计学的合并技术进行整体效应的定量分析。
3. 变量关联分析:变量关联分析用于评估两个或多个变量之间的关系。
相关系数可以用来度量两个变量之间的线性关系,如Pearson相关系数和Spearman等级相关系数。
此外,还可以通过回归分析来研究一个或多个自变量对因变量的影响。
4. 风险评估与预测:在临床试验中,风险评估和预测是一项重要的统计方法。
例如,Kaplan-Meier生存分析用于评估治疗组和对照组的生存曲线差异,Cox回归分析用于评估多个自变量对生存时间的风险影响。
5.随机性分析:随机性分析用于评估试验中的随机抽样过程是否满足预设的随机性要求。
例如,随机化完整性检查可用于检查随机分配的效果,查找可能的偏倚。
6.安全性分析:安全性分析主要用于评估药物或治疗措施的不良事件和副作用情况。
可以利用卡方检验或费希尔精确概率检验来比较不良事件在不同组别中的发生率。
以上是临床试验中常用的几种统计分析方法,不同的研究目的、研究设计和数据类型,可能需要采用不同的统计方法进行分析。
此外,临床试验中还可以使用一些高级的统计技术,如生存分析、荟萃分析和多个比较法等,以获得更详细和准确的研究结果。
统计学中的描述性统计分析方法

统计学中的描述性统计分析方法统计学是一门研究数据收集、整理、分析和解读的学科,它可以帮助我们更好地理解和解释数据。
描述性统计是统计学中的一个重要分支,旨在总结和揭示数据的基本特征。
在本文中,我们将介绍统计学中常用的描述性统计分析方法。
一、数据收集与整理描述性统计分析的第一步是数据收集,通过合适的调查问卷、实验或观察,我们可以获取所需的数据。
在数据收集完成后,我们需要对数据进行整理和准备,以便后续的分析。
二、测量指标在描述性统计中,我们常用各种测量指标来描绘数据的中心趋势、离散程度以及数据之间的关联性。
1. 中心趋势测量中心趋势测量用来反映数据集中的一个“典型值”。
(1)平均数(Mean):平均数是数据集中所有观测值的总和除以观测值的数量。
它可以用来衡量数据的总体情况。
(2)中位数(Median):中位数是将数据集按大小顺序排列后的中间值。
它可以忽略异常值的影响,更好地反映数据的中心位置。
(3)众数(Mode):众数是数据集中出现频率最高的值。
它在描述分类数据时特别有用。
2. 离散程度测量离散程度测量用来反映数据集的分散程度。
(1)标准差(Standard Deviation):标准差是数据集各个观测值与平均数之间的偏离度的平均值。
它反映了数据的总体分散程度。
(2)方差(Variance):方差是各个观测值与平均数之间偏离度的平方的平均值。
它是标准差的平方。
(3)极差(Range):极差是数据集中最大值与最小值之间的差值。
它可以用来衡量数据的全局范围。
三、数据可视化数据可视化是描述性统计分析中非常重要的一部分。
通过图表和图形的方式展示数据,可以使数据的特征更加直观地呈现出来。
1. 条形图(Bar Chart):条形图用于对比不同类别或组之间的数据差异。
2. 折线图(Line Chart):折线图可以展示变量随时间的变化趋势。
3. 饼图(Pie Chart):饼图适用于展示分类数据的比例关系。
4. 散点图(Scatterplot):散点图可以直观地显示两个变量之间的关系。
描述性统计分析

描述性统计分析【导言】在科学研究、市场调查、社会调查以及政策制定等各个领域中,描述性统计分析是一种重要的分析方法。
它主要通过对数据的整理、总结和分析,来描述数据的特征、分布和关系等。
本文将简要介绍描述性统计分析的概念和应用领域,并探讨其在实际问题中的意义和方法。
【一、描述性统计分析的概念】描述性统计分析是一种通过对数据的整理、总结和分析,来描述数据的特征、分布和关系等的方法。
它不仅可以帮助我们更好地理解数据,还可以从中发现问题和规律,为后续的分析和决策提供依据。
描述性统计分析主要包括数据的中心趋势度量、数据的离散程度度量和数据的分布特征等内容。
【二、描述性统计分析的应用领域】描述性统计分析在各个领域中都有广泛的应用,以下是几个常见的应用领域:1. 科学研究:在科学研究中,描述性统计分析可以帮助研究人员对实验数据进行整理和总结,发现数据中的规律和趋势,从而对研究对象进行深入的理解和解释。
2. 市场调查:在市场调查中,描述性统计分析可以帮助市场研究人员对市场数据进行整理和总结,了解产品的市场需求、消费者的购买行为和市场竞争情况,为市场营销活动提供科学依据。
3. 社会调查:在社会调查中,描述性统计分析可以帮助调查人员对社会问题的数据进行整理和总结,了解社会现象的普遍性和差异性,为制定社会政策提供参考依据。
4. 教育评估:在教育评估中,描述性统计分析可以帮助教育管理者对学生成绩、教学效果等数据进行整理和总结,洞察学生的学习状况和教育的质量问题,为教育改革提供参考依据。
【三、描述性统计分析的意义】描述性统计分析的意义主要体现在以下几个方面:1. 描述数据特征:通过描述性统计分析,我们可以对数据的中心趋势、离散程度等特征进行客观的量化和描述,从而更好地理解数据。
2. 发现问题和规律:通过描述性统计分析,我们可以发现数据中的异常值、缺失值等问题,从而及时采取措施进行修复;同时,还可以发现数据中的规律和趋势,为后续的分析和决策提供依据。
描述性统计和推论统计的区别及其应用

描述性统计和推论统计的区别及其应用在统计学中,主要有两种分析数据的方法:描述性统计和推论统计。
这两种方法各自有其应用场景和运用方法,以下将详细讨论这两种统计方法的区别及其应用。
一、描述性统计描述性统计是对收集到的数据进行汇总和分析,从而得出数据的特征。
主要包括以下指标:1. 频数分布频数分布是指统计数据中各个取值出现的频率。
例如,某个班级的考试成绩分布可以表示为“90分及以上的人数为3人,80分至89分的人数为5人,70分至79分的人数为10人...”,从中可以看出各个分数段的人数及其比例。
2. 中心趋势中心趋势是用以描述一组数据的“中心”位置,包括平均数、中位数和众数三种指标。
平均数是一组数据的总和除以数据的个数,中位数则是把数据按大小排列后,位于最中间的数;众数是出现次数最多的数。
3. 变异程度变异程度用以描述一组数据的差异性,包括范围、方差和标准差三种指标。
范围是最大值与最小值之间的差,方差和标准差则是对数据分布的离散程度进行量化。
4. 偏态与峰态偏态和峰态是用以描述数据分布形态的指标。
偏态是指数据分布向左或向右偏斜的程度,正态分布的数据是对称的。
峰态则是用以描述数据分布的峰度,正态分布的峰度为3。
描述性统计的应用场景十分广泛,包括社会研究、商业分析、医学研究等。
例如,在商业领域,描述性统计可以用于对市场调查数据的分析,从而了解目标用户的需求和喜好等信息。
二、推论统计推论统计是在收集到数据的基础上,通过对一部分数据进行推断,从而估计总体特征。
主要包括以下方法:1. 抽样抽样是指从总体中随机地选取一部分样本进行统计,以此来推断总体的特征。
抽样时需要注意样本的大小和抽样方式,以保证结果的准确性和可靠性。
2. 置信区间置信区间是用来估计总体特征的一个区间范围。
置信区间的范围越小,则估计结果越准确。
置信区间的计算可以利用正态分布或t分布进行。
3. 假设检验假设检验是用来检验某个假设是否成立的方法。
描述性统计与推断性统计

描述性统计与推断性统计统计学是一门研究数据收集、分析和解释的学科。
在统计学中,描述性统计和推断性统计是两个重要的概念。
描述性统计是对数据进行总结和描述的过程,而推断性统计则是通过对样本数据进行分析来推断总体特征的过程。
一、描述性统计描述性统计是对数据进行总结和描述的过程。
它主要通过计算和图表来展示数据的特征,包括中心趋势、离散程度和数据分布等。
常用的描述性统计方法包括平均数、中位数、众数、标准差、方差和百分位数等。
1. 中心趋势中心趋势是描述数据集中程度的统计指标。
常用的中心趋势指标有平均数、中位数和众数。
平均数是将所有数据相加后除以数据个数得到的结果,它可以反映数据的总体水平。
中位数是将数据按照大小排序后,位于中间位置的数值,它可以反映数据的中间位置。
众数是数据集中出现次数最多的数值,它可以反映数据的集中程度。
2. 离散程度离散程度是描述数据分散程度的统计指标。
常用的离散程度指标有标准差和方差。
标准差是数据偏离平均数的平均程度,它可以反映数据的离散程度。
方差是标准差的平方,它可以反映数据的离散程度。
3. 数据分布数据分布是描述数据在不同取值上的分布情况。
常用的数据分布指标有百分位数和频数分布表。
百分位数是将数据按照大小排序后,位于某个百分比位置的数值,它可以反映数据的分布情况。
频数分布表是将数据按照不同取值进行分类,并统计每个取值的频数,它可以反映数据的分布情况。
二、推断性统计推断性统计是通过对样本数据进行分析来推断总体特征的过程。
它主要通过假设检验和置信区间来进行推断。
假设检验是通过对样本数据进行统计推断,判断总体参数是否满足某个假设。
置信区间是通过对样本数据进行统计推断,估计总体参数的范围。
1. 假设检验假设检验是通过对样本数据进行统计推断,判断总体参数是否满足某个假设。
它包括设置原假设和备择假设、选择适当的检验统计量、计算检验统计量的值、确定拒绝域和做出推断等步骤。
常用的假设检验方法有单样本检验、双样本检验和方差分析等。
描述性统计简介

数理统计的基础知识
描述性统计简介
为了研究总体分布的性质,人们通过试验得 到许多观测值,这些数据一般都是杂乱无章的, 需对数据进行整理,并常借助表格或图形对数据 加以描述.数值型数据整理常用的方法是分组.
分组是指根据研究的需要,将数据分为不同 的组别.常用的数据分组为单项式分组和组距式 分组.其中,单项式分组只适用于离散变量,且 在变量较少的情况下使用;组距式分组常用于连 续变量或变量值较多的情况.
试画出这些数据的频率直方图.
数理统计的基为 组距 为
K 1 ln n 1 ln84 7 . ln 2 ln 2
(159.5 124.5) / 7 5 .
根据分组整理成频数分布表,如表 5-2 所示.
分组
频数 fi
频率 fi /n
124.5~129.5
数理统计的基础知识
描述性统计简介
分组的具体步骤如下.
第一步:确定组数.实际分组时,常根据以下经验公式来确定组
数K:
K 1 ln n 11.442 7ln n , ln 2
(5-7)
其中, n 为数据的个数.将式(5-7)的计算结果按四舍五入取整即为
组数.实际应用时,可根据数据的多少和特点及分析的要求,参考这
1
数理统计的基础知识
描述性统计简介
根据分组数据绘制频率直方图,如图 5-2 所示.
图 5-2
概率论与数理统计
第三步:根据分组整理成频数分布表, 绘制频率直方图.先数出落在每个小区间内
的数据的频数 fi ,再算出频率 fi /n ,最后从
左至右依次在各个小区间上作以 fi 为高
n 的小矩形,得到该数据的频率直方图.显然, 小矩形的面积就等于数据落在该小区间的
《描述性统计量》课件

要点二
详细描述
通过使用描述性统计量,企业可以对员工数据进行初步的 分析,了解员工的结构、分布和特点,为人力资源规划、 招聘、培训等工作的开展提供数据支持。
财务数据分析
总结词
在财务数据分析中,描述性统计量用于描述财务数据的 特征,如收入、支出、资产等。
详细描述
通过使用描述性统计量,企业可以对财务数据进行初步 的分析,了解财务状况的整体情况,发现财务数据的分 布规律和异常值,为财务决策和预算制定提供依据。
描述性统计量仅关注数据的表面特征,无法揭示数据之间的内在关系或模式。例如,两个变量之间的相关系数或因果 关系需要通过更复杂的统计方法来分析。
无法处理缺失数据
描述性统计量在处理缺失数据时可能会遇到困难。对于缺失的数据,可能需要采用插值、填充或删除等 方法进行处理,这些方法可能会影响结果的准确性和可靠性。
描述性统计量
• 描述性统计量的定义和作用 • 描述性统计量的种类 • 描述性统计量的计算方法 • 描述性统计量的应用场景 • 描述性统计量的优缺点分析 • 描述性统计量的未来发展趋势和展望
目录
Part
01
描述性统计量的定义和作用
定义
描述性统计量
描述数据分布特征的量数
1
,用于概括和描述数据的
集中趋势、离散程度和分
销售数据分析
总结词
在销售数据分析中,描述性统计量用于描述 销售数据的特征,如销售额、销售量、客户 数量等。
详细描述
通过对销售数据进行描述性统计量的分析, 企业可以了解销售业绩的整体情况,发现销 售数据的分布规律和异常值,为销售策略的
制定和优化提供依据。
人力资源数据分析
要点一
总结词
在人力资源数据分析中,描述性统计量用于描述员工数据 的特征,如员工数量、年龄、性别等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
描述性统计第一章描述性统计统计分析:包括统计描述和统计推断。
步骤:数据------ 描述性统计----- 统计推断data statistical description statistical inference统计描述:主要是描述样本的特征。
统计推断:参数估计,假设检验。
第一节变量与数据一、变量的类型:1. 连续型变量(计量资料):取值范围为实数轴上的一个连续区间。
如:身高体重脉搏血细胞计数计量资料(measurement data) : 连续型变量的观察值构成的资料。
2. 离散型变量(计数资料)只能在孤立的几个数中取值的变量。
如: 二值变量(binary variable)。
也称为类别变量(categorical variable) 或名义变量(nominal variable)。
如: 性别--- 男、女职业--- 工、农、商、学、兵计数资料(count data) : 离散型变量的频数资料。
3. 有序变量(等级资料)如: 疗效--- 无效、有效、显效、痊愈等级资料(ranked data):有序变量的频数资料。
二、数据的结构和特点:1. 基本观察单位:是按研究需要确定的采集数据的基本单位。
观察对象本身可以是一个基本观察单位,也可以同时具有若干个基本观察单位。
2. 记录项目:用于统计分析的记录项目通常由分组因素、反应变量和协变量三部分组成。
表1.1 100名高血压患者治疗后的临床记录患者编号年龄(岁) 性别治疗分组收缩压(kP a) 舒张压(kP a)心电图疗效判定1 37 男A药18.67 11.47 正常显效2 45 女对照20.00 12.53 正常有效……………………100 54 女B药16.80 11.73 正常有效第二节频数表与直方图统计描述包括:图表描述和指标描述。
频数表 (frequency table)与直方图 (histogram):形象直观描述。
1.频数表:离散型频数表:表1.2 108名病人中性别频数表类别频数频率(%) 累积频数累积频率(%)女 45 41.7 45 41.7男 63 58.3 108 100.0合计 108 100.0表1.3 108名病人中职业频数表类别频数频率(%) 累积频数累积频率(%)工 28 25.9 28 25.9农 23 21.3 51 47.2商 24 22.2 75 69.4学 18 16.7 93 86.1兵 15 13.9 108 100.0合计108 100.0连续型频数表:制作频数表的一般方法:例1.3某地随机抽取正常成年男子120名, 其红细胞计数值(1012/L)如下:5.12 5.13 4.58 4.31 4.09 4.41 4.33 4.58 4.24 5.45 4.32 4.844.915.14 5.25 4.89 4.79 4.90 5.09 4.04 5.14 5.46 4.66 4.20……4.70 4.28 4.375.33 4.78 4.75 5.39 5.27 4.896.18 4.13 5.22……4.83 4.11 3.29 4.18 4.13 4.06 3.42 4.68 4.525.19 3.70 5.51……试作该批样本的频数表。
(1) 求极差R:R=6.18-3.29=2.89(2) 确定组距i:通常分8-15个组,为方便计,取参考极差的十分之一, 再略加调整。
i= R /10=2.89/10=0.289≈0.30(3) 列出组段:第一组包括最小值,最后一个组段必须封口,并且包含最大值。
(4) 划记归组获得频数。
2. 直方图:离散型频数图—直条图对离散型变量, 可在横轴上等距离标出属性的各个类别或各类别所对应的变量值; 在横轴的相应位置上绘制垂直线段, 其高度反映各类别的频数(图1.1, 图1.2)。
连续型频数图—直方图102030405060700 1x1234551015202530y性别图 1.1 108名病人性别频数图 x :性别,0:女,1:男职业图 1.2 108名病人职业频数图 y :职业,1:工,2:农,3:商,4:学,5:兵频数频数对连续型变量, 可在横轴上等距离标出各组段的起始点, 在各组段上分别绘制长方形, 本例为等组距分组, 长方形高度等于频数, 如图1.3a 所示, 即令长方形的高度等于频数。
第三节 样本平均水平的度量5101520253.20 3.804.405.00 5.606.200.10.20.30.40.50.60.7 3.20 3.80 4.40 5.00 5.60 6.20(a )频数直方图 (b )频率密度直方图图1.3 据120名正常成年男子红细胞计数(1012/L )的频数表绘制频数频率密度红细胞记数红细胞记数数字描述,对连续型变量我们常着重描述两个特征:平均水平和变异性。
根据不同的分布规律可选取不同的指标来描述一组变异值的平均水平。
现介绍三种常用的指标。
1. 算术均数(arithmetic mean)适用情形:当样本值的频数直方图接近对称时, 能较好地代表其平均水平的指标是算术均数,简称均数 (mean, average),它是样本观察值的总和除以个体值数目。
(1)直接法:记各个体的观察值为n x x x ,,,21 ,算术均数为x , 则nx n x x x x ni i n∑==+++=121...(2)频数表法:当不掌握原始数据而只有频数表时, 可利用频数表来近似计算算术均数,称为频数表法。
通常取各组段的组中值作为该段的代表值。
用数学公式可表示为: i n i i i n i i x n f nx f x ∑=∑=⎪⎭⎫⎝⎛==11利用频数表计算的样本均数等于组中值的加权平均,权重系数为频数。
2. 几何均数(geometric mean):是将n 个观察值X 的乘积再开n 次方所得的根。
若对各观察值X 取对数,对数值均值的反对数即为G 。
适用情形:如果原始变量经对数转换后近似对称分布,适用几何均数。
常用于微生物学和免疫学指标。
一般地, 设样本中几个个体值均大于零, 记为n x x x ,,,21 , 几何均数记为g x , 则:g x ⎪⎭⎫ ⎝⎛+++=-n x x x n log ...log log log 211或n n g x x x x 21=几何均数的计算可参考算术均数的计算,唯一不同的是需要在计算前将变量取对数,最后将结果转换回其真值。
3. 中位数 (median):已知原始数据 ,由小到大排序,n x x x ,,,21 ,设某观察值,有50%的观察值小于它,有50%的观察值大于它,称该观察值为中位数。
适用情形:数据分布非对称的情形,开口资料。
例:1,1,2,2,3,4,6,9,10 ( n = 9, 为奇数) M d = 第5位 = 3一般, M d = 第 [ n (.50%)05 ]位例: 1 , 1 , 2 , 2 , 3 , 4 , 6 , 9 , 10 , 13( n=10, 为偶数) M d = 第5位和第6位的平均 = (3+4)/2 一般, M d =第 n (50%) 位和其后一位的平均第四节 样本变异性的度量例:三组同年龄﹑同性别儿童体重(kg )数据如下: 甲组 26 28 30 32 34 乙组 24 27 30 33 36 丙组 26 29 30 31 34平均数仅描述了一组数据的集中趋势,由于变异的客观存在,需要一类指标描述资料的离散趋势。
两者结合使用才能对数据进行全面的统计学描述。
常用的指标:极差或全距,四分位数间距,方差与标准差,变异系数1. 极差或全距R:极差= 最大值-最小值2. 四分位数间距Q:Q = 75% 分位数-25% 分位数3. 方差与标准差:充分利用全部个体的信息。
离均差= 个体值-总体均数= μx-i离均差之和=0 ∑( 离均差)2σ=∑ ( 离均差 )2的平均总体方差2总体标准差σ总体均数常不知道,用样本均数x代替μ离均差 = 个体值 -样本均数 = x x i -( 离均差 )2 = 22221)()()(x x x x x x n -++-+- (变小了!)样本方差:1)(1)(1)(1)()()(2212222212--=--=--=--++-+-=∑∑∑=n x x n x x n x x n x x x x x x s ii n i i n(让分母也变小)其中,n-1 称为自由度。
样本标准差s : 1)(2--=∑n x x s计算公式 : 1/)(22--=∑∑n nx x s iii i4. 变异系数 (coefficient of variation , CV )CV xs=例 : 均数 标准差 变异系数 青年男子身高 170 cm 6 cm 0.035 体重 60 kg 7 kg 0.117第五节 相对数与率的标准化一、比、频率和强度:1. 比 (ratio) :任两个量之比值。
例: 新生儿性别比 = 男性新生儿数 / 女性新生儿数 体块指数 = 体重 / ( 身高 )22. 频率 (frquency) :是一种特定形式的比, 分子和分母都是计数值, 而分子又是分母的一部份。
对于一份随机样本,当分母适当大时, 频率近似地描述某事件在总体中发生的机会。
例如, 医治100例病人, 90例痊愈, 则%9010090===治疗人数治愈人数治愈率频率没有量纲, 可表示为[0,1]区间上的百分比或小数。
3. 强度(intensity):是另一种特殊类型的比,分母是一定时期内总的观察人-年,分子是该时期内某事件的发生数。
例如, 某年死亡率 (mortality rate)的定义为:的人年数该年内暴露于死亡危险该年内死亡人数某年死亡率=分子的量纲为“人”, 分母的量纲为“人⨯年”, 死亡率的量纲为“人/(人⨯年)”或“1/年”。
如果分子看作是“校正的总人数⨯1年”,则死亡率可以看作是一年内校正的死亡频率。
一般来说,强度可以理解为“单位时间内的频率”,它反映单位时间内某事件发生的机会。
因为不同性质的相对数所适用的统计方法有所不同,如欲就某个相对数通过样本推断总体, 则需认清该相对数究竟属于哪一种类型:只是一个简单的比,还是反映机会大小的频率, 还是既反映机会又有时间量纲的强度。
二、标准化方法:某病两种疗法治愈率的比较病情甲疗法乙疗法病人数构成比治愈数治愈率(%) 病人数构成比治愈数治愈率(%)轻40 0.40 36 90.0 60 0.60 54 90.0 重60 0.60 42 70.0 40 0.40 28 70.0 合计100 1.00 78 78.0 100 1.00 82 82.0 上表甲乙疗效比较,何者治愈率高?病情甲疗法乙疗法病人数治愈率预期治愈数病人数治愈率预期治愈数轻50 90.0 45 50 90.0 45重50 70.0 35 50 70.0 35合计100 80 100 80假设甲乙病情相同,病情构成相同时,合计治愈率相同为了得出相互对比的正确结论,一是病情轻重之间相互比较,二是对两疗法病情轻重人数构成进行标准化处理。