02定量资料统计描述
第二章--定量资料的统计描述

分类变量(名义变量 分类变量 名义变量) 名义变量 定性变量 有序变量(等级变量 有序变量 等级变量) 等级变量
变量
离散型变量 定量变量 连续型变量 统计描述: 统计描述:用统计图表或计算统计指标的方法表达一个特定群 这个群体可以是总体也可以是样本)的某种现象或特征, 体(这个群体可以是总体也可以是样本)的某种现象或特征, 称为统计描述。 称为统计描述。 统计描述可以使人们对资料有一个大致的了解, 统计描述可以使人们对资料有一个大致的了解,为进一步的统 计分析打下基础。 计分析打下基础。
图2-1 某地96名妇女产前检查次数频率分布 某地96名妇女产前检查次数频率分布 96
30 25 20
频率(%)
15 10 5 0 0 1 2 3 4 产前检查次数 5 >5
横坐标为产前检查 横坐标为产前检查 频率, 次数,纵坐标为频率 次数,纵坐标为频率, 即产前检查k次的妇 即产前检查 次的妇 女在被统计妇女中所 占的比例(%) 占的比例( ) 从表2-1和图 和图2-1可 从表 和图 可 以看出, 以看出,产前检查次 数为4次或 次或5次的孕妇 数为 次或 次的孕妇 数目最多, 数目最多,不检查或 检查次数很多的孕妇 不多, 不多,产前检查很多 次的孕妇也不多。 次的孕妇也不多。
与表2-2相比, 与表 相比,直方图可以更直观 相比 地表达出血清铁数据在各组段的分 布情况。 布情况。
三、频率分布表(图)的用途 频率分布表( (一)揭示资料的分布类型 1、对称分布 集中位置位于中央,左右两侧频数对称。 集中位置位于中央,左右两侧频数对称。
12 10 频 率 密度 (%) 8 6 4 2 0 7 9 11 13 15 17 19 血清铁 21 23 25 27 29
定量资料的统计描述解析

第一节 频数分布表与频数分布图
统计描述是统计分析的最基本内容,也 是统计分析的重要一部分.在统计学中经常 用统计指标和统计图表来揭示和反映原始 资料的数量特征和信息.
频数分布表
➢ 用于反映各变量(观察单位的某种特征)值及其 相应频数之间关系的一类表格,我们称之为频 数表.这里频数指对一种变量在多个观察单位 中进行多次观察,其中某一变量值重复出现的 次数.
数表法两种。
(1)直接法 当观察例数 n 不大时,此法常用。
先将观察值按大小顺序排列,选用下列公式
求 M。
当 n 为奇数时
为偶数时
M=
X
n 2
X
n 1 2
2
例 某病患者 8 人的潜伏期(天)分别为 2,3,3,4,7,8, 10,18,求它们的中位数。
本例 n=8 为偶数,将 8 人潜伏期从小到大排列,用公式算 得
➢ 不同的资料类型编制频数表难易程度不同,其 中计数资料和等级资料比较简单,而计量资料 相对较繁杂些.
计量资料频数表的编制
一般情况下,样本含量小于30的统计资料 无须编制频数表,但对于大样本含量的资料, 编制频数表有利于进一步的统计分析、且频 数表本身也具有统计描述的作用.
编制频数表的步骤
一般 8- 15 之间
3、方差(variance) 离均差平方和的算术平均数,即为方差。总体方差用
符号σ2(σ读seigama)表示,样本方差用S2表示。计算公 式分别为:
N
xi 2
2 i1
N
n
xi
X
2
S 2 i1
n 1
4、标准差(standard deviation) 方差的平方根即为标准差。总体标准差用σ表示,
研究生统计学讲义第2讲第3章定量资料的统计描述

现在我们把 X 转换为标准正态变量,因为μ=100, σ=10,所以
u X 90 100 1.0
10
因此90分能够用平均值下的1个标准差表示,见图 右图
P (X < 90)=P ( u <-1.0 )
附表3从u=0.00到u=4.99以增量0.01编成标准正态分布 的CDF表,沿着表的左边按所给u的一个小数找到u ,再从表的顶端找到u的第二位小数,在表内主要部
x2=78.6g/L时,u2 = (78.6-73.8)/3.9=1.23
2.查标准正态曲线下面积表(附表3):u= -0.46时 ,在表的左侧找到-0.4,在表的上方找到0.06,二者相 交处为0.3228,标准正态曲线下,横轴上u值小于- 0.46的面积为Ф(-0.46)= P(U<-0.46)=32.28%,即标 准正态变量u值小于-0.46的概率为32.28%;同样查 得u=1.23时,标准正态曲线下,横轴上u值小于1.23的 面积为Ф(1.23) =P(U<1.23)= 0.8907,即u值小于1.23的 概率为89.07% 。
图3.16左边μ=100,σ=10,X≥125 右边μ=0,σ=1, u≥2.5,注意刻度不同
只有0.62%的得分将是125或更高.
补例2 假设女高血压患者舒张压大约集中在100mmHg
,标准差是16mmHg ,血压是正态分布.求:
1.P (X<90) 2.P (X>124) 3.P (96<X<104) 4.求
2.中位数M (Median)
中位数M是排序观察值的中间值.当一组数据按照 从小到大的顺序排列起来时,值的深度d=(n+1)/2, 是它相对于极端值(末端)所在的位置.它不是由全 部观察值综合计算出来的,而是由居中位置的观察值 所决定,因此它不受个别特小或特大的观察值的影响 ,应用范围较广。
第二章 定量资料的统计描述 1-4节

fx x f
0
1 7 3 9 .... 1 29 2228 18.57( μ m ol/ L) 1 3 .... 1 120
2、几何均数(geometric mean,G)
有研究者测定8人血清的抗体效价分别为 1:200,1:25,1:400,1:800,1:50,1:100, 1:50,1:25,求平均抗体滴度。该研究者用倒 数求均数,得平均抗体低度为1:206.25。 1)资料的类型? 2)该研究者对资料的描述是否正确? 3)如何描述该资料的集中趋势?
第二章
定量资料的统计描述
第一节 频率分布表与频率分布图
频率分布表(frequency distribution table):
整理原始数据的一种工具,用来表示数据 各观察值在不同取值区间出现的频数分布情 况。 频数分布表: 显示数据分布的范围、分布最集中的区间 和分布形态。
一、离散型定量变量的频率分布 例2-1 某年某山区96名孕产妇产前检查次 数资料如下: 0,3,2,0,1,5,6,3,2,4,1,0,6,5….4,7 试编制产前 检查次数的频率分布表
(1)直接法:直接将所有原始观察值相加, 再除以总例数。
x1 x2 ..... xn x n
x
i 1
i
n
(2 1)
例2-3 某年某医院女性晚期肺癌患者红 细胞计数(1012/L)为4.20,6.43,2.08, 3.45, 2.26,4.04,5.42,3.38。试求其算术均 数。
1.描述变量的分布类型 1)对称分布 2)偏态分布 (1)正偏态分布:峰向左侧偏移 (2)负偏态分布:峰向右侧偏移 2.揭示变量的分布特征 集中趋势:频数向中间组段集中, 离散趋势:由中间组段向两侧,频数逐渐 减少 3.便于发现某些离群值或极端值 4.便于进一步计算统计指标和统计分析
卫生统计学第二章定量资料的统计描述

正确答案: E
答案解析:标准差反映观察值的变异程度,标准误反映抽样误差的大小,根据其计算公式可知总体标准差一定时,增大样本例数会减小标准误。在应用中,标准差用于参考值范围的估计,而标准误用于可信区间的估计。
做答人数:1
做对人数:0
题号: 12 本题分数: 2
下列说法正确的是
A. 计量资料都服从或近似服从正态分布
B. 正态分布曲线下,横轴上,从均数μ到μ+1.96倍标准差的面积为97.5%
C. 对数正态分布是原资料的对数值服从正态分布
D. 医学参考值范围一定要定为95%或99%
E. 标准正态分布曲线下中间90%的面积所对应的横轴尺度μ的范围是-∞到+1.645
求正常人某个指标的参考值范围,在理论上要求
A. 正态分布不能用均数标准差法
B. 正态分布不能用百分位数法
C. 偏态分布不能用均数标准差法
D. 偏态分布不能用百分位数法
E. 对称分布不能用百分位数法
正确答案: C
答案解析:制定医学参考值范围一般有两种方法:正态分布法(均数标准差法)和百分位数法。正态分布法适用于正态分布或近似正态分布资料;百分位数法适用于任何类型的资料,但满足正态分布的资料多采用正态分布法。
答案解析:任意正态分布经过标准化变换:u=(x-μ)/σ,可转换为μ=0,σ=1的标准正态分布。由于其位置参数和形态参数均为常数,因此它的曲线是唯一的。
做答人数:1
做对人数:1
所占比例: 100%
题号: 11 本题分数: 2
对于偏峰分布资料且测量值过高才有临床意义,95%单侧正常值范围可定
医学统计学课件:02_统计描述(定量定性)

中位数(median,M)
将一组观察值从小到大按顺序排列,居于中心位置 的数值。在全部观察值中有半数的值比M大,另有半数 的值比M小。 适用于当大部分观测值比较集中,少数观测值偏向 一侧时;或资料分布情况不清楚时;或数据的最大值
(最小值)无准确测量数据时。如传染病的潜伏期。任
何分布的定量数据均可用中位数描述其分布的集中趋势, 使用范围广。
2003年4月22日全国SARS发病人数频数表
发病地区 北京 山西 广东 河北 内蒙 天津 广西 其他省市 频数 105 16 14 6 3 2 1 0 频率/% 71.4 10.9 9.5 4.1 2.0 1.4 0.7 0.0 累积频数 105 121 135 141 144 146 14移,向右侧拖尾
负偏态(左偏态)
峰向右偏移,向左侧拖尾
集中趋势的特征值
—— 平均水平的度量
算术均数(arithmetic mean,M)
适用于正态分布和近似正态分布的资
料。
总体均数用µ表示;样本均数用 x 表示。
直接计算法
将所有观察值直接相加再除以观察值的个数。
f i lg X i f1 lg X 1 f 2 lg X 2 f n lg X n 1 lg G lg f f i i
1
频数表资料的几何均数
抗体滴度 ⑴
人数,f ⑵
滴度倒数,X ⑶
lgX ⑷
f· lgX ⑸
累积频率/%
71.4 82.3 91.8 95.9 98.0 99.3 100.0 100.0
合计
147
100.0
某药物疗效的频数表
治疗效果 治愈 频数 65 频率/% 43.3 累积频数 65
统计学方积乾 第七版 第二章 定量资料的统计描述课后练习题答案
第2章 定量资料的统计描述案例2-1(P27)答:该资料为一正常人群发汞值的检测结果,已整理成频率分布表(P27)。
统计描述时应首先考察资料的分布规律,通过频率(频数)分布表(表2-9 P27)和直方图(图2-3 P14)可以看出,此238人发汞值的频数分布呈正偏态分布,即观察值绝大多数集中在发汞值较小的组段。
对偏态分布,选用算术均数和标准差进行统计描述是不恰当的。
应选用中位数描述该市居民发汞平均水平,选用四分位间距描述居民发汞值变异度,计算如下:25507523.5(23825%20) 4.7(mol/kg)6625.5(23850%86) 6.6(mol/kg)6027.5(23875%146)8.9(mol/kg)48(%)x xL xiP L n x f f P u P u P u离散程度指标:四分位间距=P75-P25=8.9-4.7=4.2umol/kg。
故该市居民发汞平均水平为6.6 umol/kg,离散度为4.2umol/kg,思考与练习(P31)1.答:(1)某年某地120例6-7岁正常男童胸围测量结果(cm)的频数分布(2)Descriptive StatisticsN Range Min Max Mean Std. Deviation 胸围120 12.7 49.1 61.8 55.120 2.3188(3) 利用频数分布表数据计算均数和标准差0149.5161.56623.01112055.19(cm)fX X f∑=∑⋯⨯++⨯==⋯++=(4)………..S 2.33(cm)=255075153.0(12025%19)53.58(cm)19155.0(12050%56)55.29(cm)14156.0(12075%70)56.77((cm)26%)x x L xiP L n f f P x P P2.答:该资料最大值为一不确定值,根据此特点,宜用中位数和四分位间距进行统计描述.M=16.5(天) P25=15(天) P75=20(天) Q=20-15=5(天)3.答:根据资料中血凝抑制抗体滴度指标呈等比数列变化的特点,计算其平均滴度应选用几何均数,由于是频数表资料,故用加权法计算几何均数。
02-医学统计学定量数据的统计描述
X为组段的组中值。 X=(组段上限+组段下限)/2
【例】120名健康男性居民血清铁含量的频数分布表,试求 其算术均数。
组段 频数 组中值 6~ 1 7 8~ 3 9 10~ 6 11 12~ 8 13 14~ 12 15 16~ 20 17 fX 7 27 66 104 180 340 组段 频数 组中值 18~ 27 19 20~ 18 21 22~ 12 23 24~ 8 25 26~ 4 27 28~30 1 29 fX 513 378 276 200 108 29
概 述 平均数(average),是描述一组观察值集中位置或 平均水平的统计指标,常作为一组数据的代表值用于 分析和进行组间的比较。 常用的有算术均数、几何均数、中位数、百分位 数等。
算术均数 算术均数(arithmetic mean),等于一个变量所有观 察值的和除以观察值个数。 总体均数用希腊字母μ表示,样本均数用符号 X 表示。 算术均数适用于对称分布的资料,如分布均匀的小 样本数据或近似正态分布的大样本数据。 算术均数易受极端值的影响,并且受极大值的影响 大于受极小值的影响。
n为总频数。
【例】52例慢性肝炎患者的HBsAg滴度数据表,试求其 几何均数。
抗体滴度 1:16 1:32 1:64 1:128 1:256 1:512 合计 频数 2 7 11 13 12 7 52 滴度倒数 16 32 64 128 256 512 lgX 1.20412 1.50515 1.80618 2.10721 2.40824 2.70927 f (lgX) 2.40824 10.53605 19.86798 27.39373 28.89888 18.96489 108.06977
中位数 中位数(median,M),是在按大小顺序排列的变 量的所有观察值中,位于正中间的一个或两个数值。 当数据呈偏态分布、或频数分布两端无确定数值, 均宜采用中位数描述集中趋势。 中位数的确定取决于它在数据序列中的位置,因此 对极端值不敏感。
定量资料的统计描述
1.集中趋势 (算术)平均数: 几何均数: 中位数:
2.离散趋势 全距: 四分位数间距: 离均差平方和: 方差: 标准差: 变异系数:
3.正态分布 特征: (P16) 应用 估计频率分布
确定医学参考值范围
4.t 分布
(正态近似法和百分位数法)
质量控制 理论基础 特征: (P22) 应用 区间估计 假设检验
(P42)
Ni N
p NNi pi
标准组选取方法 有代表性的
(P42)
两组合并 择其一
定量资料(计量资料)统计推断
一、定量资料的参数估计 (P23)
1.点估计: X
2.区间估计 σ未知,n较小: Xt.SX
σ已知: Xu.X
σ未知但n足够大:
Xu.SX
二、定量资料的假设检验 (P26)
t
检验
单个样本t检验:
3. yˆ 的含义( P138或见讲义) 。
4.回归与相关的区别和联系(见讲义) 5.等级相关的适用范围(P147)。 6.直线回归的应用(P142~ P143 )。
统计表与统计图
1.统计表的分类(P255) 2.统计表的编制要求(P253) 3.统计表的改错(P255)
4.常用统计图的适用条件及要求
(P256 ~ P259 )
基本概念(见讲义)
1.总体和样本(P3) 2.参数和统计量(见讲义)
3.变异(见讲义)
4.抽样误差(见讲义) 5.概率(P4) 6.样本含量(P3) 7.定量资料(P4) 8.定性资料(P4)
9.正偏态分布(P8) 10.负偏态分布(P8) 11.中位数(P11) 12.百分位数(P13) 13. 医学参考值范围(P18) 14.统计推断(P20) 15. 标准误(P22) 16.参数估计(P23)
定量资料统计描述和正态分布
变异系数
变异系数
标准差与平均数的比值,用于比较不同组数据的离散程度。
计算方法
标准差除以平均数。
意义
变异系数越大,说明数据的离散程度越大;变异系数越小,说明数 据的离散程度越小。
03
正态分布
正态分布的中,正态分 布是极其重要的,因为大部分的定量变量都服从或近似服从正态分布。
定量资料统计描述和正态 分布
• 引言 • 定量资料统计描述 • 正态分布 • 定量资料统计描述与正态分布的关系 • 实例分析 • 总结与展望
01
引言
主题简介
定量资料统计描述
对数值型数据进行的统计描述,包括 数据的集中趋势、离散趋势和分布形 态等。
正态分布
一种常见的概率分布,其特点是数据 呈现钟形曲线,且具有三个特征值: 均值、方差和标准差。
平均数与正态分布的关系
平均数是一组数据的总和除以数据的个数,用于描述数据的 集中趋势。在正态分布中,平均数与分布的对称轴重合,表 示数据的中心位置。
正态分布是一种常见的概率分布,描述了许多自然现象的概 率分布形态。在正态分布中,数据值以平均数为中心,向两 侧逐渐减少,呈现对称分布。
标准差与正态分布的关系
02
定量资料统计描述
平均数
平均数
表示一组数据的总体“平均水平”的统计量。
计算方法
将一组数据相加后除以数据的个数。
类型
算术平均数、调和平均数、几何平均数等。
中位数
中位数
将一组数据从小到大排列后,位于中间位置的 数。
特点
不受数据中极端值的影响,可以反映数据的中 心位置。
应用场景
当数据量较大或数据分布偏态时,中位数更有代表性。
它是一种钟形曲线,特征是“中间大,两头小”,即大部分数据都集中在均值附近, 极端值较少。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
离散型定量变量的频数分布
离散型定量变量(discrete variable)通常 是指取值不连续的定量变量,通常只能取 数轴上的整数值。 例如受检次数、新生儿数、手术病人数等 例2-1:1998年某山区96名孕妇产前检测 次数数据
频数分布表 (frequency table)
检查次数
0 1 2 3 4 5 >5 合计
算术均数(arithmetic mean)
算术均数(μ总体均数 ,x 样本均数)简称均 数,在已知各观察单位具体变量值时,可以采 用直接法计算,公式如下:
X1 X 2 X n X n
X
i 1
n
i
n
算术均数(arithmetic mean)
测得8只正常大鼠血清总酸性磷酸酶(TACP)含量 (U/L)为:4.20、6.43、2.08、3.45、2.26、4.04、 5.42、3.38;求其品均水平。 解
K 1 lg n (k为 组 数 , 为 样 本 含 量 ) n lg 2
确定组距:组距是一个组的下限与下一个组段下限之 差,可根据全部数据的最大值和最小值及所分的组数 来确定,即组距=Int [( 最大值 - 最小值)÷ 组数 ] 列出组段:第一组段的下限略小于最小值,最后一个 组段上限必须包含最大值 统计出各组的频数并整理成频数分布表
凌乱的原始数据
4.09 4.88 4.20 4.54 4.27 5.36 4.81 4.35 4.50 4.67 5.33 4.31 4.13 4.68 5.10 4.18 3.84 5.26 4.92 6.18 5.62 4.12 3.94 4.48 5.78 4.33 4.17 5.04 4.13 4.37 4.63 5.33 4.41 4.40 5.12 4.84 4.85 5.38 5.05 5.40 5.18 4.40 5.26 4.76 3.60 4.74 3.29 4.93 5.14 4.15 4.27 4.79 4.66 4.81 4.01 4.60 4.91 5.41 5.05 4.08 5.07 3.92 5.29 4.57 4.75 4.76 4.45 4.52 5.17 4.71 3.60 5.46 5.23 4.97 5.80 4.58 4.43 3.86 4.55 4.12 3.31 4.81 5.58 3.94 6.01 4.34 4.99 4.99 5.42 4.79 5.32 5.09 3.53 5.48 5.50 4.72 4.49 4.24 5.70 4.89
请问教务处是否满意我的报告?
一、集中趋势(central tendency)
1. 同质的群体中数据向其中心值靠拢的倾向和程度 2. 测量集中趋势就是寻找数据水平的代表值或中心 值,该值通常称为:平均数 3. 不同类型的数据用不同的集中趋势测量值 4. 常见的平均数指标有:算术均数、几何均数、中 位数、众数与调和均数
(0.1+0.6+0.2)/3=0. 3,他的平均收益为30%
发展速度的“平均值”
如果每年获利30%,则三年后的资金总额为 10万 ×(1+0.3)3=2197000元 第一年末拥有的资金为原始的1.1倍 第二年末拥有的资金为原始的1.1×1.6倍 第三年末拥有的资金为原始的1.1×1.6×1.2倍; 所以第三年末拥有资金100万× 1.1×1.6×1.2 =2112000元
(4.20 6.43 2.08 3.45 2.26 4.04 5.42 3.38) x f 3.908 (U/L)
算术均数(arithmetic mean)
求120名健康成年男性 的平均血清铁含量 资料来源于整理后的 频数表,无法取得原 始数据 采用加权法计算加权 均数,作为算术均数 的近似值
12
20 27 18 12 8 4 1 120
10.00
16.67 22.50 15.00 10.00 6.67 3.33 0.83 100.00
30
50 77 95 107 115 119 120 —
25.00
41.67 64.17 79.17 89.17 95.83 99.17 100.00 —
120名正常成年男子血清铁含量(mmol/L)频数表
组段 6~ 8~ 10~ 12~ 频数 1 3 6 8 频率(%) 0.83 2.50 5.00 6.67 累计频数 1 4 10 18 累计频率(%) 0.83 3.33 8.33 15.00
14~
16~ 18~ 20~ 22~ 24~ 26~ 28~30 合计
偏态分布1:老年人生存质量自评分
400
300
人 数
200
100
0 0 10 20 30 40 50 60 70 80 90 100
自评分
偏态分布2: 乳腺癌患者的生存时间
第二节:定量变量的特征数
教务处得到卫生统计学成绩报告如下:
该班级共有学生130名,参加考试130名 成绩分布于55~95之间 成绩好坏比例基本相等
120名正常成年男子血清铁含量(mmol/L)频数图 (直方图histogram)
30
数 频
26
20
20 18
10 8 6 3 0 7. 0 9. 0 11. 0 13. 0
12
12
8
4
15. 0
17. 0
19. 0
21. 0
23. 0
25. 0
27. 0
29. 0
血清铁(umol/L)
120名正常成年男子血清铁含量(mmol/L)频数图 (直方图histogram)
24~
26~ 28~30 合计
8
4 1 120
25
27 29 —
200
108 29 2228
算术均数(arithmetic mean)
直接法计算的均数为:18.60849 加权法计算的均数为:18.56667 二者十分接近;可见加权法计算的结果是 对直接法的良好近似;而且加权法的计算 较直接法稳定、快速。
算术均数(arithmetic mean)小结
1. 它是一组数据的均衡点所在;集中趋势的 最常用指标 2. 易受极端值的影响 3. 用于定量数据,不能用于分类数据和等级 数据 4. 适用于服从正态或近似正态计量资料(对 称分布)的集中趋势描述
抗体滴度的“平均值”
7名慢性迁延性肝炎患者的HBsAg滴度资料为:1:16、1:32、1:32、 1:64、1:64、1:128、1:512,求平均滴度? 解:先将滴度取倒数,用算术均数的直接法计算求得,倒数的平均数 约为121.14,所以平均滴度约为1:121 是否合理? 如果将1:512去除,则平均滴度变化为1:39;可见去除一个极端数据, 算术均数将有巨大变化;比1:121大的有5个数据,而比它小的只有2 个,而且大多数的数据在1:100以内,所以看来1:121不合适!
第二讲:定量资 料的统计描述
如何展示个体变异的规律性?
个体变异(individual variation)是同质观察对象间表现出的 差异。 变异是生物体在一种或多种、已知或未知的不可控因素作 用下所产生的综合反映。 就每个观察单位而言,其观察指标的变异是不可预测的,或 者说是随机的(random)。 就总体而言,个体变异是有规律的。 如何展示这种规律性?——借助频数分布表与频数分布图
第一节:频数分布
由于个体变异的存在,医学研究得到的原始数据 (raw data)往往是庞大的,但也不是杂乱无章的, 而是有一定规律的,呈一定的分布(distribution) 频数分布表的基本思想:将原始数据按照一定的 标准划分为若干各组,合计各组数据的个数(频 数),得到频数分布表;在将频数表绘制成频数 分布图。通过它们探寻数据的分布规律。
人耳刚刚能够感觉到声音强度稍微超过 10-12 W/m2(听阈),所能承受的最大强度为1W/m2(痛 阈),求该范围的中心值 (10-12+1)/2≈0.5W/m2 0.5W/m2转换为分贝数为117dB,而人耳的痛阈约 为120dB!
直接法算术均数是加权均数的一个特例
算术均数(arithmetic mean)
组段 6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 频数 1 3 6 8 12 20 27 18 12 组中值 7 9 11 13 15 17 19 21 23 频数×组中值 7 27 66 104 180 340 513 378 276
几何图形边长的“平均值”
已知矩形边长为4和1,求平均边长 已知立体图形长、宽、高分别为4、1、2,求 平均边长
几何图形边长的“平均值”
矩形平均边长为 a 1 4 2 立体图形平均边长为 a 3 1 2 4 2
发展速度的“平均值”
假设某投资者拥有资金100万元,第一年他取得10 %的收益,第二年为60%,第三年为20%,求三 年来的年均收益?
分布形态(distribution mode)
就总体而言,血清铁变异是有规律的。 变异规律的体现:血清铁取值通常满足一定的概率分 布(Probability distribution) 何为概率分布? 我的最爱的刀鱼分布在长江下游水域 熊猫分布在温暖多雨的山区,尤以中国西南部 随机事件中变量取值与出现概率的关系 分布形态具体指概率分布的对称程度,以及概率分布的高 低
连续型定量变量的频数分布
连续型定量变量(continuous variable)通 常是指取值连续的定量变量,可以取数轴 上的任意数值。 例如身高、体重、血压、血清胆固醇值等 例2-2:某地120名18-35岁健康男性居民 血清铁含量(mmol/L)数据