第四章 数据特征与统计描述
统计学习题_第四章_数据分布特征的描述习题答案

统计学习题_第四章_数据分布特征的描述习题答案第四章静态指标分析法(⼀)⼀、填空题1、数据分布集中趋势的测度值(指标)主要有、和。
其中和⽤于测度品质数据集中趋势的分布特征,⽤于测度数值型数据集中趋势的分布特征。
2、标准差是反映的最主要指标(测度值)。
3、⼏何平均数是计算和的⽐较适⽤的⼀种⽅法。
4、当两组数据的平均数不等时,要⽐较其数据的差异程度⼤⼩,需要计算。
5、在测定数据分布特征时,如果M M e X 0==,则认为数据呈分布。
6、当⼀组⼯⼈的⽉平均⼯资悬殊较⼤时,⽤他们⼯资的⽐其算术平均数更能代表全部⼯⼈⼯资的总体⽔平。
⼆.选择题单选题:1.反映的时间状况不同,总量指标可分为()A 总量指标和时点总量指标B 时点总量指标和时期总量指标C 时期总量指标和时间指标D 实物量指标和价值量指标2、某⼚1999年完成产值200万元,2000年计划增长10%,实际完成了231万元,超额完成( )A 5.5%B 5%C 115.5%D 15.5%3、在同⼀变量数列中,当标志值(变量值)⽐较⼤的次数较多时,计算出来的平均数()A 接近标志值⼩的⼀⽅B 接近标志值⼤的⼀⽅C 接近次数少的⼀⽅D 接近哪⼀⽅⽆法判断4、在计算平均数时,权数的意义和作⽤是不变的,⽽权数的具体表现()A 可变的B 总是各组单位数C 总是各组标志总量D 总是各组标志值 5、1998年某⼚甲车间⼯⼈的⽉平均⼯资为520元,⼄车间⼯⼈的⽉平均⼯资为540元,1999年各车间的⼯资⽔平不变,但甲车间的⼯⼈占全部⼯⼈的⽐重由原来的40%提⾼到了60%,则1999年两车间⼯⼈的总平均⼯资⽐1998年()A 提⾼D 不能做结论 6、在变异指标(离散程度测度值)中,其数值越⼩,则()A 说明变量值越分散,平均数代表性越低B 说明变量值越集中,平均数代表性越⾼C 说明变量值越分散,平均数代表性越⾼D 说明变量值越集中,平均数代表性越低7、有甲、⼄两数列,已知甲数列:07.7,70==甲甲σX ;⼄数列:41.3,7==⼄⼄σX 根据以上资料可直接判断( )A 甲数列的平均数代表性⼤B ⼄数列的平均数代表性⼤C 两数列的平均数代表性相同D 不能直接判别8、杭州地区每百⼈⼿机拥有量为90部,这个指标是()A 、⽐例相对指标B 、⽐较相对指标C 、结构相对指标D 、强度相对指标9、某组数据呈正态分布,计算出算术平均数为5,中位数为7,则该数据分布为() A 、左偏分布 B 、右偏分布 C 、对称分布 D 、⽆法判断10、加权算术平均数的⼤⼩() A 主要受各组标志值⼤⼩的影响,与各组次数多少⽆关; B 主要受各组次数多少的影响,与各组标志值⼤⼩⽆关; C 既与各组标志值⼤⼩⽆关,也与各组次数多少⽆关; D 既与各组标志值⼤⼩有关,也受各组次数多少的影响11、已知⼀分配数列,最⼩组限为30元,最⼤组限为200元,不可能是平均数的为() A 、50元 B 、80元 C 、120元 D 、210元12、⽐较两个单位的资料,甲的标准差⼩于⼄的标准差,则()A 两个单位的平均数代表性相同B 甲单位平均数代表性⼤于⼄单位C ⼄单位平均数代表性⼤于甲单位D 不能确定哪个单位的平均数代表性⼤ 13、若单项数列的所有标志值都增加常数9,⽽次数都减少三分之⼀,则其算术平均数() A 、增加9 B 、增加6 C 、减少三分之⼀ D 、增加三分之⼆ 14、如果数据分布很不均匀,则应编制 ( )A 开⼝组B 闭⼝组C 等距数列D 异距数列 15、计算总量指标的基本原则是:( )A 总体性B 全⾯性16、某企业的职⼯⼯资分为四组:800元以下;800-1000元;1000—1500元;1500以上,则1500元以上这组组中值应近似为 ( )A1500元 B 1600元 C 1750元 D 2000元 17、统计分组的⾸要问题是 ( )A 选择分组变量和确定组限B 按品质标志分组C 运⽤多个标志进⾏分组,形成⼀个分组体系D 善于运⽤复合分组18、某连续变量数列,其末组为开⼝组,下限为200,⼜知其邻组的组中值为170,则末组组中值为 ( )A 230B 260C 185D 215 19、分配数列中,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,这种分布的类型是 ( )A 钟型分布B U 型分布C J 型分布D 倒J 型分布 20、要了解上海市居民家庭的开⽀情况,最合适的调查⽅式是:() A 普查 B 抽样调查 C 典型调查 D 重点调查21、已知两个同类企业的职⼯平均⼯资的标准差分别为5元和6元,⽽平均⼯资分别为3000元,3500元则两企业的⼯资离散程度为 ( )A 甲⼤于⼄B ⼄⼤于甲C ⼀样的D ⽆法判断 22、加权算术平均数的⼤⼩取决于 ( )A 变量值B 频数C 变量值和频数D 频率23、如果所有标志值的频数都减少为原来的1/5,⽽标志值仍然不变.那么算术平均数 ( ) A 不变 B 扩⼤到5倍 C 减少为原来的1/5D 不能预测其变化 24、计算平均⽐率最好⽤ ( )A 算术平均数B 调和平均数C ⼏何平均数D 中位数25、若两数列的标准差相等⽽平均数不同,在⽐较两数列的离散程度⼤⼩时,应采⽤ ( ) A 全距 B 平均差 C 标准差 D 标准差系数26、若n=20,∑∑==2080,2002x x ,标准差为 ( )A 2B 4C 1.5D 327、已知某总体3215,3256==eMM,则数据的分布形态为( )A左偏分布 B 正态分布 C 右偏分布 D U型分布28、⼀次⼩型出⼝商品洽谈会,所有⼚商的平均成交额的⽅差为156.25万元,标准差系数为14.2%,则平均成交额为( )万元A11 B 177.5 C 22.19 D 8826、欲粗略了解我国钢铁⽣产的基本情况,调查了上钢、鞍钢等⼗⼏个⼤型的钢铁企业,这是()A普查B重点调查C典型调查D抽样调查多选题:1.某企业计划2000年成本降低率为8%,实际降低了10%。
统计学第4章数据特征的描述

极差计算简单,但容易受到极端值的影响,不能全面 反映数据的离散程度。
四分位差
定义
四分位差是第三四分位数与第 一四分位数之差,用于反映中
间50%数据的离散程度。
计算方法
四分位差 = 第三四分位数 第一四分位数
优缺点
四分位差能够避免极端值的影 响,更稳健地反映数据的离散
程度,但计算相对复杂。
方差与标准差
统计学第4章数据特征 的描述
https://
REPORTING
• 数据特征描述概述 • 集中趋势的度量 • 离散程度的度量 • 偏态与峰态的度量 • 数据特征描述在统计分析中的应用 • 数据特征描述的注意事项
目录
PART 01
数据特征描述概述
REPORTING
WENKU DESIGN
数据特征描述在推断性统计中的应用
参数估计 假设检验 方差分析 相关与回归分析
基于样本数据特征,对总体参数进行估计,如点估计和区间估 计。
通过比较样本数据与理论分布或两组样本数据之间的差异,对 总体分布或总体参数进行假设检验。
研究不同因素对总体变异的影响程度,通过比较不同组间的差 异,分析因素对总体变异的贡献。
定义
方差是每个数据与全体数据平均数之方根,用于衡量数据的波动大小。
计算方法
方差 = Σ(xi - x̄)² / n,标准差 = √方差
优缺点
方差和标准差能够全面反映数据的离散程度,且计算相对简单,但容易受到极端值的影响。同时,方差 和标准差都是基于均值的度量,对于非对称分布的数据可能不够准确。
适用范围
适用于数值型数据,且数据之间可能 存在极端异常值的情况。
特点
中位数不受极端值影响,对于存在极 端异常值的数据集,中位数能够更好 地反映数据的集中趋势。
第4章 数据的概括性度量(数据特征的描述PPT课件

满意
45
270
非常满意
30
300
合计
300
—
解:QL位置= (300)/4 =75 QU位置 =(3×300)/4 =225
从累计频数看, QL在“ 不满意”这一组别中; QU 在“一般”这一组别中。因 此
QL = 不满意 QU = 一般
18.08.2020
22
数值型数据的四分位数
9个家庭的人均月收入数据
离散程度 (离中趋势)
离散程度:反映各数据远离中心的趋势
18.08.2020
5
分布形状 (偏态和峰态)
分布形状:反映数据分布的偏态和 峰态
18.08.2020
6
数据分布特征的测度
数据特征的测度
集中趋势
众数 中位数 均值
18.08.2020
离散程度
分布的形状
异众比率 四分位差 方差和标准差 离散系数
Mi
成交额 (元)
Mi fi
成交量 (公斤)
fi
甲 1.20 18000 15000 乙 0.50 12500 25000 丙 0.80 6400 8000
合计 — 36900 48000
解:由公式
Hm
Mi fi Mi fi
Mi fi
fi
Mi
所以 H m
成交额
成交额 批发价格
36900 0.769(元) 48000
调和平均数:是均值的另一种表现形式。 它易受极端值的影响。
计算公式为:
Hm
Mi fi Mi fi
Mi fi fi
Mi
18.08.2020
31
例题分析:调和平均数
【例4.10】某蔬菜批发市场三种蔬菜的日成交数 据如下表,计算三种蔬菜该日的平均批发价格.
《医学统计学》统计描述 (1)

2500 2500 2500 420
500 500 500
甲 乙丙
例4-9,etc
1.极差(Range) (全距)
符号:R 意义:反映全部变量值的
R X max X min
变动范围。
580
优点:简便,如说明传染病、
560 540
食物中毒的最长、最短潜 520
伏期等。
500
缺点:1. 只利用了两个 极端值
表2-2 115名正常成年女子血清转氨酶(mmol/L)含量分布
转氨酶含量
人数
12~
2
15~
9
18~
14
21~
23
24~
19
27~
14
30~
11
33~
9
36~
7
39~
4
42~45
3
人数
25
20 15
10 5
0
13.5 19.5 25.5 31.5 37.5 43.5. 血清转氨酶(mmol/L)
图2-2 115名正常成年女子血清转氨酶的频数分布
lg 表示以10为底的对数;
lg 1表示以10为底的反对数
X 0,为正值 (0,负数?)
几何均数的适用条件与实例
适用条件:呈倍数关系的等比资料或对数正态分 布(正偏态)资料;如抗体滴度资料
例 血清的抗体效价滴度的倒数分别为:10、
100、1000、10000、100000,求几何均数。
XG
lg1
图 2-3 101 名 正 常 人 血 清 肌 红 蛋 白 的 频 数 分 布
2. 描述计量资料的分布特征
①集中趋势(central tendency):变量值集中 位置。本例在组段“4.7~4.9”。
统计学原理第4章:数据特征的描述

第四章 数据特征的描述
某公司400名职工平均工资计算表 单位:元
按月工资 组中值 职工
分组
x
人数
f
x f
比重(%)
f
f
①
②
③ ④=②×③ ⑤=③÷ 400
1100以下 1000
60
60000
15
1100-1300 1200 100 120000
25
1300-1500 1400 140 196000
35
分组
职工 人数
f
x f
①
1100以下 1100-1300 1300-1500 1500-1700 1700以上
②
1000 1200 1400 1600 1800
③ ④=②×③
60
60000
100 120000
140 196000
60
96000
40
72000
人数为权数
x x f f
544000 400
算术平均数、调和平均数、中位数、众数、几何平均数
3. 各种平均数的Excel操作
24/77
1. 集中趋势的含义
第四章 数据特征的描述
集中趋势是一组数据向其中心值靠
拢的倾向和程度
测度集中趋势就是寻找数据一般水
平的代表值或中心值
中心值 即:平均水平
▲
25/77
2. 集中趋势的度量方法
第四章 数据特征的描述
第四章 数据特征的描述
《统计学原理》(第3版)
第四章 数据特征的描述
学习目标
第一节 总量与相对量的测度 第二节 集中趋势的测度 第三节 离散程度的测度
2/77
第一节 总量与相对量的测度
第四章数据特征与统计描述

0
13.5 19.5 25.5 31.5 37.5 43.5. 血清转氨酶(mmol/L)
图2-2 115名正常成年女子血清转氨酶的频数分布
左偏态分布(负偏态分布):
左侧的组段数多于右侧的组段数,频数向左侧拖 尾。
表4- 101名正常人的血清肌红蛋白(g/mL )含量分布
肌红蛋白含量 0~ 5~ 10~ 15~ 20~ 25~ 30~ 35~ 40~ 45~50
P100(max) P75
P50(中位数) P25
P0(min)
Px
:QD=QR/2
频数表资料的百分位数
Px 所在组段下限值 组距 (n x% 至该下限值的累计频数)
所在组段下限值至上限值间的频数
Px
Li
(n
x% fL ) fm
(n x% fL )
i; fm
组段 (1) 2.30~ 2.60~ 2.90~ 3.20~ 3.50~ 3.80~ 4.10~ 4.40~ 4.70~ 5.00~ 5.30~ 5.60~5.90 合计
频数 f (2) 1 0 0 0 17 20 17 12 9 0 0 8 101
4.便于进一步做统计分析和处理
第二节 计量资料的常用统计指标
资料类型 计数和等级 计量
组段
频数
观察结果的所有 分类
根据观察结果重 新划分
相同类别出现的 次数
分组统计
P44 表4-1,4-2,4-3
表4-3
编号 1 2 3 4 5 6 7 8 …
某地150名正常成年男子红 细胞数(1012/L)
红细胞数 3.98 4.54 4.74 5.13 4.43 4.81 4.98 3.79
《医学统计学》第四章定性资料的统计描述

1、不要把构成比与率相混淆。即分析时不能以构成 比代率;这是常见的错误。
某文章作者根据上述资料认为,沙眼在20~组的患病率最高,以后随年 龄增大而减少。该作者把构成比当作率进行分析,犯了以比代率的错误。
2、使用相对数时分母不宜过小。分母过小时相对数 不稳定。
3、注意资料的可比性;
不同时期、不同地区、不同条件下的资料比较时应注意具有 可比性。
12965.2
46.3
否
265
660291.4
40.1
说明该地市区非吸烟女性饮酒者的肺癌发病率是
非吸烟女性不饮酒者的1.15倍。
3.比数比
比数比( Odds ratio ,OR) : 常用于流行病学
中病例-对照研究资料,表示病例组和对照组中的 暴露比例与非暴露比例的比值之比,是反映疾病 与暴露之间关联强度的指标。其计算公式为
一般的,两个地方的出生率、死亡率、发病率、不同级别 医院某病的治愈率等不能直接比较。
无可比性的实例:
由表2-7可见,无论有无腋下淋巴结转移,省医院的5年生存 率均高于市医院,但从总生存率看,省医院的5年生存率低于市 医院。这不符合常理。因此,省医院与市医院的总生存率就不能 直接比较(标准化后再比)。
感谢聆听
率
某事物或现象发生的实 际数 某事物或现象发生的所 有可能数
比例基数
公式中的“比例基数”通常依据习惯而定。
需要注意的是,率在更多情况下是一个具有时间 概念的指标,即用于说明在某一段时间内某现象 发生的强度或频率,如出生率、死亡率、发病率 、患病率等,这些指标通常是指在1年时间内发 生的频率。
例4-1 某单位在2009年有3128名职工,该单位 每年对职工进行体检,在这一年新发生高血压 病人12例,则
练习题答案04

第四章数据特征与统计描述练习题一、最佳选择题1. 编制频数表时,分组数目一般取()。
A. 5~10组B. 8~15组C. 10~30组D. 15~20组E. 越多越好2. 描述一组正态分布资料的离散程度,以()指标较好。
A. 极差B. 离均差C. 标准差D. 离均差平方和E. 变异系数3. 描述一组正态分布资料的集中程度,以()指标较好。
A. 算术均数B. 几何均数C. 中位数D. 四分位数E. 百分位数4. 对成倍增长的计量资料描绘其集中趋势,宜用()。
A. 算术均数B. 几何均数C.中位数D.方差E.百分位数5. 若比较身高、身体质量资料的变异度,宜用()。
A. 标准差B. 离均差C. 四分位数间距D. 变异系数E. 极差6. 调查某地中学生的近视情况,若描述近视学生的年龄分布可用A. 普通线图B.直方图C.半对数线图D.圆图E.条图7. 比较某地区解放以来三种病的发病率在各年度的发展速度,宜绘制()。
A. 普通线图B.百分条图C.半对数线图D.圆图E. 条图8. 欲表示某地区2003年SARS病人的职业构成,可绘制()。
A. 单式条图B.圆图C. 直方图D.线图E. 散点图二、问答题1.统计描述主要从哪几个方面发现和描述数据特征?2.频数表的主要用途有哪些?3.算术均数、几何均数和中位数各有什么适用条件?4.标准差有何用途?5.变异系数与标准差有何异同?6.应用相对数应注意些什么?7.简述统计表的主要结构。
8.简述统计图的主要结构。
三、计算题1.某市110名健康女大学生血清总蛋白(g/L)测量资料如下:110名健康女大学生血清总蛋白含量(g/L)(1)编制频数分布表并绘制直方图,简述其分布特征。
(2)计算均数与中位数。
(3)计算标准差和变异系数。
2.某防疫站对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度资料如下,试计算其平均滴度。
抗体滴度1:8 1:16 1:32 1:64 1:128 1:256 1:512 合计例数 2 6 5 10 4 2 1 30 3.50例链球菌咽峡炎患者的潜伏期如下,试计算均数、中位数、几何均数,并说明何者的代表性较好。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
---------------------------------------------------------------最新资料推荐------------------------------------------------------ 第四章数据特征与统计描述第四章数据特征与统计描述1/ 105本章结构? ???第一节第二节第三节第四节频数分布表与频数分布图计量资料的常用统计指标计数资料的常用统计指标统计图表---------------------------------------------------------------最新资料推荐------------------------------------------------------ 第一节频数分布表与频数分布图3/ 105一、频数分布表 (frequency table)用途:用于描述资料的分布特征频数:在一批样本中,相同情形出现的次数称为该情形的频数。
资料类型计数和等级计量组段观察结果的所有分类根据观察结果重新划分频数相同类别出现的次数分组统计P44 表4-1,4-2,4-3---------------------------------------------------------------最新资料推荐------------------------------------------------------ 表4-3 某地150名正常成年男子红细胞数(1012/L)编号红细胞数12 3 4 5 6 73.984.54 4.74 5.13 4.43 4.81 4.98编号… 143 144 145 146 147 148红细胞数… 4.67 5.40 5.29 4.77 5.38 5.158 …3.79 …1491504.645.195/ 1051. 频数表的编制步骤(1)求极差(range):即最大值与最小值之差,又称为全距。
本例极差: R=5.88-3.79=2.09(1012/L)(2)决定组数、组段和组距:根据研究目的和样本含量n确定。
组距=极差/组数,通常分10-15 个组,为方便计,组距参考极差的十分之一, 再略加调整。
本例i= R /10=2.09/10=0.209≈0.2。
---------------------------------------------------------------最新资料推荐------------------------------------------------------ (3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。
(4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。
7/ 105组段(1)3.7~频数,f (2)1组中值,X (3)3.8fX (4)= (2)×(3)3.83.9~4.1~ 4.3~411 174.04.2 4.416.046.2 74.84.5~4.7~ 4.9~ 5.1~ 5.3~ 5.5~ 5.7~5.9 合计2632 26 18 10 4 1 1504.64.8 5.0 5.2 5.4 5.6 5.8119.6153.6 130.0 93.6 54.0 22.4 5.8 719.8---------------------------------------------------------------最新资料推荐------------------------------------------------------ 三、频数分布图P479/ 105二、频数表和频数分布图用途1.描述频数分布的类型* (1)对称分布:若各组段频数的分布以频数最多的组段为中心左右两侧大体对称(总体则完全对称),就认为该资料是对称分布 (图4-2) (2)偏态分布:---------------------------------------------------------------最新资料推荐------------------------------------------------------ ?右偏态分布(正偏态分布):频数最多组段右侧的组段数多于左侧的组段数,高峰向左偏移,频数向右侧拖尾。
表4- 115名正常成年女子血清转氨酶(mmol/L)含量分布人 2 9 14 23 19 14 11 9 7 4 3 数转氨酶含量 12~ 15~ 18~ 21~ 24~27~ 30~ 33~ 36~ 39~ 42~4511/ 105252015人数105013.519.525.531.537.543.5.血清转氨酶(mmol/L)图2-2 115名正常成年女子血清转氨酶的频数分布---------------------------------------------------------------最新资料推荐------------------------------------------------------ ?左偏态分布(负偏态分布):左侧的组段数多于右侧的组段数,频数向左侧拖尾。
表4- 101名正常人的血清肌红蛋白( ?g/mL )含量分布肌红蛋白含量 0~ 5~ 10~ 15~ 20~ 25~ 30~ 35~ 40~ 45~50 人 2 3 7 9 10 22 23 14 9 2 数13/ 10525 20人数15 10 5 0 2.5 12.5 22.5 32.5 42.5 52.5 血清肌红蛋白(μ g / m L)图 2-3 101 名正常人血清肌红蛋白的频数分布---------------------------------------------------------------最新资料推荐------------------------------------------------------ 2. 描述计量资料分布的集中趋势和离散趋势①集中趋势(central tendency):变量值集中位置。
本例在组段“4.7~”。
——平均水平指标②离散趋势(tendency of dispersion):变量值围绕集中位置的分布情况。
离“中心”位置越远,频数越小;且围绕“中心”左右对称。
——变异水平指标15/ 1053.便于发现一些特大或特小的可疑值*组段 (1) 2.30~ 2.60~2.90~ 3.20~ 3.50~ 3.80~ 4.10~ 4.40~ 4.70~ 5.00~5.30~ 5.60~5.90 合计频数 f (2) 1 0 0 0 17 20 17 12 9 0 0 8 101---------------------------------------------------------------最新资料推荐------------------------------------------------------ 4.便于进一步做统计分析和处理17/ 105第二节计量资料的常用统计指标? ?描述集中趋势的特征数描述离散趋势的特征数---------------------------------------------------------------最新资料推荐------------------------------------------------------ 计量资料(定量资料、数值变量资料)总体:有限或无限个(定量)变量值样本:从总体随机抽取的n个变量值:X1,X2,X3,……,Xnn为样本例数(样本大小、样本含量)19/ 105一、描述集中趋势的特征数(平均指标)总称为平均数(average)反映了资料的集中趋势( central tendency )。
常用的有: 1. 算术均数(arithmetic mean),简称均数 (mean) 2. 几何均数(geometric mean) 3. 中位数 (median)---------------------------------------------------------------最新资料推荐------------------------------------------------------ 1. 均数(mean)符号:总体 ? 样本 X 适用条件:资料呈对称分布,尤其是正态或近似正态。
计算: X 1 ? X 2 ? ? ? X n ?X 例4-2 (1)直接法 X ? ? (2)频数表法 f1 X 1 ? f 2 X 2 ? f3 X 3 ? ? ? f k X k ?fX i X? ? f1 ?f 2 ? f3 ? ? ? f k ?fiΣ为求和符号,读成sigma,k, X , f 意义“权数” 例4-nn21/ 105p49,例4-3:均数=719.8/150=4.8---------------------------------------------------------------最新资料推荐------------------------------------------------------ 2. 几何均数(geometric mean)X G ? n X1 X 2 ? X n 1 ? lg X lg X G ? (lg X 1 ? lg X 2 ? ? ? lg X n ) ? n n lg X ?1 ? 几何均数:变量 X G ? lg n 对数值的算术均 lg 表示以10为底的对数;数的反对数。
lg 表示以10为底的反对数 X ? 0,为正值?123/ 105几何均数的适用条件与实例适用条件:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如抗体滴度资料例血清的抗体效价滴度的倒数分别为:10、100、1000、10000、100000,求几何均数。
? lg 101 ? lg 102 ? lg 103 ? lg 104 ? lg 105 ? ? ? 1000 G ? lg ?1 ? ? ? 5 ? ? 此例的算术均数为22222,显然不能代表滴度的平均水平。
同一资料,几何均数<均数---------------------------------------------------------------最新资料推荐------------------------------------------------------G ? lg?1频数表资料的几何均数 ? ? f lg X ? ? f lg X ? f lg X ? ? ?f ? ? ? lg ? ? ?f ? ? ?f ? ? ?i i ?1 1 1 2 2 i inlg X n ? ? ? ?f· lgX⑸ 0.6021 4.5155 7.2246 3.0102 ┇ 13.5465 72.2471抗体滴度⑴ 1:4 1:8 1:16 1:32 ┇ 1:512 合计人数,f ⑵ 1 5 6 2 ┇ 5 72lgX 滴度倒数,X ⑶ ⑷ 4 0.6021 8 0.9031 16 1.2041 32 1.5051 p51,例4-5:几何┇ ┇ 512 2.7093 均数=反对数(72.2471/40)= 64.0025/ 1053. 中位数(median)意义:中位数是将一批数据从小至大排列后位次居中的数据值,反映一批观察值在位次上的平均水平。