第一单元 计量资料的统计描述
第一单元计量资料的统计描述
【习题】
分析计算题
某医院神经科用火焰原子吸收光谱法测定了102名男性脑卒中患者头发中微量元素锌(Zn)的含量(μg/g),资料如下:
4087105113121%
127133142152168215
5488105113~
121127134143153173220
6192106&
113122127135143153176
7494、
107114124128136143155177
77{
94107116124128137145156180
—
8095109117124128138147156182
、
8196109119125130138147163? 183
8297111119125130138149?163186
83102112120126131140*
151166188
85105112120126132`
141151168195
(1) 编制频数表并绘制直方图,简述频数分布类型和频数分布特征。
(2) 计算适当的集中趋势指标和离散程度指标。
某医院神经科用火焰原子吸收光谱法测定了102名男性脑卒中患者头发中
微量元素铜(Cu)的含量(μg/g),资料如表1,求男性脑卒中患者头发中微量元素铜的平均含量。
表1 102名男性脑卒中患者头发中微量元素铜(Cu)的含量/(μg·g-1)频数表
头发中铜的对数值~
频数f
0~1
0~2
0~4
0~3
0~"
18
0~36
0~22
0~6
0~3
0~:
3
0~04
合计102
某年某地一次伤寒暴发潜伏期的分布情况如表2,计算该年伤寒暴发的
平均潜伏期。
表2 某年某地一次伤寒暴发潜伏期频数表
潜伏期/d(
发病人数f
3~3
5~24
7~20
9~17
11~&
14
13~7
15~6
17~2
19~1
21~23.
2
合计96
测得566名成年男子的心率及血压情况如表3,试比较这些指标的离散程度。
表3 566名成年男子的心率及血压
指标X S
心率/(次·min-1)|
收缩压/kPa
舒张压/kPa
脉压差/kPa《
根据1999年某大学的体检资料,得该校312名一年级女大学生的平均
身高X=㎝,标准差S=㎝,请据此资料:
(1) 计算其95%频数范围。
(2) 试估计该校一年级女大学生身高在~㎝范围内的人数。
(3) 试估计该校身高低于152㎝一年级女大学生所占比例。
最佳选择题
(1) 下列指标中可以用来描述计量资料的离散程度。
a. X
b. G
c. M
d. R
e. 75P
《
(2) 偏态分布资料宜用 来描述其集中趋势。 a. X b. S c. M d. CV e. 2S
(3) L U Q Q -排除了有序数列两端各 的观察值的影响。 a. 5% b. 10% c. 15% d. 20% e. 25% (4) 离散程度指标中,最容易受极端值影响的是 。 a. R b. S c. CV d. 2S e. L U Q Q - (5) 可用于比较坐高与头围的变异度。 a. R b. S c. CV d. 2S e. L U Q Q -
(6) 频数分布两端无确切值的资料,宜用 来描述其分布的集中趋势。 a. X b. G c. M d. R e. 2S
《
(7) 两组同质资料,若甲组X 小于乙组X ,但甲组S 大于乙组S ,则 。 a. 甲组X 代表性较好 b. 甲组X 代表性较差 c. 两组X 一样大 d. 两组S 一样大 e. 无法判断
(8) 分布的资料,X 等于M 。
a. 对称
b. 正偏态
c. 负偏态
d. 偏态
e. 正态 (9) 用X 和S 可以全面描述 分布资料的分布特征。 a. 正态 b. 对称 c. 正偏态 d. 负偏态 e. 任何计量资料
复习思考题
】
均数、中位数、几何均数的适用范围有何异同 同一资料的标准差是否一定小于均数
极差、四分位数间距、标准差、变异系数的适用范围有何异同
【习题解答】
分析计算题
解:
(1) 编制频数表,绘制直方图
1) 频数表的编制
①求全距X min=40,X max=220,全距R=220-40=180(μg/g)
…
②划分组段n=102,拟分10组;组距=R/组数=180/10=18(μg/g),确定各组段的上下限,见表。
③统计各组段频数。
表102名男性脑卒中患者发锌含量的频数分布
组段/(μg·g-1)频数f频率/%累计频数累计频率/% 40~2% 2
58~24
76~9; 13
94~1528
112~28, 56
130~2177
148~11;88
166~997
184~3{ 100
202~2202102
合计102` --
2) 绘制直方图,见图。
图 102名男性脑卒中患者发锌含量的频数分布
3) 本资料频数分布范围为40~220μg/g ;集中分布在94~、112~、130~、148~组段,其中112~组段的频数分布最多;从中央向两侧频数逐渐减少,左右基本对称。
(2) 由上述分析可知,本资料呈单峰对称分布,近似正态,故选用X 作为描述集中趋势的指标,以S 作为描述离散程度的指标。
用加权法求均数:
(
==
102
2
2113193267249?+?+???+?+?=
∑n
fX
X (μg/g )
由频数表得∑=fX 13152,∑=2fX 1801182,代入公式:
()2
2
2
()1
13152180118210232.301021fX fX n S n -=
=
--
-∑∑
=(μg/g )
SPSS操作
数据录入:
打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量x和标签Zn;再点击Data View标签,录入数据(见图,图。
图Variable View窗口内定义要输入的变量x和标签Zn
?
图Data View窗口内录入数据
分析:
Graphs Histogram
Variable:Zn[x] 要描述的变量是x,Zn是标签
OK
Analyze Descriptive Statistics Descriptives
Variable[s]:Zn[x]
OK
-
解:本题为对数正态分布资料,应采用几何均数描述其集中趋势。
令发铜含量为X ,发铜对数值为lg X
111
lg lg (
)10.400020.500094.4lg ()=lg 8.42(/)
12102f X G f
g g μ--=?+?+???== ?++??∑∑-…+4 1.4000…+4
即男性脑卒中患者头发中铜含量的几何均数为μg/g 。 SPSS 操作 数据录入:
打开SPSS Data Editor 窗口,点击Variable View 标签,定义要输入的变量logx 和f ;再点击Data View 标签,录入数据(见图,图。
&
图 Variable View 窗口内定义要输入的变量logx 和f
图 Data View 窗口内录入数据
分析:
Data
Weight Cases
Weight Cases by
Frequency Variables : f 权重为f OK
;
Analyze
Descriptive Statistics
Descriptives
Variable[s]: logx 描述变量logx OK
注:将结果中的mean 求反对数,就可以得到几何均数。
解:本资料为偏态分布资料,宜用中位数来描述其集中趋势。
()M L M 2
(50%)9 9650%47 9.1217
i M L n f f =+
?-=+?-=∑天 即该年该地伤寒暴发潜伏期的中位数约为天。
注:由于本题无原始数据,不宜用统计软件计算中位数。
:
解:本资料是比较计量单位不同的多个指标的离散程度,宜用变异系数来描述,
根据公式%100?=
X
S
CV ,计算结果见表。 表 566名成年男子的心率及血压的离散程度比较
指标 X
S
CV /%
心率/(次·min -1)
《
收缩压/kPa 舒张压/kPa 脉压差/kPa
*
由变异系数可见,脉压差的离散程度最大,其次是心率,而舒张压和收缩压的离散程度较小。
解:(1) 95%频数范围即95%的医学参考值范围,根据题意,得
下限: 1.96 158.0 1.96 6.5145.26X S -=-?=cm 上限: 1.96 158.0 1.96 6.5170.74X S +=+?=cm
即该校一年级女大学生身高的95%频数范围为, cm 。
%
(2) 本题为非标准正态分布,需先进行标准化变换。由于312例为大样本,
可用样本均数X 和样本标准差S 作为总体均数μ和总体标准差σ的点估计值,得
11156.5158.0
0.236.5X u μ
σ--=
==-
22159.2158.00.186.5X u μσ--===
查标准正态分布曲线下的面积表得
Φ(u 1) =Φ(- =,Φ(u 2)=1-Φ(- =1-= D =Φ(u 2)-Φ(u 1) =- = =%
故估计该校1999年身高界于~范围内的一年级女大学生所占比例为%,估
计312名一年级女大学生中身高界于~范围内的人数为312×% =≈名。
(3) 根据公式
X
u
μ
σ
-
=得
152158.0
0.92
6.5
u
-
==-
查标准正态分布曲线下的面积表得
{
Φ(u) =Φ(-==%
故估计该校1999年一年级女大学生中身高低于152cm者所占比例为%。
最佳选择题
(1) d (2) c (3) e (4) a (5) c (6) c (7) b (8) a (9) a
【复习思考题参考答案】
答:三者的相同点为均用于描述定量资料的集中趋势,其不同点见表。
表常用平均数的不同点比较
平均数>
意义
应用
均数平均数量水平对称分布,特别是正态分布或近似正态分布的资料
几何均数平均增(减)倍数等比资料;对数正态分布资料
中位数位次居中的观察值水平、
偏态分布;两端无确切值;分布不明确的资料
答:不一定。均数是描述定量资料集中趋势的指标,而标准差是描述定量资料离散程度的指标,二者反映的是资料分布特征的两个不同方面。
答:这四个指标的相同点在于均用于描述计量资料的离散程度。其不同点为:极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度。若样本含量相差较大,不宜用极差来比较资料的离散程度。
四分位数间距适用于描述偏态分布资料、两端无确切值或分布不明确资料的
离散程度。
标准差常用于描述对称分布,特别是正态分布或近似正态分布资料离散程度。
变异系数适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。
)
【补充选择题】
A型题
1.统计资料的类型可以分为
A 定量资料和等级资料
B 分类资料和等级资料
C 正态分布资料和离散分布的资料
D 定量资料和分类资料
E 二项分布资料和有序分类资料
2.下列符号中表示参数的为
A S
B u C
·
D t
E X
3.统计学上所说的随机事件发生的概率P,其取值范围为
A P≤1
B P≥1
C P≥0
D 1≥P≥0
E 1>P>0
4.小概率事件在统计学上的含义是
—
A 指的是发生概率P≤的随机事件
B 指一次实验或者观察中绝对不发生的事件
C 在一次实验或者观察中发生的可能性很小的事件,一般指P≤
D 以上说法均不正确
E A和C正确
5.描述定量资料集中趋势的指标有
A 均数、几何均数、变异系数
B 均数、几何均数、四分位数间距
C 均数、变异系数、几何均数
D 均数、四分位数间距、变异系数
E 均数、几何均数、中位数
6.关于频数表的说法正确的是
>
A 都分为10个组段
B 每一个组段必须组距相等
C 从频数表中可以初步看出资料的频数分布类型
D 不是连续型的资料没有办法编制频数表
E 频数表中的每一个组段不一定是半开半闭的区间,可以任意指定
7. 关于偏态分布资料说法不正确的是
A 正偏态资料的频数分布集中位置偏向数值大的一侧
B 负偏态资料的频数分布集中位置偏向数值大的一侧
C 偏态分布资料频数分布左右不对称
D 不宜用均数描述其集中趋势
<
E 不宜用变异系数来描述其离散程度
8. 对于一个两端都没有确切值的资料,宜用下列哪个指标来描述其集中趋势
A 几何均数
B 均数
C 方差
D 中位数
E 四分位数间距
9.下列关于标准差的说法中哪种是错误的
A 对于同一个资料,其标准差一定小于均数
&
B 标准差一定大于0
C 同一个资料的标准差可能大于均数,也可能小于均数
D 标准差可以用来描述正态分布资料的离散程度
E 如果资料中观察值是有单位的,那么标准差一定有相同单位
10. 下列关于标准差S和样本含量n的说法,正确的是
A 同一个资料,其他条件固定不变,随着n增大,S一定减小
B 同一个资料,即使其他条件固定不变,随着n增大,也不能确定S一定减小
C 同一个资料,其他条件固定不变,随着n增大,S一定增大
D 以上说法均正确
E 以上说法均错误
!
11. 用下列哪两个指标可以较全面地描述正态分布特征
A 均数和中位数
B 中位数和方差
C 均数和四分位数间距
D 均数和标准差
E 几何均数和标准差
12. 下列哪个资料适宜用几何均数来描述其集中趋势
A 偏态分布的资料
B 对称分布的资料
C 等比级数资料
D 一端不确定的资料
E 正态分布资料
13. 下列关于变异系数的说法,错误的是
A 与标准差一样都是用来描述资料变异程度的指标,都有单位
^
B 可以比较计量单位不同的几组资料的离散程度
C 可以比较均数相差悬殊的几组资料的离散程度
D 变异系数的实质是同一个资料的标准差与均数的比值
E 变异系数可以用来描述正态分布资料的变异程度
14. 假设将一个正态分布的资料所有的原始数据都加上一个正数,下列说法正确的是
A 均数将增大,标准差不改变
B 均数和标准差均增大
C 均数不变,标准差增大
D 不一定
E 均数和标准差均没有变化
15. 假设将一个正态分布的资料所有的原始数据都乘以一个大于1的常数,下列说法正确的是
A 均数不发生改变
B 标准差将不发生改变
。
C 均数是否变化不一定
D 变异系数不发生改变
E 中位数不发生改变
16. 下列关于正态分布曲线的两个参数μ和σ说法正确的是
A μ和σ越接近于0时,曲线越扁平
B 曲线形状只与μ有关,μ值越大,曲线越扁平
C 曲线形状只与σ有关,σ值越大,曲线越扁平
D 曲线形状与两者均无关,绘图者可以随意画
E 以上说法均不正确
17. 对于正态分布曲线的描述正确的是
A 当σ不变时,随着μ增大,曲线向右移
?
B 当σ不变时,随着μ增大,曲线向左移
C 当μ不变时,随着σ增大,曲线向右移
D 当μ不变时,随着σ增大,曲线将没有变化
E 以上说法均不正确
18.在正态曲线下,下列关于μ-σ说法正确的是
A μ-σ到曲线对称轴的面积为90%
B μ-σ到曲线对称轴的面积为10%
C μ-σ到曲线对称轴的面积为5%
D μ-σ到曲线对称轴的面积为45%
E μ-σ到曲线对称轴的面积为%
19.,
20.在正态曲线下,小于μ-σ包含的面积为
A 1%
B 99%
C %
D %
E %
21.在正态曲线下,大于μ-σ包含的面积为
A 1%
B 99%
C %
^
D %
E %
21. 下列关于标准正态分布的说法中错误的是 A 标准正态分布曲线下总面积为1
B 标准正态分布是μ=0并且σ=1的正态分布
C 任何一种资料只要通过σ
μ
-=
X u 变换均能变成标准正态分布
D 标准正态分布的曲线是唯一的
E 因为标准正态分布是对称分布,所以u ≥与u ≤所对应的曲线下面积相等 22. 某年某中学体检,测得100名高一女生的平均身高X =154cm, S =,该校高一女生中身高在143~170cm 者所占比重为(0.00780.04752.42, 1.67u u =-=-) A 90%
"
B 95%
C %
D %
E 99%
23. 下列关于确定正常人肺活量参考值范围说法正确的是
A 只能为单侧,并且只有上限
B 只能为单侧,并且只有下限
C 只能为双侧,这样才能反映全面
D 单双侧都可以
E 以上说法均不确切
24. 下列关于医学参考值范围的说法中正确的是
A 医学参考值范围是根据大部分“健康人”的某项指标制定的
】
B 医学参考值范围的制定方法不受分布资料类型的限制
C 在制定医学参考值范围时,最好用95%范围,因为这个范围最能说明医学问题
D 在制定医学参考值范围时,最好用95%范围,因为这样比较好计算
E 以上说法均不正确
25. 为了制定尿铅的正常值范围,测定了一批正常人的尿铅含量,下列哪种说法正确
A 无法制定,要制定正常值范围必须测定健康人的尿铅含量
B 可以制定,应为单侧上限
C 可以制定,应为单侧下限
D 可以制定,但是无法确定是上侧范围还是下侧范围
E 可以制定双侧95%的参考值范围
B型题
26~30题
A 中位数
B 四分位数间距
C 均数
D 几何均数
E 对数标准差的反对数
26. 对于只有上限不知道下限的资料,欲描述其集中趋势宜用
27. 某学校测定了大学一年级新生乙肝疫苗的抗体滴度,欲描述其集中位置,宜用
28. 描述偏态资料的离散程度,可用
29. 描述近似正态分布的资料的集中趋势,最适宜用
30. 偏态分布的资料,如果经对数变换后服从正态分布,那么欲描述其离散程度,应选用
补充选择题参考答案