医学统计学习题
医学统计学习题

《医学统计学》习题集第一章绪论1.下面的变量中,属于分类变量的是(B )。
A.脉搏B.血型C.肺活量D.红细胞计数E.血压2.某人记录了50名病人体重的测定结果:小于50kg的13人,介于50kg和70kg 间的20人,大于70kg的17人,此种资料本属于(A )。
A.定量资料B.分类资料C.有序资料D.二分类资料E.名义变量资料第二章定量资料的统计描述1.欲比较身高(cm)和体重(kg)哪个指标变异程度大,应采用(D )。
A.标准差B.极差C.四分位数间距D.变异系数2.已知某疾病患者10人的潜伏期(天)分别为:6,13,5,9,12,10,8,11,8,>20,其潜伏期的平均水平约为(B )天。
A.9B.9.5C.10D.10.2E.113.调查测定某地107名正常人尿铅含量(mg/L)如下:尿铅0~ 4~ 8~ 12~ 16~ 20~ 24~ 28~ 合计含量例数14 22 29 18 15 6 1 2 107 (1)描述该资料的集中趋势,宜用(B )。
A.均数B.中位数C.几何均数D.极差(2)描述该资料的离散趋势,宜用(C )。
A.极差B.变异系数C.四分位间距D.标准差第三章定性资料的统计描述1.某医院某年住院病人中胃癌患者占5%,则( B )。
A.5%是强度指标B. 5%是频率指标C. 5%是相对比指标D. 5%是绝对数2.某病患者120人,其中男性114人,女性6人,分别占95%与5%,则结论为(D )。
A.该病男性易得B.该病女性易得C.该病男性、女性易患程度相等D.尚不能得出结论3.一项新的治疗方法可延长病人的生命,但不能治愈该病,则最有可能发生的情况是(A )。
A.该病的患病率增加B.该病的患病率减少C.该病的发病率增加D.该病的发病率减少4.某市有30万人口,2002年共发现2500名肺结核患者,全年总死亡人数为3000,其中肺结核死亡98人,要说明肺结核死亡的严重程度,最好应用()。
医学统计学练习题及答案

一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题1.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。
《医学统计学》习题及答案

《医学统计学》习题及答案一、最佳选择题(每题共有A、B、C、D,请选出最适答案,每题1分,共50分。
)1.理论上,正态分布总体N(μ,σ)中有95%变量值X在______范围内。
A.x±1.96σB.μ±1.96σC.μ±1.96xD.x±1.96x s2.在同一总体中随机抽样,样本含量n越大,则理论上____越小。
A.样本标准差B.中位数C.标准差的抽样误差D.第95百分位数3.血清滴度(X )资料常用几何均数表示平均水平是由于_____。
A.按等比级数分组B.X近似正态分布C.lg X近似于对数正态分布D.X近似于对数正态分布4.算术均数与中位数相比,。
A.抽样误差更大B.不易受极端值的影响C.更充分利用数据信息D.更适用于分布不明及偏态分布资料5.标准正态分布是指。
A.N(μ,σ)B.N(0,0)C.N(1,1)D.N(0,1)6.以中位数表示集中趋势,资料。
A.不能用于正态分布的B.不能用于严重偏态的连续分布的C.可用于任何分布的计量D.可用于任何一种属性(分类)7.直方图可用于。
A.2001年5种疾病发病率比较B.10个年龄组患病率比较C.身高和患病率的关系分析D.描述O型血者血红蛋白含量分布8.标准正态分布中,单侧u0.05值为。
A.1.96B.0.05C.1.64D.0.0259.随机抽查某地成年女子身高,算得均数x=160cm,标准差s=5cm,则可计算变异系数CV= 。
A.160/5B.5/160C.(160/5)cmD.(5/160)cm10.标准正态分布曲线下,横轴上从-1到1.96的面积为__%。
A.>95.0B.81.64C.84.14D.68.2711.如果一批数据全是负数,则。
A.x>0,s≥0B.s<xC.x<0,s<0D.s>x12.表示。
xA.总体均数标准误B.总体均数标准误的估计值C.样本均数标准误D.样本均数标准误的估计值13.实际工作中,两均数作差别的统计检验,要求数据近似正态分布及。
医学统计学题库完整

第一章 绪论习题一、选择题1.统计工作和统计研究的全过程可分为以下步骤:(D )A. 调查、录入数据、分析资料、撰写论文B. 实验、录入数据、分析资料、撰写论文 C 。
调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料2.在统计学中,习惯上把(B )的事件称为小概率事件。
A 。
10.0≤P B 。
05.0≤P 或01.0≤P C 。
005.0≤PD 。
05.0≤PE 。
01.0≤P3~8A.计数资料 B 。
等级资料 C.计量资料 D 。
名义资料 E.角度资料3。
某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。
该资料的类型是( A )。
4.分别用两种不同成分的培养基(A 与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A:48、84、90、123、171;B :90、116、124、225、84。
该资料的类型是(C ). 5。
空腹血糖测量值,属于( C)资料.6。
用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人.该资料的类型是(B ).7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641.该资料的类型是(D )。
8。
100名18岁男生的身高数据属于(C )。
二、问答题1.举例说明总体与样本的概念.答:统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。
实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。
例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本. 2.举例说明同质与变异的概念答:同质与变异是两个相对的概念.对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体内部的差异,即个体的特异性。
医学统计学试题及答案

医学统计学试题及答案一、选择题1. 医学统计学中的描述性统计主要用来描述()。
A. 总体参数B. 样本数据C. 个体差异D. 随机误差答案:B2. 在医学研究中,双盲法的主要目的是()。
A. 增加样本量B. 控制偏倚C. 减少随机误差D. 提高治疗效果答案:B3. 下列哪种情况下,使用卡方检验是合适的?()A. 比较两个连续变量的均值B. 比较两个分类变量的分布C. 检验一个连续变量的方差D. 检验两个样本的一致性答案:B4. 在医学统计分析中,多元线性回归可以用来评估()。
A. 一个变量对另一个变量的影响B. 两个或多个变量对一个变量的影响C. 一个变量对另一个变量的影响是否显著D. 两个或多个变量之间的相关性答案:B5. 以下哪项是医学统计学中的基本概念?()A. 疾病发生率B. 疾病死亡率C. 疾病预后D. 疾病流行趋势答案:A二、填空题1. 在医学统计中,用于描述数据分布离散程度的指标是________。
答案:方差2. 为了减少样本误差,提高统计效能,医学研究中常用的抽样方法是________。
答案:分层随机抽样3. 在医学研究中,用于比较两个独立样本均值差异的统计方法是________。
答案:独立样本t检验4. 用于评估医学治疗效果的统计指标是________。
答案:治疗效果差异5. 用于描述个体在群体中的分布情况的统计图表是________。
答案:直方图三、简答题1. 请简述医学统计学在临床研究中的应用及其重要性。
医学统计学在临床研究中的应用极为广泛,它通过科学的方法对临床数据进行收集、整理、分析和解释,从而为临床决策提供依据。
其重要性体现在以下几个方面:首先,统计学可以帮助研究者正确设计研究方案,确保研究的有效性和可靠性;其次,通过统计分析,可以评估治疗效果、疾病风险和预后情况,为临床治疗提供指导;再次,统计学还能够识别和控制研究中的偏倚和误差,提高研究结果的准确性;最后,统计学方法在临床试验中尤为重要,它能够确保试验结果的客观性和科学性,为新药物或治疗方法的开发和应用提供支持。
医学统计学练习题及答案

一、单向选择题1. 医学统计学研究的对象是 E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是E.依照随机原那么抽取总体中的局部个体3. 以下观测结果属于等级资料的是 D.病情程度4. 随机误差指的是 E. 由偶然因素引起的误差5. 收集资料不可防止的误差是1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数2. 算术均数及中位数相比,其特点是 B.能充分利用数据的信息3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧1. 变异系数主要用于 A .比拟不同计量指标的变异程度2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差 “正常〞总体中有95%的人在此范围4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布5.动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用 E .四分位数间距2. 抽样误差产生的原因是D.个体差异,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是×109×109/L ,其含义是 E.该区间包含总体均数的可能性为95%1. 两样本均数比拟,检验结果05.0>P 说明 D.不支持两总体有差异的结论2. 由两样本均数的差异推断两总体均数的差异, 其差异有统计学意义是指 E. 有理由认为两总体均数有差异3. 两样本均数比拟,差异具有统计学意义时,P 值越小说明4. 减少假设检验的Ⅱ类误差,应该使用的方法是5.两样本均数比拟的t 检验和u 检验的主要差异是B.u 检验要求大样本资料 1. 利用2χ检验公式不适合解决的实际问题是C.两组有序试验结果的药物疗效2.欲比拟两组阳性反响率, 在样本量非常小的情况下(如1210,10n n <<), 应采用C.Fisher 确切概率法 二、简答题1.抽样中要求每一个样本应该具有哪三性?从总体中抽取样本,其样本应具有“代表性〞、“随机性〞和“可靠性〞。
医学统计学练习题

《医学统计学》习题(一)单项选择题1.观察单位为研究中的( )。
A.样本 B. 全部对象C.影响因素 D. 个体2.总体是由()。
A.个体组成 B. 研究对象组成C.同质个体组成 D. 研究指标组成3.抽样的目的是()。
A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例研究误差 D. 研究总体统计量4.参数是指()。
A.参与个体数 B. 总体的统计指标C.样本的统计指标 D. 样本的总和5.关于随机抽样,下列那一项说法是正确的()。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变7.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数B.差C.极差D.标准差8.以下指标中()可用来描述计量资料的离散程度。
A.算术均数B.几何均数C.中位数D.标准差9.偏态分布宜用()描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距10.各观察值同乘以一个不等于0的常数后,()不变。
A.算术均数 B.标准差C.几何均数D.中位数11.()分布的资料,均数等于中位数。
A.对称B.左偏态C.右偏态D.偏态12.对数正态分布是一种()分布。
A.正态B.近似正态C.左偏态D.右偏态13.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距14.()小,表示用该样本均数估计总体均数的可靠性大。
A. 变异系数B.标准差C. 标准误D.极差15.血清学滴度资料最常用来表示其平均水平的指标是()。
A. 算术平均数B.中位数C.几何均数D. 平均数16.变异系数CV的数值()。
A. 一定大于1B.一定小于1C. 可大于1,也可小于1D.一定比标准差小17.数列8、-3、5、0、1、4、-1的中位数是()。
医学统计学试题及答案

医学统计学试题及答案一、选择题(每题2分,共20分)1. 医学统计学中的“总体”是指:A. 所有可能的样本B. 所有可能的个体C. 研究中所关注的全部个体D. 研究中实际测量到的个体答案:C2. 以下哪个是参数估计的常用方法?A. 描述性统计B. 假设检验C. 点估计D. 方差分析答案:C3. 以下哪个是描述数据离散程度的统计量?A. 平均数B. 中位数C. 标准差D. 众数答案:C4. 医学统计学中的“样本”是指:A. 研究中实际测量到的个体B. 所有可能的个体C. 研究中所关注的全部个体D. 所有可能的样本答案:A5. 以下哪个是医学统计学中的“误差”?A. 抽样误差B. 系统误差C. 随机误差D. 所有选项都是答案:D6. 以下哪个是正态分布的特点?A. 均数、中位数、众数相等B. 均数大于中位数C. 中位数大于众数D. 众数大于均数答案:A7. 以下哪个是相关系数的取值范围?A. -1到1B. 0到1C. -∞到∞D. 1到∞答案:A8. 以下哪个是医学统计学中常用的非参数检验方法?A. t检验B. 方差分析C. 卡方检验D. 秩和检验答案:D9. 以下哪个是医学统计学中的“效应量”?A. 样本量B. 效应大小C. 标准差D. 信度答案:B10. 以下哪个是医学统计学中的“混杂因素”?A. 研究设计中的变量B. 研究中的误差来源C. 影响研究结果的外部因素D. 研究中的随机误差答案:C二、简答题(每题5分,共20分)1. 简述医学统计学中的“假设检验”。
答案:假设检验是统计学中用于检验研究假设是否成立的一个过程。
它通常包括零假设(H0)和备择假设(H1)。
通过收集数据并进行统计分析,我们可以决定是接受零假设还是拒绝零假设,从而支持或反对研究假设。
2. 解释什么是“置信区间”。
答案:置信区间是参数估计中用来表示估计值的可信程度的一个范围。
它给出了一个区间,在这个区间内,我们相信参数的真实值有一定概率(如95%)会落在这个范围内。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章补充练习题一、选择题(一)A1型:每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。
1.下面的变量中,属于分类变量的是__________。
A.脉搏B. 血型C.肺活量D.红细胞计数E.血压2下面的变量中,属于定量变量的是__________。
A.性别B.体重C.血型D.职业E.民族3.某人记录了50名病人体重的测定结果:小于50Kg的13人,介于50Kg和70 Kg间的20人,大于70 Kg的17人,此种资料属于__________。
A.定量资料B.分类资料C.有序资料D.二分类资料E.以上都不正确4.上述资料可以进一步转换为__________。
A.定量资料B.分类资料C.有序资料D.二分类资料E.以上都不正确5.若要通过样本作统计推断, 样本应是__________。
A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分6.统计量__________。
A.是统计总体数据得到的量B.反映总体统计特征的量C.是根据总体中的全部数据计算出的统计指标D.是用参数估计出来的E. 是由样本数据计算出的统计指标(二)A2型:每一道题以一个小案例出现,其下面都有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。
1. 教材中提及美国人1954年实施了旨在评价索尔克(Salk)疫苗预防小儿麻痹或死于脊髓灰质炎效果的临床试验。
有180万儿童参与,约有1/4参与者得到了随机化。
这180万儿童是__________。
A. 目标总体B. 研究总体C. 1份样本D. 1份随机样本E. 180万份样本2. 上述试验最终肯定了索尔克疫苗的效果。
请问此结论是针对__________而言。
A. 180万儿童B. 每个儿童C. 所有使用索尔克疫苗的儿童D. 所有儿童E. 180万儿童中随机化的1/4二、是非题1.定量变量、分类变量和有序变量可以相互转换。
()2.假变量可以参与计算,所以假变量是定量变量。
()3.离散变量在数值很大时,单位为“千”或“万”时可以取小数值,此时可近似地视为连续型变量。
()4.同质的个体间不存在变异。
( )5.如果个体间有变异,则它们一定不是来自同一总体。
( )[参考答案]一、选择题(一)1.B 2.B 3.C 4.D 5.C 6.E 7.C(二)1.C 2.C二、是非题1. ⨯2. ⨯3. √4. ⨯5. ⨯第二章补充练习题选择题(一)A1型:每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。
1. 用频率表计算平均数时,各组的组中值应为。
A. 本组段变量值的平均数B. 本组段变量值的中位数C. 本组段的上限值D. 本组段的下限值E. (本组段上限值+本组段下限值)/22.离散型定量变量的频率分布图可以用表达。
A. 直方图B.直条图C.百分条图D. 箱式图E.复式条图3. 变异系数越大说明。
A.标准差越大B.平均数越大C.标准差、平均数都大D.平均数小E.以均数为准变异程度大4.均数和标准差的关系是____________。
A. 均数越大,标准差越小B. 均数越大,标准差越大C. 标准差越大,均数对各变量值的代表性越好D. 标准差越小,均数对各变量值的代表性越好E. 均数和标准差都可以描述资料的离散趋势5. 把P25,P50,P75标在一个数轴上,则。
A. P50一定在P25和P75的中点B. P50一定不在P25和P75的中点C. P50一定靠近P25一些D. P50一定靠近P75一些E. 以上都不是(二)A2型:每一道题以一个小案例出现,其下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。
1. 已知某疾病患者10人的潜伏期(天)分别为:6,13,5,9,12,10,8,11,8,>20,其潜伏期的平均水平约为。
A. 9天B. 9.5天C. 10天D. 10.2天E. 11天2.已知某地一群7岁男童身高均数为100cm,标准差为5cm;体重均数为20kg,标准差为3kg,则身高和体重的变异程度有:A. 身高的变异程度大于体重的变异程度B. 身高的变异程度等于体重的变异程度C. 身高的变异程度小于体重的变异程度D.身高的变异程度与体重的变异程度之比为5:3E. 因单位不同,无法比较3.测定10名正常人的脉搏(次/分),结果为68,79,75,74,80,79,71,75,73,84。
则10名正常人的脉搏标准差为______________。
A. 4.73B. 22.4C. 75.8D. 75.0E. 1.504. 测定5人的血清滴度为1:2,1:4,1:4,1:16,1:32,则5人血清滴度的平均水平为_______________。
A. 1:4B. 1:8C. 1:11.6D. 1:6.96E.1:165. 测得200名正常成年男子的血清胆固醇值(mmol/L),为进行统计描述,下列说法不正确的是___________。
A. 可用频率表法计算均数 B.可用直接法计算均数C. 可用直接法计算标准差D. 可用加权法计算标准差E. 可用直条图表示频率分布图(三)A3/A4型:以下提供若干案例,每个案例下设若干道题目。
请根据题目所提供的信息,在每一道题下面的A、B、C、D、E五个备选答案中选择一个最佳答案。
(第1~2题共用题干)A. 均数B. 中位数C. 几何均数D. 众数E. 极差2. 描述该资料的离散趋势,宜用____________。
A. 极差B.方差C. 四分位数间距D. 标准差E.变异系数(四)B1型:以下提供若干组题目,每一组题目前列出A、B、C、D、E五个备选答案,请从中为每一道题目选择一个最佳答案。
某个备选答案可被选择一次、多次或不被选择。
(1~4题共用备选答案)A.极差B.四分位数间距C.标准差D.变异系数E.中位数1.比较7岁男童与17岁青年身高的变异程度,宜用____________。
2.描述近似正态分布资料个体观察值的离散趋势,宜用_____________。
3.描述偏峰分布资料个体观察值的变异程度,宜用______________。
4.描述分布末端无确定值资料的离散程度,宜用_____________。
(5~8题共用备选答案)A.中位数B.均数C.几何均数D.极差E.众数5. 反映一组等比资料集中趋势的指标,宜用_____________。
6. 反映一组偏峰分布资料的平均水平,宜用_____________。
7.样本中出现次数最多的观察值称为____________。
8.描述近似正态分布资料的集中位置,宜用_____________。
[参考答案] 选择题(一)1. E 2. B 3. E 4. D 5. E (二)1. B 2. C 3.B 4.D 5.E (三)1.B 2. C(四)1. D 2. C 3. B 4. B5. C6. A7. E8. B案例 某市1974年留驻该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人的发汞值(μmol/kg )检测结果如表2-6的第1和3列所示。
试对该市居民发汞水平进行统计描述。
某市1974年238人的发汞检测结果组段 组中值0X 人数f 频率(%) 累计频数 累计频率(%)(1) (2) (3) (4) (5)(6) 1.5~ 2.5 20 8.4 20 8.4 3.5~ 4.5 66 27.7 86 36.1 5.5~ 6.5 60 25.2 146 61.3 7.5~ 8.5 48 20.2 194 81.5 9.5~ 10.5 18 7.6 212 89.1 11.5~ 12.5 16 6.7 228 95.8 13.5~ 14.5 6 2.5 234 98.3 15.5~ 16.5 1 0.4 235 98.7 17.5~ 18.5 0 0.0 235 98.7 19.5~21.5 20.5 3 1.3 238 100.0合计238100为描述该市居民发汞水平的集中趋势和离散趋势,某研究者采用算术均数和标准差两个统计指标。
按照频率表法计算算术均数为1472381699.ffX X ===∑∑(μmol/kg ) 计算标准差为323123892261412020..n n /)fX (fXS =-=--=∑∑(μmol/kg ) 因此该研究者认为该市居民发汞的均数±标准差为7.14±3.32(μmol/kg )。
你认为这样统计描述合理吗?为什么?案例答案 该资料为一正常人群发汞值(μmol/kg )的检测结果,已整理成频率分布表(见教材表2-6)。
统计描述时首先应考察资料的分布规律,通过频率分布表(见教材表2-6)和直方图(见教材图2-3)可以看出,此238人发汞值的频率分布呈正偏峰分布,即观察值绝大多数集中在发汞值较小的组段。
对偏峰分布,选用算术均数和标准差进行统计描述是不恰当的。
应选用中位数描述该市居民发汞平均水平,选用四分位数间距描述居民发汞变异度。
计算如下:()()668650238861462555050.%.F %n F F iL P L L i L =-⋅-+=-⋅-+=+(μmol/kg )()()74202523820862532525.%.F %n F F iL P L L i L =-⋅-+=-⋅-+=+(μmol/kg )()()98146752381461942577575.%.F %n F F iL P L L i L =-⋅-+=-⋅-+=+(μmol/kg )故该市居民发汞中位数(四分位数间距)为 6.6(4.7~8.9)μmol/kg 。