实验一 计量资料的统计描述、参考值范围、可信区间
医学统计学复习重点

整理分析和2.计描述4.(集合)。
1.抽样随机2.分组随机3.实验顺序随机。
称全距,用离散系数,为标准差与均数只比,常:CV=s/x究,1.抽样研究2.个体变异。
系统误差:指数据搜集和测量过程中由于仪器不准确、造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差由于一些非人真实性(validity):观察值与真值的接近程度,受系统误差的影响( (reliabiliy)——也称精密度(precision)或重复性(repeatability)是直接用样本统计量作为对应的总体参数最常用的是95%10095有5在描述两变量间的关系时,若散点图呈直线趋势或有直线相关关系,可进行直线回归分析。
参数:根根据样本的分布特征而计算得到的1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。
5、★频数表的用途:揭示计量资料的分布类型;揭示计量资料的分布特征;便于发现特大值和特小值;便于进一步进行统计分析★常见的统计资料的类型有:计量资料;计数资料;等级资料7、★t检验的应用条件是:①正态分布:当样本含量较小时,要求样本来自正态总体。
②方差齐性:两样本均数比较时,要求两总体方差相等。
U检验的应用条件是:①大样本(如n>50);②小样本,σ已知且样本来自正态总体。
8、★.描述分类变量常用的指标有率、构成比、相对数。
9、率是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,常用来描述某种现象发生的频率大小或强度构成比是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,常用来描述某一事物内部各组成部分所占的比重或分布。
10、★四格表卡方专用公式应用条件n≥40,且Tmin≥5 研究事物或现象间的线性关系用相关分析,研究事物或现象间的线性数量依存关系用回归分析。
统计概述计量描述习题

实习二计量资料的统计描述名词解释1. 均数答:均数是能反映全部观察值的平均水平的统计指标,适用于对称分布尤其是正态分布资料。
2. 标准差答:标准差是用于描述资料离散趋势的统计指标,适用于对称分布资料,尤其正态分布资料的。
标准差大,表明资料的变异度大,组内数据参差不齐的程度较明显。
填空题1 计量资料的分布特征有____和____。
答:集中趋势和离散趋势。
2 描述计量资料集中趋势的常用指标有____ 、____和____答:均数、几何均数和中位数。
3 描述计量资料离散趋势的常用指标有____ 、_______和____答:极差、方差与标准差和变异系数是非题1. 频数表中组数越多越好。
(⨯)解释:频数表中组数不宜过多也不宜过少。
2. 对称分布资料理论上均数和中位数一致(∨)解释:对于对称分布的资料,两者的计算结果在理论上是相同的。
但在实际计算中往往也会存在一定偏差。
选择题1 有5人的血清滴度为:1:20,1:40,1:80,1:160,1:320则平均滴度是A.1:40B.1:80C.1:160D.1:320答:应选B。
描述平均滴度宜用几何均数。
2.一组变量值,其大小分别为10,12,9,7,11,其中位数是A.9B.7C.10D.11答:应选C。
先将观察值由小到大顺序排列,7,9,10,11,12。
n为奇数时,M=X3=103.一组变量值,其大小分别为10,12,9,7,11,39,其中位数是A.9B.7C.10.5D.11答:应选C。
先将观察值由小到大顺序排列,7,9,10,11,12,39。
n为偶数时,M=( X3 +X4)/2 =(10+11)/2=10.54. 某组资料共5例, ∑X2=190, ∑X=30, 则均数和标准差分别是1A.6 和1.29B.6.33和2.5C.3和6.78D.6和1.58答:应选D,计算步骤是先用 X除以5求得均数,数值为6。
再代入直接法求标准差公式,求得标准差为1.58。
医学统计学期末重点总结

误差:观测值与真实值、样本计量与总体参数之间的差别。
相对数:两个有关的绝对数之比,也可以是两个有关联统计指标之比。
相对比:相对比是A、B两个有关联指标值之比,用以描述两者的对比水平,说明A是B 的若干倍或百分之几。
统计描述:描述及总结一组数据的重要特征,目的是使实验或观察得到的数据表达清楚并便于分析。
统计推断:指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
同质:指根据研究目的所确定的观察单位其性质应大致相同。
变量:反映实验或观察对象生理、生化、解剖等特征的指标,变量的观测值称为数据。
定量数据:也称计量资料。
变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低,一般有计量单位。
根据变量的取值特征可分为连续型数据和离散型数据。
有序数据:也称半定量数据或等级资料。
变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别。
总体:根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。
样本:从研究总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据。
参数:描述总体特征的指标称为参数。
统计量:描述样本特征的指标称为统计量。
概率:描述某事件发生可能性大小的度量。
小概率事件:习惯上将P≤0.05的事件称为小概率事件。
平均数:是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。
率:率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比。
构成比:表示某事物内部各组成部分在整体中所占的比重,常以百分数表示,计算公式为区间估计:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。
线性相关的概念:研究两个变量之间是否具有直线相关关系。
相关系数:是说明具有线性相关关系的两个数值变量间相关的密切程度与相关方向的统计量。
研究对象:根据研究目的而确定的观察总体,也可称为受试对象或实验对象。
处理因素:根据研究目而欲施研究对象的干预措施。
统计学习题及答案(完整)

第一部分 计量资料的统计描述、最佳选择题1、描述一组偏态分布资料的变异度,以( )指标较好。
A 、全距B 、标准差C 、变异系数D 、四分位数间距E 、方差2.用均数和标准差可以全面描述( )资料的特征。
A .正偏态分布B .负偏态分布C .正态分布D .对称分布E .对数正态分布3.各观察值均加(或减)同一数后( )。
A .均数不变,标准差改变B .均数改变,标准差不变9.最小组段无下限或最大组段无上限的频数分布资料,可用( )描述其集中趋势。
A .均数B .标准差C .中位数D .四分位数间距E .几何均数10.血清学滴度资料最常用来表示其平均水平的指标是()。
A .算术平均数B .中位数C .几何均数D .变异系数E .标准差二、简答题1、对于一组近似正态分布的资料,除样本含量 n 外,还可计算 ,S 和 ,问各说明什么?2、试述正态分布、标准正态分布及对数正态分布的 联系和区别。
3、说明频数分布表的用途。
4、变异系数的用途是什么?5、试述正态分布的面积分布规律。
三、计算分析题1、根据 1999 年某地某单位的体检资料, 116 名正常 成年女子的血清甘油三酯( mmol/L )测量结果如右表, 请据此资料: (1)描述集中趋势应选择何指标?并计算之。
(2)描述离散趋势应选择何指标?并计算之。
( 3)求该地正常成年女子血清甘油三酯的 95%参考值范围。
( 4)试估计该地正常成年女子血清甘油三酯在 0.8mmol/L 以下者及 1.5mmol/L 以下者各占正常女子总人数的百分比。
2、某些微丝蚴血症者 42 例治疗后 7 年用间接荧火抗体试验得抗体滴度如下。
求平均抗体滴度。
C .两者均不变D .两者均改变4.比较身高和体重两组数据变异度大小宜采用(A .变异系数B 5.偏态分布宜用( A .算术均数 B.方差 C .极差 D )描述其分布的集中趋势。
.标准差 C .中位数0 的常数后,(B .标准差C .几何均数 )分布的资料,均数等于中位数。
医学统计学重点概要

第一章 绪论总体:根据研究目的确定的同质的所有观察单位某种变量值的集合。
总体包括有限总体和无限总体。
样本:从总体中随机抽取的部分观察单位,其实测值的集合。
获取样本仅仅是手段,通过样本信息来推断总体特性才是研究的目的。
资料的类型计量资料、计数资料和等级资料。
误差包括随机误差、系统误差和非系统误差。
抽样误差:由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计量之间的差异称为抽样误差。
概率:是描述随机事件发生可能性大小的一个度量。
取值范围0≤P ≤1。
小概率事件:表示在一次实验或观察中该事件发生的可能性很小,可以认为很可能不发生。
P ≤0.05或P ≤0.01。
医学统计学的步骤:设计、收集资料、整理资料和分析资料。
统计分析包括:统计描述和统计推断。
统计推断包括:参数估计和假设检验。
第二章计量资料的统计描述频数表和频数分布图的用途:(1)描述频数分布的类型,以便选择相应的统计指标和分析方法。
对称分布:集中位置在中间,左右两侧頻数基本对称。
偏态分布:正、负偏态分布正偏态集中位置偏向值小一侧,负偏态反之。
(2)描述頻数分布的特征;(3)便于发现资料中的可疑值;(4)便于进一步计算统计指标和进行统计分析。
计量资料集中趋势包括算术均数、几何均数和中位数。
算术均数:直接法(样本小):n x x ∑=;頻数表法(样本大)x =nfx ∑ 几何均数:直接法:)lg (lg 1n x G ∑-=;頻数表法)lg (lg )lg (lg 11n x f fx f G ∑∑∑--==(常用于等比资料或对数正态分布资料)中位数:直接法:n 为奇数2/)1(+=n x M ,n 为偶数2/)(12/2/++=n n x x M ;頻数表法:∑-⨯+=)%50(L M M f n f iL M 。
中位数的应用注意事项:可用于各种分布资料,不受极端值的影响,主要用于(1)偏态分布资料(2)端点无确切值的资料(3)分布不明确的资料。
统计题

实习一计量资料的统计描述1、某省农村120例6-7岁正常男童胸围(cm)测量结果如表所示。
120例6-7岁正常男童胸围(cm)测量结果51.6 54.1 51.3 56.6 51.2 53.6 56.0 58.354.0 56.9 55.5 57.7 56.0 57.4 55.2 53.657.7 55.5 57.4 53.5 56.3 54.0 57.5 55.458.3 55.4 55.9 53.3 54.1 55.9 57.2 56.153.8 57.7 56.0 58.6 57.6 56.0 58.1 49.151.3 53.8 50.5 53.8 56.8 56.0 54.5 51.757.3 54.8 58.1 56.5 51.3 50.2 55.5 53.652.1 55.3 58.3 53.5 53.1 56.8 54.5 56.154.8 54.7 56.2 53.7 52.4 58.1 56.6 56.753.4 57.1 54.4 53.7 54.1 59.0 56.2 55.753.1 55.9 56.6 56.4 50.4 53.3 56.7 50.851.4 54.6 56.1 58.0 54.2 53.8 55.3 55.956.1 61.8 56.7 52.7 52.4 51.4 53.5 56.659.3 56.8 58.1 59.0 53.1 54.2 54.0 54.759.8 53.9 52.6 54.6 52.7 56.4 55.5 54.4(1)试编制胸围数据的频数表,绘制直方图,分析其分布特征。
(2)用合适的统计量描述胸围数据的集中趋势、变异趋势。
(3)计算P25、P50、P75。
2、根据2010年某地某单位的体检资料,116名正常成年女子的血清甘油三酯(mmol/L)测量结果如下,请据此资料:(1)描述集中趋势应选择何指标?并计算之。
(2)描述离散趋势应选择何指标?并计算之。
医学统计学学习笔记
医学统计学笔记一、绪论及基本概念1. 资料类型①计量资料(定量资料、数值变量资料):连续型、离散型②计数资料(定性资料、无序分类变量、名义变量):二分类、多分类③等级资料(半定量资料、有序分类变量)信息量:计量资料>等级资料>计数资料2.误差类型①过失误差:可避免②系统误差:具有明确的方向性,可避免③随机误差:分为随机测量误差和随机抽样误差,没有固定的大小和方向,不可避免3.核心概念参数:u、σ;固定的常数,总体的统计指标,参数大小客观存在,但往往未知。
统计量:X̅,S,P;样本的统计指标,参数附近波动的随机变量。
概率为参数,频率为统计量。
4.医学统计工作的基本步骤:设计、收集资料、整理资料、分析资料二、计量资料的统计描述1.集中趋势的描述a.算术均数,简称均数(mean):主要适用于对称分布或偏度不大的资料,尤其适合正态分布资料。
不能用于开口型资料。
u(总体均数),X(样本均数)。
b.几何均数(geometric mean,G):适用于经对数转换后呈对称分布。
观察值不能为0 、不能同时有正有负。
同一资料算得的几何均数小于算术均数。
c.中位数(median, M)和百分位数(precentile, Px):适用于各种分布类型资料。
当计量资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。
用频数表法计算百分位数时,组距不一定要相等。
P x=L x+i x(n∗x%−∑f L)f xL x:第x百分位数所在组段的下限i x:第x百分位数所在组段的组距f x:第x百分位数所在组段的频数∑f L:第x百分位数所在组段上一组段累计频数d.调和均数(harmonic mean,H):适用于表达呈极严重的正偏态分布资料的平均水平。
计算方法为求倒数的均值后再取其倒数。
SPSS:在Transform中输入公式。
2.离散(dispersion)趋势的描述a.极差(range,R):也称为全距。
b.四分位数间距(quartile range,Q):即统计图中箱子的高度,常用于偏态资料离散度的描述,多与M 合用。
《医学统计学》计算题答案
《医学统计学》计算分析题参考答案孙振球主编. 医学统计学.第3版. 北京:人民卫生出版社,2010第二章计量资料的统计描述计算分析题(P26)1. 根据某单位的体检资料,116名正常成年女子的血清甘油三酯测量结果如下,请据此资料:(1)描述集中趋势应选择何指标?并计算之。
(2)描述离散趋势应选择何指标?并计算之。
(3)求该地正常成年女子血清甘油三酯的95%参考值范围。
(4)试估计该地正常成年女子血清甘油三脂在0.8mmol/L以下者及1.5mmol/L者各占正常成年女子总人数的百分比?表2-1某单位116名正常成年女子的血清甘油三酯(mmol/L)测量结果组段频数0.6~ 10.7~ 30.8~ 90.9~ 131.0~ 191.1~ 251.2~ 181.3~ 131.4~ 91.5~ 51.6~1.7 1合计116(1)数据文件数值变量名:组段,频数;用Compute产生新变量“组中值”(也可直接输入组中值)。
(2)操作步骤Analyze èData èWeight Cases ;Weight Cases by 频数。
Analyze èDescriptives èDescriptives ;将“组中值”选入V ariable 框中;单击OK 。
(3)结果解释表2-1显示某单位116名正常成年女子的血清甘油三酯测量结果呈正态分布,故选择均数描述集中趋势,选择标准差描述离散趋势。
某单位116名正常成年女子的血清甘油三酯测量结果的均数为1.16(mmol/L ),标准差为0.20(mmol/L );该地正常成年女子血清甘油三酯的95%参考值范围是(0.77,1.55)mmol/L 。
计算过程根据公式s x 96.1±,即1.16±1.96×0.20。
该单位正常成年女子血清甘油三酯在0.8 mmol/L 以下者估计占总人数的3.59%,1.5 mmol/L 以下者估计占总人数的95.54%。
上海交通大学网络《医学统计学》习题册答案
上海交通大学网络教育学院医学院分院医学统计学课程练习册第一章绪论一、单选题1. 小概率事件是指P ( B )A.P>0.05 B.P<0.05 C. P >0.01 D. P <0.12. 从一个数值变量资料的总体中抽样,产生抽样误差的原因是( A )A总体中个体值存在差别B样本中个体值存在差别C样本只含总体的一部分D总体均数不等于03. 调查中国放射科医生接触射线情况,全国放射科医生的全部组成为( A )A.研究总体B.目标总体C.研究样本D.目标样本4. 若以舒张压90mmHg、收缩压130 mmHg为高血压阳性临界点,调查3000人中有300名血压超过临界值,这份资料属于:( B )A. 定量资料B. 分类资料C. 等级资料D. 离散型变量5. 下列属于统计量的指标是( C )A 总体均数B 总体标准差C 样本标准差D 总体率6. 调查某地区高血压的患病情况,抽样调查了2000名居民,得到了2000对舒张压与收缩压的数据,请问此资料是:( C )A 分类资料B等级资料 C 定量资料D分析后才知7. 下列属于参数的指标是( D )A 样本均数B 样本率C 样本标准差D总体标准差8. 用样本做统计推断,样本应是( B )A. 总体中典型一部分B. 总体中有代表性一部分C. 总体中任意一部分D. 总体中信息明确一部分9. 统计推断的内容为( D )A. 用样本指标估计相应的总体指标B. 检验统计上的“检验假设”C. A和B均不是D. A和B均是10. 随机调查社区2000人,得到平均体重为60公斤,则该资料属于( A )A. 计量资料B. 总体资料C. 计数资料D. 等级资料二、名词解释1.抽样误差:由于总体中各观察单位间存在个体变异,抽样研究中抽取的样本,只包含总体的一部分观察单位,因而样本指标不一定恰好等于相应的总体指标。
样本指标与总体指标的差异称为抽样误差。
2.总体:根据研究目的性质相同的观察单位的全体3.分类变量:用定性方法测得,表现为互不相容的类别或属性,如性别等4.数值变量:用定量方法测量得到,表现为数值大小,一般有计量单位,如身高、体重。
医学统计学总复习(刘桂芬主编-研究生使用) (1)
b. t 检验 c. 用 r 检验来代替。 ④ 作结论:如 P≤0.05, 说明方程成立,列出回归方程;如 P>0.05, 说明方程不成立,不列回归方程。 5. 直线相关的概念 6. 直线相关的主要用途:用于分析两变量是否有相关关系及其方 向
观察人数
期内死亡人数
- 14 -
x~
nx
Dx
0~
25
10
1~
22
20
2~
10
9
3~
11
7
4~
10
1
5~
8
4
6~
4
0
7~
4
1
8~
3
0
9~
3
0
10~
2
0
11~
1
0
第三部分 期末成绩评定
一、成绩评定方法 总评(100%)=平时作业 10%+基础理论知识考试(笔试)60%+操作 技能考试(上机)30% 二、考试题型 (一)基础理论知识考试(笔试)(考试时间:100 分钟) 1、最佳选择题(单选)(30%,30 小题,每题 1 分) 2、辨析题(30%,10 小题,每题 3 分) 3、简答题(10%,2 小题,每题 5 分) 4、分析应用题(30%,5-6 题)
第十六章 生存分析
1.生存资料的特点 2.生存分析的几个基本概念(生存时间、死亡概率与生存概率、生存 率、中位生存期) 3.生存分析的用途 4.生存率计算方法:(1)K-M 法:例数少,且为未分组;(2)寿命表 法:例数多,且为频数表资料(注意:生存概率与生存率的结果) 5.生存率曲线比较:(1)log-rank test:两组或多组;(2)Gehan Score test:两组 6.Cox 模型(不要求) 第二十二章 医学论文统计结果报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
N(100 ,σ2) N(150 ,σ2)
max
N(µ,0.52) N(µ,12) N(µ,22)
σ =0.5
f(x)
f(x)
σ =1 σ =2
0
µ1 µ2
0
µ
正态曲线下的面积分布规律
µ±1σ 占正态曲线下面积的 68.27% 占正态曲线下面积的 95.00% 占正态曲线下面积的 99.00%
代替, 代替。 x代替,σ用 s 代替。
X + 1.96S
X + 2.58S
(1)百分位数法 )
表 3-2
百分范围(%) 95 99
参考值范围所对应的百分位数(偏态分布资料) 参考值范围所对应的百分位数(偏态分布资料) 位数 分布资料
单 下限 测 上限 下限 双 测 上限)
P5 P1
P95 P99
P2.5 P0.5
P97.5 P99.5
某地150名正常成年男子红细胞数(1012/L) 名正常成年男子红细胞数( 某地 名正常成年男子红细胞数 ) 正态分布图
正偏态
图4-4 某地居民 某地居民235人发汞含量(µmol/kg)分布 人发汞含量( 人发汞含量 )
负偏态
图4-5 某地居民糖尿病人年龄的频数分布图
正态分布的图形
2.正态分布的特征 2.正态分布的特征
计量资料的统计描述、 实验一 计量资料的统计描述、 参考值范围、 参考值范围、可信区间
一、目的与要求
掌握:数值变量统计描述指标( 掌握:数值变量统计描述指标(集中和离散 趋势指标)的计算、适用条件及意义。 趋势指标)的计算、适用条件及意义。 掌握:正态分布的特点和面积分布规律、 掌握:正态分布的特点和面积分布规律、参 考值范围的估计方法。 考值范围的估计方法。 掌握:总体均数的置信区间及估计方法。 掌握:总体均数的置信区间及估计方法。 熟悉:频数表的编制步骤。 熟悉:频数表的编制步骤。
统计分析: 统计分析:
统计描述
计算指标
集中趋势 离散程度 抽样误差
绘制统计表、图 绘制统计表、 参数估计— 参数估计—CI
统计推断
假设检验
计量— 计量— 计数— 计数—
… t
x
2 检验
编制频数表的步骤
第一组段包括极小值, 第一组段包括极小值,最后 一组段包括极大值, 一组段包括极大值,除最后 一组段可同时标出上下限, 一组段可同时标出上下限, 其他组段只标出下限。 其他组段只标出下限。
表3-3
百分范围%) 95 99
参考值范围所对应的正态分布区间( 正态分布资料 分布资料) 参考值范围所对应的正态分布区间( 正态分布资料) 正态分布区间
单 下限 测 上限 下限 双 测 上限)
X − 1.645S
X − 2.33S
X + 1.654S
X + 2.33S
X − 1.96S
X − 2.58S
1.可信区间(CI) 1.可信区间(CI)的计算 可信区间
1)大样本: 1)大样本: 按正态分布原理 大样本 95%CI x ± 1 . 96 s x 99%CI x ± 2 . 58 s x
总体均数µ 的概率在这个范围。 即总体均数µ有95% 的概率在这个范围。
即总体均数µ有99% 的概率在这个范围。 总体均数µ 的概率在这个范围。
µ±1.645σ 占正态曲线下面积的 90.00%
µ±1.96σ µ±2.58σ
若n>100,则µ可用 n>100,
1.0%
-2.58σ -1.96σ -1σ σ σ σ µ
2.5%
+1σ +1.96σ +2.58σ σ σ σ
确定医学参考值范围
1.医学参考值的意义 医学参考值的意义 医学参考值( 医学参考值(reference value)是指包括 ) 绝大多数正常人的人体形态、 绝大多数正常人的人体形态、机能和代谢 产物等各种生理及生化指标常数, 产物等各种生理及生化指标常数,也称正 常值。习惯上取该人群 常值。习惯上取该人群95%的个体某项医 的个体某项医 学指标的界值。 学指标的界值。
谢 谢
The end
4).确定医学参考值范围的方法 4).确定医学参考值范围的方法
如正态分布资料用正态分布法; 如正态分布资料用正态分布法;对数正态分 布资料用对数正态分布法; 布资料用对数正态分布法;偏态分布资料用 百分位数法。 百分位数法。
(1)正态分布法
双侧 95% 参考值范围: 参考值范围: X ± 1.96 S 参考值范围: 单侧 95%参考值范围: X − 1.645S 或 < X + 1.645S 参考值范围 >
决定取单测还是双测范围
单测或双测是根据指标的实际而定,指标 如 单测或双测是根据指标的实际而定 指标(如 指标 红细胞,血红蛋白等 过高过低均为异常则取双 红细胞 血红蛋白等)过高过低均为异常则取双 血红蛋白等 测,参考值范围需要分别确定下限和上限。 参考值范围需要分别确定下限和上限。 指标仅过高或过低为异常,则取单测。 指标仅过高或过低为异常,则取单测。如 肺活量仅过低异常,取单测下限;尿铅值过 肺活量仅过低异常,取单测下限; 高为异常,取单测上限。 高为异常,取单测上限。
为 U ,变量值的归组统一定为 L ≤ X < U ⑷列表划记。 列表划记
某地120名健康女性右足跟骨硬度指数频数分布表 名健康女性右足跟骨硬度指数频数分布表 某地
组段 5060708090100110120130140-150 合计 组中值X 组中值 55 65 75 85 95 105 115 125 135 145 频数f 频数 3 3 3 9 12 9 27 21 23 10 n=120 Σ fx=? ? Σ fX2 =? ? 累积频数 3 6 累积频率(%) 累积频率 2.5 5.0 fX 165 195 fX2 9075 12675
计算 X 、S 、M
∑ x= ∑f
fX
∑ =
fX n
s=
∑
fX 2 −(∑ fX ) 2 / n n −1
i (n.x% − f L ) PX = L + fX
其中P 为百分位数, 为百分数 为百分数,L为欲求的百 其中 X为百分位数,X为百分数 为欲求的百 分位数所在组段的下限, 为该组段的组距 为该组段的组距, 分位数所在组段的下限,i为该组段的组距, fx为百分位数所在组段的频数,n为总频数, 为百分位数所在组段的频数, 为总频数 为总频数, fL百分位数所在组段之前的累计频数。 百分位数所在组段之前的累计频数。 显然,中位数M=P50 。 显然,中位数
计量资料频数分布的类型和特征
正态分布:各组段的频数以中间组段为中心, 正态分布:各组段的频数以中间组段为中心,左右两侧基本对称 分布类型 偏态分布:各组段的频数不以中间组段为中心, 偏态分布:各组段的频数不以中间组段为中心,而是一侧偏多或偏少
集中趋势: 集中趋势:指频数表中频数分布表现为频数向某一位置集中的趋势 分布特征 离散趋势:指频数虽然向某一位置集中, 离散趋势:指频数虽然向某一位置集中,但频数分布表现为各组段都 有频数分布,而不是所有频数分布在集中位置的趋势。 有频数分布,而不是所有频数分布在集中位置的趋势。
1.正态曲线在横轴上方,中间高,两侧低, 1.正态曲线在横轴上方,中间高,两侧低, 正态曲线在横轴上方 左右对称; 左右对称; 2.正态曲线的高峰位于均数位置; 2.正态曲线的高峰位于均数位置; 正态曲线的高峰位于均数位置 3.正态分布的两个参数是 和标准差σ 3.正态分布的两个参数是μ和标准差σ μ(位置参数 决定曲线的中心位置; 位置参数) μ(位置参数) 决定曲线的中心位置; 形态参数) 决定曲线的陡峭或扁平( σ(形态参数) 决定曲线的陡峭或扁平(高 胖瘦)程度。 矮、胖瘦)程度。 4.正态曲线下的面积为1 (或100%),有一定 4.正态曲线下的面积为1 (或100%),有一定 正态曲线下的面积为 分布规律. 分布规律.
二、实习内容:
P392: : 二、案例辨析题:讨论分析 X 、S指标是否 案例辨析题: 指标是否 恰当? 恰当? P394: 3题 : 题 (1)完善频数表,计算X 、S 、M )完善频数表, (2) 两种方法(正态、偏态)计算 ) 两种方法(正态、偏态)计算95%参考 参考 值范围 (3)计算总体均数的 )计算总体均数的99%可信区间 可信区间
一般 8- - 15 之间 求 出极差 确定组段数 确定组距
列出各个组段
确定每一组段频数
极差即最大值 极差即最大值 与最小值之差
组距=R/组段数, 组距 组段数, 组段数 但一般取一方便 计算的数字
根据变量值大小 把各观察单位归 入各个组段
步骤如下: 步骤如下: 最大值-最小值 ⑴找出全距 R=最大值 最小值 最大值 最小值=146.98-53.06=93.92 和组距(i) ⑵确定组段数(K)和组距 确定组段数 和组距 K=10 组 距 是 指 相 邻 两 组 之 间 的 距 离 。 K= ; i=93.92/10= 392≈ i=93.92/10=9.392≈10 93 (3)根据组距写出组段 每个组段下限为 L ,上限 上限 。
均数的抽样误差
由抽样的原因造成样本均数与样本均数之 间、样本均数与总体均数之间的差异称为 均数的抽样误差。 均数的抽样误差。用于表示均数抽样误差 大小的指标通常称为样本均数的标准误 。 大小的指标通常称为样本均数的标准误 样本
s =计: 点估计:由样本统计量 X、 、 S p 参数的估计 直接估计 总体参数 µ、 、 σ π 区间估计:即按一定的置信度( 区间估计:即按一定的置信度(概 置信度 所在的范围。 率)估计μ所在的范围。 置信度常用95% 99%。 常用95 置信度常用95%或99%。
2)小样本: 则要查t 2)小样本: 则要查t值表 小样本