医学]医学统计学医学检验检验总复习
医学统计学复习重点

整理分析和2.计描述4.(集合)。
1.抽样随机2.分组随机3.实验顺序随机。
称全距,用离散系数,为标准差与均数只比,常:CV=s/x究,1.抽样研究2.个体变异。
系统误差:指数据搜集和测量过程中由于仪器不准确、造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差由于一些非人真实性(validity):观察值与真值的接近程度,受系统误差的影响( (reliabiliy)——也称精密度(precision)或重复性(repeatability)是直接用样本统计量作为对应的总体参数最常用的是95%10095有5在描述两变量间的关系时,若散点图呈直线趋势或有直线相关关系,可进行直线回归分析。
参数:根根据样本的分布特征而计算得到的1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。
5、★频数表的用途:揭示计量资料的分布类型;揭示计量资料的分布特征;便于发现特大值和特小值;便于进一步进行统计分析★常见的统计资料的类型有:计量资料;计数资料;等级资料7、★t检验的应用条件是:①正态分布:当样本含量较小时,要求样本来自正态总体。
②方差齐性:两样本均数比较时,要求两总体方差相等。
U检验的应用条件是:①大样本(如n>50);②小样本,σ已知且样本来自正态总体。
8、★.描述分类变量常用的指标有率、构成比、相对数。
9、率是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,常用来描述某种现象发生的频率大小或强度构成比是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,常用来描述某一事物内部各组成部分所占的比重或分布。
10、★四格表卡方专用公式应用条件n≥40,且Tmin≥5 研究事物或现象间的线性关系用相关分析,研究事物或现象间的线性数量依存关系用回归分析。
医学统计学医学检验检验总复习 .ppt

假设检验
统计资料的类型
—— 计量资料
观察单位某项指标测定值的集合。亦称 变量值,是定量的指标,一般有单位。
—— 计数资料
按性质和类别进行分组所得的资料。其变量值 是定性的,可分二项分类和多项分类。
—— 等级资料
按某项指标的不同程度进行分组的资料。 各组之间有量的差别亦为半定量的资料。
根据分析的需要各类资料可以互相转化。
审核 合理分组
统计描述 统计推断
统计工作的步骤
—— 设计
医学科研设计
调查设计
临床实验设计
—— 搜集资料
统计报表
统计资料
医疗卫生工作记录 (经常性工作记录)
专题调查或实验 (一时性工作记录)
—— 整理资料
整理资料
核对检查原始数据 分组汇总资料
—— 分析资料
统计分析
统计描述 统计推断
统计指标、统计 图、表
抽样误差产生的原因:
1、个体之间存在变异; 2、样本是总体中的一部分。
六、 概率 (probability)
•是描述随机事件发生可能性大小的数 值,用P表示。
0≤ P≤1 ﹡ 必然事件的概率为1(100%) ﹡ 不可能发生事件的概率为0 ﹡ 随机事件的概率在0~1之间
统计学基本概念
变量
同质 总体 测量
总复习
医学统计学是统计学的一门分支学科, 它应用概率论和数理统计的原理和方 法,研究医学领域数据资料的收集, 整理分析和推断。它是进行医学科学 研究所必需的主要手段。
医学统计学的主要内容有:
﹡统计描述
﹡参数估计 ﹡假设检验 ﹡医学科研设计
统计学基本步骤
设计
资料搜集
整理
医学统计学复习资料

小;③要注意分子分母正确选用;④要注意率与比的正确应用;⑤要注 意平均率的计算方法;⑥要注意资料的可比性;⑦率和构成比比较时作 假设检验。 7. 简述直线回归与直线相关的区别。 (1)资料要求上不同:直线回归分析适用于应变量是服从正态分布的随 机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布 的资料。 (2) 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存 关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快; 相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越 大,两个变量的关联程度越大。 9. 假设检验的理论依据是什么?请简述假设检验的基本步骤。 答:假设检验的理论依据是小概率事件原理,步骤为: (1)根据研究目的建立假设,确定检验水准 (2)根据样本统计量的抽样分布规律,选择适当的统计方法,计算检验 统计量 (3)确定P值,做出推断结论 10.方差分析应用广泛,可用于:①两个或多个样本均数间的比较;②分 析两个或多个因素间的交互作用;③回归方程的线性假设检验;④多元 线性回归分析中偏回归系数的假设检验等。本章主要介绍完全随机设计 资料的方差分析、配伍组设计资料的方差分析及重复测量数据的方差分 析。 11. 完全随机设计的两样本率比较时,如何正确选择统计分析方法 (写出相应的计算公式)。 (1)当总例数n≥40且所有格子的T≥5时,用2检验的基本公式或四格表 资料2检验的专用公式; (2)当n≥40但有1≤T<5时,用四格表资料2检验的校正公式;或改用四 格表资料的Fisher确切概率法的连续性校正法: (3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。 12. 什么是医学参考值范围?估计医学参考值范围如何正确选用统计 方法? 答:医学参考值范围是指所谓“正常人”的解剖、生理、生化等指标的 波动范围,亦称正常值范围。如95%的参考值范围包括了95%的观察 值,而有5%的观察值不在这一范围内。 估计医学参考值范围确定方法:
医学统计学复习资料

医学统计学第一章绪论第一节医学统计学的定义和内容1.医学统计学的主要内容 :统计推断、统计描述第二节统计工作的基本步骤1.医学统计工作可分为四个步骤:统计设计搜集资料整理资料分析资料第三节统计资料的类型医学统计资料按研究指标的性质一般分为:定量资料、定性资料、等级资料一、定量资料(计量资料)定量资料(quantitative data)是用定量的方法测定观察单位(个体)某项指标数值的大小,所得的资料称定量资料。
如身高(㎝)、体重(㎏)、脉搏(次/分)、血压(kPa,mmHg)等为数值变量,其组成的资料为定量资料。
二、定性资料(计数资料)定性资料(qualitative data)是将观察单位按某种属性或类别分组,清点各组的观察单位数,所得的资料。
亦称无序分类资料。
如:男-女分组;中医的虚、实,阴、阳等分组;按生存-死亡分组;A、B、O、AB分组。
三、等级资料等级资料(ranked data)是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料。
亦称有序分类资料。
如治疗结果分为治愈、显效、好转、无效四个等级。
:疾病的严重程度可以分为,轻、中、重;中医辨证中舌象的颜色有,淡、红、暗、紫。
♦根据需要,各类变量可以互相转化。
♦若按贫血的诊断标准将血红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正常,可按等级资料处理。
有时亦可将定性资料或等级资料数量化,如将等级资料的治疗结果赋以分值,分别用0、1、2…等表示,则可按定量资料处理。
第四节统计学中的几个基本概念一、同质与变异同质(homogeneity)是指观察单位或研究个体间被研究指标的主要影响因素相同或基本相同。
如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。
变异(variation)由于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。
如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别。
医学统计学复习资料(完整版)

第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
tj8[医学]医学统计学试题
![tj8[医学]医学统计学试题](https://img.taocdn.com/s3/m/5495126fe45c3b3566ec8b25.png)
医学统计学复习题一、名词解释1.总体2.样本3.随机抽样4.变异5.等级资料6.参数7.统计量8.算术均数9.中位数10.百分位数11.频数分布表12.几何均数13.方差14.标准差15.变异系数16.可信区间17.统计推断18.参数估计19.构成比20.率二、单项选择1.观察单位为研究中的()。
A.样本B.全部对象C.影响因素D.个体E.观察指标2.总体是由( )组成。
A.部分个体B.全部对象C.全部个体D.同质个体的所有观察值E.相同的观察指标3.抽样的目的是()。
A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例D.研究总体统计量E.研究特殊个体的特征4.参数是指( ) 。
A.参与个体数B.总体中研究对象的总和C.样本的统计指标D.样本的总和E.总体的统计指标5.关于随机抽样,下列哪一项说法是正确的()。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随机抽取个体D.为确保样本具有更好的代表性,样本量应越大越好E.选择符合研究者意愿的样本6.反映计量资料平均的指标是()。
A.频数B.参数C.百分位数D.平均数E.统计量7.表示总体均数的符号是( ) 。
A.σB.μC.XD. SE. M8.下列指标中,不属于集中趋势指标的是()。
A.均数B.中位数C.百分位数D.几何均数E.众数9. ( )分布的资料,均数等于中位数。
A.对称分布B.正偏态分布C.负偏态分布D.对数正态分布E.正态分布10.一组某病患者的潜伏期(天)分别是:2、5、4、6、9、7、10和18,其平均水平的指标该选()。
A.中位数B.算术均数C.几何均数D.平均数E.百分位数末端有确定数据11.编制频数分布时,组距通常是()。
A.极差的1/20B.极差的1/10C.极差的1/5D.极差的1/4E.极差的1/212.以下适宜描述计量资料离散趋势的指标有()。
复习资料(医学统计)

复习资料第一大题:单项选择题1、欲了解某市8岁小学生的身高情况,该市某小学二年级8岁小学生是:()∙ A. 样本∙ B. 有限总体∙ C. 无限总体∙ D. 个体2、抽样调查了某地4岁男孩的生长发育情况,得到身高均数为98.67cm,标准差为4.63cm,头围均数为46.23cm,标准差为3.16cm,欲比较两者的变异程度,下列结论正确的是:()∙ A. 身高变异程度大∙ B. 头围变异程度大∙ C. 身高和头围的变异程度相同∙ D. 由于两者的均数相差很大,无法比较两者的变异程度3、在计算方差时,若将各观察值同时减去某一常数后求得的方差:( )∙ A. 会变小∙ B. 会变大∙ C. 不变∙ D. 会出现负值4、某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为( )∙ A. 概率∙ B. 构成比∙C. 发病率∙D. 相对比5、两个分类变量的频数表资料作关联性分析,可用( )∙A. 积距相关或等级相关∙B. 积距相关或列联系数∙C. 列联系数或等级相关∙D. 只有等级相关6、对于服从双变量正态分布的资料,如果直线相关分析算出的值越大,则经回归分析得的相应的b 值:∙A. 越大∙B. 越小∙C. 比r小∙D. 可能较大也可能较小7、多组均数的两两比较中,若不用q检验而用t 检验,则:()∙A. 结果更合理∙B. 结果一样∙C. 会把一些无差别的总体判断为有差别∙D. 会把一些有差别的总体判断为无差别8、在比较甲、乙两种监测方法测量结果是否一直时,若采用配对设计秩和检验,甲、乙两法测量值之差中有-0.02、0.02,若差值绝对值的位次为3、4,则这两个差值的秩次分别为:()∙A. -3.5,3.5∙ B. -3.5,-3.5∙ C. 3.5,3.5∙ D. -3,49、Y=14+4X是1~7岁儿童以年龄(岁)估计体重(市斤)回归方程,若体重换成国际单位kg,则此方程:()∙ A. 截距改变∙ B. 回归系数改变∙ C. 两者都改变∙ D. 两者都不变10、某卫生局对其辖区内甲、乙两医院医疗技术人员的业务素质进行考核,在甲医院随机抽取100人,80人考核结果为优良;乙医院随机抽取150人,100人考核结果为优良。
医学统计学复习

复 习
医学统计中的基本概念
医学统计工作的内容
实验设计 整理资料
收集资料 分析资料
资料的类型
医学统计资料一般可分为计量资料 和计数资料两大类。 不同的统计资料应采用不同的统计 分析方法。
总体和样本
总体是同质的个体所构成的全体。 从总体中抽取部分个体的过程称 为抽样,所抽得的部分成为样本
通常单侧检验比双侧检验更为灵敏,更 易检验出差别,以此宜广泛采用。 错。单侧检验的使用应以专业知识为依据, 它充分利用了另一侧的不可能性,故检出 率高,但应慎用。
2 2 四个样本率作比较, 0.05( 3) 可认为
各总体率均不相等
错。应为均不相等或不全相等
选择题 对两样本作均数比较时,已知两样本例数 均小于30,总体方差不齐,且呈偏态分 布,宜用( C )。 A. t 检验 B. u 检验 C. 秩和检验 D. F 检验
配对资料的秩和检验 成组资料的秩和检验 多组资料的秩和检验
完全随机化设计资料 配伍组设计资料
非参数检验方法的优点是适应性强,但 此时由于损失了部分信息,检验效率降 低了。即在资料服从正态分布的前提下, 当H0不真时,非参数检验方法不如参数 检验方法能灵敏地拒绝H0,换句话说犯 第二类错误的可能性大于参数检验法。 因此,对于适合参数检验的资料,最好 还是用参数检验。
t检验
t检验的适用条件:总体服从正态分布, 且不知总体标准误,而用样本标准误代 替标准误进行计算 两小样本均数进行比较时,方差齐,用t 检验;方差不齐,用t’检验。
t 检验
例 根据大量调查,已知健康成年男子的 脉搏均数为72次/分。某医生在某山区随 机调查25名健康男子,求得脉搏均数为 74.2次/分,标准差为6.0次/分。能否认 为该山区的成年男子的脉搏均数高于一 般成年男子的脉搏均数?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
﹡应 用
变量值分布一端或两端无确定数值
分布不明资料
﹡计算方法
直接用变量值计算
M = X n+1 (n为奇数时)
2
1
或 M= 2
X n + X n+1 (n为偶数时)
2
2
用频数表计算
in M = L + ( — ∑fL )
fx 2
附:百分位数 ( Percentile,Px ) 描述变量值序列在某百分位位置的水平,
标)。观察指标的测定结果则 称变量值。
变 异: 同质个体间测定结果的差异。
二、总体和样本
总 体 (population):
根据研究目的而确定的同质的观察单位 某项指标测定值的集合。
有限总体
总体
无限总体
样 本 (sample):
从总体中随机抽取部分观察单位组成 为使样本对总体具有代表性要求:
﹡抽样必须遵循随机的原则 ﹡保证足够的样本含量
多个百分位数结合可更全面地描述变量值的 分布特征。
i Px = L + fx (n ·x% — ∑fL )
三、离散趋势 (fendency of dispersion)
抽样误差产生的原因:
1、个体之间存在变异; 2、样本是总体中的一部分。
六、 概率 (probability)
•是描述随机事件发生可能性大小的数 值,用P表示。
0≤ P≤1 ﹡ 必然事件的概率为1(100%) ﹡ 不可能发生事件的概率为0 ﹡ 随机事件的概率在0~1之间
统计学基本概念
变量
误差
同质 总体 测量
参数估计
假设检验
统计资料的类型
—— 计量资料 (数值变量)
观察单位某项指标测定值的集合。 亦称变量值,是定量的指标,一般有单 位。
—— 计数资料 (无序分类变量)
按性质和类别进行分组所得的资料。其 变量值是定性的,可分二项分类和多项分类。
—— 等级资料 (有序分类变量)
按某项指标的不同程度进行分组的资料。 各组之间有量的差别亦为半定量的资料。
﹡应 用
对称分布资料,尤其是正态分布资料
﹡计算方法 直接法χ=
χ1+ χ2+……+ χn n
∑χ =n
加权法χ=
f 1 χ1+f 2 χ2+……+f kχk =
∑f χ
f 1 +f 2+……+f k
n
常用平均数:
—— 几何均数 (geometric mean)
﹡表示符号 (G) ﹡应 用 变量值呈倍数关系,对数正态分布资料
根据分析的需要各类资料可以互相转化。
三类数据间的关系
例:一组2040岁成年人的血压
<8 低血压
等 8 正常血压
定量数据
级 数 据
12 15
轻度高血压 中度高血压
定性数据
17 重度高血压
以12kPa为界分为正常与异常两组,统计每组例
数
医学统计学的几个基本概念 一、 变量与变异
变 量: 被观察单位的特征(即观察指
﹡计算方法 直接法 G = n √ x1 ·x2 … xn
加权法
G = lg–1 lgx1+lgx2+…+lgxn = lg–1 ∑ lgx
n
n
G = lg–1 f1lgx1+f2lgx2+…+fklgxk = lg–1 ∑f lgx
n
n
常用平均数
—— 中位数 (median)
﹡表示符号
(M)
偏态分布资料
16
228
95.8
2.7~
6
234
98.3
3.1~
1
235
98.7
3.5~
0
235
98.7
3.9~4.3
3
238
100.0
负偏态分布
某地某年恶性肿瘤死亡率的年龄分布
年龄组 0~ 10~ 20~ 30~ 40~ 50~ 60~ 70~
恶性肿瘤死亡率(1/10万) 0.5 12 15 76
189 234 386 286
三、 抽样
从总体中抽样必须遵循科学原则 样本应具有: 代表性、随机性、可靠性、可比性
常用随机抽样方法:
机械抽样、分层抽样、随机数字表
四、 设计类型
完全随机设计:(两组或多组比较) 配对设计:(同源或异源两两配对) 随机区组设计:(两个以上受试对象组成一
个配伍组)
五、 误差 (error)
系统误差、随机测量误差、抽样误差 (smapling error):指样本统计量与总体参数 之差,由抽样所造成,是不可避免的,但可 以控制。
参数: 变异 ,,
概率
•P(A | B) = P(A and B) P(B)
样本
统计量:
x, s, p
频率
一、计量资料的统计描述
——编制频数表
—— 频数分布的特征
﹡集中趋势
变量值集中分布的位 置
﹡离散趋势
变量值围绕集中位置 的分布情况
—— 频数分布的类型
﹡对称分布
某地区130名正常成年男子红细胞数(1012/L)的频数分布
红细胞数
划记
频数
(1)
(2)
(3)
3.70~
||
2
3.90~ 4.10~ 4.30~ 4.50~ 4.70~ 4.90~ 5.10~ 5.30~
||||
4
正||||
9
正正正 |
16
正正正正 | |
22
正正正正正
25
正正正正 |
21
正正正 | |
17
正||||
9
5.50~
||||
4
5.70~5.90
|
审核 合理分组
统计描述 统计推断
统计工作的步骤
—— 设计
医学科研设计
调查设计
临床实验设计
—— 搜集资料
统计报表
统计资料
医疗卫生工作记录 (经常性工作记录)
专题调查或实验 (一时性工作记录)
—— 整理资料
整理资料
核对检查原始数据 分组汇总资料
—— 分析资料
统计分析
统计描述 统计推断
统计指标、统计 图、表
1
合计
——
130
﹡偏态分布
正偏态分布
238名正常人发汞值(μg/g) 的中位数和百分位数的频数表计算
发汞值
频数
累计频数
累计频率(%)
(1)
(2)
(3)
(4)=(3)/238
0.3~
20
20
8.4
0.7~
66
866
61.3
1.5~
48
194
81.5
1.9~
18
212
89.1
2.3~
总复习
医学统计学是统计学的一门分支学科, 它应用概率论和数理统计的原理和方 法,研究医学领域数据资料的收集, 整理分析和推断。它是进行医学科学 研究所必需的主要手段。
医学统计学的主要内容有:
﹡统计描述
﹡参数估计 ﹡假设检验 ﹡医学科研设计
统计学基本步骤
设计
资料搜集
整理
分析
调查设计 实验设计
资料来源 质量控制
二、集中趋势(Central tendency) 的描述
平均数(average)常用于描述一组变量值 的集中趋势,是反映同质资料的平均水平或 集中位置的特征值。
常用平均数
均数 ( X ) 几何均数(G)
中位数(M)
常用平均数:
—— 均数 (算术均数) (mean)
﹡表示符号
总体均数 (μ)
样本均数 (χ)