卫生统计学复习笔记

合集下载

卫生统计学知识点整理

卫生统计学知识点整理

卫生统计学知识点整理1.数据类型:卫生统计学包括两种主要类型的数据,即定量数据和定性数据。

定量数据是数值型数据,如身高、体重等,可以使用各种统计方法进行分析。

定性数据是非数值型数据,如性别、职业等,可以使用描述性统计方法进行分析。

2.数据收集方法:卫生统计学使用多种方法收集数据,其中包括调查、观察、实验和文献研究等。

调查是最常用的数据收集方法,通过设计问卷或面对面访谈等手段收集信息。

观察是观察和记录事件或行为,以获取相关数据。

实验是通过对照组和干预组进行比较来确定原因和效果的方法。

文献研究是通过分析已有的文献、报告和统计数据来获取相关信息。

3.数据描述和总结:在数据收集完成后,卫生统计学需要对数据进行描述和总结。

这包括计算各种统计指标,如平均数、中位数、众数和标准差等,以了解数据的分布和变异程度。

4.假设检验:卫生统计学中常用的方法之一是假设检验,用于判断一些变量是否与其他变量有显著关联或差异。

假设检验基于统计学原理,通过计算样本数据与预期数据之间的差异,评估是否拒绝或接受一些假设。

5.相关分析:相关分析是研究两个或多个变量之间关系的统计方法。

它可以确定变量之间的相关性大小和方向,并计算相关系数来度量相关性的强弱。

6.回归分析:回归分析是用来预测和解释一个或多个因变量与一个或多个自变量之间关系的方法。

它可以估计自变量对因变量的影响程度,并评估其统计显著性。

7.生存分析:生存分析是研究个体在一定时间内生存或发生一些事件的概率的统计方法。

它通常用于研究疾病的生存率和治疗效果。

8.抽样方法:抽样方法是在卫生调查中常用的一种方法,它可以通过选择一部分样本来代表整体群体。

常见的抽样方法包括随机抽样、系统抽样、分层抽样和整群抽样等。

9.统计软件:卫生统计学使用各种统计软件来进行数据分析和统计计算。

常用的统计软件包括SPSS、SAS、R和STATA等,它们提供了丰富的统计功能和图形展示方式。

10.数据伦理:卫生统计学中数据伦理是一个重要的问题,主要涉及数据的保密性、隐私保护和知情同意等方面。

卫生统计学笔记整理

卫生统计学笔记整理

卫生统计学笔记整理第1章绪论1、卫生统计学的概念:2、统计工作的基本步骤:3、卫生统计学的几个基本概念(attention:资料的分类)第2章调查研究设计1、调查研究的特点:2、调查研究的类型,按调查抽样比例划分.第3章实验设计1、实验设计的特点.2、实验设计的三要素四原则。

3、常用的实验设计方案:(attention:正确区别完全随机设计和配对设计)第4章定量资料的统计描述1、频数表的编制步骤和频数表的用途2、集中趋势的描述。

(P55知识点4-2)3、离散趋势的描述。

(P58知识点4-3)4、正态分布的特征5、制定医学参考值范围第5章定性资料的统计描述1、相对数是对定性资料进行统计描述的一类指标。

2、常用相对数(率、构成比、相对比)的定义3、应用相对数需要注意的问题[知识点5-3] P694、标准化法的意义和基本思想5、标准化率的计算方法与注意事项[知识点5-5] P74补充:1、该方法便于比较,但不能反映实际情况。

2、并非所有资料都可以计算标准化率,若各组间出现交叉,不宜用该方法。

3、两样本做标准化率后应做假设检验第6章总体均数和总体率的估计1、抽样误差的概念。

2、标准误的概念。

[知识点6-2] P793、t分布(了解)(一)t分布的概念与计算公式(二)t分布的特征与t界值表4、可信区间的概念。

5、总体均数的估计方法:[知识点6-3] P83第7章假设检验1、假设检验的基本思想及基本步骤[知识点7-1] P922、Ⅰ型错误与Ⅱ型错误。

[知识点7-2] P933、单侧检验与双侧检验区分。

[知识点7-3] P954、假设检验应该注意的问题。

[知识点7-3] P97第8章 t检验第一节样本与总体均数的比较1.检验步骤2.[知识点8-1] P1003.当样本数量n≧50或总体均数已知时用z检验[知识点8-2] P102第二节配对设计均数的比较1.检验步骤2.[知识点8-3] P103第三节两样本均数的比较1.检验步骤2.z检验的适用条件第9章方差分析第一节方差分析的基本思想和应用条件(1)总变异、组间变异、组内变异的定义与公式(2)条件:符合定量资料,具有独立性正态分布方差齐性的特征,多样本(3或3个以上)间的比较第二节完全随机设计的方差分析(1)检验步骤(2)注意事项:[知识点9-2] P120第四节多个样本均数的两两比较1.q检验适用范围:当方差分析得出结论拒绝H0接受H1假设时需进行q检验2.掌握检验步骤第10章 X2检验第一节2x2表的X2 检验(一)完全随机设计X2 检验1.检验步骤及公式2.注意事项:[知识点10-2] p141(二)配对设计X2 检验1.检验步骤及公式2.[知识点10-3] p142第二节RⅹC表的X2 检验1.注意事项:[10-4] p143第11章非参数检验适用条件:(1)总体分布形式未知或分布类型不明(2)偏态分布的资料(3)等级资料不能精确测定,只能以严重程度优劣等级次序先后等表示(4)不满足参数检验条件资料各组方差明显不齐(5)数据的一端或两端为不确定数值的资料、等级资料(6)[知识点11-1] p153第一节秩和检验1.检验步骤:详读p154 (2)(3)3.第二节两样本比较的秩和检验1.掌握编秩的方法2.注意条件详看p157的3第12章双变量关联性分析第一节直线相关1、直线相关的概念:又称简单相关,是用来描述具有直线关系的两变量x、y相互关系的统计方法,要求两变量均来自双变量正态分布的随机变量,且两变量不分主次,处于同等地位。

医学统计学重点笔记一复习必备

医学统计学重点笔记一复习必备
10
正态分布及其应用
2024/1/26
正态分布概念
一种概率分布,具有钟型曲线特点,由均数和标准差决定 其分布形状。
正态分布在医学中的应用
许多医学指标如身高、体重、血压等服从或近似服从正态 分布;在估计医学参考值范围、质量控制等方面有广泛应 用。
正态性检验方法
图形法(直方图、P-P图、Q-Q图)、计算法(偏度系数 和峰度系数检验、Shapiro-Wilk检验、KolmogorovSmirnov检验等)。
任务
揭示医学领域中的数量规律,为 医学研究和临床实践提供科学的 方法和手段。
4
医学统计学发展简史
01
02
03
古典统计学时期
以描述性统计为主,关注 数据的收集和整理。
2024/1/26
推断统计学时期
以概率论为基础,发展出 假设检验、参数估计等推 断性统计方法。
现代统计学时期
引入计算机技术和复杂数 学模型,推动统计学向更 高层次发展。
2024/1/26
26
2024/1/26
06
卡方检验
27
四格表资料卡方检验
2024/1/26
适用条件
四格表资料,即2×2列联表,用于分析两个二分类变量之间的关联 。
检验统计量
卡方值,计算公式为χ2=(ad-bc)2N/(a+b)(c+d)(a+c)(b+d),其 中N为样本总量。
拒绝域
根据自由度和显著性水平确定拒绝域,自由度为1。
20
多重比较方法
多重比较方法是在方差分析的基础上 ,进一步比较各组均值之间的差异是 否显著的方法。
常用的多重比较方法有LSD法、S-NK法、Tukey法等,其中LSD法是一种 较为简单的方法,适用于各组样本量 相等的情况;S-N-K法是一种基于学 生化极差的方法,适用于各组样本量 不等的情况;Tukey法是一种基于t分 布的方法,适用于多组比较的情况。

卫生统计学知识点汇总

卫生统计学知识点汇总

卫生统计学知识点汇总卫生统计学知识点汇总卫生统计学是一门研究如何收集、整理、分析和解释与人类健康相关的统计数据的学科。

以下是一些卫生统计学的知识点汇总:1. 健康指标和健康统计数据卫生统计学研究的核心是健康指标和健康统计数据。

健康指标是用来衡量人类健康状况的指标,如死亡率、发病率、存活率等。

健康统计数据是指收集和整理的与人类健康相关的数据信息。

2. 健康调查和流行病学研究卫生统计学包括健康调查和流行病学研究。

健康调查是通过问卷调查、面访和体检等方式,对人群的健康状况进行评估和监测。

流行病学研究是研究疾病在人群中分布、发生和传播规律的学科。

3. 死因统计学死因统计学是研究人口死亡原因及其统计方法的学科。

通过对死亡证明和其他相关资料的分析,可以得到不同死因的死亡率和死因结构,为公共卫生和医疗健康政策制定提供依据。

4. 卫生服务利用统计卫生服务利用统计研究人群对卫生服务的需求,以及卫生服务的提供情况。

包括统计各类卫生机构的数量、位置和服务范围,以及人群对卫生服务的需求和利用情况。

5. 卫生经济学指标卫生经济学指标是研究卫生经济学相关问题的统计指标。

包括卫生资源投入和产出指标,如医疗卫生总费用、卫生人力资源和医疗服务产出等。

6. 因素分析和回归分析因素分析是研究多个相关变量之间关系的统计方法,可以用于探索影响健康的各种因素。

回归分析是通过建立数学模型,研究一个或多个自变量对因变量的影响程度和方向。

7. 卫生统计学软件与工具卫生统计学的研究除了基本的统计学知识外,还需要掌握一些卫生统计学软件和工具的使用。

如SPSS、R、EpiInfo等数据处理和分析软件。

以上是一些卫生统计学的知识点汇总,这门学科涵盖了众多的知识领域,为研究人类健康提供了重要的数据支持和决策依据。

卫生统计学知识点(笔记)

卫生统计学知识点(笔记)

第一章绪论1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。

2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。

可分为目标总体和研究总体。

若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。

需要谨慎的是,就研究总体所下的结论未必适用于目标总体。

3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。

获取样本的过程称为抽样(sampling)。

抽样研究的目的是用样本数据推断总体的特征。

需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。

4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。

5.▲变异(variation)是指同质的个体之间存在的差异。

6.▲变量的类型二分类变量分类变量或名义变量定性变量多分类变量变量有序变量或等级变量定量变量离散型变量连续型变量变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总体均数μ,总体标准差σ。

8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。

统计学的任务就是依据样本统计量来推断总体参数。

9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。

当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。

2023年医学统计学总结重点笔记复习资料

2023年医学统计学总结重点笔记复习资料

第一章2选1总体:总体(population)是根据研究目的拟定的同质观测单位(研究对象)的全体,事实上是某一变量值的集合。

可分为有限总体和无限总体。

总体中的所有单位都可以标记者为有限总体,反之为无限总体。

总体population根据研究目的而拟定的同质观测单位的全体。

样本:从总体中随机抽取部分观测单位,其测量结果的集合称为样本(sample)。

样本应具有代表性。

所谓有代表性的样本,是指用随机抽样方法获得的样本。

样本sample从总体中随机抽得的部分观测单位,其实测值的集合。

3选1小概率事件:我们把概率很接近于0(即在大量反复实验中出现的频率非常低)的事件称为小概率事件。

P值:P 值即概率,反映某一事件发生的也许性大小。

记录学根据显著性检查方法所得到的P 值反映结果真实限度,一般以P ≤ 0.05 认为有记录学意义, P ≤0.01 认为有高度记录学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。

P值是:1) 一种概率,一种在原假设为真的前提下出现观测样本以及更极端情况的概率。

2) 拒绝原假设的最小显著性水平。

3) 观测到的(实例的) 显著性水平。

4) 表达对原假设的支持限度,是用于拟定是否应当拒绝原假设的另一种方法。

小概率原理:一个事件假如发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不也许性原理。

记录学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1)(1)计量资料:对每个观测单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。

计量资料亦称定量资料、测量资料。

.其变量值是定量的,表现为数值大小,一般有度量衡单位。

如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。

计量资料measurement data定量资料quantitative data数值变量资料numerical variable为观测每个观测单位某项指标的大小,而获得的资料。

卫生统计学重点笔记

卫生统计学重点笔记

医师资格考试蓝宝书-预防医学医学统计学方法第一节基本概念和基本步骤(非常重要)一、统计工作的基本步骤设计(最关键、决定成败)、搜集资料、整理资料、分析资料。

总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。

总体的指标为参数。

实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。

样本的指标为统计量。

由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。

抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。

某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件,<0.05或0.01为小概率事件。

二、变量的分类变量:观察单位的特征,分数值变量和分类变量。

第二节数值变量数据的统计描述(重要考点)一、描述计量资料的集中趋势的指标有1.均数均数是算术均数的简称,适用于正态或近似正态分布。

2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。

对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。

3.中位数一组按大小顺序排列的观察值中位次居中的数值。

可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。

不能求均数和几何均数,但可求中位数。

百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。

二、描述计量资料的离散趋势的指标1.全距和四分位数间距。

2.方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。

均为数值越小,观察值的变异度越小。

3.变异系数多组间单位不同或均数相差较大的情况。

变异系数计算公式为:CV=s/X×100%,公式中s为样本标准差,X为样本均数。

卫生统计学的重点归纳

卫生统计学的重点归纳

卫生统计学的重点归纳卫生统计学的重点归纳一、卫生统计学的定义卫生统计学是以统计理论和方法为基础,应用数学、物理、化学、计算机等学科技术,研究卫生和医疗问题的数据分析方法。

它以收集,处理,分析和解释卫生和医疗等领域的统计数据为基础,以定量分析和定性分析卫生数据,研究卫生和应用流行病学方法,识别患病危险因素,以及制定卫生与医疗保健的政策与措施,为医学和公共卫生提供科学依据的一门学科。

二、卫生统计学的基本原理(1)基本理论卫生统计学的基本理论包括:(1)数理统计学:数理统计学是以统计学的数据处理方法为工具,探讨多变量间相互关系的学科;(2)社会科学统计学:社会科学统计学是以统计学的方法为工具,研究社会判断和实证研究的学科;(3)中国统计学:中国统计学是以中国传统的统计学理论和方法为基础,研究社会发展进程中社会变迁的学科;(4)应用统计学:应用统计学是以统计学的方法来解决实际问题,如实验设计与分析、生态学分析、经济学分析等。

(2)基本方法卫生统计学的基本方法包括:(1)分类法:分类法是按照实际问题的性质,将被研究对象进行科学的定性分类;(2)测度法:测度法是按照实际问题的性质,将被研究对象进行科学的定量测度;(3)统计方法:统计方法是利用统计技术处理数据,以处理、描述、分析和预测实证问题;(4)流行病学方法:流行病学方法是指在全面调查的基础上,利用统计技术,研究病因、流行病学及其预防控制等方面的方法。

三、卫生统计学的应用1、卫生统计学用于事件分析。

事件分析包括:病原体检测、医疗并发症监测、病因研究、新药研发、疾病控制等研究;2、卫生统计学用于政策分析,为卫生政策、医疗政策、公共卫生政策的制订、实施和评价,提供科学依据;3、卫生统计学用于质量控制。

对质量控制体系中的质量指标进行定量分析、定性分析和评价;4、卫生统计学用于教育考试。

有助于改进教育评价,提高客观能力,开发判断及决策技能;5、卫生统计学用于职业卫生领域,可以指导职业卫生政策的制定和促进各种职业病的预防。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

卫生统计学复习笔记一、概述1、卫生统计学的概念(熟练掌握)统计学是研究数据的收集、整理和分析的一门科学,帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。

卫生统计学是应用数统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。

由此看出:统计学是处理资料中变异性的科学和艺术,是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科。

这里强调了“过程”,但在实际工作中,许多人往往是忽略了设计、收集和归类(整理),到了分析数据时才想到统计学,此时难免发生“悔之晚矣”的憾事。

作为统计学的应用者应充分认识到这一点。

卫生统计学的内容(了解):1)健康统计:医学人口统计、疾病统计和生长发育统计等;2)卫生服务统计:包括卫生资源利用、医疗卫生服务的需求、医疗保健体制改革等方面的统计学问题。

2、卫生统计学的工作步骤(熟练掌握)统计学对统计工作的全过程起指导作用,任何统计工作和统计研究的全过程都可分为以下四个步骤:1)、设计:在进行统计工作和研究工作之前必须有一个周密的设计。

设计是在广泛查阅文献、全面了解现状、充分征询意见的基础上,对将要进行的研究工作所做的全面设想。

其内容包括:明确研究目的和研究假说,确定观察对象、观察单位、样本含量和抽样方法,拟定研究方案、预期分析指标、误差控制措施、进度与费用等。

设计是整个研究工作中最关键的一环,也是指导以后工作的依据2)、收集资料:遵循统计学原理采取必要措施得到准确可靠的原始资料。

及时、准确、完整是收集统计资料的基本原则。

卫生工作中的统计资料主要来自以下三个方面:①统计报表:是由国家统一设计,有关医疗卫生机构定期逐级上报,提供居民健康状况和医疗卫生机构工作的主要数据,是制定卫生工作计划与措施、检查与总结工作的依据。

如法定传染病报表,职业病报表,医院工作报表等。

②经常性工作记录:如卫生监测记录、健康检查记录等。

③专题调查或实验。

3)、整理资料:收集来的资料在整理之前称为原始资料,原始资料通常是一堆杂乱无章的数据。

整理资料的目的就是通过科学的分组和归纳,使原始资料系统化、条理化,便于进一步计算统计指标和分析。

其过程是:首先对原始资料进行准确性审查(逻辑审查与技术审查)和完整性审查;再拟定整理表,按照“同质者合并,非同质者分开”的原则对资料进行质量分组,并在同质基础上根据数值大小进行数量分组;最后汇总归纳。

4)、分析资料:其目的是计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律。

统计分析包括统计描述和统计推断。

前者是用统计指标与统计图(表)等方法对样本资料的数量特征及其分布规律进行描述;后者是指如何抽样,以及如何用样本信息推断总体特征。

进行资料分析时,需根据研究目的、设计类型和资料类型选择恰当的描述性指标和统计推断方法。

统计工作的四个步骤紧密相连、不可分割,任何一步的缺陷,都将影响整个研究结果。

3、基本概念:1)、同质与变异。

严格地讲,同质是指被研究指标的影响因素完全相同。

但在医学研究中,有些影响因素往往是难以控制的(如遗传、营养等),甚至是未知的。

所以,在统计学中常把同质理解为对研究指标影响较大的、可以控制的主要因素尽可能相同。

例如研究儿童的身高时,要求性别、年龄、民族、地区等影响身高较大的、易控制的因素要相同,而不易控制的遗传、营养等影响因素可以忽略。

同质基础上的个体差异称为变异。

如同性别、同年龄、同民族、同地区的健康儿童的身高、体重不尽相同。

事实上,客观世界充满了变异,生物医学领域更是如此。

哪里有变异,哪里就需要统计学。

若所研究的同质群体中所有个体一模一样,只需观察任一个体即可,无须进行统计研究。

2)、总体与样本任何统计研究都必须首先确定观察单位,亦称个体。

观察单位是统计研究中最基本的单位,可以是一个人、一个家庭、一个地区、一个样品、一个采样点等。

总体是根据研究目的确定的同质观察单位的全体,或者说,是同质的所有观察单位某种观察值(变量值)的集合。

例如欲研究山东省2002年7岁健康男孩的身高,那么,观察对象是山东省2002年的7岁健康男孩,观察单位是每个7岁健康男孩,变量是身高,变量值(观察值)是身高测量值,则山东省2002年全体7岁健康男孩的身高值构成一个总体。

它的同质基础是同地区、同年份、同性别、同为健康儿童。

总体又分为有限总体和无限总体。

有限总体是指在某特定的时间与空间范围内,同质研究对象的所有观察单位的某变量值的个数为有限个,如上例;无限总体是抽象的,无时间和空间的限制,观察单位数是无限的,如研究碘盐对缺碘性甲状腺病的防治效果,该总体的同质基础是缺碘性甲状腺病患者,同用碘盐防治;该总体应包括已使用和设想使用碘盐防治的所有缺碘性甲状腺病患者的防治效果,没有时间和空间范围的限制,因而观察单位数无限,该总体为无限总体。

在实际工作中,所要研究的总体无论是有限的还是无限的,通常都是采用抽样研究。

样本是按照随机化原则,从总体中抽取的有代表性的部分观察单位的变量值的集合。

如从上例的有限总体(山东省2002年7岁健康男孩)中,按照随机化原则抽取100名7岁健康男孩,他们的身高值即为样本。

从总体中抽取样本的过程为抽样,抽样方法有多种。

抽样研究的目的是用样本信息推断总体特征。

统计学好比是总体与样本间的桥梁,能帮助人们设计与实施如何从总体中科学地抽取样本,使样本中的观察单位数(亦称样本含量)恰当,信息丰富,代表性好;能帮助人们挖掘样本中的信息,推断总体的规律性。

3)、资料与变量及其分类总体确定之后,研究者应对每个观察单位的某项特征进行测量或观察,特征称为变量。

如“身高”、“体重”、“性别”、“血型”、“疗效”等。

变量的测定值或观察值称为变量值或观察值,亦称为资料。

按变量的值是定量的还是定性的,可将变量分为以下类型,变量的类型不同,其分布规律亦不同,对它们采用的统计分析方法也不同。

在处理资料之前,首先要分清变量类型。

1)数值变量:其变量值是定量的,表现为数值大小,可经测量取得数值,多有度量衡单位。

如身高(cm)、体重(kg)、血压(mmHg kPa)、脉搏(次/min)和白细胞计数(×10 9 /L)等。

这种由数值变量的测量值构成的资料称为数值变量资料,亦称为定量资料。

大多数的数值变量为连续型变量,如身高、体重、血压等;而有的数值变量的测定值只能是正整数,如脉搏、白细胞计数等,在医学统计学中把它们也视为连续型变量。

2)分类变量:其变量值是定性的,表现为互不相容的类别或属性。

分类变量可分为无序变量和有序变量两类:(1)无序分类变量是指所分类别或属性之间无程度和顺序的差别。

它又可分为①二项分类,如性别(男、女),药物反应(阴性和阳性)等;②多项分类,如血型(O、A、B、AB),职业(工、农、商、学、兵)等。

对于无序分类变量的分析,应先按类别分组,清点各组的观察单位数,编制分类变量的频数表,所得资料为无序分类资料,亦称计数资料。

(2)有序分类变量各类别之间有程度的差别。

如尿糖化验结果按-、±、+、++、+++分类;疗效按治愈、显效、好转、无效分类。

对于有序分类变量,应先按等级顺序分组,清点各组的观察单位个数,编制有序变量(各等级)的频数表,所得资料称为等级资料。

变量类型不是一成不变的,根据研究目的的需要,各类变量之间可以进行转化。

例如血红蛋白量(g/L)原属数值变量,若按血红蛋白正常与偏低分为两类时,可按二项分类资料分析;若按重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高分为五个等级时,可按等级资料分析。

有时亦可将分类资料数量化,如可将病人的恶心反应以0、1、2、3表示,则可按数值变量资料(定量资料)分析。

4、随机事件与概率医学研究的现象,大多数是随机现象,对随机现象进行实验或观察称为随机试验。

随机试验的各种可能结果的集合称为随机事件,亦称偶然事件,简称事件。

例如用相同治疗方案治疗一批某病的患者,治疗转归可能为治愈、好转、无效、死亡四种结果,对于一个刚入院的患者,治疗后究竟发生哪一种结果是不确定的,可能发生的每一种结果都是一个随机事件。

对于随机事件来说,在一次随机试验中,某个随机事件可能发生也可能不发生,但在一定数量的重复试验后,该随机事件的发生情况是有规律可循的。

概率是描述随机事件发生的可能性大小的数值,常用P表示。

例如,投掷一枚均匀的硬币,随机事件A表示“正面向上”,用 n表示投掷次数;m表示随机事件A发生的次数;f表示随机事件A发生的频率(f=m/n),0≤m≤n, 0≤f≤1。

用不同的投掷次数n作随机试验,结果如下:m/n=8/10=0.8, 7/20=0.35,…… , 249/500=0.498,501/1000=0.501, 10001/2000=0.5000,由此看出当投掷次数n足够大时,f=m/n→0.5,称P(A)=0.5,或简写为:P=0.5。

当n足够大时,可以用f估计P。

随机事件概率的大小在0与1之间,即0<P<1,常用小数或百分数表示。

P越接近1,表示某事件发生的可能性越大;P越接近0,表示某事件发生的可能性越小。

P=1表示事件必然发生,P=0表示事件不可能发生,它们是确定性的,不是随机事件,但可以把它们看成随机事件的特例。

若随机事件A的概率P(A)≤a,习惯上,当a=0.05时,就称A为小概率事件。

其统计学意义是小概率事件在一次随机试验中不可能发生。

例如,某都市大街上疾驶的汽车撞伤行人的事件的发生概率为1/万,但大街上仍有行人,这是因为“被撞”事件是小概率事件,所以行人认为自己上街这“一次试验”中不会发生“被撞”事件。

“小概率”的标准a是人为规定的,对于可能引起严重后果的事件,如术中大出血等,可规定a=0.01,甚至更小。

误差是指测定结果与真实结果之间的差值。

对任何一个物理量进行的测量都不可能得出一个绝对准确的数值,即用测量技术所能达到的最完善的方法,测出的数值也和真实值存在差异,这种测量值和真实值的差异称为误差。

误差的分类误差分为绝对误差和相对误差。

也可以根据误差的来源分为系统误差(又称偏性)和随机误差(又称机会误差)。

1、绝对误差是测量值对真值偏离的绝对大小,因此它的单位与测量值的单位相同。

2、相对误差则是绝对误差与真值的比值,因此它是一个百分数。

一般来说,相对误差更能反映测量的可信程度。

相对误差等于测量值减去真值的差的绝对值除以真值,再乘以百分之一百。

3、系统误差是由一些固有的因素(如测量方法的缺陷)产生的,理论上总是可以通过一定的手段来消除。

如天平的两臂应是等长的,可实际上是不可能完全相等的;天平配置的相同质量的砝码应是一样的,可实际上它们不可能达到一样。

4、随机误差是由于在测定过程中一系列有关因素微小的随机波动而形成的具有相互抵偿性的误差(也称为偶然误差和不定误差)。

相关文档
最新文档