医学统计学重点总结
医学统计学重点总结

(1) 单个样本均数 H0:μ=μ0t= ν=n-1 (小样本)
(已知样本——均数) H1:μ≠μ0
α=u= 或u= (大样本)(2)配对:H0:μ=μ0
H1:μ≠μ0t= ν=对子数-1
α=
(3) 两独立样本均数H0:μ=μ0t= ν=n1+n2-2
(4)(已知样本——样本) H1:μ≠μ0
9.对任何参数μ和σ的正态分布,都可以通过一个简单的变量变换成标准正态分布,即μ=X-μ
σ
9
标准正态分布
正态分布
面积或概率
-1~1
μ σ
%
~
μ σ
%
·
μ σ
%
10.医学参考值范围(reference value range)传统上称作正常值范围,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。习惯上是包含95%的参照总体的范围。
实际工作中标准差 σ往往未知,因而通常用样本标准差S代替σ,求得样本均数 准误估计值S ,计算公式为 S = (当n→无穷,S→σ,S →0)
3 95%的可信区间的计算:x (μ,σ ) 1) σ已知,可信区间= σ
2)σ未知,n为小样本: t 3)σ未知,n为大样本:
T变换
μ变换
N (0,1)
3、t分布曲线的形态变化与自由度v=n-1有关。
2.四格表专用公式(
3对于四格表资料,通常规定为:(1)当n≥40且所有的T ≥ 5时,用检验的基本公式或四格表的专用公式;(2)当n ≥ 40 但有1≤T<5时,用四格表资料的校正公式;(3)当n<40,或T<1时,用四格表资料的Fisher确切 概率法。
4 行×列表资料的χ 检验: 自由度:ν=(行数-1)(列数-1)
医学统计学重点概要

第一章 绪论总体:根据研究目的确定的同质的所有观察单位某种变量值的集合。
总体包括有限总体和无限总体。
样本:从总体中随机抽取的部分观察单位,其实测值的集合。
获取样本仅仅是手段,通过样本信息来推断总体特性才是研究的目的。
资料的类型计量资料、计数资料和等级资料。
误差包括随机误差、系统误差和非系统误差。
抽样误差:由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计量之间的差异称为抽样误差。
概率:是描述随机事件发生可能性大小的一个度量。
取值范围0≤P ≤1。
小概率事件:表示在一次实验或观察中该事件发生的可能性很小,可以认为很可能不发生。
P ≤0.05或P ≤0.01。
医学统计学的步骤:设计、收集资料、整理资料和分析资料。
统计分析包括:统计描述和统计推断。
统计推断包括:参数估计和假设检验。
第二章计量资料的统计描述频数表和频数分布图的用途:(1)描述频数分布的类型,以便选择相应的统计指标和分析方法。
对称分布:集中位置在中间,左右两侧頻数基本对称。
偏态分布:正、负偏态分布正偏态集中位置偏向值小一侧,负偏态反之。
(2)描述頻数分布的特征;(3)便于发现资料中的可疑值;(4)便于进一步计算统计指标和进行统计分析。
计量资料集中趋势包括算术均数、几何均数和中位数。
算术均数:直接法(样本小):n x x ∑=;頻数表法(样本大)x =nfx ∑ 几何均数:直接法:)lg (lg 1n x G ∑-=;頻数表法)lg (lg )lg (lg 11n x f fx f G ∑∑∑--==(常用于等比资料或对数正态分布资料)中位数:直接法:n 为奇数2/)1(+=n x M ,n 为偶数2/)(12/2/++=n n x x M ;頻数表法:∑-⨯+=)%50(L M M f n f iL M 。
中位数的应用注意事项:可用于各种分布资料,不受极端值的影响,主要用于(1)偏态分布资料(2)端点无确切值的资料(3)分布不明确的资料。
医科大学医学统计学重点知识总结

第一章绪论1、统计学的定义:统计学研究数据的收集、整理、分析的一门学科。
医学统计学:医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理、方法,研究医学资料的搜集、整理、分析和推断的一门科学。
2、医学统计研究三个步骤:研究设计、资料分析、结论3、(必考的)几个概念:(1)同质:性质相同异质:性质不同观察单位间的同质性是进行研究的前提同质是相对的(不同研究中或同一研究中不同观察指标对观察对象的同质性的要求不同)(2)个体变异:同质个体间的差异。
变异的两个方面:不同观察单位(个体)间的差别;同一个体在不同阶段的差别(重复测量)个体变异是普遍存在的;个体变异是有规律的。
注意:由于个体变异的存在,同质个体指标的取值会存在差异!(例:体温波动)(3)总体:按研究目的所确定的同质研究对象的全体。
有限总体:有时间、空间的概念,观察单位有限无限总体:无时间、空间的概念(例:某种治疗措施的效果,就包括接受这种治疗措施的所有病人过去、现在、未来,因而观察单位无限)(4)个体:组成总体的基本单位。
样本:从研究总体中随机抽取具有代表性的部分观察单位随机性的三个体现:抽样随机、分组随机、试验顺序随机(5)随机变量:观察对象个体的特征或测量的结果观察结果在一定范围内以一定的概率分布随机取值的变量,表示随机现象。
在一定条件下,并不总是出现相同结果变量值:个体观察指标具体取值(6)总体参数:总体的统计指标或特征值固有的、不变的,但往往是未知的(7)样本统计量:由样本所算出的统计指标或特征值已知的,且随着试验的不同而不同,但分布是有规律的(8)样本含量:样本中包含个体的数量(9)频率f=m/n,f的值随n的增大接近常数p,概率P(A)=p即:频率为一变量,是样本统计量;概率为常数,是一总体参数小概率事件:概率小于等于0.05小概率原理:小概率事件在一次试验中是不会发生的(10)抽样误差:两个表现:样本统计量与总体参数间的差别;不同样本统计量间的差别两个原因:个体变异;抽样过程抽样误差不可避免,但是有规律。
新版医学统计学知识点归纳总结

新版医学统计学知识点归纳总结医学统计学是医学研究中不可或缺的一部分,它涉及到数据的收集、分析和解释,帮助医学工作者从大量数据中提取有价值的信息。
以下是新版医学统计学的知识点归纳总结:1. 研究设计:研究设计是统计分析的前提,包括观察性研究和实验性研究。
观察性研究如队列研究、病例对照研究,而实验性研究如随机对照试验(RCT)。
2. 数据类型:医学统计学中的数据可分为定性数据和定量数据。
定性数据如性别、血型,定量数据如血压、体重。
3. 描述性统计:描述性统计用于描述数据集的特征,包括集中趋势(均值、中位数、众数)和离散程度(方差、标准差、极差)。
4. 概率分布:在统计学中,概率分布描述了随机变量取值的概率。
常见的分布有正态分布、二项分布和泊松分布。
5. 假设检验:假设检验是统计推断的核心,用于判断样本数据是否支持某个假设。
常见的检验方法有t检验、卡方检验和F检验。
6. 置信区间:置信区间提供了一个范围,用以估计总体参数的可能值。
95%的置信区间意味着有95%的把握认为总体参数落在这个区间内。
7. 回归分析:回归分析用于研究一个或多个自变量对因变量的影响。
简单线性回归和多元线性回归是常见的回归分析方法。
8. 生存分析:生存分析关注个体生存时间的分布和相关因素,常用于肿瘤学和流行病学研究。
Kaplan-Meier估计和Cox比例风险模型是生存分析中的重要工具。
9. 诊断试验评价:诊断试验评价涉及敏感性、特异性、阳性预测值和阴性预测值等指标,用于评估诊断方法的准确性。
10. 样本量计算:样本量计算是研究设计的重要环节,它决定了研究的可行性和结果的可靠性。
样本量计算需要考虑效应大小、显著性水平和检验力。
11. 多变量分析:多变量分析用于同时考虑多个变量对结果的影响,如多元回归分析和判别分析。
12. 统计软件的应用:统计软件如SPSS、SAS和R在医学统计分析中扮演着重要角色,它们提供了数据处理和统计分析的功能。
医学统计学重点

医学统计学重点说明:本重点仅供参考:不能包括所有选择题考题,名词和简答可信度高,计算题熟练运算过程;同时自己要清楚各种检验方法的基本思想,重点程度与星号数量相关)一、名词解释1、★★★医学统计学:用概率论和数理统计方法研究医学事件的群体特征的一门方法。
2、★总体:根据研究目的确定的同质的研究对象的全体(集合)。
3、样本:从总体中随机抽取的部分研究对象。
4、随机:总体中每个个体有同等的机会进入样本。
5、系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。
6、随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。
7、★★抽样误差:由于抽样原因造成的样本指标与总体指标之间的差,或者是样本指标与样本指标之间的差。
8、准确度(accuracy)或真实性(validity):观察值与真值的接近程度,受系统误差的影响(9、可靠度(reliabiliy)——也称精密度(precision)或重复性(repeatability):重复观察时观察值与其均值的接近程度,受随机误差的影响。
10、★★★小概率事件:一般常将p ≤ 0.05或p ≤ 0.01称为小概率事件,表示某事件发生的可能性很小。
通俗讲一次抽样是不可能发生的事件。
11、★★正态分布定:又称高斯分布,是一条中间高,两头低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
12、★★医学参考值范围:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。
最常用的是95%参考值范围。
13、★★标准误:用于反映均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。
14、★95%的可信区间:如果从同一总体中重复抽取100个独立样本,将可能有95个可信区间包括总体均数,有5个可信区间未包括总体均数。
二、填空题1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。
(完整版)医学统计学重点总结

1.简述总体和样本的定义,并且举例说明。
总体是研究目的确定的所有同质观察单位的全体。
样品是从研究总体中抽取部分有代表性的观察单位。
2.简述参数和统计量的定义,并且举例说明。
描述总体特征的指标称为参数,描述样本特征的指标称为统计量。
3.变量的类型有哪几种?举例说明各种类型变量有什么特点。
①定量数据:计量资料;定量的观测值是定量的,其特点是能够用数值的大小衡量其水平的高低。
②定性数据:计数资料;变量的观测值是定性的,表现为互不相容的类别或属性。
③有序数据:半定量数据/等级资料;变量的观测值是定性的,但各类别(属性)有程度或顺序上的差异。
4.请举例说明一种类型的变量如何变换为另一种类型的变量。
定量数据>有序数据>定性数据--------------->5.请简述什么是小概率事件?概率是描述事件发生可能性大小的度量,P 0.05事件称为小概率事件。
≤6.举例说明什么是配对设计。
配对设计是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。
①同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;②异源配对:为消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理。
7.非参数假设检验适合什么类型数据进行分析?①总体分布类型未知或非正态分布数据;②定量或半定量数据;③数据两端无确定的数值。
8.简述P 25 P 50 P 75的统计学意义。
(条件:明显偏态且不能转化为正态或近似对称;一端或两端无确定数值;分布情况未知)用来描述资料的观测值序列在某百分位置的水平,四分位数间距可以作为说明个体差异的指标(说明个体在不同位置的变异情况)。
9.直条图、直方图、圆饼图的使用条件是什么?直条图:各自独立的统计指标的数值大小和他们之间的对比;直方图:连续变量频数分布情况;圆饼图:全体中各部分所占的比例。
10.统计分析包括哪两个方面的内容?为什么要进行统计推断?统计描述和统计分析;统计描述用来描述及总结一组数据的重要特征,其目的是使实验或观察得到的数据表达清楚并便于分析。
医学统计学重点

医学统计学重点医学统计学是医学领域中不可或缺的一门学科,它借助数理统计方法研究医学数据和临床试验的结果,为医学决策提供可靠的依据。
以下是医学统计学的几个重点内容。
一、描述统计学描述统计学是医学统计学的基础,主要研究如何分类、整理和描述医学数据。
其主要方法包括测量尺度、频率分布表、中心趋势测量和变异程度测量。
1. 测量尺度在医学统计学中,常见的测量尺度包括名目尺度、有序尺度和数值尺度。
名目尺度适用于无序分类的变量,有序尺度适用于有序分类的变量,而数值尺度适用于具有度量意义的变量。
2. 频率分布表频率分布表用来展示变量的分布情况,主要包括类别、频数和频率等内容。
通过频率分布表,可以直观地了解变量的分布状况。
3. 中心趋势测量中心趋势测量主要包括平均数、中位数和众数。
平均数是所有观测值的总和除以观测值的个数,中位数是将观测值按大小排列后的中间值,众数是出现次数最多的观测值。
4. 变异程度测量变异程度测量用来描述数据的分散程度,主要包括极差、方差和标准差。
极差是最大观测值与最小观测值之间的差异,方差是观测值与均值之间的差异的平方的平均数,标准差是方差的平方根。
二、推断统计学推断统计学是医学统计学的核心内容,主要研究如何通过样本数据推断总体参数,并对假设进行检验。
其中包括参数估计、假设检验和置信区间等方法。
1. 参数估计参数估计是利用样本数据估计总体参数,常用的方法有点估计和区间估计。
点估计是通过样本数据得到一个单一的数值作为总体参数的估计值,区间估计是通过样本数据得到一个范围作为总体参数的估计区间。
2. 假设检验假设检验是用来检验某个陈述是否与观察数据相符的方法。
在医学研究中,研究者常常根据实验数据对研究假设进行检验,以确定是否有统计显著性。
3. 置信区间置信区间是对总体参数的一个范围估计。
置信区间的计算方法与区间估计相似,通过对样本数据进行分析计算得到。
三、生存分析生存分析是医学统计学中的一个重要分支,主要研究疾病患者的生存时间和生存率等问题。
医学统计学知识点汇总

医学统计学知识点汇总医学统计学是指应用统计学原理和方法进行医学研究设计、数据分析和结果解释的学科。
医学统计学的知识点非常丰富,包括统计学基础知识、研究设计、样本量计算、控制方法、参数估计、假设检验和数据分析等方面。
以下是医学统计学知识点的一些精华汇总。
1.统计学基本概念:包括基本统计量(均值、中位数、众数)、数据类型(定量数据、定性数据)、数据的描述方法(频数分布表、直方图等)。
2.研究设计:包括随机对照试验、队列研究、病例对照研究等,了解不同研究设计的优缺点及适用场景。
3.样本量计算:确定研究样本量是保证研究结果可靠性的重要一环,需要根据研究目的、效应量和统计显著性水平确定样本量。
4.控制方法:包括随机分组、盲法、配对设计等,用于减少实验误差和避免偏倚。
5.参数估计:常用的参数估计方法有点估计和区间估计。
点估计是通过样本数据得到总体参数的一个点估计值,区间估计是对总体参数的一个区间估计。
6.假设检验:假设检验是用来判断样本数据与总体假设之间的差异是否显著的统计方法。
常用的假设检验方法有t检验、卡方检验、方差分析等。
7.数据分析:包括描述性统计分析和推断性统计分析。
描述性统计分析用来描述研究变量的基本情况,推断性统计分析用来推断样本数据与总体数据之间的关系。
8.相关分析:用来分析变量之间的关联程度,包括皮尔逊相关系数和斯皮尔曼等级相关系数等。
9. 回归分析:用来分析因变量与自变量之间的关系,包括线性回归分析和 logistic回归分析等。
10.生存分析:用来分析时间到达事件发生的概率,包括生存曲线的绘制、生存率的估计和影响因素的分析等。
11. 多变量分析:用来分析多个自变量对因变量的影响,包括多元方差分析、多元回归分析和多元Logistic回归分析等。
12. Meta分析:用于综合多个独立研究结果,对总体效应进行定量分析和综合评价。
以上是医学统计学的一些精华知识点的汇总。
医学统计学的应用非常广泛,不仅在医学研究中需要应用统计学的原理和方法,也在临床实践中需要对医学统计学知识有一定的了解和应用。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
标准差与标准误的区别: (1)概念不同:标准差是描述样本中个体值间的变异程度的指标,标准差越小,表示变量 值围绕均数的波动越小。标准误是描述样本均数间变异程度的指标,标准误越小,表示样 本均数围绕总体均数的波动越小。 (2)用途不同:标准差常用于表示变量值对均数波动的大小,当资料呈正态分布时,与均 数结合可估计正常值范围,计算变异系数等;标准误常用于表示样本统计量(样本均数, 样本率)对总体参数(总体均数,总体率)的波动情况,可估计参数的可信区间,进行假 设检验。 (3)与例数的关系不同:当样本含量足够大时,标准差趋向稳定。而标准误随例数的增大 而减小,甚至趋向于 0。若样本含量趋向于总例数,则标准误接近于 0。 标准差与标准误的联系: 二者均为变异指标,如果把总体中各样本均数看成一个变量,则标准误可称为样本均数的 标准差。当样本含量不变时,均数的标准误与标准差成正比。两者均可与均数结合运用, 但描述的内容各不相同。 假设检验的原理:假设检验的基本思想是反证法和小概率的思想。 反证法思想:首先提出假设(由于未经检验是否成立,所以称为无效假设),用适当的统 计方法确定假设成立的可能性大小,如果可能性小,则认为假设不成立,拒绝它;如果可 能性大,还不能认为它不成立 小概率思想:是指小概率事件在一次随机试验中认为基本上不会发生概率小于多少算小概 率是相对的,在进行统计分析时要事先规定,即检验水准。 假设检验的基本步骤: (1)建立检验假设,确定检验水准:假设有两种:一种为检验假设或称无效假设,符号为 H0;一种为备择假设,符号为 H1。这两种假设都是根据统计推断的目的要求而提出的对总 体特征的假设。确定检验水准,亦称为显著性水准,符号为α,是预先给定的概率值。是判 定样本指标与总体指标或两样本指标间的差异有无统计学意义的概率水准,在实际工作中, α常取 0.05。 (2)选择检验方法并计算统计量:要根据所分析资料的类型和统计推断的目的要求选用不 同的检验方法。 (3)确定 P 值,作出推断结论:P 值是指由 H0 所规定的总体中做随机抽样,获得等于及大 于(或等于及小于)现有统计量的概率。当求得检验统计量的值后,一般可通过特制的统 计用表直接查出 P 值。作出推断结论:当 P≤a 时,结论为按所取检验水准α拒绝 H0,接受 H1,差异有统计学意义。如果 P>a,结论为按所取检验水准α不拒绝 H0,差异无统计学意 义。其间的差异是由抽样误差引起的。 T 检验的应用条件: (1)随机样本 (2)来自正态分布总体 (3)均数比较时,要求两总体方差相等(方差齐性)。 区间估计与假设检验是统计推断的两种方法。可信区间用于说明量的大小即推断总体均数 的范围,而假设检验用于推断质的不同即判断两总体均数是否不同。每一种区间估计都可 以对应一种假设检验方法。它们之间既相互联系,又有区别。 T 值的分布与自由度 V 有关。T 分布只有一个参数 V。
检验结果 实际情况 拒绝 H0 第Ⅰ类错误(α) 假阳性(误诊) 结论正确(1- β) 检验功效 不拒绝 H0 结论正确(1- α) 置信度 第Ⅱ类错误(β) 假阴性(漏诊)
H0 为真
H0 不真
方差分析的基本思想:根据资料的设计类型及研究目的,即按变异的不同来源将全部观察 值间的总变异分为两部分或多个部分,其自由度也分解为相应的部分,除随机误差外,其 余每个部分的变异可由某个因素的作用加以解释。 方差分析的应用条件是: (1)各样本是相互独立的随机样本;即任何两个观察值之间均不相关; (2)各样本来自正态总体; (3)各处理组总体方差相等,即方差齐(homogeneity of variance)。简单地概括为任何 观察值 Xij 都是独立地来自具有等方差的正态总体。 方差分析的步骤: (1)建立假设并确定检验水准 H0: 三个总体均数相等, 即μ1= μ2= μ3 H1: 三个总体均数不等或不全相等 α=0.05 (2)计算检验统计量 F 值 (3)确定 P 值并作出推断结论 四格表资料的卡方检验目的:两独立样本率差异的比较,即根据两独立样本的频率分布, 检验两个样本的总体分布是否相同。
第一章
统计学的基本概念:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、 解释和表达数据,目的是求得可靠的结果。 统计学的研究对象:有变化的事物或现象。 总体:是根据研究目的的确定的同质研究对象的全体,统计学家用总体这个术语来表示大 同小异的对象全体。 样本:是指从研究总体中抽取少量有代表性的个体。 同质:一些个体处于同一总体,就是指它们大同小异,具有同质性。 变异:同一总体内的个体间存在差异又是绝对的,这种现象就是 Fisher 强调的变异。 没有同质性就构不成一个总体供人们研究,总体内没有变异性就无需统计学。 变量:可分为定性变量、定量变量。 定性变量:常见的是分类变量或名义变量,还有一种是有序变量。 定量变量(quantitative variable):也称为数值变量,其变量值是定量的,所获资料为计 量资料。即对每一个观察对象用定量的方法测定某项指标量的大小。有度量衡单位。分为 离散型变量(只能取整数值)和连续型变量(任何数值)。
假设检验的两类错误: 第Ⅰ类错误:如果实际情况与 H0 一致,仅仅由于抽样的原因,使得统计量的观察值落到拒 绝域,拒绝原本正确的 H0,导致推断结论错误。这样的错误称为第Ⅰ类错误。犯第Ⅰ类错 误的概率大小为α。 第Ⅱ类错误:如果实际情况与 H0 不一致,也仅仅由于抽样的原因,使得统计量的观察值落 到接受域,不能拒绝原本错误的 H0,导致了另一种推断错误。这样的错误称为第Ⅱ类错误。 犯第Ⅱ类错误的概率为β。
常用的抽样方法:单纯随机抽样、系统抽样、分层抽样、整群抽样。
第二章
频数分布表的编制方法: (1)求全距:(极差) (2)定组段数与组距 : 8~15 个组段,组距 i=全距/组段数 (3)划组段:以一个稍小于或等于最小值的整数作为第一个组段的起点数据。 下限:每个组段的起点(最小值) 。 上限:每个组段的终点(近似最大值)。 注:最后一个组段应同时写出上限和下限来。 (4)绘制整理表“下限≤x<上限” 注:各组段的频数之和应等于总的观察例数。 平均数:描述一组同质计量资料的集中趋势;反映一组观察值的平均水平。常用的有:算 数平均数、几何均数、中位数 算术均数:简称均数,用希腊字母µ表示。适用于服从对称分布的变量,尤其是服从正态分 布或近似正态分布的变量。 几何均数:用 G 表示,常用来反映一组含多个数量级数据的集中位置。适用于原始观察值 分布不对称,但经对数转换后呈对称分布的变量,常用于等比级数资料或对数正态分布资 料。 几何均数应用的注意事项: (1)几何均数常用于等比级数资料或对数正态分布资料 (2)观察值中不能有 0 (3)观察值中不能同时有正值和负值。 中位数:将一组变量值从小到大按顺序排列,位次居中的那个变量值就是中位数。适用于 服从各种分布的变量,特别是偏锋分布的变量、分布末端无确定值的变量等,常用于偏态 分布资料。 变异:同一总体中不同个体间存在的差异称为变异。 变异系数:适用于量纲不同或均数差别较大的变量间变异程度的比较。 极差(R):也称全距。样本量接近的同类资料比较时,极差越大意味着数据间变异越大。 适用的变量分布类型不限 四位数间距:适用于各种类型的连续型变量,特别对服从偏锋分布的变量。
第三章
应用相对数时的注意事项: (1)防止概念混淆,正确区分率和比 (2)计算相对数时分母应有足够数量 (3)正确估计合并率 (4)资料的对比应注意可比性 ①观察对象同质,研究方法相同,观察时间相等,以及地区民族等客观条件一致 ②其他影响因素在各组的内部构成是否相同 (5)对相对数的统计推断 死亡率(death rate) 表示某地每 1000 人中的死亡人数,计算公式如下:
某人群某时点某病患病 率
某地某时期某病患病例 数 K 某年同时期内平均人囗 数
病死率(cause fatality)表示某期间内,某病患者中因某病死亡的频率,计算公式如下:
某病病死率
某期间因某病死亡人数 K 同群该病的患病数
正态分布: Φ(—1.96)=0.025 z 取值于(—1.96~1.96), 即 X 取值区间μ±1-96σ内的概 率为 0.95,X 取值在区间μ±2.58σ上的概率为 0.99。 标准正态分布参数:0,1 样本均数的标准误:由个体变异产生的、由于抽样而造成的样本均数与样本均数及样本均数 与总体均数之间的差异称为均数的抽样误差。用于表示均数抽样误差的指标叫样本均数的 标准差,也称样本均数的标准误。 标准误:样本均数的标准差。 样本均数的分布特点: (1)各样本均数未必等于总体均数; (2)样本均数之间存在差异; (3)样本均数的分布很有规律,围绕着总体均数,中间多,两边少,左右基本对称,也服 从正态分布。
统计量:由观察资料计算出来的量称为统计量。 参数(固定常数):也叫参变量,是一个变量,是总体的统计指标。 频率:样本的实际发生率。 误差分类(泛指测量值与真值之差): (1)系统误差(特点:一边倒,偏大偏小,人为原因造成) (2)随机测量误差,偶然因素造成(特点:不可避免,有规律的) (3)抽样误差:从某一总体中随机抽取一个样本,所的样本统计量与相应的总体参数往往 是不同的。其中包括改变抽样方法、增加样本量 n、选择变异程度小的研究指标(特点:有 规律性) 概率:描述随机事件发生可能大小的量。 小概率原理:小概率事件在一次试验中几乎不可能发生,利用该原理对科研资料进行假设 检验。P≤0.05 或 P≤0.01 称为小概率事件。 统计步骤:统计设计、收集资料、整理资料、分析资料。
死亡率
某年死亡总人数 1000‰ 同年年平均人囗数
年龄别死亡率(age -specific death rate)表示某地某年龄(组)每 1000 人囗中的死
亡数,计算公式如下:
某年龄(组)死亡率
某年某年龄(组)死亡人数 1000‰ 同年龄(组)年平均人囗数
死因别死亡率(cause specific death rate)表示某年每 10 万人中因某种原因(某病)死 亡人数,计算公式如下:
某病死亡专率
同年某病死亡人数 1000‰ 同年年平均人囗数