医学统计学知识点梳理

合集下载

医学统计学知识点汇总(精华)

医学统计学知识点汇总(精华)一.概论1，医学统计学：运用概率论和数理统计学的原理和方法，研究医学领域中随机现象有关数据的搜集、整理、分析和推断，进而阐明其客观规律性的一门应用科学。

2，医学统计学的主要内容：1）统计研究设计调查研究设计和实验研究设计2）医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。

A：资料的搜集与整理 B：常用统计描述，集中趋势和离散趋势，相对数，相关系数，回归系数，统计表，统计图 C：统计推断，如参数估计和假设检验。

3）医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。

3，统计工作步骤：1）设计明确研究目的和研究假说，确定观察对象与观察单位，样本含量和抽样方法，拟定研究方案，预期分析指标，误差控制措施，进度与费用。

2）搜集材料A，搜集材料的原则及时、准确、完整B，统计资料的来源医学领域的统计资料的来源主要有三个方面。

一是统计报表，二是经常性工作记录，三是专题调查或专题实验。

C，资料贮存3）整理资料 a检查核对b设计分组c拟定整理表d归表4）分析资料统计分析包括统计描述和统计推断4，同质（homogeneity）：指被研究指标的影响因素相同。

变异(variation)：同质基础上的各观察单位间的差异。

变量(variable)：收集资料过程中，根据研究目的确定同质观察单位，再对每个观察单位的某项特征进行测量或观察，这种特征称为变量变量值：变量的观察结果或测量值。

变量类型变量值表现实例资料类型数值变量离散型定量测量值，有计量单位产前检查次数计量资料连续型身高分类变量无序二分类对立的两类属性性别（男女）计数资料多分类不相容的多类属性血型（A,B,O,AB）有序多分类类间有程度差异的属性受教育程度（小学，中学，高中，大学…）等级资料5，总体（population）根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。

医学统计学基础知识

德.摩根 2048 1061 0.5181 蒲丰 4040 2048 0.5064 K.皮尔逊 12000 6019 0.5016 K.皮尔逊 24000 12012 0.5005
概率推断是按一定的概率用样本信息推断总体的特征,即统计推断含有一定概率。
小概率事件：P<0.05(或0.01)
小概率事件原理：即小概率事件在一次抽样中一般认为不会发生。
第二章计量资料的统计描述
学习目标：
1. 能够了解频数分布表的编制方法及分布图的绘制，并以此描述资料的频数分布特征。
2. 能够掌握各种集中趋势指标的计算，特点及其适用条件。
3. 能够掌握各种离散趋势指标的计算，特点及其适用条件。
4. 能够了解正态分布的概念、特征及应用，掌握标准正态分布的基本规律。
52
42
49
55
53
51
45
47
47
47
50
48
51
51
53
46
47
57
45
46
51
46
51
47
51
55
47
52
47
48
54
47
54
49
44
53
54
45
48
44
48
42
47
48
50
55
50
53
56
49
50
56
41
53
53
49
44
49
48
45
52
52
46
54
50
44
53
49
47

医科大学医学统计学重点知识总结

第一章绪论1、统计学的定义：统计学研究数据的收集、整理、分析的一门学科。

医学统计学：医学统计学是以医学理论为指导，应用概率论与数理统计的有关原理、方法，研究医学资料的搜集、整理、分析和推断的一门科学。

2、医学统计研究三个步骤：研究设计、资料分析、结论3、（必考的）几个概念：（1）同质：性质相同异质：性质不同观察单位间的同质性是进行研究的前提同质是相对的（不同研究中或同一研究中不同观察指标对观察对象的同质性的要求不同）（2）个体变异：同质个体间的差异。

变异的两个方面：不同观察单位（个体）间的差别；同一个体在不同阶段的差别（重复测量）个体变异是普遍存在的；个体变异是有规律的。

注意：由于个体变异的存在，同质个体指标的取值会存在差异！（例：体温波动）（3）总体：按研究目的所确定的同质研究对象的全体。

有限总体：有时间、空间的概念，观察单位有限无限总体：无时间、空间的概念（例：某种治疗措施的效果，就包括接受这种治疗措施的所有病人过去、现在、未来，因而观察单位无限）（4）个体：组成总体的基本单位。

样本：从研究总体中随机抽取具有代表性的部分观察单位随机性的三个体现：抽样随机、分组随机、试验顺序随机（5）随机变量：观察对象个体的特征或测量的结果观察结果在一定范围内以一定的概率分布随机取值的变量，表示随机现象。

在一定条件下，并不总是出现相同结果变量值：个体观察指标具体取值（6）总体参数：总体的统计指标或特征值固有的、不变的，但往往是未知的（7）样本统计量：由样本所算出的统计指标或特征值已知的，且随着试验的不同而不同，但分布是有规律的（8）样本含量：样本中包含个体的数量（9）频率f=m/n，f的值随n的增大接近常数p，概率P（A）=p即：频率为一变量，是样本统计量；概率为常数，是一总体参数小概率事件：概率小于等于0.05小概率原理：小概率事件在一次试验中是不会发生的（10）抽样误差：两个表现：样本统计量与总体参数间的差别；不同样本统计量间的差别两个原因：个体变异；抽样过程抽样误差不可避免，但是有规律。

医学统计学知识点总结

知识点1.统计学是应用概率论和数理统计的基本原理和方法，研究数据的搜集、整理、分析、表达和解释的一门学科。

2.医学统计学是应用统计学的基本原理和方法，研究医学及其有关领域数据信息的搜集、整理、分析、表达和解释的一门学科。

3.统计软件包是对资料进行各种统计处理分析的一系列程序的组合。

4.统计工作的基本步骤：研究设计、搜集资料、整理资料和分析资料。

5.科研结果的好坏取决于研究设计的好坏，研究设计是统计工作中的基础和关键，决定着整个统计工作的成败。

6.统计分析包括统计描述和统计推断。

统计描述是对已知的样本（或总体）的分布情况或特征值进行分析表述；统计推断是根据已知的样本信息来推断未知的总体。

7.医学原始资料的类型有：计量资料、计数资料、等级资料。

8.计量资料是用定量的方法对每一个观察单位的某项指标进行测定所得的资料。

9.计数资料是把观察单位按某种属性（性质）或类别进行分组，清点各组观察单位数所得资料。

10.等级资料是把观察单位按属性程度或等级顺序分组，清点各组观察单位数所得资料。

各属性之间有程度的差别。

等级资料的等级顺序不能任意颠倒。

11.同质：是指所研究的观察对象具有某些相同的性质或特征。

12.变异：是同质个体的某项指标之间的差异，即个体变异或个体差异性。

13.总体是根据研究目的确定的同质研究对象的总体。

样本是总体中具有代表性的一部分个体。

14.抽样研究是通过从总体中随机抽取样本，对样本信息进行分析，从而推断总体的研究方法。

抽样误差是由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异，其根源在于总体中的个体存在变异性，只要是抽样研究，就一定存在抽样误差，不能用样本的指标直接下结论。

15.统计学的主要任务是进行统计推断，包括参数估计和假设检验。

16.概率是某随机事件发生可能性大小（或机会大小）的数值度量。

概率的取值为0≤P≤1。

小概率事件是指P≤0.05的随机事件。

17.频数表和频数分布图的用途：(1)揭示计量资料的分布类型。

医学统计学知识点汇总

医学统计学知识点汇总医学统计学是指应用统计学原理和方法进行医学研究设计、数据分析和结果解释的学科。

医学统计学的知识点非常丰富，包括统计学基础知识、研究设计、样本量计算、控制方法、参数估计、假设检验和数据分析等方面。

以下是医学统计学知识点的一些精华汇总。

1.统计学基本概念：包括基本统计量（均值、中位数、众数）、数据类型（定量数据、定性数据）、数据的描述方法（频数分布表、直方图等）。

2.研究设计：包括随机对照试验、队列研究、病例对照研究等，了解不同研究设计的优缺点及适用场景。

3.样本量计算：确定研究样本量是保证研究结果可靠性的重要一环，需要根据研究目的、效应量和统计显著性水平确定样本量。

4.控制方法：包括随机分组、盲法、配对设计等，用于减少实验误差和避免偏倚。

5.参数估计：常用的参数估计方法有点估计和区间估计。

点估计是通过样本数据得到总体参数的一个点估计值，区间估计是对总体参数的一个区间估计。

6.假设检验：假设检验是用来判断样本数据与总体假设之间的差异是否显著的统计方法。

常用的假设检验方法有t检验、卡方检验、方差分析等。

7.数据分析：包括描述性统计分析和推断性统计分析。

描述性统计分析用来描述研究变量的基本情况，推断性统计分析用来推断样本数据与总体数据之间的关系。

8.相关分析：用来分析变量之间的关联程度，包括皮尔逊相关系数和斯皮尔曼等级相关系数等。

9. 回归分析：用来分析因变量与自变量之间的关系，包括线性回归分析和 logistic回归分析等。

10.生存分析：用来分析时间到达事件发生的概率，包括生存曲线的绘制、生存率的估计和影响因素的分析等。

11. 多变量分析：用来分析多个自变量对因变量的影响，包括多元方差分析、多元回归分析和多元Logistic回归分析等。

12. Meta分析：用于综合多个独立研究结果，对总体效应进行定量分析和综合评价。

以上是医学统计学的一些精华知识点的汇总。

医学统计学的应用非常广泛，不仅在医学研究中需要应用统计学的原理和方法，也在临床实践中需要对医学统计学知识有一定的了解和应用。

（完整版）医学统计学复习要点

（完整版）医学统计学复习要点第⼀章绪论1、数据/资料的分类：①、计量资料，⼜称定量资料或者数值变量；为观测每个观察单位某项治疗的⼤⼩⽽获得的资料。

②、计数资料，⼜称定性资料或者⽆序分类变量；为将观察单位按照某种属性或者类别分组计数，分组汇总各组观察单位数后⽽得到的资料。

③、等级资料，⼜称半定量资料或者有序分类变量。

为将观察单位按某种属性的不同程度分成等级后分组计数，分类汇总各组观察单位数后⽽得到的资料。

2、统计学常⽤基本概念：①、统计学（statistics）是关于数据的科学与艺术，包括设计、搜集、整理、分析和表达等步骤，从数据中提炼新的有科学价值的信息。

②、总体（population）指的是根据研究⽬的⽽确定的同质观察单位的全体。

③、医学统计学（medical statistics）：⽤统计学的原理和⽅法处理医学资料中的同质性和变异性的科学和艺术，通过⼀定数量的观察、对⽐、分析，揭⽰那些困惑费解的医学问题背后的规律性。

④、样本（sample）：指的是从总体中随机抽取的部分观察单位。

⑤、变量（variable）：对观察单位某项特征进⾏测量或者观察，这种特征称为变量。

⑥、频率（frequency）：指的是样本的实际发⽣率。

⑦、概率（probability）：指的是随机事件发⽣的可能性⼤⼩。

⽤⼤写的P表⽰。

3、统计⼯作的基本步骤：①、统计设计：包括对资料的收集、整理和分析全过程的设想与安排；②、收集资料：采取措施取得准确可靠的原始数据；③、整理资料：将原始数据净化、系统化和条理化；④、分析资料：包括统计描述和统计推断两个⽅⾯。

第⼆章计量资料的统计描述1. 频数表的编制⽅法，频数分布的类型及频数表的⽤途①、求极差（range）：也称全距，即最⼤值和最⼩值之差，记作R；②、确定组段数和组距，组段数通常取10-15组；③、根据组距写出组段，每个组段的下限为L，上限为U，变量X值得归组统⼀定为L≤X＜U，最后⼀组包括下限。

医学统计知识点整理

医学统计学知识点整理第一节统计学中基本概念一、同质与变异同质：统计研究中，给观察单位规定一些相同的因素情况。

如儿童的生长发育，规定同性别、同年龄、健康的儿童即为同质的儿童。

变异：同质的基础上个体间的差异。

“同质”是相对的，是客观事物在特定条件下的相对一致性，而“变异”则是绝对的μ.δ.πX.S.p1.2.变量：确定总体之后，研究者应对每个观察单位的某项特征进行观察或测量，这种特征能表现观察单位的变异性，称为变量。

一、数值变量资料又称为计量资料、定量资料：观测每个观察单位某项指标的大小而获得的资料。

表现为数值大小，带有度、量、衡单位。

如身高（cm）、体重(kg)、血红蛋白（g）等。

二、无序分类变量资料又称为定性资料或计数资料：将观察对象按观察对象的某种类别或属性进行分组计数，分组汇总各组观察单位后得到的资料。

分类：二分类：+ -；有效，无效；多分类：ABO血型系统特点：没有度量衡单位，多为间断性资料【例题单选】某地A、B、O、AB血型人数分布的数据资料是( )A.定量资料B.计量资料C.计数资料D.等级资料分组统计描述：是利用统计指标、统计表和统计图相结合来描述样本资料的数量特征及分布规律。

统计推断：是使用样本信息来推断总体特征。

统计推断包括区间估计和假设检验。

第四节统计表与统计图★一、统计表统计表的基本结构与要求标题：高度概括表的主要内容，时间、地点、研究内容，位于表的上方，居中摆放，左侧加表的序号。

标目：横标目和纵标目。

线条：通常采用三线表和四线表的形式。

没有竖线或斜线。

数字：表内数字一律用阿拉伯数字。

同一指标，小数位数应一致，位次对齐。

无数字用“—”表示。

暂缺用“…”表示。

“0”为确切值。

备注：位于表的下面，通常是对表内数字的注解和说明，必要时可以用“*”等标出。

一张统计表的备注不宜太多。

二、制表原则1.（7理分布。

【例题填空】描述某地十年间结核病死亡率的变化趋势宜绘制_________图。

医学统计学重点整理汇总

医学统计学重点第一章绪论1.基本概念：总体：根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。

样本：从总体中随机抽取部分个体的某个变量值的集合。

总体参数：刻画总体特征的指标，简称参数。

是固定不变的常数，一般未知。

统计量：刻画样本特征的指标，由样本观察值计算得到，不包含任何未知参数。

抽样误差：由随机抽样造成的样本统计量与相应的总体参数之间的差异。

频率：若事件A在n次独立重复试验中发生了m次，则称m为频数。

称m/n为事件A在n次试验中出现的频率或相对频率。

概率：频率所稳定的常数称为概率。

统计描述：选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。

统计推断：包括参数估计和假设检验。

用样本统计指标(统计量)来推断总体相应指标(参数)，称为参数估计。

用样本差别或样本与总体差别推断总体之间是否可能存在差别，称为假设检验。

2.样本特点：足够的样本含量、可靠性、代表性。

3.资料类型：（1）定量资料：又称计量资料、数值变量或尺度资料。

是对观察对象测量指标的数值大小所得的资料，观察指标是定量的，表现为数值大小。

每个个体都能观察到一个观察指标的数值，有度量衡单位。

（2）分类资料：包括无序分类资料（计数资料）和有序分类资料（等级资料）①计数资料：是将观察单位按某种属性或类别分组，清点各组观察单位的个数(频数)，由各分组标志及其频数构成。

包括二分类资料和多分类资料。

二分类：将观察对象按两种对立的属性分类，两类间相互对立，互不相容。

多分类：将观察对象按多种互斥的属性分类②等级资料：将观察单位按某种属性的不同程度、档次或等级顺序分组，清点各组观察单位的个数所得的资料。

4.统计工作基本步骤：统计设计、资料收集、资料整理、统计分析。

第二章实验研究的三要素1.实验设计三要素：被试因素、受试对象、实验效应2.误差分类：随机误差（抽样误差、随机测量误差）、系统误差、过失误差。

3.实验设计的三个基本原则：对照原则、随机化分组原则、重复原则。

(完整版)医学统计学重点总结

1.简述总体和样本的定义，并且举例说明。

总体是研究目的确定的所有同质观察单位的全体。

样品是从研究总体中抽取部分有代表性的观察单位。

2.简述参数和统计量的定义，并且举例说明。

描述总体特征的指标称为参数，描述样本特征的指标称为统计量。

3.变量的类型有哪几种？举例说明各种类型变量有什么特点。

①定量数据：计量资料；定量的观测值是定量的，其特点是能够用数值的大小衡量其水平的高低。

②定性数据：计数资料；变量的观测值是定性的，表现为互不相容的类别或属性。

③有序数据：半定量数据/等级资料；变量的观测值是定性的，但各类别（属性）有程度或顺序上的差异。

4.请举例说明一种类型的变量如何变换为另一种类型的变量。

定量数据>有序数据>定性数据--------------->5.请简述什么是小概率事件？概率是描述事件发生可能性大小的度量，P 0.05事件称为小概率事件。

≤6．举例说明什么是配对设计。

配对设计是将受试对象按某些重要特征相近的原则配成对子，每对中的两个个体随机地给予两种处理。

①同源配对：同一受试对象或同一标本的两个部分，随机分配接受两种不同处理；②异源配对：为消除混杂因素的影响，将两个同质受试对象配对分别接受两种处理。

7.非参数假设检验适合什么类型数据进行分析？①总体分布类型未知或非正态分布数据；②定量或半定量数据；③数据两端无确定的数值。

8．简述P 25 P 5０ P ７5的统计学意义。

（条件：明显偏态且不能转化为正态或近似对称；一端或两端无确定数值；分布情况未知）用来描述资料的观测值序列在某百分位置的水平，四分位数间距可以作为说明个体差异的指标（说明个体在不同位置的变异情况）。

9.直条图、直方图、圆饼图的使用条件是什么？直条图：各自独立的统计指标的数值大小和他们之间的对比；直方图：连续变量频数分布情况；圆饼图：全体中各部分所占的比例。

10.统计分析包括哪两个方面的内容？为什么要进行统计推断？统计描述和统计分析；统计描述用来描述及总结一组数据的重要特征，其目的是使实验或观察得到的数据表达清楚并便于分析。

医学统计学知识点

医学统计学知识点1.数据类型：医学研究中使用的数据包括定类数据和定量数据。

定类数据是非数值型的数据，例如性别、种族等；定量数据是数值型的数据，例如年龄、体重等。

了解数据类型是分析数据的第一步。

2.数据收集：医学研究中的数据可以通过不同的方式收集，例如问卷调查、实验研究、观察等。

在数据收集过程中，需要注意样本的选择、数据的完整性和准确性。

3.描述统计学：描述统计学包括对数据的整体特征进行描述和总结。

常用的描述统计学方法包括中心趋势度量（例如均值、中位数、众数）、离散程度度量（例如标准差、方差）和数据分布描述等。

4.推断统计学：推断统计学是从样本数据推断总体特征的一种方法。

通过推断统计学，可以根据样本数据的统计量（例如样本均值、样本比例）来推断总体参数的区间估计或假设检验。

5.假设检验：假设检验是根据样本数据对总体参数提出假设，并通过计算概率值来判断是否接受或拒绝该假设。

常用的假设检验方法包括t检验、卡方检验、方差分析等。

6.相关分析：相关分析用于研究两个或多个变量之间的关系。

常见的相关分析方法有皮尔逊相关系数、斯皮尔曼相关系数等。

相关分析可以帮助研究者了解变量之间的线性关系和方向。

7. 回归分析：回归分析用于研究因变量与自变量之间的关系，并可用于预测因变量的数值。

常用的回归分析方法有简单线性回归分析、多元线性回归分析和 logistic 回归分析等。

8. 生存分析：生存分析用于研究时间相关的数据，例如疾病患者的生存时间或事件发生的时间。

生存分析方法包括 Kaplan-Meier 曲线、Cox 比例风险模型等。

9.双盲试验和随机分组：在医学研究中，双盲试验和随机分组是常用的研究设计方法。

双盲试验是指研究中既不知道接受治疗的病人，也不知道给予治疗的医生；随机分组是指将研究对象随机分配到不同的治疗组和对照组。

10.统计软件：为了进行医学统计分析，研究者可以使用专业的统计软件，例如SPSS、SAS、R等。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第一章绪论一、名词解释1.统计学：是一门关于收集、分析、解释和表达数据的科学。

2.设计(design)：根据研究的问题与目的，从统计学的角度对各步提前做出的周密计划和安排。

是整个研究的基础，是关键的一步。

3.收集资料(data collection)：获得研究所需要的原始数据的过程。

4.整理资料(data storing)：对收集到的原始资料进行归类整理汇总的过程。

5.分析资料(data analysis)：对整理的资料进行统计分析，获取资料中有关信息的过程。

6.n同质（homogeneity）:对观察指标影响较大且可以控制的主要因素尽可能的相同。

7.n变异（variation）：同质基础上个体间的差异。

8.n.总体(population)：根据研究目的确定的，所有同质研究对象的某些指标的集合。

9.n样本(sample)：从总体中随机抽取的、数量足够的、能代表总体特征的部分研究对象某些指标的集合。

10.参数(parameter)：描述总体特征的指标称为参数。

11.统计量（statistic）：描述样本特征的指标12.变异(variation)：对同质研究对象某指标值得波动性称为变异。

13.误差(error)：实际观察值与客观真实值之差14.系统误差(systematic error)：在实际观测过程中，由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。

15.过失误差：由科研工作者的失误或过错造成的误差。

16.n.抽样误差（Sampling error）：由个体变异产生的，由于抽样造成的样本统计量与总体参数的差异，称为抽样误差。

17.随机误差(random error)：在没有过失误差和系统误差的条件下仍存在大量偶然无法消除的不确定因素所引起的误差为随机误差。

18.n频率(frequency)：在相同条件下，独立重复实验n次，其中事件A出现了m次，那么事件A发生的频率记为f(A)=m/n,0≤f(A)≤119.变量(variable)：观察结果的取值不能事先确定的某一特征叫随机变量(randomvariable)简称变量20.n概率（Probability）：描述随机事件发生可能性大小的度量(P)。

取值范围:不可能事件0~1。

估计方法:当n足够大时,用频率估计概率。

小概率事件:P ≤0.05（5％）或P ≤0.01（1％）称为小概率事件(习惯)，统计学上认为不大可能发生。

小概率原理即某事件发生的概率很小，可以视为只进行一次实验时，我们说这个事件是“不会发生的”，这句话在大多数情况下是正确的，但他一定有犯错误的时候。

21.资料(data)：变量全部或部分测量值构成资料22.计量资料(measurement data)：每个研究对象的变量值为一数值，表现出有量的大小，由这样一组研究对象定量观测值所构成的资料为计量资料。

23.计数资料(enumeration data)：每个研究对象的变量值为互不相同的属性之一，由这样一组研究对象定性变量值组成的资料为技术资料。

24.等级资料(ranked data)：每个研究对象变量值为互不相容的属性之一，且这些属性间有程度的递进或递减关系，有这样一组研究对象变量值组成的资料为等级资料。

25.实验因素(study factor)：研究者根据研究目的在实验中需要观察并阐明其效应的因素26.实验对象(subject)：处理因素作用的客体27.实验效应(experimental effect)：试验因素作用于受试对象后受试对象产生的变化。

28.随机化(randomization)：在抽样或分组时必须做到总体中每个个体都有相等的机会被抽入样本或分配到各组中29.重复原则(replication)：在相同的实验条件下进行的受试对象需具有一定数量。

二、简答题1.三种误差的区别误差：实际观察值与客观真实值之差①过失误差：人为失误不应出现的②系统误差：因测量仪器、实验方法导致的测量时不可避免，但可通过一些方法改善或消除③随机误差：排除上述误差后尚存的误差受多种无法控制的因素的影响有一定的规律，可以估计出来2.资料和变量分类3.统计工作的基本步骤①设计②数据收集③数据清理与转换④统计描述⑤统计估计(推断)⑥做出与专业有关的结论4.设计的方法①调查研究(横断面、现状)②实验研究(对照)③队列研究(时间变化的影响)通过对照实验设计，可以达到发现因果关系的目的。

通过队列研究，可以发现时间对因果关系变化的影响。

5.设计的原则①随机化原则随机抽样随机分配②对照的原则控制实验中其它非实验影响因素和偏倚③重复的原则足够的样本含量第三章定量资料的统计描述一、名词解释1.统计描述：是用统计图(表)、统计指标来描述资料的分布规律及其数量特征。

2.统计推断：用样本信息推断总体特征。

3.频数(frequency)：资料中相同数值或同种属性的观察单位个数。

4.极差(range)：所有数据的范围，定义为一组中观察值的最大值和最小值的差，又称全距。

5.组距：将极差分成若干组段，相邻组段之间的区间长度为组距。

6.集中趋势(central tendency)：大多数观察值所在的中心位置。

7.离散趋势(tendency of dispersion)：变量值围绕集中位置的分布情况。

（各观察值远离中心值的程度。

）8.直方图(histogram)：组段为横坐标，频数或频率为纵坐标，用矩形面积表示连续变量的频数分布。

9.算术均数(arithmetic mean)：用来描述一组对称分布数值的平均水平。

计算方法有直接法和加权法。

10.几何均数(geometric mean)：多用于对正态分布或观测值之间存在倍数关系的资料，描述它的平均水平。

计算方法有直接法和加权法。

11.中位数(median)：将一组观察值按大小顺序排列后位置居中的数值。

12.百分位数(percentile)：将一组观察值按大小顺序排列后，第X位观察值为第X百分数，记作Px。

13.四分位数间距(inter-quartile range,IQR)：第75位百分数P75和第25位百分数P25之差。

14.方差(variance)：反应每个观察值的平均变异的数值，总体方差用σ²表示，计算公式为15.标准差(standard deviation)：方差的平方根。

16.变异系数(coefficient of variation,CV)：用于比较两个或多个度量衡单位不同指标的变异程度，或者虽然单位相同但均数相差悬殊的情况，是标准差与均数之比。

17.正态分布(normal distribution)：又称高斯分布，频数分布以均数为中心两侧基本对称，越接近均数分布越多，越远离均数频数越少。

18.医学参考值范围（medical reference range）：是指绝大多数“正常”人的解剖、生理、生化指标及组织代谢产物含量等数据的波动范围。

19.P-P图：以实际观测值的累计频率为横轴，以正态分布的理论或期望累计概率为纵轴绘制散点图。

20.Q-Q图：以实际观测值的分位数Px为横轴，以正态分布的理论或期望分位数为纵轴绘制散点图。

21.标准误（standard error of mean）:样本均数的标准差，是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度二、简答题1.标准差和标准误的区别SD=√S2; SE=√n•标准差SD用于描述离散程度，用于使用样本对总体的变异进行估计。

在标准正态分布中，约95%的总体个体值落在均数的1.96个标准差之内(mean±1.96SD)。

•标准误是对均数可靠程度的估计，表示的是抽样误差。

论文中应标明使用的是标准差还是标准误3.如何将一个一般的正态分布转换为标准正态分布将样本中的每个数值减去μ，再除σ²Z=X−μσ²4.制定参考值范围的注意事项(1)选定足够例数的同质正常人作为研究对象判断是否分组(为保证足够的同质性)性别年龄种族……(2)控制检测误差(3)单、双侧界值①双侧：白细胞计数，血清总胆固醇……②单侧：上限: 转氨酶，尿铅，发汞……③下限: 肺活量，IQ ……(4)选择百分界值(5)选择合适的算法来计算参考值范围5.正态曲线下面积常用数据-σ~σ：0.6827-1.96σ~1.96σ：0.9500-2.58σ~2.58σ：0.9900三、课件要点1.表示集中趋势的统计量:(1)Arithmetic mean 算数平均数：适用于正态分布(2)Median 中位数：适用于不对称的分布，正、负偏态分布(3)Geometric mean 几何平均数：适用于正偏态分布2.描述离散趋势的统计量(变异):极差R=最大值-最小值四分位数、四分位间距：适用于偏态分布方差标准差变异系数3.正态分布是单峰分布，以均数为中心，左右完全对称，呈钟形。

正态分布的参数μ为位置参数，描述正态分布的集中位置σ为尺度参数，决定了正态分布的形状4.曲线下面积分布有一定的规律性正态曲线下的总面积恒等于1，正态曲线下一定区间的面积可用积分法求出。

对于服从正态分布的指标，只要知道总体均数μ与标准差σ，就可用公式：求得曲线下（X1，X2）范围内的面积。

5.正态分布的判定2221()212()2xxxP x X x e dxμσσπ--<≤=⎰第四章定量资料的参数估计与假设检验基础一、名词解释1.统计推断(statistical inference)：从总体中随机抽取一定数量的观察单位作为样本进行抽样研究，然后由样本信息推断总体特征。

2.抽样误差(sampling error)：由于个体变异存在，抽样研究所造成的各样本统计量之间以及样本统计量与总体参数之间的变异。

3.可信区间(confidence interval,CI)：从已知总体中以固定n 重复随机抽样，根据每个样本可算得一个可信区间，则平均有1-α的可信区间包含了总体参数，而不是总体参数落在该范围的可能性是1-α。

4.中心极限定理(central limit theorem)：讨论随机变量序列部分和分布渐近于正态分布的一类定理5.小概率事件（small probability event ）:概率≤0.05的随机事件，在以此观察或事件中发生的可能性很小，可认为不发生二、简答题1.可信区间和个体容许值参考区间 95%总体均数可信区间：(μ−1.S√n μ+1.S√n )95%个体值容许区间 (医学参考值范围)：(μ−1.96S,μ+1.96S)2. 假设检验的基本步骤(1) 建立假设，确定检验水准① H 0: μ = μ0 [零假设/无效假设] ② H 1: μ ≠ μ0 [备择假设] ③ α = 0.05 [检验水准] (2) 计算统计量[根据资料的类型和分析目的选择适当的检验方法] 根据检验方法计算。