医学统计学考试重点

合集下载

医学统计学复习重点

整理分析和2.计描述4.（集合）。

1.抽样随机2.分组随机3.实验顺序随机。

称全距，用离散系数，为标准差与均数只比，常：CV=s/x究，1.抽样研究2.个体变异。

系统误差：指数据搜集和测量过程中由于仪器不准确、造成观察结果呈倾向性的偏大或偏小，这种误差称为系统误差由于一些非人真实性（validity）：观察值与真值的接近程度，受系统误差的影响( （reliabiliy）——也称精密度(precision)或重复性（repeatability）是直接用样本统计量作为对应的总体参数最常用的是95%10095有5在描述两变量间的关系时，若散点图呈直线趋势或有直线相关关系，可进行直线回归分析。

参数：根根据样本的分布特征而计算得到的1、★医学统计学工作基本步骤：统计设计；收集资料.；整理资料；分析资料2、★统计分析包括：统计描述、统计推断3、频数分布的两个重要特征：集中趋势和离散趋势4、正态分布的两个参数：均数；标准差。

5、★频数表的用途：揭示计量资料的分布类型；揭示计量资料的分布特征；便于发现特大值和特小值；便于进一步进行统计分析★常见的统计资料的类型有：计量资料；计数资料；等级资料7、★t检验的应用条件是：①正态分布：当样本含量较小时，要求样本来自正态总体。

②方差齐性：两样本均数比较时，要求两总体方差相等。

U检验的应用条件是：①大样本（如n>50）；②小样本，σ已知且样本来自正态总体。

8、★.描述分类变量常用的指标有率、构成比、相对数。

9、率是指某种现象在一定条件下，实际发生的观察单位数与可能发生该现象的总观察单位数之比，常用来描述某种现象发生的频率大小或强度构成比是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比，常用来描述某一事物内部各组成部分所占的比重或分布。

10、★四格表卡方专用公式应用条件n≥40，且Tmin≥5 研究事物或现象间的线性关系用相关分析，研究事物或现象间的线性数量依存关系用回归分析。

医学统计学考试重点资料

一、名解：1、定量资料：以定量值表达每个观察单位的某项观察指标2、定性资料：以定性方式表达每个观察单位的某项观察指标3、等级资料：以等级方式表达每个观察单位的某项观察指标4、总体：是指按研究目的所确定的研究对象中所有观察单位某项指标取值的集合。

5、样本：是指从研究总体中随机抽取具有代表性的部分观察单位某项指标取值的集合。

6、参数：描述某总体特征的指标称为总体参数。

7、统计量：描述某样本特征的指标称为样本统计量。

8、小概率事件：当某事件发生的概率小于或等于0.05时，统计学上称该事件为小概率事件9、小概率原理：其涵义为该事件发生的可能性很小，进而认为其在一次抽样中不可能发生,此即为小概率原理。

小概率原理是进行统计推断的依据。

(8&9常写在一起)10∙变异,是以具有同质性的观察单位为载体，某项观察指标在其单位之间显示的差别。

11标准化率：用统一的标准对内部构成不同的各组频率进行调整和对比，对比后的率为标准化率。

12参考值范围：又称正常值范围，大多数人正常人某观察指标所在的范围。

由于正常人的形态、功能、生化等各种指标的数据因人而异，而且同一个人的某些指标还会随着时间、机体内外环境的改变而变化，因此需要确定其波动范围，即正常值范围，简称正常值。

13、抽样误差：由抽样引起的样本统计量与总体参数间的差别。

14、中心极限定理：①从均数为U,标准差为。

的总体中独立随机抽样，当样本含量？增加时，样本均数的分布将趋于正态分布，均数为标准差为。

X②从非正态分布的总体中随机抽样，只要样本含量足够大，样本均数趋于正态分布。

15、统计推断：就是根据样本所提供的信息，以一定的概率推断总体的性质。

16、区间估计/参数估计/可信区间：包括点估计和区间估计，由样本信息估计总体参数。

按一定的概率或可信度(La)用一个区间估计总体参数所在范围。

这个范围称作可信度为l-α的可信区间(ConfidenCeinterval,Cl),又称置信区间。

医学统计学重点

医学统计学重点说明：本重点仅供参考：不能包括所有选择题考题，名词和简答可信度高，计算题熟练运算过程；同时自己要清楚各种检验方法的基本思想，重点程度与星号数量相关）一、名词解释1、★★★医学统计学：用概率论和数理统计方法研究医学事件的群体特征的一门方法。

2、★总体：根据研究目的确定的同质的研究对象的全体（集合）。

3、样本：从总体中随机抽取的部分研究对象。

4、随机：总体中每个个体有同等的机会进入样本。

5、系统误差：指数据搜集和测量过程中由于仪器不准确、标准不规范等原因，造成观察结果呈倾向性的偏大或偏小，这种误差称为系统误差。

6、随机误差：由于一些非人为的偶然因素使得结果或大或小，是不确定、不可预知的。

7、★★抽样误差:由于抽样原因造成的样本指标与总体指标之间的差，或者是样本指标与样本指标之间的差。

8、准确度(accuracy)或真实性（validity）：观察值与真值的接近程度，受系统误差的影响(9、可靠度（reliabiliy）——也称精密度(precision)或重复性（repeatability）：重复观察时观察值与其均值的接近程度，受随机误差的影响。

10、★★★小概率事件：一般常将p ≤ 0.05或p ≤ 0.01称为小概率事件，表示某事件发生的可能性很小。

通俗讲一次抽样是不可能发生的事件。

11、★★正态分布定：又称高斯分布，是一条中间高，两头低，左右完全对称地下降，但永远不与横轴相交的钟形曲线。

12、★★医学参考值范围：指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。

最常用的是95%参考值范围。

13、★★标准误：用于反映均数抽样误差大小的指标，也叫样本均数的标准差，它反映了样本均数之间的离散程度。

14、★95%的可信区间：如果从同一总体中重复抽取100个独立样本，将可能有95个可信区间包括总体均数，有5个可信区间未包括总体均数。

二、填空题1、★医学统计学工作基本步骤：统计设计；收集资料.；整理资料；分析资料2、★统计分析包括：统计描述、统计推断3、频数分布的两个重要特征：集中趋势和离散趋势4、正态分布的两个参数：均数；标准差。

医学统计学重点重点知识总结

医学统计学重点选择1.几何均数：平均血清抗体滴度（如P9例2.4）2.正态分布：横轴为μ（界值、面积）2.5% I1.962.5%单侧双侧90%： 1.6495%： 1.64 1.9699%： 2.583.P值与α的关系，α是人为规定的，它们之间没有关系；P值f,Qt（X）4.方差分析自由度V的计算，V总=nT;V组间=组数（k）-1；V组间=V总-V组间5.理论秩和（n（n+1）∕2）,实际秩和（通过平均秩次算）6.可信区间的正确应用：总体参数有95%的可能落在该区间内（X）；有95%的总体参数在该区间内（X）；该区间包含95%的总体参数（X）；该区间有95%的可能包含总体参数。

（X）;这个区间的可信度为95%（√）；总体参数只有一个，要么在区间内，要么不在7.相关系数与回归系数：相关系数为0,两个变量之间没有相关关系（X）；回归系数t,相关系数t（X）;（要做假设检验）二、名解1.参考值范围：根据正常人的数据估计绝大多数的正常人所在的范围2.区间估计（可信区间）：按一定的概率或可信度（bα）用一个区间估计总体参数所在范围。

这个范围称作可信度为1-a的可信区间，又称置信区间。

3.P值：拒绝HO时所冒的风险（或“作出拒绝HO而接受H1”结论时冒了P风险）4.a（第一类错误）：HO真实时被拒绝（或HO真实时,拒绝H0,接受H1）5.β（第二类错误）：HO不真实时不拒绝（或HO不真实时，不拒绝HO）1-β检验效能：对真实的H1做肯定结论之概率6.秩次：是指全部观察值按某种顺序排列的位序；7.秩和：同组秩次之和8.剩余标准差：扣除了X的影响后,Y方面的变异；引进回归方程后，Y方面的变异。

三、简答1.假设检验与可信区间的联系与区别分辨多个样本是否分别属于不同的总体，并对总体作出适当的结论。

分辨一个样本是否属于某特定总体等。

区间估计（可信区间）：按一定的概率或可信度（1-a）用一个区间估计总体参数所在范围。

医学统计学重点官方版

一：基本概念：1.参数：反映总体的统计指标。

2. 统计量:反映样本的统计指标称为统计量。

3. 概率：描述随机事件发生的可能性的大小的一个量度4.小概率事件：把p小于等于0.05或小于等于0.01的随机事件。

资料类型：计量资料，计数资料，等级资料。

医学统计的基本步骤：研究设计，收集资料，整理资料，分析资料，结果报告与结论表达。

二：变量分布：1.正态分布：指变量的频数或频率呈中间最多，两端逐渐对称地减少，表现为钟形的一种概率分布。

特征：（1）正态分布曲线是单峰，对称，钟形曲线，X=μ时曲线达到最高峰。

（2）正态曲线有两个参数，总体均数μ和总体标准差σ，μ越大曲线右移，越小左移，故称位置参数，σ越小曲线越瘦高，越大曲线越矮胖，故称形状参数。

（3）正态分布曲线下的面积分布具有一定的规律。

P80页。

应用：（1）质量控制（2）是统计学的理论基础（3）制定医学参考值范围制定医学参考值范围：包括绝大多数正常人的人体形态功能和代谢反应等各种生理生化指标的波动范围，是作为判定某项指标正常与否的参考标准。

方法：确定正常人对象的范围，统一测量标准，确定分组，样本含量确定，确定参考值范围的但双侧，确定百分界值，医学参考值范围的估计。

2.二项分布特征：（1）二项分布的图形：当π＝0.5时图形对称，π≠0.5时，图形呈偏态，且当n的含量增大时，图形趋于对称。

（2）二项分布的均数与标准差：μ=n π；σ²=nπ（1-π）；σ=根号下nπ（1-π）（3）二项分布的正态近似：当n无限增大时越趋近于正态分布。

应用：对立性，独立性，重复性三：统计分析：㈠1.统计描述：图表和指标（1）图表：频数分布图分为正偏态和负偏态，长尾向右侧延伸为正偏态，向左侧延伸为负偏态。

频数分布的特点：集中趋势和离散趋势。

（2）指标：分为计数指标和计量指标。

计数指标：相对数。

应用相对数的注意事项：①计算相对数时分母不宜太小②观测单位数不等的几个率不能直接想加求其合计率③资料对比时注意可比性④资料分析时不能以构成比代替率⑤考虑存在抽样误差计量指标：1.集中趋势：①算数均数χ：适用于对称分布资料，特别是正态或近似正态分布的计量资料。

医学统计学复习重点

医学统计学复习重点统计设计：调查设计、实验设计第一章绪论1.基本概念：总体——根据研究目的确定，所有同质观察单位某种观察值的全体。

样本——总体中抽取的一部分具有代表性的个体组成的集合。

参数-—刻画总体特征的统计指标。

一般用希腊字母表示μ、σ、π统计量—-刻画样本特征的统计指标.抽取的样本不同，统计量会变化；一般用拉丁字母或英文字母表示、S、p抽样误差：个体变异所致，抽样研究中样本信息与总体特征间的差异。

抽样误差是不可避免的。

属于随机误差,无方向性,重复抽样可以呈现一定的规律性。

小概率事件P≤0。

052.*统计工作的四个步骤：设计、收集资料、整理资料、分析资料。

(用工作实例解释）第二章调查研究设计第三章实验研究设计1.调查研究(观察性研究）：特点:无人为施加处理因素调查研究的分类：按调查涉及的对象划分:全面调查(普查)、抽样调查、典型调查注意：收集的资料要有可比性＊随机抽样方法(做统计推断有意义)：单纯随机抽样、系统抽样、分层抽样、整群抽样非随机抽样方法（不能做统计推断,可能有偏差）：偶遇抽样、判断抽样、滚雪球抽样等2.实验研究特点：与调查研究最本质的区别：根据研究目的主动施加干预措施实验设计的三个基本要素：受试对象、处理因素、实验效应实验设计的基本原则：对照原则、随机化原则、重复原则第四章定量资料的统计描述第五章定性资料的统计描述1.定量资料（1）定量资料——*频数分布表、直方图、箱式图—-判断分布类型——（2）描述离散趋势的统计指标:✓极差R=最大值—最小值、✓四分位数间距Q：常用于描述*偏态分布资料的离散趋势、一端或两端无确切值的资料、分布不明确资料✓方差（总体、样本S2）＆标准差(、S）:＊正态或近似正态分布✓变异系数（3）(4）正态分布及其应用：**制定医学参考值范围步骤：判断分布类型-—正态分布-—＊双侧95％参考值范围：±1.96S、单侧95％参考值范围:下限为—1。

64S、上限为+1。

医学统计学重点简答题

一、平均水平常用的统计指标及其适用范围？常用统计指标包括算术均数,几何均数，中位数。

算术均数适用于对称分布，特别是正态分布的数据；几何均数适用于经对数变换后频数分布对称或呈等比级数的数据；中位数主要适用于三种情形：①非正态分布资料（对数正态分布除外)。

②频数分布的一端或两端无确切数据的资料。

③总体分布不清楚的资料。

二、应用相对数的注意事项1.计算相对数时应有足够的观察单位数。

例数太少会使相对数波动较大，这种情况下最好用绝对数表示。

2。

正确计算合计率. 计算观察单位不等的几个率的合计率（平均率)时，不能将几个率直接相加求其平均率，而应分别将分子分母合计,再求出合计率。

3不能以构成比代替率. 构成比说明事物内部各部分所占的比重,不能说明某现象发生的频率或强度.4.注意资料的可比性。

在比较相对数时,除了要比较的因素外，其余的因素应尽可能相同或相近。

5。

样本率或构成比的比较应做假设检验. 由于样本率或构成比也存在抽样误差，比较两个或多个率或构成比时，不能凭样本率或构成比的差别作出结论，而必须进行差别的假设检验。

三、正常值范围与置信区间的区别四、标准误与标准差的区别与联系.区别点标准误标准差含义样本均数的标准差，描述样本均数的抽样误差，即样本均数与总体均数的接近程度。

描述个体间的变异程度计算公式1k)xx(s2x--=∑---1n)xx(s2--=∑-用途总体均数的区间估计医学参考值范围估计相似点性质相似，都是用来说明变异程度五、简述四格表卡方检验统计方法的选择条件六、行×列表资料χ²检验的注意事项1。

行×列表资料中各格的理论频数T均不应小于1，并且1≤ T＜5的格子数不宜超过格子总数的1/5，否则可能产生偏性。

处理的方法有三种:①增大样本含量，使理论频数增大；②根据专业知识，删去理论频数太小的行或列或将理论频数太小的行或列与性质相近的邻行或邻列合并。

③改用双向无序R×C表的Fisher确切概率法。

医学统计学重点

医学统计学重点医学统计学是医学领域中不可或缺的一门学科，它借助数理统计方法研究医学数据和临床试验的结果，为医学决策提供可靠的依据。

以下是医学统计学的几个重点内容。

一、描述统计学描述统计学是医学统计学的基础，主要研究如何分类、整理和描述医学数据。

其主要方法包括测量尺度、频率分布表、中心趋势测量和变异程度测量。

1. 测量尺度在医学统计学中，常见的测量尺度包括名目尺度、有序尺度和数值尺度。

名目尺度适用于无序分类的变量，有序尺度适用于有序分类的变量，而数值尺度适用于具有度量意义的变量。

2. 频率分布表频率分布表用来展示变量的分布情况，主要包括类别、频数和频率等内容。

通过频率分布表，可以直观地了解变量的分布状况。

3. 中心趋势测量中心趋势测量主要包括平均数、中位数和众数。

平均数是所有观测值的总和除以观测值的个数，中位数是将观测值按大小排列后的中间值，众数是出现次数最多的观测值。

4. 变异程度测量变异程度测量用来描述数据的分散程度，主要包括极差、方差和标准差。

极差是最大观测值与最小观测值之间的差异，方差是观测值与均值之间的差异的平方的平均数，标准差是方差的平方根。

二、推断统计学推断统计学是医学统计学的核心内容，主要研究如何通过样本数据推断总体参数，并对假设进行检验。

其中包括参数估计、假设检验和置信区间等方法。

1. 参数估计参数估计是利用样本数据估计总体参数，常用的方法有点估计和区间估计。

点估计是通过样本数据得到一个单一的数值作为总体参数的估计值，区间估计是通过样本数据得到一个范围作为总体参数的估计区间。

2. 假设检验假设检验是用来检验某个陈述是否与观察数据相符的方法。

在医学研究中，研究者常常根据实验数据对研究假设进行检验，以确定是否有统计显著性。

3. 置信区间置信区间是对总体参数的一个范围估计。

置信区间的计算方法与区间估计相似，通过对样本数据进行分析计算得到。

三、生存分析生存分析是医学统计学中的一个重要分支，主要研究疾病患者的生存时间和生存率等问题。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

考试题型：名词解释10 个选择20 个填空题20 个简答4-5 个讨论分析1-2 题计算1-2 题绪论2 选1总体：总体（population）指特定研究对象中所有观察单位的测量值。

可分为有限总体和无限总体。

总体中的所有单位都能够标识者为有限总体，反之为无限总体。

样本：从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample）。

样本应具有代表性。

所谓有代表性的样本，是指用随机抽样方法获得的样本。

3 选1 小概率事件：我们把概率很接近于0（即在大量重复试验中出现的频率非常低）的事件称为小概率事件P值：结果的统计学意义是结果真实程度（能够代表总体）的一种估计方法。

p值是将观察结果认为有效即具有总体代表性的犯错概率。

一般结果0.05被认为是有统计学意义小概率原理：一个事件如果发生的概率很小的话，那么可认为它在一次实验中是不会发生的，数学上称之小概率原理。

统计学中，一般认为等于或小于0.05 或0.01 的概率为小概率。

资料的类型（3 选1）（1）计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data。

计量资料亦称定量资料、测量资料。

.其变量值是定量的，表现为数值大小，一般有度量衡单位。

如某一患者的身高（cm）、体重（kg）、红细胞计数（1012/L）、脉搏（次/分）、血压（KPa ）等。

（2）计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。

计数资料亦称定性资料或分类资料。

其观察值是定性的，表现为互不相容的类别或属性。

如调查某地某时的男、女性人口数；治疗一批患者，其治疗效果为有效、无效的人数；调查一批少数民族居民的A、B、AB 、O 四种血型的人数等。

（3）等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。

等级资料又称有序变量。

如患者的治疗结果可分为治愈、好转、有效、无效或死亡，各种结果既是分类结果，又有顺序和等级差别，但这种差别却不能准确测量；一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。

等级资料与计数资料不同：属性分组有程度差别，各组按大小顺序排列。

等级资料与计量资料不同：每个观察单位未确切定量，故亦称为半计量资料。

2 选1抽样误差（sampling error ）是指样本统计量与总体参数的差别。

在总体确定的情况下，总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。

系统误差：由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差，称为系统误差。

它带有规律性，经过校正和处理，通常可以减少或消除。

统计的步骤(考填空题，四个空)统计工作的步骤1.设计:设计容包括资料收集、整理和分析全过程总的设想和安排。

设计是整个研究中最关键的一环，是今后工作应遵循的依据。

2•收集资料:应采取措施使能取得准确可靠的原始数据。

3•整理资料：简化数据，使其系统化、条理化，便于进一步分析计算。

4•分析资料：计算有关指标，反映事物的综合特征，阐明事物的在联系和规律。

分析资料包括统计描述和统计推断。

实验设计的基本原则(考填空题，三个空)随机化原则、对照的原则(对照的类型，对照的设置)、重复的原则。

2选1参数：参数(paramater)是指总体的统计指标，如总体均数、总体率等。

总体参数是固定的常数。

多数情况下，总体参数是不易知道的，但可通过随机抽样抽取有代表性的样本，用算得的样本统计量估计未知的总体参数。

统计量：统计量(statistic )是指样本的统计指标，如样本均数、样本率等。

样本统计量可用来估计总体参数。

总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。

第二章频数表的制作步骤以及频数分布表的用途(问答题)频数分布表的编制步骤：例：某市1982年50名7岁男童的身高(cm)资料如下，试编制频数表。

114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1123.5118.3120.3116.2114.7119.7114.8119.6113.2120.119.8116.8119.8122.5119.7120.7114.3122.0117.0122.5119.7124.9126.1120.0124.6120.0121.5114.3124.1117.2120.2120.8126.6121.5126.1117.7124.1128.3121.8118.71、找出观察值中的最大值(largest value)、最小值(smallest value)，求极差(range)。

极差等于最大值减最小值。

本例最大值=128.3，最小值=110.8，则极差=128.3-110.8=17.5(cm )2、确定分组数和组距 (class interval )o组数的多少是根据例数的多少来确定的，以能够反映出频数分布的特征为原则，一般分10—15组。

组距为相邻两组的间隔，组距=极差/组数。

本例拟分10组，则组距=17.5/10=1.75 "，为划记方便，可取稍大或稍小的数(当然本例组距也可取1.5)。

3、确定组段。

第一组段包括要最小值，取较最小值稍小且划分方便的数，本例取“10〜”最后组段包括最大值并写岀其上限值。

4、划记。

将各观察值以划正”字的方法，一笔代表一例，划在相应组段中。

例如第一个数l14.4应在组段“114”处划, 第二个数117.2应在“114”处划，以此类推。

5、统计各组段的频数。

全部数据划记完后，清点各组段的人数。

根据编制出的频数表即可了解该数值变量资料的频数分布特征。

频数分布表的用途1、描述资料的分布特征和分布类型。

频数分布有两个重要特征：集中趋势和离散趋势。

大部分观察值向某一数值集中的趋势称为集中趋势，常用平均数指标来表示，各观察值之间大小参差不齐。

频数由中央位置向两侧逐渐减少，称离散趋势，是个体差异所致，可用一系列的变异指标来反映。

2、便于进一步计算有关指标或进行统计分析。

当数据较多且需手工计算时，常先编制频数表，再进行统计计算。

3、发现特大、特小的可疑值。

如果频数表的一端或两端出现连续几个组段的频数为零后，又出现少数几个特大值或特小值，使人怀疑其是否准确，需进一步检查和核对并做相应处理。

4、据此绘制频数分布图。

描述数据分布集中趋势的指标和描述数据分布离散程度的指标（考选择或者填空）2.描述数据分布集中趋势的指标掌握其意义、用途及计算方法。

算术均数、几何均数、中位数。

3.描述数据分布离散程度的指标掌握其意义、用途及计算方法。

极差、四分位数间距、方差、标准差、变异系数。

正态分布的特征（考选择题u、b对图形的影响）服从正态分布的变量的频数分布由u 、b完全决定。

（1）u是正态分布的位置参数，描述正态分布的集中趋势位置。

正态分布以X = u为对称轴，左右完全对称。

正态分布的均数、中位数、众数相同，均等于u 。

（2）b描述正态分布资料数据分布的离散程度，b越大，数据分布越分散，b越小，数据分布越集中。

b也称为是正态分布的形状参数，b越大，曲线越扁平，反之，b越小，曲线越瘦高。

标准正态分布（填空）1 •标准正态分布是一种特殊的正态分布，标准正态分布的u 0，b2 1，通常用u （或Z）表示服从标准正态分布的变量，记为u〜N （0，12）。

正态分布的应用（简答）某些医学现象，如同质群体的身高、红细胞数、血红蛋白量，以及实验中的随机误差，呈现为正态或近似正态分布；有些指标（变量）虽服从偏态分布，但经数据转换后的新变量可服从正态或近似正态分布，可按正态分布规律处理。

其中经对数转换后服从正态分布的指标，被称为服从对数正态分布。

1. 估计频数分布一个服从正态分布的变量只要知道其均数与标准差就可根据公式（3-2 ）估计任意取值（X1 ,X2 ）围频数比例。

2. 制定参考值围（1 ）正态分布法适用于服从正态（或近似正态）分布指标以及可以通过转换后服从正态分布的指标。

（2）百分位数法常用于偏态分布的指标。

表3-1 中两种方法的单双侧界值都应熟练掌握。

3. 质量控制：为了控制实验中的测量（或实验）误差，常以X 2S作为上、下警戒值，以X 3S作为上、下控制值。

这样做的依据是：正常情况下测量（或实验）误差服从正态分布。

4. 正态分布是许多统计方法的理论基础。

t检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。

许多统计方法虽然不要求分析指标服从正态分布，但相应的统计量在大样本时近似正态分布，因而大样本时这些统计推断方法也是以正态分布为理论基础的。

医学参考值围的制定（计算题）确定参考值围的单双侧：一般生理物质指标多为双侧、毒物指标则多为单侧。

907 = 1.645T-1.28S T+1.28S P厂生95£-1.64$X+IMS弓3 E Pg997 + 2,585无■ 2.33&7 + 2,335P、&第三章标准误的概念，计算公式。

标准误及b X :通常将样本统计量的标准差称为标准误。

许多样本均数的标准差b X称为均数的标准误（standard error of mean, SEM），它反映了样本均数间的离散程度，也反映了样本均数与总体均数的差异，说明均数抽样误差的大小。

t分布的图形特征及其与正态分布的区别1. 以0为中心，左右对称的单峰分布；2. t分布是一簇曲线，其形态变化与n （确切地说与自由度V大小有关。

自由度v越小，t分布曲线越低平；自由度v越大，t分布曲线越接近标准正态分布（U分布）曲线。

t分布对应于每一个自由度V，就有一条t分布曲线，每条曲线都有其曲线下统计量t的分布规律，计算较复杂。

t分布与正态分布t分布与标准正态分布相比有以下特点：①都是单峰、对称分布；② t分布峰值较低，而尾部较高；③随自由度增大，t分布趋近与标准正态分布；当n ? Y时，t分布的极限分布是标准正态分布。

置信区间和参数估计（名解2选1）置信区间，定义：是指由样本统计量所构造的总体参数的估计区间。

1、对于具有特定的发生概率的随机变量，其特定的价值区间------一个确定的数值围（一个区间”2、在一定置信水平时，以测量结果为中心，包括总体均值在的可信围。

3、该区间包含了参数B真值的可信程度。

4、参数的置信区间可以通过点估计量构造，也可以通过假设检验构造。

参数估计：指用样本指标值（统计量）估计总体指标值（参数）。

参数估计有两种方法：点估计和区间估计。

可信区间与参考值围的不同点（简答）t 检验的应用条件和类型（填空）t 检验的应用条件：要求各样本来自相互独立的正态总体且各总体方差齐。