医学统计学知识点汇总
《医学统计学》复习重点总结

计量数据比较的统计公式
X 0 t Sx
样本均数与标准值的比较 *配对数据的比较(不做方 差齐性检验 *两样本均数的比较,例数 较小时(做方差齐性检验)
d d t Sd
X1 X 2 t S x1 x2
t检验与可信区间公式小结
X1 X 2 t , SX1X 2
两独立样本均数的t n1 n2 2 检验公式
病变性质
肿瘤
恶性
1.层次不清,结构混乱,难于理解 2.线条过多,不符要求
修改后:
表 10 病变性质 良性肿瘤 恶性肿瘤﹡ 囊肿 瘤样病变 合 计
口腔颌面部不同病变构成情况 例 数 674 558 192 168 1592 构成比(%) 42.34 35.05 12.06 10.55 100.00
﹡包括癌437例,肉瘤101例,果用统计表表达。
统计表类型:
简单表和组合表
统计图: 要求掌握图形选择. 如线图、直条图、直方图、构成图
例: 简单表格式
某地1980年男女HBsAg阳性率的比较 性别 调查例数 男 4234 女 4530 合计 8764 阳性数 303 181 484 阳性率% 7.16 4.00 5.52
第14章基于秩次的统计方法
掌握概念: 1)何为非参数统计? 2) 什么样数据适合采用秩和检验,以及秩和 检验的优缺点。 3)秩和检验有那几种检验方法?
注意:结果(y)数据为等级时,两组比较采 用秩和检验效率高于χ2检验,应首选秩和检验.
表 某病两组疗效的比较 比较组 无效 有效 显效 痊愈 合计 试验组 18( 31.6) 18 (31.6) 15(26.3) 6 (10.5) 57 对照组 21 (46.7) 15( 33.3) 8(17.8) 1( 2.2) 45 Total 39 33 23 7 102
医学统计学知识点

实用标准文案精彩文档第一章绪论1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。
2、研究对象:具有不确定性结果的事物。
3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。
4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。
5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。
6、医学统计学中的基本概念(1) 同质与变异同质,指根据研究目的所确定的观察单位其性质应大致相同。
变异,指总体内的个体间存在的、绝对的差异。
统计学通过对变异的研究来探索事物。
(2) 变量与数据类型变量,是反映实验或观察对象生理、生化、解剖等特征的指标。
变量的观测值,称为数据分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。
(如身高、体重、血压、温度等)定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。
包括二分类、无序多分类。
(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等)有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。
统计方法的选用与数据类型有密切的关系。
(3)总体与样本总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。
样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。
抽样,是从研究总体中随机抽取部分有代表性的观察单位。
参数,指描述总体特征的指标。
统计量,指描述样本特征的指标。
(4)误差误差,指观测值与真实值、统计量与参数之间的差别。
可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。
随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。
抽样误差,是抽样引起的统计量与参数间的差异。
医学统计学复习资料(完整版)

第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
医学统计学重点总结

10
53
40
16
56
83
26
109
40.36
12.64
42.64
11.36
T11=53× 83/109=40.36 T12=53× 26/109=12.64 T21=56× 83/109=42.64 T22=56× 26/109=13.36
既非呈连续分布的定量资料,也非仅按性质归属于独立的若干类的定性资料;
04
确定参考值范围的意义:
05
用于判断正常与异常。
06
“正常人”的定义:
07
排除了影响所研究的指标的疾病和有关因素的同质的人群。
08
抽样误差(sampling error)
由抽样引起的样本统计量与总体参数间的差别。
原因:个体变异+抽样
03
表现:
04
样本统计量与总体参数间的差别
05
不同样本统计量间的差别
7. X±2.58s包括变量值的 A. 68.3% B. 90.0% C. 95.0% D. 99.0% 8. 均数与标准差之间的关系是 A.标准差越小,均数代表性越好 B. 标准差越小,均数代表性越差 C. 均数越大,标准差越小 D. 均数越大,标准差越大 9.分析定性资料时,最常用的显著性检验方法是 A.t检验 B.正态检验 C.U检验 D.χ2检验 10.四格表如有一个实际数为0 A.就不能做χ2检验; B.就不能用校正χ2检验; C.还不能决定是否可做χ2检验; D.肯定可做校正χ2检验。
4.正态分布曲线下,横轴上从均数到(μ + 1.96σ)的面积为: A.95% B.45% C.47.5% D.90% 5. 某人群血糖的正常值范围是指 ( ) (A)该指标在所有人中的波动范围 (B)该指标在所有正常人中的波动范围 (C)该指标在绝大部分正常人中的波动范围 (D)该指标在一个人不同时间的波动范围 6.假设检验中的第一类错误是指 A.拒绝了实际上成立的H0 B.不拒绝实际上成立的H0 C.拒绝了实际上不成立的H0 D.不拒绝实际上不成立的H0
医科大学医学统计学重点知识总结

第一章绪论1、统计学的定义:统计学研究数据的收集、整理、分析的一门学科。
医学统计学:医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理、方法,研究医学资料的搜集、整理、分析和推断的一门科学。
2、医学统计研究三个步骤:研究设计、资料分析、结论3、(必考的)几个概念:(1)同质:性质相同异质:性质不同观察单位间的同质性是进行研究的前提同质是相对的(不同研究中或同一研究中不同观察指标对观察对象的同质性的要求不同)(2)个体变异:同质个体间的差异。
变异的两个方面:不同观察单位(个体)间的差别;同一个体在不同阶段的差别(重复测量)个体变异是普遍存在的;个体变异是有规律的。
注意:由于个体变异的存在,同质个体指标的取值会存在差异!(例:体温波动)(3)总体:按研究目的所确定的同质研究对象的全体。
有限总体:有时间、空间的概念,观察单位有限无限总体:无时间、空间的概念(例:某种治疗措施的效果,就包括接受这种治疗措施的所有病人过去、现在、未来,因而观察单位无限)(4)个体:组成总体的基本单位。
样本:从研究总体中随机抽取具有代表性的部分观察单位随机性的三个体现:抽样随机、分组随机、试验顺序随机(5)随机变量:观察对象个体的特征或测量的结果观察结果在一定范围内以一定的概率分布随机取值的变量,表示随机现象。
在一定条件下,并不总是出现相同结果变量值:个体观察指标具体取值(6)总体参数:总体的统计指标或特征值固有的、不变的,但往往是未知的(7)样本统计量:由样本所算出的统计指标或特征值已知的,且随着试验的不同而不同,但分布是有规律的(8)样本含量:样本中包含个体的数量(9)频率f=m/n,f的值随n的增大接近常数p,概率P(A)=p即:频率为一变量,是样本统计量;概率为常数,是一总体参数小概率事件:概率小于等于0.05小概率原理:小概率事件在一次试验中是不会发生的(10)抽样误差:两个表现:样本统计量与总体参数间的差别;不同样本统计量间的差别两个原因:个体变异;抽样过程抽样误差不可避免,但是有规律。
新版医学统计学知识点归纳总结

新版医学统计学知识点归纳总结医学统计学是医学研究中不可或缺的一部分,它涉及到数据的收集、分析和解释,帮助医学工作者从大量数据中提取有价值的信息。
以下是新版医学统计学的知识点归纳总结:1. 研究设计:研究设计是统计分析的前提,包括观察性研究和实验性研究。
观察性研究如队列研究、病例对照研究,而实验性研究如随机对照试验(RCT)。
2. 数据类型:医学统计学中的数据可分为定性数据和定量数据。
定性数据如性别、血型,定量数据如血压、体重。
3. 描述性统计:描述性统计用于描述数据集的特征,包括集中趋势(均值、中位数、众数)和离散程度(方差、标准差、极差)。
4. 概率分布:在统计学中,概率分布描述了随机变量取值的概率。
常见的分布有正态分布、二项分布和泊松分布。
5. 假设检验:假设检验是统计推断的核心,用于判断样本数据是否支持某个假设。
常见的检验方法有t检验、卡方检验和F检验。
6. 置信区间:置信区间提供了一个范围,用以估计总体参数的可能值。
95%的置信区间意味着有95%的把握认为总体参数落在这个区间内。
7. 回归分析:回归分析用于研究一个或多个自变量对因变量的影响。
简单线性回归和多元线性回归是常见的回归分析方法。
8. 生存分析:生存分析关注个体生存时间的分布和相关因素,常用于肿瘤学和流行病学研究。
Kaplan-Meier估计和Cox比例风险模型是生存分析中的重要工具。
9. 诊断试验评价:诊断试验评价涉及敏感性、特异性、阳性预测值和阴性预测值等指标,用于评估诊断方法的准确性。
10. 样本量计算:样本量计算是研究设计的重要环节,它决定了研究的可行性和结果的可靠性。
样本量计算需要考虑效应大小、显著性水平和检验力。
11. 多变量分析:多变量分析用于同时考虑多个变量对结果的影响,如多元回归分析和判别分析。
12. 统计软件的应用:统计软件如SPSS、SAS和R在医学统计分析中扮演着重要角色,它们提供了数据处理和统计分析的功能。
医学统计学重点重点知识总结

医学统计学重点选择1.几何均数:平均血清抗体滴度(如P9例2.4)2.正态分布:横轴为μ(界值、面积)2.5% I1.962.5%单侧双侧90%: 1.6495%: 1.64 1.9699%: 2.583.P值与α的关系,α是人为规定的,它们之间没有关系;P值f,Qt(X)4.方差分析自由度V的计算,V总=nT;V组间=组数(k)-1;V组间=V总-V组间5.理论秩和(n(n+1)∕2),实际秩和(通过平均秩次算)6.可信区间的正确应用:总体参数有95%的可能落在该区间内(X);有95%的总体参数在该区间内(X);该区间包含95%的总体参数(X);该区间有95%的可能包含总体参数。
(X);这个区间的可信度为95%(√);总体参数只有一个,要么在区间内,要么不在7.相关系数与回归系数:相关系数为0,两个变量之间没有相关关系(X);回归系数t,相关系数t(X);(要做假设检验)二、名解1.参考值范围:根据正常人的数据估计绝大多数的正常人所在的范围2.区间估计(可信区间):按一定的概率或可信度(bα)用一个区间估计总体参数所在范围。
这个范围称作可信度为1-a的可信区间,又称置信区间。
3.P值:拒绝HO时所冒的风险(或“作出拒绝HO而接受H1”结论时冒了P风险)4.a(第一类错误):HO真实时被拒绝(或HO真实时,拒绝H0,接受H1)5.β(第二类错误):HO不真实时不拒绝(或HO不真实时,不拒绝HO)1-β检验效能:对真实的H1做肯定结论之概率6.秩次:是指全部观察值按某种顺序排列的位序;7.秩和:同组秩次之和8.剩余标准差:扣除了X的影响后,Y方面的变异;引进回归方程后,Y方面的变异。
三、简答1.假设检验与可信区间的联系与区别分辨多个样本是否分别属于不同的总体,并对总体作出适当的结论。
分辨一个样本是否属于某特定总体等。
区间估计(可信区间):按一定的概率或可信度(1-a)用一个区间估计总体参数所在范围。
(完整版)医学统计学重点总结

1.简述总体和样本的定义,并且举例说明。
总体是研究目的确定的所有同质观察单位的全体。
样品是从研究总体中抽取部分有代表性的观察单位。
2.简述参数和统计量的定义,并且举例说明。
描述总体特征的指标称为参数,描述样本特征的指标称为统计量。
3.变量的类型有哪几种?举例说明各种类型变量有什么特点。
①定量数据:计量资料;定量的观测值是定量的,其特点是能够用数值的大小衡量其水平的高低。
②定性数据:计数资料;变量的观测值是定性的,表现为互不相容的类别或属性。
③有序数据:半定量数据/等级资料;变量的观测值是定性的,但各类别(属性)有程度或顺序上的差异。
4.请举例说明一种类型的变量如何变换为另一种类型的变量。
定量数据>有序数据>定性数据--------------->5.请简述什么是小概率事件?概率是描述事件发生可能性大小的度量,P 0.05事件称为小概率事件。
≤6.举例说明什么是配对设计。
配对设计是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。
①同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;②异源配对:为消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理。
7.非参数假设检验适合什么类型数据进行分析?①总体分布类型未知或非正态分布数据;②定量或半定量数据;③数据两端无确定的数值。
8.简述P 25 P 50 P 75的统计学意义。
(条件:明显偏态且不能转化为正态或近似对称;一端或两端无确定数值;分布情况未知)用来描述资料的观测值序列在某百分位置的水平,四分位数间距可以作为说明个体差异的指标(说明个体在不同位置的变异情况)。
9.直条图、直方图、圆饼图的使用条件是什么?直条图:各自独立的统计指标的数值大小和他们之间的对比;直方图:连续变量频数分布情况;圆饼图:全体中各部分所占的比例。
10.统计分析包括哪两个方面的内容?为什么要进行统计推断?统计描述和统计分析;统计描述用来描述及总结一组数据的重要特征,其目的是使实验或观察得到的数据表达清楚并便于分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学总结 绪论 1、随机现象:在同一条件下进行试验,一次试验结果不能确定,而在一定数量的重复试验之后呈现统计规律的现象。 2、同质:统计学中对研究指标影响较大的,可以控制的主要因素。 3、变异:同质基础上各观察单位某变量值的差异。 数值变量:变量值是定量的,由此而构成的资料称为数值变量资料或计量资料,其数值是连续性的,称之为连续型变量。 变量 无序分类变量:所分类别或属性之间无顺序和程度上的差异 分类变量 :定性变量
有序分类变量:有顺序和程度上的差异 4、总体:根据研究目的确定的同质研究对象中所有观察单位某变量值的集合。可以分为有限总体和无限总体。 5、样本:是按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。样本代表性的前提:同质总体,足够的观察单位数,随机抽样。
统计学中,描述样本特征的指标称为统计量,描述总体特征的指标称为参数。 6、概率:描述随机事件发生的可能性大小的一个度量。若P(A)=1,则称A为必然事件;若P(A)=0,则称A为不可能事件;随机事件A的概率为0<P<1. 小概率事件:若随机事件A的概率P≤α,则称随机事件A为小概率事件,其统计学意义为:小概率事件在一次随机试验中认为是不可能发生的。
统计描述 1、频数分布有两个重要的特征:集中趋势和离散程度。频数分布有对称分布和偏态分布之分。后者是指频数分布不对称,集中趋势偏向一侧,如偏向数值小的一侧为正偏态分布,如偏向数值大的一侧为负偏态分布。 2、常用的集中趋势的描述指标有:均数,几何均数,中位数等。
均数:适用于正态或近似正态的分布的数值变量资料。样本均数用x表示,总体均数用μ表示。 几何均数:适用于等比级数资料和对数呈正态分布的资料。注意观察值中不能有零,一组观察值中不能同时有正值和负值。 中位数:适用于偏态分布资料以及频数分布的一端或两端无确切数据的资料。 3、常用的离散程度的描述指标有:全距,四分位数间距,方差,标准差,变异系数。 全距:任何资料,一组中最大值与最小值的差。 四分位数间距:适用于偏态分布以及分布的一端或两端无确切数据资料。 方差和标准差:正态分布资料。标准差表示观察值的变异度的大小。 变异系数:比较度量单位不同或均数相差悬殊的两组资料的变异度。
4、标准正态分布:对正态分布的(X-μ)/σ进行u的变换,u=(X-μ)/σ,则正态分布变换为μ=0,σ=1的标准正态分布,亦称u分布。u被称为标准正态变量或标准正态离差。 两个参数:μ是位置参数,σ是形状参数。用N(0,1)表示标准正态分布。 2 / 18
常用估计医学参考值范围的方法有: (1) 正态分布方法:适用于正态或近似正态分布的资料。 双侧界值:X±uσ/2S 单侧上界:X+uσS,或单侧下界:X-uσS (2) 对数正态分布方法:适用于对数正态分布资料。 双侧界值:Lg-1(X lgx±uσ/2S lgx ) 单侧上界:Lg-1(X lgx +uσS lgx), 或单侧下界:Lg-1(X lgx -uσS lgx) (3)百分位数法:用于偏态分布资料以及资料中一端或两端无确切数值的资料。 双侧上界:P2.5和P97.5;单侧上界:P95,或单侧下界:P5
常用的u值表
5、分类变量资料的统计描述:常用相对数指标描述,包括:率,构成比,相对比。 率:说明某现象发生的频率或强度。(病死率不等于死亡率) 构成比:说明某现象内部组成部分所占的比重或分布,常以百分数表示。 相对比:亦称比,是A、B 2个有关指标之比,说明A为B的若干倍或百分之几。两个指标可以性质相同,也可以性质不同。 应用相对数时的注意事项: 1、计算相对数的分母不宜过小;2、分析时不能以构成比代替率;3、对观察单位数不等的几个率,不能直接相加求其平均率;4、比较相对数时应注意其可比性;5、对样本率(或构成比)的比较应遵循随机抽样,并做假设检验。 6、标准化法:标准化的目的在于消除混杂因素对结果的影响,使资料更具有可比性。其基本思想是:将所比较的两组或多组资料的构成按统一的“标准”调整后,计算标化率,使其更具有可比性。 标准化率的计算方法:亦称标化率,直接法用于已知被标化组的年龄别率,以及已知标准组的年龄别人口数或年龄别人口构成比时;间接法用于已知被标化组的年龄别人口数与发病(死亡)总数,但年龄别率未知,以及已知标准组年龄别发病(死亡)率与总发病(死亡)率时。 通常可从下列3种方法选用标准组:①以两组资料中任一组的年龄别人口数或构成比作为标准组;②以两组资料合并的各年龄组的人口数或构成比作为标准组;③以公认的或便于与他人资料比较的标准作为标准组。 7、统计表: 结构:由标题、标目、线条和数字构成。 编制统计表的要求: ①标题:概括表的内容,列于表的上方居中,应注明时间和地点; ②标目:主语和谓语分别列于横、纵标目,文字简明,层次清楚。横标目列于表的左侧,通常为被研究的事物,纵标目列于表的上端,为说明横标目的统计指标。 ③线条:通常,除表的顶线、底线、纵标目下以及合计上的横线外,其余线条均省去,顶线和底线应略粗些,表的左上角不宜用斜线。 ④数字:用阿拉伯数字表示,同一指标的小数位数要一致并对齐,数字暂缺或无数字者分别用“…”或“-”表示,数字为0者要记作“0”,不应空项,为方便核实和分析,应有合计。
参考值范围(%) 单侧 双侧 80 0.842 1.282 90 1.282 1.645 95 1.645 1.96 99 2.326 2.576 ⑤备注:一般不列入表内,必要时可用“*”标出,列于表下。 8、统计图: ①条图:用于相互对比关系的资料; ②圆图与百分条图:适用于百分构成比资料,表示事物各组成部分所占的比重或构成; ③线图:用于连续性资料,用于说明事物在时间上的发展变化,或某现象随另一现象而变动的情况; ④直方图:表示连续性资料的频数分布; ⑤散点图:适用于直线相关分析,说明两个变量间的数量关系和变化趋势。
抽样分布与参数估计 抽样研究的目的是用样本信息来推断总体特征,即统计推断,包括两个内容:一是总体参数的估计,二是假设检验。 1、抽样误差:由于变异的存在,抽样研究所造成的样本统计量与总体参数之间的差异或各样本统计量之间的差异称为抽样误差。
常用标准误x反映均数抽样误差的大小;用率的标准误σp反映率的抽样误差的大小;用
Possion计数的标准误μ反映其抽样误差的大小。 2、中心极限定理和正态分布推理:从正态分布N(μ,σ2)总体中以固定n随机抽取样本,样本均数x的分布仍服从正态分布,即使是从偏态分布总体中随机抽样,只要n足够大,x的分布也近似正态分布。样本均数的均数仍为μ,样本均数的标准差为x。 样本均数的抽样误差x(简称标准误)是反映均数抽样误差大小的指标。
x =nσ 用样本均数S作为σ的估计值,则xs=nS
3、t分布:将x看成变量值,那么可将正态变量进行u变换(u=x-μ/σ)后,也可将N(μ,2x)变换成标准正态分布N(0,1)。常用s作为σ的估计值,统计量为t,此分布为t分布。
统计量 t=xsx t曲线的形态变化与自由度v的大小有关。v越小,t值越分散,曲线越低平,v逐渐增大时,则t分布逐渐逼近正态分布,当v=无穷大时,t分布即为u分布。 4、总体均数的估计有两种方法:一种是点估计,即用统计量x估计总体均数;二是区间估计,亦称可信区间。 (1)σ未知且n小:x-tα/2,v sx<μ<x+tα/2,v sx
(2)σ未知,但n足够大,t分布逼近u分布:x-uα/2sx<μ<x+uα/2sx
(3)σ已知:x-uα/2σx<μ<x+uα/2σx 标准差和标准误的比较 标准差 标准误
S=1)(2nxx xs=ns 表示观察值的变异程度大小 估计均数的抽样误差大小 计算变异系数CV=xs100% 估计总体均数可信区间
x-tα/2,v sx<μ<x+tα/2,v sx
确定医学参考值的范围 进行假设检验 计算标准误
数值变量资料的假设检验 1、假设检验的原理:假设在一次抽样研究中得出了u≥1.96,则P≤0.05,此为小概率事件,依据“小概率事件在一次随机试验中认为是不可能发生的”的定理,可认为此样本不是来自该总体。 2、步骤:①建立假设和确定检验水准;假设有两种,一种是检验假设,常称无效假设或零假设,记为H0,假设样本所代表的总体参数与已知总体参数相等;另一种是备择假设,记为H1,是与H0相联系且对立的假设;检验水准,亦称显著性水准,是判断拒绝或不拒绝H0,也是允许犯Ⅰ型错误的概率,通常用0.05。 ②选定检验方法和计算统计量③确定P值,做出推断结论。P值是指从H0所规定的总体中随机抽样时,获得等于及大于现有样本统计量的概率。 3、t检验:适用于:①样本均数与总体均数比较(σ未知且n<50或n<30);②成组设计的两小样本均数的比较(n1,n2均小于30或50);③配对设计的两样本均数比较。 应用条件:①当样本含量较小(n<50或n<30)时,要求样本来自正态分布总体;②用于成组设计的两样本均数比较时,要求两样本来自总体方差相等的总体。 4、单样本t检验:用于样本均数与已知总体均数的比较,研究目的是推断样本所代表的总体
均数μ与已知总体均数μ0有无差别。统计量t= n/s0μx v=n-1 5、配对t检验:用于配对设计资料的两均数的比较。其研究目的是推断某种处理有无作用,或两种处理的效果有无差别。 配对设计类型有3种:①先将受试对象按配比条件配对,然后用随机分组方法将各对中的2个受试对象分别分配到不同的处理组;②同一对象分别接受2种不同处理;③同一对象处理前
后。t=n/sdd (d是差值的样本均数)v=n-1 6、两样本t检验:用于完全随机设计的两样本均数的比较,两个样本来自两个总体,其研究目的是推断两样本所分别代表的总体均数是否相等。