医学统计学重点总结

合集下载

医学统计学知识点汇总(精华)

医学统计学知识点汇总(精华)

医学统计学知识点汇总(精华)一.概论1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。

2,医学统计学的主要内容:1)统计研究设计调查研究设计和实验研究设计2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。

A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。

3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。

3,统计工作步骤:1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。

2)搜集材料A,搜集材料的原则及时、准确、完整B,统计资料的来源医学领域的统计资料的来源主要有三个方面。

一是统计报表,二是经常性工作记录,三是专题调查或专题实验。

C,资料贮存3)整理资料 a检查核对b设计分组c拟定整理表d归表4)分析资料统计分析包括统计描述和统计推断4,同质(homogeneity):指被研究指标的影响因素相同。

变异(variation):同质基础上的各观察单位间的差异。

变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,这种特征称为变量变量值:变量的观察结果或测量值。

变量类型变量值表现实例资料类型数值变量离散型定量测量值,有计量单位产前检查次数计量资料连续型身高分类变量无序二分类对立的两类属性性别(男女)计数资料多分类不相容的多类属性血型(A,B,O,AB)有序多分类类间有程度差异的属性受教育程度(小学,中学,高中,大学…)等级资料5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。

医学统计学重点总结

医学统计学重点总结
小结:
(1) 单个样本均数 H0:μ=μ0t= ν=n-1 (小样本)
(已知样本——均数) H1:μ≠μ0
α=u= 或u= (大样本)(2)配对:H0:μ=μ0
H1:μ≠μ0t= ν=对子数-1
α=
(3) 两独立样本均数H0:μ=μ0t= ν=n1+n2-2
(4)(已知样本——样本) H1:μ≠μ0
9.对任何参数μ和σ的正态分布,都可以通过一个简单的变量变换成标准正态分布,即μ=X-μ
σ
9
标准正态分布
正态分布
面积或概率
-1~1
μ σ
%
~
μ σ
%
·
μ σ
%
10.医学参考值范围(reference value range)传统上称作正常值范围,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。习惯上是包含95%的参照总体的范围。
实际工作中标准差 σ往往未知,因而通常用样本标准差S代替σ,求得样本均数 准误估计值S ,计算公式为 S = (当n→无穷,S→σ,S →0)
3 95%的可信区间的计算:x (μ,σ ) 1) σ已知,可信区间= σ
2)σ未知,n为小样本: t 3)σ未知,n为大样本:
T变换
μ变换
N (0,1)
3、t分布曲线的形态变化与自由度v=n-1有关。
2.四格表专用公式(
3对于四格表资料,通常规定为:(1)当n≥40且所有的T ≥ 5时,用检验的基本公式或四格表的专用公式;(2)当n ≥ 40 但有1≤T<5时,用四格表资料的校正公式;(3)当n<40,或T<1时,用四格表资料的Fisher确切 概率法。
4 行×列表资料的χ 检验: 自由度:ν=(行数-1)(列数-1)

医学统计学重点总结

医学统计学重点总结

10
53
40
16
56
83
26
109
40.36
12.64
42.64
11.36
T11=53× 83/109=40.36 T12=53× 26/109=12.64 T21=56× 83/109=42.64 T22=56× 26/109=13.36
既非呈连续分布的定量资料,也非仅按性质归属于独立的若干类的定性资料;
04
确定参考值范围的意义:
05
用于判断正常与异常。
06
“正常人”的定义:
07
排除了影响所研究的指标的疾病和有关因素的同质的人群。
08
抽样误差(sampling error)
由抽样引起的样本统计量与总体参数间的差别。
原因:个体变异+抽样
03
表现:
04
样本统计量与总体参数间的差别
05
不同样本统计量间的差别
7. X±2.58s包括变量值的 A. 68.3% B. 90.0% C. 95.0% D. 99.0% 8. 均数与标准差之间的关系是 A.标准差越小,均数代表性越好 B. 标准差越小,均数代表性越差 C. 均数越大,标准差越小 D. 均数越大,标准差越大 9.分析定性资料时,最常用的显著性检验方法是 A.t检验 B.正态检验 C.U检验 D.χ2检验 10.四格表如有一个实际数为0 A.就不能做χ2检验; B.就不能用校正χ2检验; C.还不能决定是否可做χ2检验; D.肯定可做校正χ2检验。
4.正态分布曲线下,横轴上从均数到(μ + 1.96σ)的面积为: A.95% B.45% C.47.5% D.90% 5. 某人群血糖的正常值范围是指 ( ) (A)该指标在所有人中的波动范围 (B)该指标在所有正常人中的波动范围 (C)该指标在绝大部分正常人中的波动范围 (D)该指标在一个人不同时间的波动范围 6.假设检验中的第一类错误是指 A.拒绝了实际上成立的H0 B.不拒绝实际上成立的H0 C.拒绝了实际上不成立的H0 D.不拒绝实际上不成立的H0

医科大学医学统计学重点知识总结

医科大学医学统计学重点知识总结

第一章绪论1、统计学的定义:统计学研究数据的收集、整理、分析的一门学科。

医学统计学:医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理、方法,研究医学资料的搜集、整理、分析和推断的一门科学。

2、医学统计研究三个步骤:研究设计、资料分析、结论3、(必考的)几个概念:(1)同质:性质相同异质:性质不同观察单位间的同质性是进行研究的前提同质是相对的(不同研究中或同一研究中不同观察指标对观察对象的同质性的要求不同)(2)个体变异:同质个体间的差异。

变异的两个方面:不同观察单位(个体)间的差别;同一个体在不同阶段的差别(重复测量)个体变异是普遍存在的;个体变异是有规律的。

注意:由于个体变异的存在,同质个体指标的取值会存在差异!(例:体温波动)(3)总体:按研究目的所确定的同质研究对象的全体。

有限总体:有时间、空间的概念,观察单位有限无限总体:无时间、空间的概念(例:某种治疗措施的效果,就包括接受这种治疗措施的所有病人过去、现在、未来,因而观察单位无限)(4)个体:组成总体的基本单位。

样本:从研究总体中随机抽取具有代表性的部分观察单位随机性的三个体现:抽样随机、分组随机、试验顺序随机(5)随机变量:观察对象个体的特征或测量的结果观察结果在一定范围内以一定的概率分布随机取值的变量,表示随机现象。

在一定条件下,并不总是出现相同结果变量值:个体观察指标具体取值(6)总体参数:总体的统计指标或特征值固有的、不变的,但往往是未知的(7)样本统计量:由样本所算出的统计指标或特征值已知的,且随着试验的不同而不同,但分布是有规律的(8)样本含量:样本中包含个体的数量(9)频率f=m/n,f的值随n的增大接近常数p,概率P(A)=p即:频率为一变量,是样本统计量;概率为常数,是一总体参数小概率事件:概率小于等于0.05小概率原理:小概率事件在一次试验中是不会发生的(10)抽样误差:两个表现:样本统计量与总体参数间的差别;不同样本统计量间的差别两个原因:个体变异;抽样过程抽样误差不可避免,但是有规律。

新版医学统计学知识点归纳总结

新版医学统计学知识点归纳总结

新版医学统计学知识点归纳总结医学统计学是医学研究中不可或缺的一部分,它涉及到数据的收集、分析和解释,帮助医学工作者从大量数据中提取有价值的信息。

以下是新版医学统计学的知识点归纳总结:1. 研究设计:研究设计是统计分析的前提,包括观察性研究和实验性研究。

观察性研究如队列研究、病例对照研究,而实验性研究如随机对照试验(RCT)。

2. 数据类型:医学统计学中的数据可分为定性数据和定量数据。

定性数据如性别、血型,定量数据如血压、体重。

3. 描述性统计:描述性统计用于描述数据集的特征,包括集中趋势(均值、中位数、众数)和离散程度(方差、标准差、极差)。

4. 概率分布:在统计学中,概率分布描述了随机变量取值的概率。

常见的分布有正态分布、二项分布和泊松分布。

5. 假设检验:假设检验是统计推断的核心,用于判断样本数据是否支持某个假设。

常见的检验方法有t检验、卡方检验和F检验。

6. 置信区间:置信区间提供了一个范围,用以估计总体参数的可能值。

95%的置信区间意味着有95%的把握认为总体参数落在这个区间内。

7. 回归分析:回归分析用于研究一个或多个自变量对因变量的影响。

简单线性回归和多元线性回归是常见的回归分析方法。

8. 生存分析:生存分析关注个体生存时间的分布和相关因素,常用于肿瘤学和流行病学研究。

Kaplan-Meier估计和Cox比例风险模型是生存分析中的重要工具。

9. 诊断试验评价:诊断试验评价涉及敏感性、特异性、阳性预测值和阴性预测值等指标,用于评估诊断方法的准确性。

10. 样本量计算:样本量计算是研究设计的重要环节,它决定了研究的可行性和结果的可靠性。

样本量计算需要考虑效应大小、显著性水平和检验力。

11. 多变量分析:多变量分析用于同时考虑多个变量对结果的影响,如多元回归分析和判别分析。

12. 统计软件的应用:统计软件如SPSS、SAS和R在医学统计分析中扮演着重要角色,它们提供了数据处理和统计分析的功能。

医学统计学重点

医学统计学重点

医学统计学重点说明:本重点仅供参考:不能包括所有选择题考题,名词和简答可信度高,计算题熟练运算过程;同时自己要清楚各种检验方法的基本思想,重点程度与星号数量相关)一、名词解释1、★★★医学统计学:用概率论和数理统计方法研究医学事件的群体特征的一门方法。

2、★总体:根据研究目的确定的同质的研究对象的全体(集合)。

3、样本:从总体中随机抽取的部分研究对象。

4、随机:总体中每个个体有同等的机会进入样本。

5、系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。

6、随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。

7、★★抽样误差:由于抽样原因造成的样本指标与总体指标之间的差,或者是样本指标与样本指标之间的差。

8、准确度(accuracy)或真实性(validity):观察值与真值的接近程度,受系统误差的影响(9、可靠度(reliabiliy)——也称精密度(precision)或重复性(repeatability):重复观察时观察值与其均值的接近程度,受随机误差的影响。

10、★★★小概率事件:一般常将p ≤ 0.05或p ≤ 0.01称为小概率事件,表示某事件发生的可能性很小。

通俗讲一次抽样是不可能发生的事件。

11、★★正态分布定:又称高斯分布,是一条中间高,两头低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。

12、★★医学参考值范围:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。

最常用的是95%参考值范围。

13、★★标准误:用于反映均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。

14、★95%的可信区间:如果从同一总体中重复抽取100个独立样本,将可能有95个可信区间包括总体均数,有5个可信区间未包括总体均数。

二、填空题1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。

医学统计学重点

医学统计学重点

医学统计学重点医学统计学是医学领域中不可或缺的一门学科,它借助数理统计方法研究医学数据和临床试验的结果,为医学决策提供可靠的依据。

以下是医学统计学的几个重点内容。

一、描述统计学描述统计学是医学统计学的基础,主要研究如何分类、整理和描述医学数据。

其主要方法包括测量尺度、频率分布表、中心趋势测量和变异程度测量。

1. 测量尺度在医学统计学中,常见的测量尺度包括名目尺度、有序尺度和数值尺度。

名目尺度适用于无序分类的变量,有序尺度适用于有序分类的变量,而数值尺度适用于具有度量意义的变量。

2. 频率分布表频率分布表用来展示变量的分布情况,主要包括类别、频数和频率等内容。

通过频率分布表,可以直观地了解变量的分布状况。

3. 中心趋势测量中心趋势测量主要包括平均数、中位数和众数。

平均数是所有观测值的总和除以观测值的个数,中位数是将观测值按大小排列后的中间值,众数是出现次数最多的观测值。

4. 变异程度测量变异程度测量用来描述数据的分散程度,主要包括极差、方差和标准差。

极差是最大观测值与最小观测值之间的差异,方差是观测值与均值之间的差异的平方的平均数,标准差是方差的平方根。

二、推断统计学推断统计学是医学统计学的核心内容,主要研究如何通过样本数据推断总体参数,并对假设进行检验。

其中包括参数估计、假设检验和置信区间等方法。

1. 参数估计参数估计是利用样本数据估计总体参数,常用的方法有点估计和区间估计。

点估计是通过样本数据得到一个单一的数值作为总体参数的估计值,区间估计是通过样本数据得到一个范围作为总体参数的估计区间。

2. 假设检验假设检验是用来检验某个陈述是否与观察数据相符的方法。

在医学研究中,研究者常常根据实验数据对研究假设进行检验,以确定是否有统计显著性。

3. 置信区间置信区间是对总体参数的一个范围估计。

置信区间的计算方法与区间估计相似,通过对样本数据进行分析计算得到。

三、生存分析生存分析是医学统计学中的一个重要分支,主要研究疾病患者的生存时间和生存率等问题。

医学统计学知识点汇总

医学统计学知识点汇总

医学统计学知识点汇总医学统计学是指应用统计学原理和方法进行医学研究设计、数据分析和结果解释的学科。

医学统计学的知识点非常丰富,包括统计学基础知识、研究设计、样本量计算、控制方法、参数估计、假设检验和数据分析等方面。

以下是医学统计学知识点的一些精华汇总。

1.统计学基本概念:包括基本统计量(均值、中位数、众数)、数据类型(定量数据、定性数据)、数据的描述方法(频数分布表、直方图等)。

2.研究设计:包括随机对照试验、队列研究、病例对照研究等,了解不同研究设计的优缺点及适用场景。

3.样本量计算:确定研究样本量是保证研究结果可靠性的重要一环,需要根据研究目的、效应量和统计显著性水平确定样本量。

4.控制方法:包括随机分组、盲法、配对设计等,用于减少实验误差和避免偏倚。

5.参数估计:常用的参数估计方法有点估计和区间估计。

点估计是通过样本数据得到总体参数的一个点估计值,区间估计是对总体参数的一个区间估计。

6.假设检验:假设检验是用来判断样本数据与总体假设之间的差异是否显著的统计方法。

常用的假设检验方法有t检验、卡方检验、方差分析等。

7.数据分析:包括描述性统计分析和推断性统计分析。

描述性统计分析用来描述研究变量的基本情况,推断性统计分析用来推断样本数据与总体数据之间的关系。

8.相关分析:用来分析变量之间的关联程度,包括皮尔逊相关系数和斯皮尔曼等级相关系数等。

9. 回归分析:用来分析因变量与自变量之间的关系,包括线性回归分析和 logistic回归分析等。

10.生存分析:用来分析时间到达事件发生的概率,包括生存曲线的绘制、生存率的估计和影响因素的分析等。

11. 多变量分析:用来分析多个自变量对因变量的影响,包括多元方差分析、多元回归分析和多元Logistic回归分析等。

12. Meta分析:用于综合多个独立研究结果,对总体效应进行定量分析和综合评价。

以上是医学统计学的一些精华知识点的汇总。

医学统计学的应用非常广泛,不仅在医学研究中需要应用统计学的原理和方法,也在临床实践中需要对医学统计学知识有一定的了解和应用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.简述总体和样本的定义,并且举例说明。

总体是研究目的确定的所有同质观察单位的全体。

样品是从研究总体中抽取部分有代表性的观察单位。

2.简述参数和统计量的定义,并且举例说明。

描述总体特征的指标称为参数,描述样本特征的指标称为统计量。

3.变量的类型有哪几种?举例说明各种类型变量有什么特点。

①定量数据:计量资料;定量的观测值是定量的,其特点是能够用数值的大小衡量其水平的高低。

②定性数据:计数资料;变量的观测值是定性的,表现为互不相容的类别或属性。

③有序数据:半定量数据/等级资料;变量的观测值是定性的,但各类别(属性)有程度或顺序上的差异。

4.请举例说明一种类型的变量如何变换为另一种类型的变量。

定量数据>有序数据>定性数据--------------->5.请简述什么是小概率事件?概率是描述事件发生可能性大小的度量,P0.05事件称为小概率事件。

6.举例说明什么是配对设计。

配对设计是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。

①同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;②异源配对:为消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理。

7.非参数假设检验适合什么类型数据进行分析?①总体分布类型未知或非正态分布数据;②定量或半定量数据;③数据两端无确定的数值。

8.简述P25 P50P75的统计学意义。

(条件:明显偏态且不能转化为正态或近似对称;一端或两端无确定数值;分布情况未知)用来描述资料的观测值序列在某百分位置的水平,四分位数间距可以作为说明个体差异的指标(说明个体在不同位置的变异情况)。

9.直条图、直方图、圆饼图的使用条件是什么?直条图:各自独立的统计指标的数值大小和他们之间的对比;直方图:连续变量频数分布情况;圆饼图:全体中各部分所占的比例。

10.统计分析包括哪两个方面的内容?为什么要进行统计推断?统计描述和统计分析;统计描述用来描述及总结一组数据的重要特征,其目的是使实验或观察得到的数据表达清楚并便于分析。

统计推断指由样本数据的特征推断总体特征的方法,包括参数估计(点估计和区间估计)和假设检验(判断随机波动引起差别的概率大小)。

统计推断是通过样本推断总体的统计方法/根据样本提供的信息和抽样分布的规律,以一定的概率推断总体的特征。

总体是通过总体分布的数量特征即参数 (如方差) 来反映的。

很多时候并不知道总体的参数,只能由样本统计量推断获得。

11.定量数据如何进行统计描述?请举例说明。

通过具体数值反应高低水平。

12.定性数据如何进行统计描述?请举例说明。

根据类别或属性的不同分类。

13.简述均数的抽样误差及率的抽样误差。

由抽样造成的样本统计量与总体参数的差异称为抽样误差,样本均数不等于总体均数μ,总体率参数π不等于样本率p。

14.简述正态分布和标准正态分布的关系。

(μ=0,)关系:标准正态分布是正态分布的一种,具有正态分布的所有特征。

所有正态分布都可以通过Z分数公式转换成标准正态分布。

区别:正态分布的平均数为μ,标准差为σ;不同的正态分布可能有不同的μ值和d值,正态分布曲线形态因此不同。

标准正态分布平均数μ=0,标准差σ=1,μ和σ都是固定值;标准正态分布曲线形态固定。

∞∞概率密度函数∞∞概率分布函数=∞15简述正态分布的特点。

1.正态分布是单峰分布,以X=为中心,左右完全对称,正态曲线以X轴为渐近线,两端与X轴不相交。

2.正态曲线在X=μ处有最大值,其值为;X越远离,值越小,在处有拐点,呈现为钟形。

3.正态分布完全由两个参数和决定,是位置参数,描述正态分布的平均水平,决定着正态曲线在x 轴上的位置;是形状参数,描述正态分布的变异程度,决定着正态曲线的分布形状。

若固定而改变,曲线沿着X轴平行移动,其形状不变,改变的只是位置;若固定而改变,越大曲线越“矮胖”,表示数据越分散即变异越大,越小曲线越“瘦高”,表示数据越集中即变异越小。

因此,不同的与不同的对应不同的正态分布。

4.正态曲线下的面积分布有一定的规律。

①曲线下的面积即为概率,服从正态分布的随机变量在某区间上的曲线下面积与该随机变量在同区间上的概率相等;②曲线下的总面积为1,以为中心左右两侧面积各占50%,越靠近μ处曲线下面积越大,两边逐渐减少;③所有正态曲线,在μ左右的任意个标准差范围内面积相同:区间范围内的面积约为68.27%,区间范围内的面积约为90.00%,区间范围内的面积约为95.00%,区间范围内的面积约为积约为99.00%16.什么是医学参考值范围。

医学参考值范围的作用。

满足正态分布的双侧医学参考值范围怎么计算。

医学参考值范围是指“正常”人的解剖、生理、生化指标等数据大多数个体值的波动范围。

确切含义是:从选择的参考总体中获得的所有个体观察值,用统计学方法建立百分位数界限,由此得到个体观察值的波动区间。

作用:①基于临床实践,从个体角度,作为临床上判定正常与异常的参考标准,用于划分界限或分类;②基于预防医学实践,从人群角度,可用来评价儿童发育水平。

步骤:1.确定参考值范围百分比;2.查表得到Z值;3.。

17.总体均数的95%可信区间的计算方法及其意义。

意义:该区间包括总体均数的概率为95%①已知:z分布:1.96②未知,n较小(<=50):自由度为v=n-1的t分布:③未知,n较大(n>50):z分布:18.三种t检验的适用条件。

1.单样本t检验:适用于样本均数与已知总体均数的比较,目的是检验样本均数所代表的总体均数μ是否与已知总体均数有差别。

2.配对样本t检验:适用于配对设计计量资料均数的比较,目的是检验两相关样本均数所代表的未知总体均数是否有差别。

3.两独立样本t检验:适用于完全随机设计的两样本均数的比较,目的是检验两样本所来自总体的均数是否相等。

19.完全随机设计的方差分析适用条件。

是一种将实验对象随机分配到不同处理组的单因素设计方法。

正态性,独立性(样本总体间相互独立),方差齐性。

20.三种卡方检验的适用条件。

1.四表格资料的检验:两独立样本的两个分类个体数排列成四表格资料,目的是推断两个或多个总体率或构成比之间有无差别。

2.配对四表格资料的检验:常用于两种检测方法、两种诊断方法或两种细菌培养方法的比较,适用于样本量不是很大的资料,特点是对样本中个观察单位分别用两种方法检测或处理,然后按两分类变量计数结果。

3.列联表资料的检验:用于多个样本率或多个构成比的比较。

21.线性相关系数r的意义。

是说明具有直线相关关系的两个数值变量间相关的密切程度和相关方向的统计量。

相关系数r没有度量衡单位,其取值范围为。

r>0表示正相关,r<0表示负相关,r=0表示无相关,即无直线关系,当时为完全相关。

相关系数的绝对值意接近1,相关愈密切;相关系数愈接近0,相关愈不密切。

22.t分布的特点。

①t分布是以0为中心,左右两侧对称的单峰分布;②t分布曲线是一簇曲线,其形态变化与自由度v的大小有关。

自由度v越小,则t值越分散,曲线越低平;自由度v逐渐增大时,t分布逐渐逼近标准正态分布。

当v=∞时,t分布就完全成为标准正态分布了。

23.卡方检验的基本思想。

该检验的基本思想是:首先假设H成立,基于此前提计算出值,它表示观察值与理论值之间的偏假设成立的情况下获得当前统计量及更极端情况的概率P。

离程度。

根据分布及自由度可以确定在H如果当前统计量大于P值,说明观察值与理论值偏离程度太大,应当拒绝无效假设,表示比较资料之间有显著差异;否则就不能拒绝无效假设,尚不能认为样本所代表的实际情况和理论假设有差别。

主要是比较两个及两个以上样本率(构成比)以及两个分类变量的关联性分析。

建立检验假设并确定检验水准;计算统计检验量;确定P值,做出推断结论。

24.假设检验的基本思想。

目的是比较总体参数之间有无差别。

假设检验的基本思想是小概率反证法思想。

小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。

反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为不假设成立。

具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。

25.简述一类错误、二类错误。

当Ho为真时,假设检验结论拒绝Ho,接受H,这类错误称为I类错误, 在医学中亦称假阳性错误。

检验水准a是预先规定的允许犯I类错误的概率,当a=0.05时,表示在Ho为真的条件下重复100次试验,理论上会有5次拒绝Ho。

当真实情况为Ho不成立时,假设检验结论不拒绝Ho,这类错误称为II类错误,在医学中亦称假阴性错误。

其概率大小用B表示。

B只取单侧,其值的大小一般未知,对于计量资料必须在知道两总体的标准差、均数的实际差值和样本含量时才能算出。

相关文档
最新文档