卡方检验

合集下载

卡方检验的原理和步骤

卡方检验的原理和步骤

卡方检验的原理和步骤卡方检验(Chi-squared test)是一种用于统计学中的假设检验方法,主要用于检验两个或更多个分类变量之间是否存在相关性。

它的原理和步骤可以概括如下:原理:卡方检验是基于卡方统计量的方法,卡方统计量是通过计算实际观察值与期望理论值之间的差异来判断变量间是否存在相关性。

具体来说,卡方统计量是通过计算每个观察值与对应期望值之间的差异平方的总和来衡量的。

如果差异较小,说明实际观察值与期望值之间较为接近,两个变量间可能不存在相关性;如果差异较大,则说明实际观察值与期望值之间存在较大差异,两个变量间可能存在相关性。

步骤:1.建立假设:在进行卡方检验之前,需要明确两个变量之间的假设。

通常有两种假设:原假设(H0)和备择假设(Ha)。

原假设是指两个变量之间没有相关性,备择假设是指两个变量之间存在相关性。

2.构建列联表:列联表(Contingency table)是用来统计两个或多个分类变量的交叉频次分布的表格。

在卡方检验中,我们需要根据实际观察数据构建列联表。

3.计算期望值:在卡方检验中,我们需要计算期望理论值。

期望理论值是指如果两个变量之间不存在相关性,那么我们可以根据边际总计与变量间的分布来计算出的预期频次。

一般情况下,期望理论值可以通过边际总计和整体频率来计算。

4.计算卡方统计量:在有了观察值和期望理论值后,我们可以通过计算卡方统计量来判断两个变量之间是否存在相关性。

卡方统计量的计算公式为:χ2=∑((O-E)^2/E),其中χ2为卡方统计量,O为观察值,E为期望理论值。

计算出卡方统计量后,可以根据自由度去查找对应的临界值。

5.决策:根据卡方统计量的计算结果,我们可以通过比较卡方统计量与对应自由度的临界值来进行决策。

如果卡方统计量小于临界值,则接受原假设,即认为两个变量之间没有相关性;如果卡方统计量大于临界值,则拒绝原假设,即认为两个变量之间存在相关性。

6.结论:最后,根据决策结果,我们可以得出结论,即两个变量之间是否存在相关性。

卡方检验数据解读

卡方检验数据解读

卡方检验数据解读卡方检验是统计学中常用的一种假设检验方法,用于评估两个变量之间的关联性。

它适用于研究两个分类变量之间是否存在关联关系,或者评估一个分类变量在不同组别中的分布是否有显著差异。

在卡方检验中,我们通过计算观察值与期望值之间的差异程度来判断统计显著性。

卡方检验的原理基于卡方统计量,其中包括观察值与期望值的比较。

观察值是通过实际数据计算得到的结果,而期望值是在假设原始数据无关的情况下,按照某种期望分布计算得到的预期结果。

通过比较观察值和期望值之间的差异,我们可以判断两个变量之间的关联性。

卡方检验的数据解读主要包括以下几个步骤:1. 理解假设:在进行卡方检验之前,需要明确研究问题并给出相应的假设。

通常情况下,我们会提出原假设(H0)和备择假设(Ha)。

原假设是指两个变量之间不存在关联性,备择假设是指两个变量之间存在关联性。

2. 构建列联表:通过观察数据,我们可以将两个变量的不同取值分别作为列和行,构建一个列联表。

列联表的目的是将观察数据按照不同取值进行分组,以便后续计算观察值和期望值。

3. 计算期望值:通过计算,可以得到期望值矩阵。

期望值是基于原始数据的分布情况,按照某种期望分布计算得到的理论预期值。

根据列联表的行和列的总和,我们可以计算期望值矩阵。

4. 计算卡方统计量:通过观察值和期望值的比较,可以计算得到卡方统计量。

卡方统计量的计算公式为Χ²= Σ((Oij-Eij)²/Eij),其中Oij表示观察值,Eij表示期望值。

卡方统计量的值越大,说明观察值与期望值之间的差异越大,即两个变量之间的关联性越强。

5. 计算自由度和P值:卡方统计量的大小只能告诉我们观察值与期望值之间的差异,但无法判断其显著性。

因此,还需要计算自由度和P值来评估卡方统计量的显著性。

自由度的计算公式为自由度=(行数-1)*(列数-1),P值是在原假设成立的情况下,观察到当前卡方统计量或更极端情况出现的概率。

卡方检验的计算步骤

卡方检验的计算步骤

卡方检验的计算步骤
卡方检验是一种常用的统计学方法,用于检验两个或多个分类变量之间是否存在显著的关联性。

以下是卡方检验的计算步骤:
1.提出假设:根据研究问题,确定检验的假设,通常有两个假设:
-H0:两个分类变量之间不存在关联性;
-H1:两个分类变量之间存在关联性。

2.计算期望频数:根据样本数据,计算每个单元格(即每个交叉分类)的期望频数。

期望频数等于每个类别在样本中的频率乘以总样本量。

3.计算卡方值:根据期望频数和实际频数,计算卡方值。

卡方值的计算公式为:
其中,O表示实际频数,E表示期望频数。

4.确定自由度:卡方检验的自由度等于行数减去1乘以列数减去1。

5.查找临界值:根据自由度和显著性水平(通常为0.05或0.01),查找卡方分布表中的临界值。

6.作出决策:如果卡方值大于临界值,则拒绝H0,接受H1,认为两个分类变量之间存在关联性。

如果卡方值小于临界值,则不能拒绝H0,认为两个分类变量之间不存在关联性。

需要注意的是,在进行卡方检验时,需要注意样本量是否足够大,以及分类变量的类别是否存在不均衡的情况。

如果存在这些情况,可能会导致检验结果不准确。

卡方检验的例子

卡方检验的例子

卡方检验的例子卡方检验是一种常用的统计方法,用于检验两个或多个分类变量之间是否存在显著的关联。

它基于观察值与期望值之间的差异,通过计算卡方值来判断变量之间的关联程度。

下面是一些关于卡方检验的例子,用于说明其在不同领域中的应用。

1. 健康调查中的卡方检验:假设我们想要研究吸烟与患肺癌之间的关系。

我们可以通过随机抽样调查一定数量的人群,记录他们的吸烟情况(吸烟或不吸烟)和是否患有肺癌(是或否)。

然后,我们可以使用卡方检验来确定吸烟与肺癌之间是否存在显著关联。

2. 教育研究中的卡方检验:假设我们想要研究学生的性别与其在数学考试中的成绩之间的关系。

我们可以对一所学校的学生进行调查,记录他们的性别(男性或女性)和数学考试的成绩(优秀、良好、及格或不及格)。

然后,我们可以使用卡方检验来确定性别与数学成绩之间是否存在显著关联。

3. 市场调查中的卡方检验:假设我们想要研究不同年龄段的消费者对某个产品的购买偏好。

我们可以对一定数量的消费者进行调查,记录他们的年龄段(青年、中年、老年)和对该产品的购买意愿(愿意购买或不愿购买)。

然后,我们可以使用卡方检验来确定年龄段与购买意愿之间是否存在显著关联。

4. 社会调查中的卡方检验:假设我们想要研究不同种族的人们对同一政治议题的支持程度。

我们可以对一定数量的人进行调查,记录他们的种族(白人、黑人、亚洲人等)和对该政治议题的支持程度(支持、中立、反对)。

然后,我们可以使用卡方检验来确定种族与支持程度之间是否存在显著关联。

5. 生物学研究中的卡方检验:假设我们想要研究某种疾病与基因型之间的关系。

我们可以对一定数量的人群进行基因型检测,记录他们的基因型(AA、AB、BB)和是否患有该疾病(是或否)。

然后,我们可以使用卡方检验来确定基因型与疾病之间是否存在显著关联。

6. 商业分析中的卡方检验:假设我们想要研究不同广告渠道对销售额的影响。

我们可以在一定时间内对不同广告渠道进行实验,记录每个渠道的广告投放量和相应的销售额。

卡方检验的参数

卡方检验的参数

卡方检验的参数
卡方检验是一种用于统计数据分析的方法,它用来判断两个分类变量之间是否存在相关性。

它基于观察到的数据与期望的数据之间的差异来进行推断。

卡方检验的参数包括样本数量、自由度和显著性水平。

样本数量是指参与检验的样本数量,它决定了卡方检验的可靠性。

自由度是指检验中独立的变量的数量,它与样本数量和分类变量的数量有关。

显著性水平是指在实际观察到的差异下,拒绝原假设的概率。

通常,我们使用显著性水平为0.05或0.01来进行判断。

在进行卡方检验时,我们首先需要建立原假设和备择假设。

原假设是指两个变量之间没有相关性,备择假设是指两个变量之间存在相关性。

然后,我们计算卡方值,并通过查阅卡方分布表来确定显著性水平下的临界值。

最后,比较计算得到的卡方值和临界值,如果计算得到的卡方值大于临界值,则拒绝原假设,认为两个变量之间存在相关性。

卡方检验可以应用于各种领域,例如医学、社会科学、市场调研等。

在医学领域,可以使用卡方检验来研究某种疾病与某种基因型之间的关系;在社会科学领域,可以使用卡方检验来研究教育水平与收入水平之间的关系;在市场调研领域,可以使用卡方检验来研究产品类型与购买决策之间的关系。

卡方检验是一种常用的统计方法,用于判断两个分类变量之间是否存在相关性。

它的参数包括样本数量、自由度和显著性水平。

通过计算卡方值并比较临界值,我们可以得出结论并进行进一步的数据分析。

卡方检验的原理

卡方检验的原理

卡方检验的原理卡方检验是一种用于检验两个分类变量之间是否存在相关性的统计方法。

它的原理是通过比较实际观察值和期望理论值之间的差异来判断两个变量之间的相关性程度。

在进行卡方检验时,我们首先需要构建一个列联表,然后根据列联表中的数据计算出卡方值,最后根据卡方值来判断两个变量之间的相关性程度。

首先,我们来看一下列联表的构建。

列联表是由两个分类变量的交叉分类频数构成的二维表格。

表格的行表示一个分类变量的各个分类,表格的列表示另一个分类变量的各个分类,交叉点上的数字表示对应分类组合的频数。

构建列联表的目的是为了清晰地展现两个变量之间的关系,为后续的卡方检验提供数据基础。

接下来,我们需要计算卡方值。

卡方值的计算公式为,χ²=Σ((O-E)²/E),其中,Σ表示求和,O表示观察频数,E表示期望频数。

在计算卡方值时,我们需要先计算出期望频数,然后将观察频数和期望频数的差异进行平方,并除以期望频数,最后将所有分类组合的差异平方和除以期望频数的总和就得到了卡方值。

最后,我们根据卡方值来判断两个变量之间的相关性程度。

在进行判断时,我们需要参考自由度和显著性水平。

自由度的计算公式为,df=(r-1)(c-1),其中,r表示行数,c表示列数。

在一般情况下,我们可以查找卡方分布表来确定显著性水平下的临界值,然后比较计算出的卡方值和临界值的大小关系,从而判断两个变量之间的相关性程度。

总的来说,卡方检验是一种用于检验两个分类变量之间相关性的统计方法,它通过比较实际观察值和期望理论值之间的差异来判断两个变量之间的相关性程度。

在进行卡方检验时,我们需要构建列联表,计算卡方值,并根据卡方值来判断两个变量之间的相关性程度。

通过卡方检验,我们可以更加清晰地了解两个变量之间的关系,为进一步的分析和决策提供依据。

卡方检验置信区间

卡方检验置信区间
描述
卡方检验(Chi-squared test)是一种常见的统计检验方法,通常可以用来检验某个样本与
期望的分布之间是否存在显著的差异。与大多数统计检验方法一样,卡方检验也是以某个
概率值作为判断依据,比如,某个统计量的概率值大于特定值,则我们可以认为两个分布
间存在显著差异。

除了拒绝域的概念外,卡方检验还引入了置信区间的概念。一般来说,置信区间表示样本
中某个重要性质所对应的真实值,当两个分布间存在显著差异时,样本包含的这个重要性
质所对应的真实值很可能位于置信区间之内;反之,如果两个分布间没有显著差异,那么

真实值很可能在置信区间之外。

综上所述,卡方检验置信区间是一个统计技术,可以用来检验样本分布与期望分布之间是
否存在显著差异,并用来估计样本中某个性质的真实值,从而给定任务不同的结论,为业
务决策提供依据。

卡方检验特征选择

卡方检验特征选择卡方检验(Chi-squared test)是一种非参数的统计方法,用于评估两个分类变量之间的关联性。

在特征选择中,卡方检验可以用于评估特征与目标变量之间的关联性,从而帮助我们选择最具有预测能力的特征。

在卡方检验中,我们假设特征与目标变量之间不存在关联(零假设),然后根据样本数据计算卡方统计量和相应的p值。

卡方统计量衡量了观察到的频数与期望频数之间的差异,p值则表示在零假设成立的情况下,观察到的差异或更极端差异的概率。

如果p值小于事先设定的显著性水平(通常为0.05),我们就可以拒绝零假设,认为特征与目标变量之间存在关联。

1.首先将数据转化为频数表格。

假设我们有一个分类特征X和目标变量Y,我们可以构建一个二维表格,行表示X的不同取值,列表示Y的不同取值,每个单元格记录了对应组合的样本频数。

2.计算每个单元格的期望频数。

期望频数是在零假设下,每个组合的期望样本频数。

可以通过行和列边际总和以及样本总数计算得出。

3. 计算卡方统计量。

卡方统计量的计算公式为:卡方统计量 =sum((观察频数-期望频数)^2 / 期望频数)。

通过计算每个单元格的统计量,并对所有单元格的统计量求和,得到整体的卡方统计量。

4.计算p值。

根据卡方统计量和自由度(自由度为(行数-1)×(列数-1))可以查找卡方分布表格,获取p值。

5.选择具有显著关联性的特征。

如果p值小于设定的显著性水平,我们可以拒绝零假设,认为特征与目标变量之间存在关联。

可以选择p值低于显著性水平的特征作为具有预测能力的特征。

卡方检验特征选择的优点是简单快速,并且不需要对数据进行任何假设,适用于任意数据类型。

然而,它也有一些限制,例如无法处理连续性特征,对于稀疏数据可能存在偏差。

此外,卡方检验只能检测特征与目标变量之间是否存在关联,不能确定具体的关联程度。

在实际应用中,卡方检验通常与其他特征选择方法结合使用,以获得更好的特征子集。

例如,可以使用卡方检验进行初步筛选,然后再使用其他方法(如互信息、皮尔逊相关系数等)进一步筛选和评估关联性。

【统计】卡方检验

卡方检验又叫x 检验,通常用来对率(总体率或样本率)进行检验。

下面介绍下两样本率的卡方检验在对样本率进行卡方检验时,常采用表格方式进行处理,这种表格称为R×C联表,R和C分别代表表格的行和列数。

举个例子。

为了检验新的教学方法是否对提高学生的体质健康有校,选取一个实验班(50人)和一个对照班(53人),实验班采取新的教学方法,对照班采取原来的教学方法,经过一个学期后以下为SPSS的卡方检验操作步骤:1. 首先在SPSS里输入数据,注意数据输入的变量设置(“是否及格”设置为数值型,并且在label里设置1为及格,2为不及格)2. 对频数进行加权处理由于在SPSS里我们输入的不是原始数据,而是汇总数据,所以需要先进行加权处理。

执行“数据—>观测量加权”(data--weight cases),弹出对话框,对什么变量进行加权,选择“人数”3. 交叉分析同时进行卡方检验。

执行“分析—>描述统计—>交叉表”(analyze—>descriptive sta—>crosstabs),弹出对话框,行(row)选择变量“班级”,列(col)选择变量“是否及格”。

再点下面的“统计”按钮,弹出对话框,见下图,选中“卡方”(chi-square),然后点“继续”,返回到交叉表对话框。

我们输入的是实际频数,卡方检验还有一个很重要的变量就是“理论频数”,这里我们也要把“理论频数”也显示出来,点下面的“单元格(cells )按钮,弹出对话框,在“计数”里选择“观察值”和“期望值”,见下图,然后点“继续”。

4. 查看结果。

最后点“确定”,就可得到检验结果。

见下面的图。

结果分析:1. 最上面的表格是对人数加权后得到的表格。

上面一排是实际计数值(实际频数),下面一排是理论计数值(理论频数)2. 下面的表格是卡方检验得到的结果。

Value是卡方值,df为自由度,sig为检验的P值。

我们看到上面有4种卡方检验的结果。

卡方检验

l l l l 增加样本含量 删去某行或某列 合理地(医学上合理性)合并部分性质相近的行或列 用精确概率法
4.多个率或构成比比较的χ2检验,结论为拒绝H0时,仅表示几组有差别,并非任2 组之间都有差别。若要了解两组间差别,可进行χ2表的分割。
作 业
1.请计算不同性别人群高血压患病情况,并统计不同人群患
病情况是否有差别。
2.请计算不同年龄组人群糖尿病患病情况,并统计不同人群
患病情况是否有差别。同时查看糖尿病患病率是否有随年增
加而增加的趋势。 3.请根据BMI分组情况,计算不同体质指数人群高血压、糖尿 病的患病情况,并统计不同人群患病情况是否有差别
H0:观察频数与期望频数没有差别
算出χ2值,它表示观察值与理论值之
间的偏离程度。根据χ2分布, χ2统计量以及自由度可以确定在
H0成立的情况下获得当前统计量及更极端情况的概率P。 如果P 很小,说明观察值和理论值偏离程度太大,应当 拒绝原假设,表示比较资料之间有显著性差异;否则就不能 拒绝原假设,尚不能认为样本所代表的实际情况与理论假设 有差别。
SPSS中的相应功能
由于卡方检验用途广泛,在SPSS中经常用到,但在 很多地方均以分布检验、方差齐性检验等其他检验的名 义出现,直接以卡方检验的名称显示的主要是以下两处: 1.非参数分布检验中的卡方检验:即检验某个分类变量 各类的出现概率是否等于指定概率的分布检验。
2.交叉表过程:主要用于针对两个/多个分类变量的交叉 表进行其关联程度的卡方检验,上面提到的后三项均可 在该过程实现。
卡方检验基础
卡方检验通用公式
由英国统计学家Karl Pearson于1900年首 次提出,故被称为Pearson χ2 。

2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

文章编号:100826579(2000)20120070271=写作知识讲座>卡方检验冯忠蕙(西安医科大学统计教研室,710061)中图号:R195.1文献编码:C关键词:统计,医学,卡方检验。

临床常用的一种统计方法。

这种资料属于定性结果的计数资料,没有测量数据单位。

医生常用于检验临床疗效的研究,比较构成比或率,如男女比,无效、好转、治愈构成比,发病率,阳性率,治愈率等。

四格表法用于两组比较;行@列表用于三组或三组以上比较。

它还可以检验事物间有无一定关系存在以及频数分布的拟合优度检验等,用途颇为广泛。

今介绍其基本计算方法如下:V2检验的基本公式:V2检验是测定观察事物的实际观察值与理论值之间的偏离程度的一种显著性检验方法。

其定义见基本公式:V2=E (A-T)2T式中A为实际值,T为理论值。

理论值是指应比较的各组在无效假设时理论上所推算的数值。

1四格表资料的V2检验。

例1,某时某地5岁以下儿童结核感染情况。

接触组结核感染率为36.0%,对照组为17.3%。

两率相差较大,这个差异是由于抽样的机遇所致,还是确实存在一定差别,需进行两率比较。

首先假设两率之间无差别。

然后进行衡量实际观察的结果与假设之间的差别的大小。

见表1。

表1某时某地5岁以下儿童结核菌素试验阳性儿童数感染率%接触组236436.0对照组2615018.3合计4921422.9V2检验的假设总体的阳性率是以两组合计的阳性率表示。

上例则将两组合计的感染率做为假设总体的感染率,从而两组在总体感染率相等的条件下,计算出各组与假设相应的阳性、阴性理论值。

因此理论值(T)是表示在假设条件下的数值,观察值(A)则表示实际观察的阳性、阴性人数。

计算步骤如下:1.1建立假设检验H0:P1=P2H1:P1X P2A=0.05H0表示无效假设,H1表示对立假设, P1表示样本1的总体率,P2表示样本2的总体率;A表示V2分布的尾部面积占整个分布面积的百分数,做为有无显著性意义的界限值。

1.2计算理论值首先计算合并率,合并率=(两组合计栏阳性人数之和/两组合计栏观察人数之和)@100%=(49/214)@100%=22.9%。

在假设两组皆等于22.9%的条件下,计算各组理论值。

各组阳性理论值=各组总人数@总感染率:接触组的阳性理论值=64@22.9%=15;对照组的理论值=150@22.9%=34。

各组阴性理论值=各组总人数-本组阳性理论值,接触组的阴性理论值=64-15=49;对照组的阴性理论值=150-34=116。

表2中,括号内表示理论值。

表2结核菌素试验阳性阴性合计接触组23a41b64(15)(49)对照组26c124d150(34)(116)合计49165214表2中阴性、阳性两列与接触组、对照组两行所形成的中间a、b、c、d四个格的数据是计算V2值的基本数据。

故称此两行、两列的格式为四格表,由此计算的V2检验方法又称为四格表的V2检验法。

1.3代入V2基本公式:V2=E(A-T)2T=(23-15)215+(26-34)234+(41-49)249+(124-116)2116=8215+8234+8249+82116=82(115+134+149+1116)=8.01四个差值的总和表示实际样本率与假设总体率之间的差异。

为表示观察值与理论值之差的大小,仍需将此差值进行平方,以避免原差值的总和等于零。

然后再除以各相应组的理论值,以消除受原数值大小的影响,使各差值在平等的条件下进行总和。

因此计算四格表卡方检验的公式为:V2=(A-T)2(1T1+1T2+1T3+1T4)1.4V2值表首先计算自由度C。

C=(行-1)(列-1)。

本例自由度C=(2-1)(2-1)=1,V2值表中C=1,概率P=0.05时,V2=3.84,写做V20.05(1)=3.84。

P=0.01时,V2= 6.63,写做V20.01(1)=6.63。

一般认为P>0.05相差不显著,0.05\P>0.01相差显著,P[0.01相差非常显著。

本例V2=8.01>V20.01(1)=6.63,P<0.01。

相差非常显著。

1.5判断由于P<0.01,按A=0.05水准,说明两组由于抽样的机遇所致的概率很小,拒绝无效假设H0,接受对立假设H1。

可认为5岁以下儿童结核感染率的结果是由接触因素所致。

接触组的感染率高于对照组。

V2值表是以连续性光滑的理论分布为依据建立的,而在临床资料中多为不连续的定性资料,在使用V2结果时不够准确,所得概率偏低。

因而进行四格表V2检验时,尤其在理论值5>T>1,样本总例数n>40则需进行V2校正。

当n<40理论值T<1时,应考虑采用四格表的确切概率法(略)。

2.行@列表资料的V2检验上述四格表的V2检验已阐述了两个率的比较。

如果是多个率比较,其基本数据则有R行、C列,即R@2表、2@K、或R@C(行@列)表。

行@列表V2检验除适用于多个率比较外,也常用于多个构成比的比较。

例2某时某地3岁以下小儿Ó型腺病毒中和抗体阳性率,试分三个年龄组进行比较。

表31~3岁小儿Ó型腺病毒中和抗体阳性率月龄阳性阴性合计阳性率%1~127(7.08)72(61.02)798.8613~248(9.08)34(32.92)4219.0525~3617(5.84)10(21.16)2762.95合计3211614821.622.1建立假设H0:三组阳性率相等,H1:三组阳性率不等,A=0.05;2.2代入V2基本公式=E(A-T)2T=(7-7.08)27.08+(72-61.9)261.92+(8-9.08)29.08+(17-8.84)25.84=(34-32.92)232.92+(6-21.16)221.16=352.3查V2值表C=(3-1)(2-1)=2,P<0.005,按A=0.05水准拒绝H0接受H1。

故可认为1~3岁小儿Ó型腺病毒中和抗体阳性率之间相差有非常显著的意义。

#70#中国儿童保健杂志2000年1月第8卷第1期CJCHC Jan.2000,Vol8,No.1当比较多个样本率或构成比时,如所得结果V2值为有显著意义,只能认为各总体率之间相差概括的说有一定差别,但不能认为各组总体率之间相差皆有差别,更不知哪两组总体率间有差别。

为进一步解决此问题可采用V2分割法。

3V2分割法V2分割法是将R@C表分割成几个四格表,这些四格表的自由度之和,应等于原R@C表的自由度。

各表V2值之和,也接近于原表V2值。

分割的方法是以相近为原则,将相近的差别不大的样本率分割出来,计算其V2值,如不显著则可将两组合并做为一个样本组,然后再与其他相近样本组进行V2检验。

依此类推至与其他样本组比较完毕。

上例中,先分割前两组,即1~12月组与13~24月组比较,进行V2检验。

表41~12月组与3~24月组比较月龄阳性阴性合计1~127(9.8)72(69.2)7913~248(5.2)34(36.8)42合计15106121H0:P1=P2,H1:P1X P2,A=0.05V2(7-9.8)2(19.8+15.2+169.8+136.8)=2.63C=(2-1)(2-1)=1,P>0.05两组相差无显著意义,意味着两组可以合并。

合并后再与25~36月组比较。

表51~24月组与25~36月组比较月龄阳性阴性合计阳性率%1~2415(26.16)106(94.84)12112.4025~3617(5.84)10(21.16)2762.95合计3211614821.62H0:P1=P2,H1:P1X P2,A=0.05V2=(15-26.16)2(126.16+15.84+194.84+121.16)=33.27C=1,P<0.005,相差有非常显著的意义。

拒绝无效假设,接受对立假设,故可认为3岁以下小儿Ó型腺病毒中和抗体阳性率1~24月组与25~36月组的两总体率相差有区别。

25~36月组阳性率高于1~24月组。

表6V2分割计算比较月龄感染率%自由度V2P11~128.861 2.63>0.0513~2419.0521~2412.40133.27<0.00525~3662.95合计235.90为验证自由度和V2值的相加是否等于原表数值。

今计算如下:表6中依据V2相加的原理,将比较1、2组的V2值相加等于35.90与原表V2=35相近,因而这种分割是正确的。

若自由度与V2值相加与原表不符,则表明分割方法不太正确。

应注意的是用R@C表多行多列进行V2检验时,要求理论值不宜太小,不然则会导至偏性。

一般认为不应有1/5以上格子的理论值小于5,或有一个格子理论值小于1。

但有人认为多个理论值小至1也不致于影响分析结果。

若理论值太小一般有下列三种办法进行处理。

¹可增加样本例数以增大理论值。

º将理论值太小的行与列删去。

»将理论值太小的行与列,和性质相近的邻行、邻列以观察值合并,经重新计算使理论值增大。

以上º、»两法可能会损失一些信息,另外也应注意不同的方式合并也会导致不同的结论,需慎用之。

(收稿日期:1999212206)作者简介:冯忠薏,女,1930年1月出生,博士后(美国),教授。

主要从事人口与健康研究。

担任中国卫生统计学会理事,陕西省卫生统计专业委员会主任委员。

(上接第64页)婴儿病情骤变的病因,依次为颅内出血,复杂的先天性心脏病、低血糖、红细胞增多症、感染和GER及低体温。

这些病因容易导致婴儿发生威胁生命的低氧血症)肺内分流,致命的上气道梗阻(窒息)及抽搐,常有猝死的高度危险性[2]。

产伤所致的颅内出血现在已较少见,宫内缺氧所致的SEH、IVH、SAH成为新生儿颅内出血的主要病理类型。

新生儿脑病病变的临床症状轻重相差悬殊,一般起病急,恶化快[3]。

呼吸暂停或不规则是严重出血的最常见症状。

37例病例中,有6例为先天性心脏病。

从M超诊断可以看到均为较严重的复杂畸形,不是单一部位的缺损、狭窄、异位。

这些复杂的先天性心脏病新生儿刚出生时可以无发绀、无心脏杂音应引起医护人员注意。

在母婴同室中,初产妇,难产(剖腹产、产钳、胎吸)产妇,产后疲劳,哺乳技巧不适当,母乳喂养信心不足等因素均可以造成婴儿入量不足而导致低血糖发生。

另外,在母婴同室时,婴儿如果出现低体温,医护人员应积极寻找原因和处理。

37例病例中,有13例体温低、5例体温不升,约占48.6%,这说明低体温是众多新生儿疾病的一个危险信号。

新生儿猝死(SDN)的原因以感染居首位。

尤其是G-菌感染,极易引起休克[3]。

37例病例中,有3例为感染性休克,其中2例为肠道感染。

相关文档
最新文档