表格资料汇总常用统计方法
Excel常用公式大全,Excel表格中公式函数大全【汇总篇】

Excel常用公式大全,Excel表格中公式函数大全【汇总篇】Excel常用公式大全,Excel表格中公式函数大全【汇总篇】我们都学过office办公软件,其中Excel表格用起来非常方便,但很多人不知道Excel还有更强大的功能函数公式,Excel的公式很多,如果你全部掌握,那你在办公这块几乎没有完成不了的工作,来看看Excel的公式都有哪些吧,强大的公式助你办公事半功倍。
一、Excel基本公式1、查找重复内容公式:=IF(COUNTIF(A:A,A2)1,重复,)。
2、用出生年月来计算年龄公式:=TRUNC((DAYS360(H6,2009/8/30,FALSE))/360,0)。
3、从输入的18位身份证号的出生年月计算公式:=CONCATENATE(MID(E2,7,4),/,MID(E2,11,2),/,MID(E2,13,2))。
4、从输入的身份证号码内让系统自动提取性别,可以输入以下公式:=IF(LEN(C2)=15,IF(MOD(MID(C2,15,1),2)=1,男,女),IF(MOD(MID(C2,17,1),2)=1,男,女))公式内的“C2”代表的是输入身份证号码的单元格。
1、求和:=SUM(K2:K56)——对K2到K56这一区域进行求和;2、平均数:=AVERAGE(K2:K56)——对K2K56这一区域求平均数;3、排名:=RANK(K2,K$2:K$56)——对55名学生的成绩进行排名;4、等级:=IF(K2=85,优,IF(K2=74,良,IF(K2=60,及格,不及格)))5、学期总评:=K2*0.3+M2*0.3+N2*0.4——假设K列、M列和N列分别存放着学生的“平时总评”、“期中”、“期末”三项成绩;6、最高分:=MAX(K2:K56)——求K2到K56区域(55名学生)的最高分;7、最低分:=MIN(K2:K56)——求K2到K56区域(55名学生)的最低分;8、分数段人数统计:(1)=COUNTIF(K2:K56,100)——求K2到K56区域100分的人数;假设把结果存放于K57单元格;(2)=COUNTIF(K2:K56,=95)-K57——求K2到K56区域95~99.5分的人数;假设把结果存放于K58单元格;(3)=COUNTIF(K2:K56,=90)-SUM(K57:K58)——求K2到K56区域90~94.5分的人数;假设把结果存放于K59单元格;(4)=COUNTIF(K2:K56,=85)-SUM(K57:K59)——求K2到K56区域85~89.5分的人数;假设把结果存放于K60单元格;(5)=COUNTIF(K2:K56,=70)-SUM(K57:K60)——求K2到K56区域70~84.5分的人数;假设把结果存放于K61单元格;(6)=COUNTIF(K2:K56,=60)-SUM(K57:K61)——求K2到K56区域60~69.5分的人数;假设把结果存放于K62单元格;(7)=COUNTIF(K2:K56,60)——求K2到K56区域60分以下的人数;假设把结果存放于K63单元格;说明:COUNTIF函数也可计算某一区域男、女生人数。
常用统计方法

xx厂xx年x月xxxx排列图
累计% 频数 240 200 100% N=240 92.5% 87.5% 100% 90% 80% 累计 % 70% 33. 3% 60% 58. 3% 50% 75% 87. 40% 5% 92. 5% 30% 100% 20% 18 10% 0 甲 乙 丙 丁 戊 其他 制作人:xxx 日期:xx.xx.xx
3
调 查 表
常用的统计工具 -1
模板制作:门国彬 模板制作:
4
调查表
定义:调查表(Data-collection Form)有叫检查表、核对表、 Form)有叫检查表、核对表、 定义:调查表(Data统计分析表。它是用来系统的收集资料和积累数据, 统计分析表。它是用来系统的收集资料和积累数据,确认 事实并对数据进行粗略整理和分析的统计图表。 事实并对数据进行粗略整理和分析的统计图表。 范围:它能够促使我们按统一的方式收集资料,便于分析; 范围:它能够促使我们按统一的方式收集资料,便于分析;一般 在质量管理活动中,特别是在QC小组活动、 QC小组活动 在质量管理活动中,特别是在QC小组活动、质量分析和质 量改进的活动中得到广泛的应用。 量改进的活动中得到广泛的应用。 步骤: 明确收集资料的目的; 步骤:1)明确收集资料的目的; 确定为达到目的所需要搜集的资料(强调问题); 2)确定为达到目的所需要搜集的资料(强调问题); 确定对资料的分析方法和负责人; 3)确定对资料的分析方法和负责人; 根据不同目的,设计用于记录资料的调查表格式, 4)根据不同目的,设计用于记录资料的调查表格式,其 内容应包括:调查者、调查时间、地点和方式等项目; 内容应包括:调查者、调查时间、地点和方式等项目; 对收集和记录的部分资料进行预先检查, 5)对收集和记录的部分资料进行预先检查,目的是审查 表格设计的合理性; 表格设计的合理性; 模板制作:门国彬 模板制作: 如有必要,应评审和修改该调查表格式。 6)如有必要,应评审和修改该调查表格式。
EXCEL电子表格中四个常用函数的用法

EXCEL电子表格中四个常用函数的用法(2010-01-16 09:59:27)转载▼分类:Excel学习标签:杂谈EXCEL电子表格中四个常用函数的用法现在介绍四个常用函数的用法:COUNT(用于计算单元格区域中数字值的个数)、COUNTA(用于计算单元格区域中非空白单元格的个数)、COUNTBLANK(用于计算单元格区域中空白单元格的个数)、COUNTIF(用于计算符合一定条件的COUNTBLANK单元格个数)。
结合例子将具体介绍:如何利用函数COUNTA统计本班应考人数(总人数)、利用函数COUNT统计实际参加考试人数、利用函数COUNTBLANK统计各科缺考人数、利用函数COUNTIF统计各科各分数段的人数。
首先,在上期最后形成的表格的最后添加一些字段名和合并一些单元格,见图1。
一、利用函数COUNTA统计本班的应考人数(总人数)因为函数COUNTA可以计算出非空单元格的个数,所以我们在利用此函数时,选取本班学生名字所在单元格区域(B3~B12)作为统计对象,就可计算出本班的应考人数(总人数)。
1.选取存放本班总人数的单元格,此单元格是一个经过合并后的大单元格(C18~G18);2.选取函数;单击菜单“插入/函数”或工具栏中的函数按钮f*,打开“粘贴函数”对话框,在“函数分类”列表中选择函数类别“统计”,然后在“函数名”列表中选择需要的函数“COUNTA”,按“确定”按钮退出“粘贴函数”对话框。
3.选取需要统计的单元格区域;在打开的“函数向导”对话框中,选取需要计算的单元格区域B3~B13,按下回车键以确认选取;“函数向导”对话框图再次出现在屏幕上,按下“确定”按钮,就可以看到计算出来本班的应考人数(总人数)了。
二、利用COUNT、COUNTBLANK和COUNTIF函数分别统计各科参加考试的人数、统计各科缺考人数、统计各科各分数段的人数我们在输入成绩时,一般情况下,缺考的人相应的科目的单元格为空就可以了,是0分的都输入0。
Excel在统计中的应用(word文档良心出品)

第十一章 Excel在统计中的应用学习目标►了解Excel是统计工作的基本工具。
►理解用Excel处理统计数据及统计分析的基本程序与基本原理。
►掌握用Excel进行时间序列分析、指数分析和相关与回归分析。
►熟练掌握及运用Excel搜集与整理数据、计算描述统计量。
统计学是一门应用性非常强的学科。
而统计工作的每一个环节几乎都离不开统计计算机软件的应用。
典型的统计软件有SAS、SPSS、MINITAB、STA TISTICA、Excel等。
其中由美国微软公司开发的Excel电子表格软件,是办公自动化中非常重要的一款软件,它不仅能够进行表格处理、图形分析、数据的自动处理和计算,而且简单易用,具有一定统计基础知识的人都可以利用它进行统计工作。
本章介绍Excel2003在统计中的应用及正确使用的方法。
第一节用Excel搜集与整理数据一、用Excel搜集数据搜集数据的方法有多种,可以采用统计报表、典型调查、重点调查或抽样调查,以后我国的统计调查将以抽样为主。
针对抽样调查,Excel的数据分析工具中提供了一个专门的“抽样”工具,可以帮助使用者快速完成抽样工作。
使用Excel进行抽样,首先要对各个总体单位进行编号,编号可以按随机原则,也可以按有关标志或无关标志,本节以例11-1为操作范例进行阐述。
例11-1假定有100名消费者,从中选取15人进行工资收入调查。
首先,将100名消费者编号为1~100号,输入编号,形成总体单位编号表如图11-12 统计学原理所示。
图11-1 总体各单位编号表完成总体单位编号清单后,利用“抽样”工具进行抽样的具体操作如下:第一步:单击“工具”菜单,选择“数据分析”选项(若无数据分析选项,可在工具菜单下选择加载宏,在弹出的对话框中选择分析工具库,便可出现数据分析选项)。
第二步:打开“数据分析”对话框,从其对话框的“分析工具”列表中选择“抽样”选项,如图11-2所示。
图11-2 “数据分析”对话框第三步:单击“确定”按钮,打开“抽样”对话框,确定输入区域、抽样方法和输出第11章Excel在统计中的应用 3 区域,如图11-3所示。
统计资料整理

第三章统计资料的整理教学目的与要求:本章是统计研究活动的第三阶段—统计资料整理阶段,阐述了统计整理的理论与方法,包括分组、汇总和统计表的设计。
重点要求为:1、明确统计资料整理的概念,了解统计整理的步骤。
2、通过学习统计分组理论,能够对不同的社会经济现象进行统计分组。
3、运用分配数列对原始数据进行系统整理。
4、掌握统计表的具体编配方法。
重点掌握:1、统计分组方法。
2、分配数列的编制与汇总技能点:1.掌握统计数据整理的基本操作方法的能力;2.通过学习统计分组理论,能够对不同的社会经济现象进行统计分组的能力。
3.运用分配数列对原始数据进行系统整理的能力;4.培养制作统计表,运用计算机绘制统计图的能力。
教学方式:用多媒体课件讲练结合。
课时安排:理论4学时,实训2学时第一节统计整理的意义和步骤一、统计整理的意义1、定义统计整理,就是根据统计研究的目的,对所搜集到的资料进行科学的加工,使之系统化,条理化的工作过程。
统计整理即包括对统计调查所得到的原始资料进行整理,也包括对加工过的综合资料,即次级资料进行再整理。
2、意义统计整理在整个统计研究中占有重要的地位。
统计整理的正确与否,将直接影响和决定着能否完成整个统计研究的任务。
如果采用不科学不完整的整理方法,即使搜集到准确、全面的统计资料,也往往使这些资料失去应用价值,掩盖客观现象的本质,难以得出正确的结论。
因此,必须十分重视统计整理工作。
二、统计资料整理的步骤第一步,设计和制定统计整理方案。
第二步,对原始资料进行审核。
第三步,对经过审核的资料进行分组、并结合汇总,计算出总体总量指标。
第四步,将汇总计算的结果,以统计表或统计图的形式表现出来。
第五步,对统计资料妥善保存,系统积累。
第二节统计分组一、统计分组的概念统计分组就是根据统计研究的需要,将统计总体按照一定的标志分为若干个组成部分的一种统计方法。
例如,将某一班级的全体同学按照性别划分为男、女两个组;对某市100家大型零售商店按照零售额、职工人数进行分组等。
七大统计手法(自己汇总,总表)

|
转速不足 |||| || |||| ||| || ||
时间不足 |
||
其他
||
|
||
·查检用查检表:
点检·顺序
1 2 3 4 5 6 7
点检项目
刷牙 洗脸 吃早餐 携带必备物品 服装仪容 公事包 大门钥匙
点检结果
(三)为何要用查检表
•有效解决问题→依据事实→收集资料 •避免「观察」与「分析」同时进行之KKD
产生
• 工业革命以后, 随着生产力的进一步发展,大规
模生产的形成,如何控制大批量产品质量成为一个突 出问题,单纯依靠事后检验的质量控制方法已不能适 应当时经济发展的要求,必须改进质量管理方式。于 是,英、美等国开始着手研究用统计方法代替事后检 验的质量控制方法。
•
1924年,美国的贝尔电话实验所休哈特博士提
管 制 图
了解品质
直 方 图
1.应用层别区分法, 借用其他图形, 找出数据差异的因 本身无固定图形 素而对症下药.
2.以4M之每1M进行 层别
1.了解两种因数或 数据之间的关系。
2.发现原因与结果 的关系
应用范围较受限 制
1.掌握制程现况的 品质
2.发现异常及时采 取行动
现实生产中,使 品质稳定的一种 管制情报
出将3Sigma原理运用于生产过程当中,并发表了著名
的“控制图法”,对过程变量进行控制,为统计质量
管理奠定了理论和方法基础。
作用
1、确保制程持续稳定、可预测。 2、提高产品质量、生产能力、降低成本。 3、为制程分析提供依据。 4、区分变差的特殊原因和普通原因,作为采取局部措
施或对系统采取措施的指南。
统称为充填机伺服机构
应用统计学第2章--统计表统计图
接收区间——各组上限值组成的一列区域 功能:返回各组的频数。
②使用【工具】→“数据分析”→“直方图”功 能
其它数值数据统计图
统计图可以形象、直观、生动、简洁地显示数 据的特征。 常用的统计图有以下几种: 1.折线图 ——通常用来描述时间序列数据,用以表示某 些指标的变化趋势。 制作折线图时应正确选择坐标轴轴的刻度。对 同样的统计资料,延伸或压缩某一坐标轴可能 传达不同的甚至是误导的印象。
0—9 10—19 20—29 30—39 40—49 50—59 60—69 70—79 80—89 90以上
未分组数据的茎叶图
• 用于显示未分组的原始数据的分布
• 由“茎”和“叶”两部分构成,其图形是由数字 组成的
• 以该组数据的高位数值作树茎,低位数字作树叶 • 对于n(20≤n≤300)个数据,茎叶图最大行数不超
标签下选“平滑线”复选框,就将折线图转换 为曲线图。
⑵经济管理中几种常见的频数分布曲线
①正态分布曲线 ——这是客观事物数量特征上表现得最为普遍的
一类频数分布曲线。 如人的身高、体重、智商,钢的含碳量、抗拉强
度,某种农作物的产量等等。
正态分布曲线
②偏态曲线
——按其长尾拖向哪一方又可分为右偏(正偏)和 左偏(负偏)两类。
排序是把数据从小到大(或从大到小)进行排列。 (2) 茎叶图
茎叶图就是将数据分成几组(称为茎),每组中数 据的值(称为叶)放置在每行的右边。结果可以显示出数 据是如何分布的,以及数据中心在哪里。
为了制作茎叶图,可以将整数作为茎,把小数(叶) 化整。例如,数值5.40,它的茎(行)是5,叶是4;数值 4.30,它的茎(行)是4,叶是3。也可以将数据的十位数 作为茎,个位数作为叶。
Excel常用电子表格公式大全汇总
Excel常用电子表格公式大全汇总Excel是大家常用的电子表格软件,掌握好一些常用的公式,能使我们更好的运用Excel表格,下面是店铺整理的一些Excel常用电子表格公式,供您参考。
一、Excel基本公式1、查找重复内容公式:=IF(COUNTIF(A:A,A2)>1,"重复","")。
2、用出生年月来计算年龄公式:=TRUNC((DAYS360(H6,"2009/8/30",FALSE))/360,0)。
3、从输入的18位身份证号的出生年月计算公式:=CONCATENATE(MID(E2,7,4),"/",MID(E2,11,2),"/",MID(E2,13,2))。
4、从输入的身份证号码内让系统自动提取性别,可以输入以下公式:=IF(LEN(C2)=15,IF(MOD(MID(C2,15,1),2)=1,"男","女"),IF(MOD(MID(C2,17,1),2)=1,"男","女"))公式内的“C2”代表的是输入身份证号码的单元格。
1、求和: =SUM(K2:K56) ——对K2到K56这一区域进行求和;2、平均数:=AVERAGE(K2:K56) ——对K2 K56这一区域求平均数;3、排名: =RANK(K2,K$2:K$56) ——对55名学生的成绩进行排名;4、等级:=IF(K2>=85,"优",IF(K2>=74,"良",IF(K2>=60,"及格","不及格")))5、学期总评: =K2_0.3+M2_0.3+N2_0.4 ——假设K列、M列和N列分别存放着学生的“平时总评”、“期中”、“期末”三项成绩;6、最高分:=MAX(K2:K56) ——求K2到K56区域(55名学生)的最高分;7、最低分:=MIN(K2:K56) ——求K2到K56区域(55名学生)的最低分;8、分数段人数统计:(1) =COUNTIF(K2:K56,"100") ——求K2到K56区域100分的人数;假设把结果存放于K57单元格;(2) =COUNTIF(K2:K56,">=95")-K57 ——求K2到K56区域95~99.5分的人数;假设把结果存放于K58单元格;(3)=COUNTIF(K2:K56,">=90")-SUM(K57:K58) ——求K2到K56区域90~94.5分的人数;假设把结果存放于K59单元格;(4)=COUNTIF(K2:K56,">=85")-SUM(K57:K59) ——求K2到K56区域85~89.5分的人数;假设把结果存放于K60单元格;(5)=COUNTIF(K2:K56,">=70")-SUM(K57:K60) ——求K2到K56区域70~84.5分的人数;假设把结果存放于K61单元格;(6)=COUNTIF(K2:K56,">=60")-SUM(K57:K61) ——求K2到K56区域60~69.5分的人数;假设把结果存放于K62单元格;(7) =COUNTIF(K2:K56,"<60") ——求K2到K56区域60分以下的人数;假设把结果存放于K63单元格;说明:COUNTIF函数也可计算某一区域男、女生人数。
用Excel统计的方法
Excel统计方法一、计量资料的常用统计描述指标1.平均数平均数表示的是一组观察值(变量值)的平均水平或集中趋势。
平均数计算公式:式中:X为变量值、Σ为总和,N为观察值的个数。
2.标准差(S) 标准差表示的是一组个体变量间的变异(离散)程度的大小。
S愈小,表示观察值的变异程度愈小,反之亦然,常写成。
标准差计算公式:式中:∑X2为各变量值的平方和,(∑X)2为各变量和的平方,N-1为自由度3.标准误(S⎺x)标准误表示的是样本均数的标准差,用以说明样本均数的分布情况,表示和估量群体之间的差异,即各次重复抽样结果之间的差异。
S⎺x愈小,表示抽样误差愈小,样本均数与总体均数愈接近,样本均数的可靠性也愈大,反之亦然,常写作。
标准误计算公式:二、计数资料的常用统计描述指标1.率和比率是一种表示在一定条件下某种现象实际发生例数与可能发生该现象的总数比,用来说明某种现象发生的频率。
比是表示事物或现象内部各构成部分的比重。
率和比计算公式:2.率和比的标准误率和比的标准误是抽样造成的误差,表示样本百分率和比与总体百分率和比之间的差异,标准误小,说明抽样误差小,可靠性大,反之亦然。
( p为率的标准误,P为样本率,当样本可靠且有一定数量的观察单位时可代替总体率。
N为样本观察例数)三、显著性检验抽样实验会产生抽样误差,对实验资料进行比较分析时,不能仅凭两个结果(平均数或率)的不同就作出结论,而是要进行统计学分析,鉴别出两者差异是抽样误差引起的,还是由特定的实验处理引起的。
1.显著性检验的含义和原理显著性检验即用于实验处理组与对照组或两种不同处理的效应之间是否有差异,以及这种差异是否显著的方法。
2.无效假设显著性检验的基本原理是提出“无效假设”和检验“无效假设”成立的机率(P)水平的选择。
所谓“无效假设”,就是当比较实验处理组与对照组的结果时,假设两组结果间差异不显著,即实验处理对结果没有影响或无效。
经统计学分析后,如发现两组间差异系抽样引起的,则“无效假设”成立,可认为这种差异为不显著(即实验处理无效)。
常用统计方法的应用
关键的少数看三点:
1、看图形:关键问题比例高; 2、看目标:对目标影响大; 3、看实际能解决的问题(不可抗拒因素排除)。
举例
课题:降低静脉输液穿刺失败率
从已有统计报表中得到1-3月份共有128次穿刺失败,逐项统计穿刺失败的 种类和数量,形成了静脉输液穿刺失败调查表和排列图。 静脉输液穿刺失败调查表
课题名称举例
——提高静脉输液穿刺成功率;
——提高口腔溃疡治愈率;
——降低患者投诉率; ——缩短门诊患者就诊排队时间;
——降低复印纸消耗;
25
2、现状调查
目的:掌握问题的严重性, 为确定目标值提供依据。
现状调查应注意用数据说话:
◆ 收集数据要有客观性, 防止只收集对自己有利的数据。 ◆ 收集数据要有可比性, 改进后能反映出变化程度。 ◆ 收集数据的时间要有约束, 要收集最近时间的数据。 例:前面收集一年,后面三个月 前面按月收集,后面按天收集
注意事项:
1、应排出关键的少数和次要的多数,否则重新排列。 2、关键少数项目应是小组有能力解决的突出问题, 否则应去掉,重新进行排列。 3、纵坐标频数可以用“件数”、“金额”等表示,但对应 各项目的度量单位必须一致。 4、取样数量不易太少,至少应有50个数据 5、排列图项目一般不少于3项,最多不宜超过8项。当 少于3项时,可用简易图表代替(如饼分图) 6、实施后,为检查措施效果,要重新画出排列图。
搜集到正确的有效信息,并做出精确的判断。
什么是
环,是美国质量管理专家戴明博士提出的,它 是全面质量管理所应遵循的科学程序。全面质量管理活动的全部过程, 就是质量计划的制订和组织实现的过程,这个过程就是按照PDCA循 环,不停顿地周而复始地运转的。
A:处 置 C:检查
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分类数据常用统计方法在科研数据的统计分析中,经常会遇到分类数据。
分类数据包括计数资料和等级资料,两者都是将观察指标分类(组),然后统计每一类(组)数目所得到的数据,区别是如果观察指标的分类是无序的则为计数资料,也叫定性资料或无序分类变量;如果观察指标的分类是有序的,则为等级资料,也叫有序分类数据。
如调查某人群的血型分布,按照A 、B 、AB 与O 四型分组,计数所得该人群的各血型组的人数就是计数资料(因为A 、B 、AB 与O 血型之间是平等的,并没有度或量的差异);观察用某药治疗某病患者的疗效,以患者为观察单位,结果可分为治愈、显效、好转、无效四级,然后对该病的患者,分别计数治愈、显效、无效、好转的人数则为等级数据(因为无效的疗效最差、次之为好转、治愈的疗效最好,它们之间有度或者量的区别)。
分类数据进行统计分析时要列成表格,根据表格中分组变量和指标变量的性质、样本含量(n )和理论频数(T )的大小以及分析的目的,所用的统计方法是不一样的。
下面通过一些有代表性的例子来介绍分类数据常用的统计分析方法。
一、2×2表2×2表也叫四格表。
在实验研究中,将研究对象分为2组进行实验,实验只有2种可能的结果,如阳性与阴性,故叫2×2表;因为基本数据只有4个,所以也叫四格表。
根据不同的实验安排,四格表又分为完全随机设计四格表和配对设计四格表。
表1 某抗生素的人群耐药性情况用药史 不敏感 敏感 合计 耐药率(%) 曾服该药 180(174.10) 215(220.90) 395 45.57 未服该药 73(78.90) 106(100.10)179 40.78 合计25332157444.08表1 为完全随机设计四格表。
其目的是要比较曾服该抗生素的人群和未曾服过该抗生素的人群,对该抗生素的耐药率有无差异。
表格中的四个基本数据(也叫实际频数)分别为180、215、73、106;括号中的四个数据(174.10、220.90、78.90、100.10)为四个理论频数(T ),因40574>=n 且四个理论频数(T )均大于5,故应用Pearson 2χ检验。
经(SPSS 11.0,以下同)计算2χ=1.145,P =0.285>0.05,故可认为曾服过该抗生素的人群和未曾服过该抗生素的人群对该抗生素的耐药率无差异。
表2 两个年级大学生的近视眼患病率比较年级 近视 非近视 合计 近视率(%) 四年级 2(4.67) 26(23.33) 28 7.14 五年级 5(2.33) 9(11.69) 14 35.71 合计7354216.67表2也为完全随机设计四格表。
虽4042>=n 但有两个格子的理论频数比1大比5小,此时需对2χ进行连续性校正(因为理论频数太小,会导致2χ增大,易出现错误的有差异的结论)。
经计算,连续性校正的c2χ=3.621,P =0.057>0.05,可认为大学四年级与大学5年级学生近视眼的患病率无差异。
如果不用连续性校正的2χ检验,则2χ=5.486,P =0.019<0.05,则会得出五年级大学生近视眼的患病率高于四年级大学生的错误结论。
表3 两种疗法对腰椎间盘脱出症的疗效疗法 治愈 未治愈 合计 治愈率(%) 新疗法 7 2 9 77.78 保守疗法 2 6 8 25.00 合计981752.94表3也为完全随机设计四格表。
因n=17<40(或有理论频数小于1),即使采用校正公式计算2χ也会有偏差,此时应采用四格表的Fisher确切检验法。
经计算P=0.057>0.05,故认为新疗法与保守疗法对腰椎间盘脱出症的治愈率无差异。
表4 198份痰液标本分别用A、B两种培养基的培养结果A培养基B培养基合计+-+48 24 72-20 106 126合计68 130 198 表4为配对设计四格表。
A、B两种培养基对同一份标本的培养结果视为对子数据,故为配对设计。
欲分析A、B两种培养基的培养结果有无差异,应用配对四格表2χ(也叫McNemar)检验。
经计算P=0.652>0.05,故认为A、B两种培养基的培养结果无差异。
表5 三个不同地区血型样本的频数分布地区 A B AB O 合计亚洲321 369 95 295 1080欧洲258 43 22 194 517北美洲408 106 37 444 995合计987 518 154 933 2592 表5为完全随机设计的R×C表。
与四格表不同的是:表5的行或列均超过2,此类表格统称为行×列表,也叫R×C表。
四格表也可以视为行(或R)=2,列(或C)=2的行×列表。
此表因为结果变量(血型)为多分类,故属于多个构成比的比较。
欲分析不同地区人群的血型分布构成有无差异,应用Pearson2χ检验。
经计算2χ=297.375,P=0.000<0.05,可认为三地区人群的血型分布构成有差异。
经进一步分析,发现亚洲地区A(29.7%)、B(34.2%)和O(27.3%)血型的人比较多,欧洲和北美洲A(分别为49.9%和41%)和O(分别为37.5%和44.6%)血型的人比较多。
表6 三组药物治疗失眠的有效率组别有效无效合计有效率(%)新药 6 42 48 12.50传统药11 26 37 29.73安慰剂29 8 37 78.38合计46 76 122 37.70 表6也为完全随机设计R×C表,因结果变量为药物的疗效,分为有效和无效,属于2分类变量,故属于多个率的比较。
欲分析不同药物治疗失眠的有效率有无差异,也用Pearson2χ检验。
经计算2χ=40.044,P=0.000<0.05,可认为三种药物治疗失眠的有效率有差异。
经进一步分析,发现安慰剂治疗失眠的效果最佳。
表7 某地5801人的血型ABO血型MN血型合计M N MNO 431 490 902 1823A 388 410 800 1598B 495 587 950 2032AB 137 179 32 348合计1451 1666 2684 5801 表7为双向无序的表格(即ABO血型无等级差别,MN血型也无等级差别)。
此表的试验设计类似于配对设计(同一观察对象同时观察两个属性。
即同一人既观察ABO血型,又观察MN血型)。
欲分析ABO血型系统与MN血型系统之间有无关联,应先做Pearson2χ检验,2χ=213.626,P=0.000<0.05,可认为ABO 血型系统与MN血型系统之间有关联。
进一步计算列联系数C=0.188,因列联系数(和1相比)不大,故可认为虽然ABO血型系统与MN血型系统之间虽有关联,但联系不是很密切。
表8 三种药物疗效的观察结果药物疗效合计无效好转显效治愈A药 5 31 49 15 100B药22 50 9 4 85C药24 45 15 1 85合计51 126 73 20 270 表8为单项有序列联表(即分组变量为药物,为无序分类变量,结果变量为药物的疗效,为有等级顺学的等级变量)。
欲分析不同药物的疗效有无差异,应用秩和检验而不能像表5那样用2χ检验。
其理由为:如果用2χ检验,则认为疗效的四个等级(无效,好转、显效和无效)之间是平等的,无等级差别,显然是不正确的。
经秩和检验得H=61.146,P=0.000<0.05,可认为A、B、C药物的疗效有差异。
经进一步分析得A药的疗效最好(95%)。
表9 眼晶状体浑浊度与年龄的关系年龄晶状体浑浊程度合计+ ++ +++20~215 67 44 32630~131 101 63 29540~148 128 132 408合计494 296 239 1029 表9为双向有序属性不同的表格(年龄有等级顺序,眼晶状体浑浊程度有等级顺序)。
欲分析不同年龄组眼晶状体浑浊程度有无差异,可把年龄看做无序变量,做秩和检验,经计算得H=68.078,P=0.000<0.05,可认为不同年龄组眼晶状体浑浊程度有差异,经进一步分析得年龄在20~的眼晶状体+所占比例最多(66%);如果欲分析年龄与晶状体浑浊程度之间有无关联,则用Spearman等级相关分析。
经计算得sr=0.253,P=0.000<0.05,可认为年龄与眼晶状体浑浊程度相关,也即年龄越大,眼晶状体浑浊程度越高。
表10 两法检查147例冠心病人室壁收缩运动的符合情况对比法核素法合计正常减弱异常正常58 2 3 63减弱 1 42 7 50异常8 9 17 34合计67 53 27 147 表10为双向有序并且属性相同的表格。
此类表格的特点是双向均为按等级分类,且分类属性相同。
欲分析两种方法检查结果是否一致,应做一致性(Kappa)检验。
经计算,Kappa检验的统计量=11.411,P=0.000<0.05,可认为两种方法检查结果一致,一致率为79.6%。
对上面的内容进行整理,可得出不同分析目的和不同特征表格常用的统计方法见表11。
表11 分类资料常用统计方法总结分类试验设计条件检验方法四格表完全随机设计n≥40且T≥5Pearson 2χ检验(如表1)n≥40且1≤T<5校正2χ检验(如表2)n<40或0<T<1确切概率法(fisher检验)(如表3)配对设计配对2χ检验(McNemar检验)(如表4)R×C表双项无序属性列联表欲分析构成比则2χ检验;欲分析行指标与列指标有无关联,则2χ检验并求列联(相关)系数;(如表5~7)分组变量无序,指标变量有序秩和检验(如表8)分组变量有序,指标变量无序2χ检验双项有序属性不同秩和检验或等级相关分析或线性趋势检验(表9)双项有序属性相同一致性检验(Kappa检验)(表10)总之,对于分类数据(R×C表)的统计分析应根据R×C表中行变量与列变量的性质、分析目的和理论频数的大小等,选用相应的统计分析方法。