(整理)2频数分析列连表.
列频数分布表的一般步骤

列频数分布表的一般步骤
频数分布表是统计学中常用的一种数据汇总和展示方法,通过
频数分布表可以清晰地展现出数据的分布情况,有助于我们对数据
进行更深入的分析和理解。
下面将介绍一般步骤来创建频数分布表。
1. 确定数据的范围,首先需要确定要统计的数据的范围,包括
最小值和最大值。
这有助于确定数据的分组范围和间隔。
2. 划分数据组,根据数据的范围,将数据划分为不同的组别,
每个组别称为一个组。
组的划分可以根据数据的实际情况来确定,
通常采用等距分组或等频分组的方法。
3. 统计每个组的频数,统计每个组别中数据出现的次数,即频数。
可以使用计数器或计算机软件来进行统计,确保数据的准确性。
4. 创建频数分布表,将每个组的范围和对应的频数整理到表格中,形成频数分布表。
表格中应包括组的范围、频数以及可以附加
一些其他统计量,如累积频数、相对频数等。
5. 分析和解释结果,最后,对频数分布表进行分析和解释,可
以通过图表或其他可视化方式展示数据的分布情况,从中找出数据的规律和特点,为进一步的数据分析提供参考。
通过以上一般步骤,我们可以清晰地了解数据的分布情况,为后续的数据分析和决策提供有力支持。
频数分布表是统计学中的重要工具,掌握其制作方法对于数据分析和研究具有重要意义。
基本统计分析(基本统计方法、频数表、列联表、独立性检验、相关性计算)

基本统计分析(基本统计⽅法、频数表、列联表、独⽴性检验、相关性计算)1 基本统计分析1.1 描述性统计分析myvar<-c("mpg","hp","wt")head(mtcars[myvar]) #显⽰数据框的头部信息dat<-mtcars[myvar] #查看数据框1.1.1 ⽅法(1)简单分析:summary()结果分析:计算了最值、分位数、均值等(2)⾃定义函数FUN sapply(dat,FUN)mysta<-function(x,na.omit=F){if(na.omit)x<-x[!is.na(x)] #缺失值删除m<-mean(x)n<-length(x)s<-sd(x) #标准差skew<-sum((x-m)^3/s^3)/n #偏度kurt<-sum((x-m)^4/s^4)/n-3 #风度return(c(n=n,mean=m,stdev=s,skew=skew,kurtosis=kurt))}sapply(dat, mys)1.1.2 ⽅法(1)调⽤包:Hmisclibrary(Hmisc)describe(dat)(2) 调⽤包:pastecslibrary(pastecs)stat.desc(dat)1.1.3 分租计算描述性统计量(1)每次只能返回⼀个统计量 aggregate()aggregate(dat,by=list(am=mtcars$am),mean)解释:aggregate()分组函数,dat分组对象,by=list(am=mtcars$am)根据什么分租,mean分组做什么事情(2)返回多个统计量 by()dsta<-function(x)sapply(x,mysta) #定义函数dsta,直接引⽤sapply(x,mysta)by(dat,mtcars$am,dsta)1.1.4 分组计算的扩展library("doBy")summaryBy(mpg+hp+wt~am,data=mtcars,FUN=mysta )解释:~前⾯mpg+hp+wt是要显⽰的变量,~后⾯是根据am进⾏分组,data指明数据集,FUN指明⽤到的函数1.2 频数表和列联表1.2.1 ⽣成频数表(1)⼀维频数表mytable<-with(Arthritis,table(Improved)) #把变量中的每⼀个取值列出来统计和解释:with第⼀个参数Arthritis是确定数据框(数据集),table()统计频率返回百分⽐:prop.table(mytable)(2)⼆维频数表 xtabs()mytable1<-xtabs(~Treatment+Improved,data=Arthritis) #⽣成列联表(3)边际操作:1代表对⾏操作,2代表对列操作margin.table(mytable1,1) #统计每⾏的和prop.table(mytable1,1) #计算每⾏的百分⽐1.2.2 独⽴性检验(检验数据框中的两列是否相互独⽴)(1)卡⽅检验原假设是相互独⽴的library(vcd)mytable2<-xtabs(~Treatment+Improved,data=dat) #⽣成⼀个列联表mytable2chisq.test(mytable2)结果分析:结果分析:p-value值⼩于0.05,拒绝原假设,说明⽤药与否与病⼈的改善效果不互相独⽴,即有关mytable3<-xtabs(~Sex+Improved,data=dat)mytable3chisq.test(mytable3)结果分析:p-value值⼤于0.05,接受原假设,认为性别与改善效果相互独⽴,即没有关系(2)精确性检验fisher.test(mytable3)结果分析:p-value值⼤于0.05,接受原假设,认为性别与改善效果相互独⽴,即没有关系(3)分层独⽴性检验分男性和⼥性来说,⽤药与改善效果相互独⽴mytable4<-xtabs(~Treatment+Improved+Sex,data=dat) #⽣成列联表mantelhaen.test(mytable4)结果分析:p-value值⼩于0.05,拒绝原假设,⽆论对于男性还是⼥性,⽤药与否对症状的改善都不是相互独⽴的,即该药⽆论是对男性还是⼥性,都是有效果的2 相关2.1 相关性度量mytable2<-xtabs(~Treatment+Improved,data=dat) #⽣成⼀个列联表mytable2assocstats(mytable2)结果:phi系数 phi-Coefficient:只对两个变量有效,即⾏变量两个,列变量也两个列连系数 Contingency Coeff克莱姆系数 Cramer’s v2.2 相关系数的类型(1)Peason相关系数,Spearman相关系数,Kendall相关系数dat<-state.x77 #指定数据集states<-dat[,1:6] #只取前6列cor(states) #列出所有变量两两之间的相关性,默认相关系数为Peason相关系数cor(states,method = "spearman") #指定是Spearman相关系数cov(states) #计算协⽅差矩阵(2)偏相关系数install.packages("ggm")library(ggm)colnames(states) #显⽰出表的列名pcor(c(1,5,2,3,6),cov(states))解释:pcor()计算偏相关系数,c(1,5,2,3,6)在控制第2、3、6列的情况下,计算第1列和第5列的偏相关性,cov(states)协⽅差矩阵2.3相关系数显著性检验原假设变量之间不相关,相关系数是接近于0的cor.test(states[,3],states[,5])结果分析:p-value值⼩于0.05,拒绝原假设,即折两列是相关的,同时也可以看到相关系数 cor ⽐较⾼计算相关系数的另⼀个函数corr.test()library("psych")corr.test(states,use="complete")。
第三章频数及其分布知识点整理

第三章频数及其分布知识点整理在统计学中,频数及其分布是非常重要的概念。
频数是指某一数值在数据集中出现的次数,而频数分布则是描述不同数值出现次数的统计表或图形。
1. 频数和频率频数是指某一数值在数据集中出现的次数,通常用符号f表示。
频率是指频数与总体或样本容量的比值,通常用符号f/n表示,其中n为总体或样本的容量。
2. 频数分布表频数分布表是一种统计表,用于总结和展示数据集中不同数值的频数和频率。
它通常分为两列,一列是数值,另一列是频数或频率。
可以根据具体情况选择按升序或降序排列数值。
3. 频数分布图频数分布图是一种用图形方式展示数据集中不同数值的频数或频率的方法。
常见的频数分布图形包括直方图、饼图和条形图。
4. 直方图直方图是一种用矩形条形表示频数或频率的频数分布图。
横轴表示数值的范围,纵轴表示频数或频率。
每个矩形条形的高度表示对应数值的频数或频率。
5. 饼图饼图是一种用圆形划分扇形区域表示频数或频率的频数分布图。
每个扇形区域的面积或角度表示对应数值的频数或频率。
6. 条形图条形图是一种用长方形条形表示频数或频率的频数分布图。
横轴表示数值,纵轴表示频数或频率。
每个长方形条形的高度表示对应数值的频数或频率。
7. 频数分布的形状频数分布的形状可以反映数据集的分布特征。
常见的频数分布形状包括对称分布、偏态分布和峰态分布。
对称分布指数据集呈现左右对称的形态,偏态分布指数据集在左侧或右侧具有较长的尾部,峰态分布指数据集的形态呈现尖峰或平坦。
8. 分组频数及其分布当数据集较大时,可以对数据进行分组处理,将连续的数值划分为若干个区间,计算每个区间的频数及频率。
这样可以更好地展示数据的特征和规律。
9. 累计频数及其分布累计频数是指某一数值及其前面数值的频数的总和,累计频率则是指某一数值及其前面数值的频率的总和。
累计频数及其分布可以帮助我们更全面地理解数据的积累情况和分布特征。
总结:频数及其分布是统计学中重要的概念,可以帮助我们更好地理解和分析数据集。
描述性统计

探索分析-II
探索分析-III
探索分析-IV
探索分析-V
探索分析-VI
2.4.1列联表分析的功能与意义
SPSS的列联表分析过程(Crosstabs)是通过分
析多个变量在不同取值情况下的数据分布情 况,从而进一步分析多个变量之间相互关系 的一种描述性分析方法。 至少指定两个变量,分别为行变量和列变量, 如果要进行分层分析,则我们还要规定层变 量。 不仅可以得到交叉分组下的频数分布,还可 以通过分析得到变量之间的相关关系。
2.2.2 描述性分析实例
【例2.2】下面的资料给出了山东省某
高校50名大一入学新生的体重。试对该 50名学生的体重进行描述性分析,了解 这50名学生体重的基本特征。 配书资料\源文件\2\正文\原始数据文 件\案例2.2.sav
描述性分析-I
描述性分析-II
描述性分析-III
描述性分析-IV
不同分布的箱线图
2.3.2 探索分析实例
【例2.3】下面的资料给出了天津、济南两
个城市07年各月份的平均气温。试据此对天 津平均气温和济南平均气温进行探索性统计 分析,研究天津平均气温和济南平均气温的 基本特征。 配书资料\源文件\2\正文\原始数据文件\案 例2.3.sav
探索分析-I
2.1.1 频数分析的功能与意义
频数分析过程(Frequencies)是描述性分析中
最基本也是最常用的方法之一。 可以得到详细的频数表以及平均值、最大值 、最小值、方差、标准差、极差、平均数标 准误、偏度系数和峰度系数等重要的描述统 计量,还可以通过分析得到合适的统计图。 不仅可以方便的对数据按组进行归类整理, 还可以对数据的分布特征形成初步的认识。
列联表

n12 12 n22 22
: :
r1 1 r2 2
: :
合计 32 32 60 60 32 32 124 124
20 20 5 5 2 2
10 10 20 20 10 10
2 2 35 35 20 20
c1 1
c2 2
n
n nij i 行第 jj 列的观察频数 ij 表示第 i
合计
27 27
40 40
2.
边缘分布
�ห้องสมุดไป่ตู้�
3.
条件分布
�
�
联合频次分布 (图示)
观察频次
老年 老年 戏曲 戏曲 歌舞 歌舞 球赛 球赛 中年 中年
联合概率分布 (概念要点)
条件频数反映了数据的分布,但不适合进行 对比 为在相同的基数上进行比较,可以计算相应 的百分比,称为联合概率分布
�
y y边缘分布
青年 青年
1.
合计 32 32 60 60 32 32 124 124 x x边缘分布
2.
20 20 5 5 2 2
10 10 20 20 10 10
2 2 35 35 20 20
�
合计
27 27
40 40
57 57
�
X 的条件概率:行的每一个观察频数除以相应 的行合计数( nij / ri) Y 的条件概率:列的每一个观察频数除以相应 的列合计数( nij / cj ) 总概率:每一个观察值除以观察值的总个数( nij / n )
1 1
合计
1 1
1 1
1 1
x x边缘分布
一般只研究控制自变量 x y x之后,因变量 y的条件分 布。
列联表中变量的相互独立性
描述性统计

EX. 未分组数据—箱线图
(box plot)
1. 用于显示未分组的原始数据的分布 2. 由一组数据的5个特征值绘制而成,它由一个箱
子和两条线段组成
3. 绘制方法
首先找出一组数据的5个特征值,即最大值、最小 值 四分、位中数位Q数UM) e和两个四分位数(下四分位数QL和上
探索分析-I
探索分析-II
探索分析-III
探索分析-IV
探索分析-V
探索分析-VI
2.4.1列联表分析的功能与意义
SPSS的列联表分析过程(Crosstabs)是通过分 析多个变量在不同取值情况下的数据分布情 况,从而进一步分析多个变量之间相互关系 的一种描述性分析方法。
至少指定两个变量,分别为行变量和列变量, 如果要进行分层分析,则我们还要规定层变 量。
相关描述统计量主要有平均值、最大值 、最小值、方差、标准差、极差、平均 数标准误、偏度系数和峰度系数等。
2.2.2 描述性分析实例
【例2.2】下面的资料给出了山东省某 高校50名大一入学新生的体重。试对该 50名学生的体重进行描述性分析,了解 这50名学生体重的基本特征。
配书资料\源文件\2\正文\原始数据文 件\案例2.2.sav
意义。
描述性统计分析常用的有:频数分 析、描述性分析、探索分析、列联 表分析。下面我们一一介绍这几种 方法的功能和意义。
2.1.1 频数分析的功能与意义
频数分析过程(Frequencies)是描述性分析中 最基本也是最常用的方法之一。
可以得到详细的频数表以及平均值、最大值 、最小值、方差、标准差、极差、平均数标 准误、偏度系数和峰度系数等重要的描述统 计量,还可以通过分析得到合适的统计图。
对离散型数据进行分析的方法

对离散型数据进行分析的方法离散型数据是指可计数且只能取有限个数值的数据,如性别(男、女)、血型(A、B、O、AB)等。
对离散型数据进行分析,我们可以采用以下几种方法:1.频数分析(Frequency Analysis):频数分析是对离散型数据进行初步描述和总结的方法。
它通过计算每个取值的频数(即该取值出现的次数)来了解各个取值的分布情况。
根据频数可以计算频率或者百分比,以更直观地描述不同取值之间的差异。
2.数据可视化:可视化是离散型数据分析的重要手段,可以更直观地展示数据的分布情况和变化趋势。
对于离散型数据,我们可以使用条形图、饼图等来呈现不同取值的频数或百分比。
此外,还可以使用象形图(Pictographs)来以图像的形式展示数据,从而更容易理解。
3.交叉分析(Cross-tabulation):交叉分析是通过比较不同离散型变量的交叉组合来分析它们之间的关系。
通过构造交叉表,我们可以计算各组合的频数或百分比,进而探寻不同离散变量之间是否存在关联。
交叉分析常用于探索一些变量在不同条件下的分布差异,例如性别与收入水平之间的关系等。
4.卡方检验(Chi-square test):卡方检验是一种常用的统计方法,用于检验两个或多个离散型变量是否相关。
它比较实际观察值与理论期望值之间的差异程度,从而判断两个变量之间是否存在独立性或相关性。
卡方检验可以帮助我们确定两个离散变量之间的统计显著性水平,并得出结论。
5.列联表分析(Contingency table analysis):除了以上方法,对离散型数据进行分析还可以采用回归分析、聚类分析等统计方法。
需要根据具体的情况选择适合的分析方法,以得出准确、有意义的结论。
同时,数据预处理和合理选择变量也是离散型数据分析的重要环节,可以通过数据清洗、特征选择等手段提高分析结果的可靠性和解释性。
spss基本分析

统计分析往往是从了解数据的基本特征开始的。
描述数据分布特征的统计量可分为两类:一类表示数量的中心位置,另一类表示数量的变异程度(或称离散程度)。
两者相互补充,共同反映数据的全貌。
这些内容可以通过SPSS中的“Descriptive Statistics”菜单中的过程来完成。
1 频数分析 (Descriptive Statistics - Frequencies)频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。
下面我们通过例子来学习单变量频数分析操作。
1) 输入分析数据在数据编辑器窗口打开“data1-2.sav”数据文件。
2)调用分析过程在主菜单栏单击“Analyze”,在出现的下拉菜单里移动鼠标至“Descriptive Statistics”项上,在出现的次菜单里单击“Frequencies”项,打开如图3-4所示的对话框。
图3-4 “Frequencies” 对话框3)设置分析变量从左则的源变量框里选择一个和多个变量进入“Variable(s):”框里。
在这里我们选“三化螟蚁螟 [虫口数]”变量进入“Variable(s):”框。
4)输出频数分布表Display frequency tables,选中显示。
5)设置输出的统计量单击“Statistics”按钮,打开图3-5所示的对话框,该对话框用于选择统计量:图3-5 “Statistics”对话框① 选择百分位显示“Percentiles Values”栏:Quartiles:四分位数,显示25%、50%和75%的百分位数。
Cut points for 10 equal groups:将数据平分为输入的10个等份。
Percentile(s)::用户自定义百分位数,输入值0—100之间。
选中此项后,可以利用“Add”、“Change”和“Remove”按钮设置多个百分位数。
② 选择变异程度的统计量“Dispersion”:(离散趋势)Std.deviation 标准差Minimum 最小值Variance 方差Maximum 最大值Range 极差S.E.mean 均值标准误③ 选择表示数据中心位置的统计量“Central Tendency”:(集中趋势)Mean 均值Median 中位数Mode 众数Sum 算术和④ 选择分布指标“Distribution”:Skewness 偏度Kurtosis 峰度6) 统计图形输出设置单击“Charts”按钮,将弹出如图3-6所示的对话框:图3-6 “Charts”对话框① Chart Type 图形选择栏:○ None:不输出图形;○ Bar charts:输出条形图;○ Pie char ts:输出饼图;⊙ Histograms:输出柱状图。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 频数分析 (Descriptive Statistics - Frequencies)频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。
下面我们通过例子来学习单变量频数分析操作。
1) 输入分析数据在数据编辑器窗口打开“data1-2.sav”数据文件。
2)调用分析过程在主菜单栏单击“Analyze”,在出现的下拉菜单里移动鼠标至“Descriptive Statistics”项上,在出现的次菜单里单击“Frequencies”项,打开如图3-4所示的对话框。
图3-4 “Frequencies” 对话框3)设置分析变量从左则的源变量框里选择一个和多个变量进入“Variable(s):”框里。
在这里我们选“三化螟蚁螟 [虫口数]”变量进入“Variable(s):”框。
4)输出频数分布表Display frequency tables,选中显示。
5)设置输出的统计量单击“Statistics”按钮,打开图3-5所示的对话框,该对话框用于选择统计量:图3-5 “Statistics”对话框① 选择百分位显示“Percentiles Values”栏:Quartiles:四分位数,显示25%、50%和75%的百分位数。
Cut points for 10 equal groups:将数据平分为输入的10个等份。
Percentile(s)::用户自定义百分位数,输入值0—100之间。
选中此项后,可以利用“Add”、“Change”和“Remove”按钮设置多个百分位数。
② 选择变异程度的统计量“Dispersion”:(离散趋势)Std.deviation 标准差Minimum 最小值Variance 方差Maximum 最大值Range 极差S.E.mean 均值标准误③ 选择表示数据中心位置的统计量“Central Tendency”:(集中趋势)Mean 均值Median 中位数Mode 众数Sum 算术和④ 选择分布指标“Distribution”:Skewness 偏度Kurtosis 峰度6) 统计图形输出设置单击“Charts”按钮,将弹出如图3-6所示的对话框:图3-6 “Charts”对话框① Chart Type 图形选择栏:○ None:不输出图形;○ Bar charts:输出条形图;○ Pie charts:输出饼图;⊙ Histograms:输出柱状图。
若选中“√With normal curve”项,则在绘制柱状图中加绘一条正态分布曲线。
② 当用户选中条形图或饼图时,在“Chart Values”框的选项中可选择:⊙ Frequencies:绘制频数图。
○ Percentages:绘制频率图。
7)设置频数表格式在图3-4对话框中,单击“Format”按钮,打开如图3-7所示的对话框:图3-7 “Format”对话框① 设置排序的方法“Order by”:⊙ Ascending values:按变量值的升序排列。
○ Descending valus:按变量值的降序排列。
○ Ascending counts:按频数的升序排列。
○ Descending counts:按频数的降序排列。
② 选择多变量输出设置“Multiple Variables ”:⊙ Compare variables 选项,所有变量在一个图形中输出,以便进行比较。
○ Organize output by variables选项,为每一个变量单独输出一个图。
③ 设置在频数表中显示的组数选中此项,输入分组数,系统缺省为10组。
设置完成后,点击“Continue”按钮回到上一级对话框。
8)提交执行在图3-4 对话框里单击“OK”按钮,SPSS在输出窗口的输出结果如表1、表2和图1结果。
9)分析结果表1 统计量表Statistics三化螟蚁螟在表1中列出的信息有:有效观测值有124个,缺失值0个,平均数75.14,标准差7.024。
偏度系数(Skewness)及误差:-0.031和0.221,峰度系数(Kurtosis)及误差:-0.582和0.438。
表2 频数表三化螟蚁螟在表2中列出的信息有:Frequency 频数;Percent 百分比;Valid Percent有效观测值的百分比;Cumulative Percent 累积百分比。
图3-8 频数分布的条形图表示2 列联表分析(Crosstabs)列联表是指两个或多个分类变量各水平的频数分布表,又称频数交叉表。
SPSS的Crosstabs过程,为二维或高维列联表分析提供了22种检验和相关性度量方法。
其中卡方检验是分析列联表资料常用的假设检验方法。
例子:山东烟台地区病虫测报站预测一代玉米螟卵高峰期。
预报发生期y为3级(1级为6月20日前,2级为6月21-25日,3级为6月25日后);预报因子5月份平均气温x1(℃)分为3级(1级为16.5℃以下,2级为16.6-17.8℃,3级为17.8℃以上),6月上旬平均气温x2(℃)分为3级(1级为20℃以下,2级为20.1-21.5℃,3级为21.5℃以上),6月上旬降雨量x3(mm)分为3级(1级为15mm以下,2级为15.1-30mm,3级为30mm以上),6月中旬降雨量x4(mm)分为3级(1级为29mm以下,2级为29.1-36mm,3级为36mm以上)。
数据如下表。
山东烟台历年观测数据分级表()注:摘自《农业病虫统计测报》 131页。
1) 输入分析数据在数据编辑器窗口打开“data1-3.sav”数据文件。
数据文件中变量格式如下:2)调用分析过程在菜单选中“Analyze-Descriptive- Crosstabs”命令,弹出列联表分析对话框,如下图3)设置分析变量选择行变量:将“五月气温[x1],六月上气温[x2],六月上降雨[x3],六月中降雨[x4]”变量选入“Rows:”行变量框中。
选择列变量:将“玉米螟卵高峰发生期[y]”变量选入“Columns:”列变量框中。
4)输出条形图和频数分布表Display clustered bar charts: 选中显示复式条形图。
Suppress table: 选中则不输出多维频数分布表。
5)统计量输出点击“Statistics”按钮,弹出统计分析对话框(如下图)。
Chi-Square: 卡方检验。
选中可以输出皮尔森卡方检验(Pearson)、似然比卡方检验(Likelihood-ratio)、连续性校正卡方检验(Continuity Correction)及Fisher精确概率检验(Fisher’s Exact test)的结果。
Correlations: 选中输出皮尔森(Pearson)和Spearman相关系数,用以说明行变量和列变量的相关程度。
Nominal: 两分类变量的关联度(Association)测量Contingency Coefficient: 列联系数,其值越大关联性越强。
Phi and Cramer’s V:Cramer列联系数,其值越大关联性越强。
Lambda: 减少预测误差率,1表示预测效果最好,0表示预测效果最差。
Uncertainty Coefficient: 不定系数Ordinal: 两有序分类变量(等级变量)的关联度测量Gamma: 关联度,+1表示完全正关联,-1表示负关联,0表示无联。
Somers’d:列联度,其取值范围和意义同上。
Kendall’s tau-b:Nominal by Interval: 一个定性变量和一个定量变量的关联度Eta:关联度统计量。
Kappa:吻合度系数,其取值-1至+1,其值越大吻合程度越高。
Risk:危险度分析。
McNemar:配对计数资料的卡方检验。
Cochran’s and Mantel-Haenszel statistics:检验在协变量存在下,两个二分类变量是否独立。
6) 设置列联表的显示单击“Cells”按钮,弹出列联表显示内容对话框(如下图)。
Counts: 频数Observed: 观测频数。
Expected: 期望频数。
Percentages: 百分比Row: 占本行的百分比。
Column: 占本列的百分比。
Total: 占全部的百分比。
Residuals: 残差分析Unstandardized: 非标准化残差分析。
Standardized: 标准化残差分析。
Adj. Standardized: 调整的标准化残差分析。
Noninteger Weights:⊙ Round cell counts: 临近列计算。
○ Truncate cell counts:。
○ Round case Weights临近记录度量○ Truncate case Weights○ No adjustments: 不调整。
7)设置输出格式单击Format按钮,弹出列联表输出格式对话框(如下图)。
Row Order: 频数⊙ Ascending: 行变量从小到大升序排列。
○ Descending: 行变量从大到小降序排列。
8)设置检验单击“Exact”按钮,弹出精确检验对话框(如下图)。
⊙Asymptotic only 近似的,系统设置。
○Monte CarloConfidence level: 99% 置信度,系统默认99%。
Number of samples: 10000 样本数量,系统默认10000。
○ExactTime limit per test: 5 minutes 限时检验时间,系统默认值5分钟。
9)提交执行设置完成后,在列联表分析对话框中,点击OK 按钮,计算结果输出在结果窗口中。
10)结果与分析在结果窗口中查看计算结果,主要输出内容如下。
五月气温 * 玉米螟卵高峰发生期CrosstabChi-Square Testsa 9 cells (100.0%) have expected count less than 5. The minimum expectedcount is 1.33.(其余的省约)结果分析:从交叉表(Crosstab)对角线中看出,只有“五月气温与玉米螟卵高峰发生期”对角线上出现的频数大于期望值(5>2.7,3>2.0,3>1.3)。
从卡方检验表得知,也只有“五月气温与玉米螟卵高峰发生期”能通过线性间的联合检验(Linear-by-Linear Association),双尾检验p<0.012。
因此,玉米螟卵高峰发生期与五月气温有密切的关系,五月气温越高,发生越早。