实验5 抽样估计的SPSS应用汇总
SPSS讲义05总体参数的估计

§5.3 区间估计
• 两个总体均值估计量的样本均值分别 为170.56和165.60,样本标准差分别为 6.97857 和 7.55659 ; 还 得 到 均 值 的 置 信 区 间 分 别 是 <168.5767, 172.5433>,<163.4524, 167.7476>.
用计算机可以很容易地得到挂面重量的 样本均值、总体均值的置信区间等等. 下面是SPSS的输出:
Descriptives( 描 述 统 计 量 )
结果变量 统计量
weight
Mean( 样 本 均 数 )
统计 量值 449 .0104
标准 误差 .794 35
95% Confidence Interval for MLeoawner B ound( 下 限 ) ( 总 体 均 数 的 95%可 信 区 间 )
§5.4 关于置信区间的注意点
• 一个描述性例子:有10000个人回答的调查 显 示 , 同 意 某 观 点 人 的 比 例 为 70%〔 有 7000 人同意〕,可算出总体中同意该观点的比例 的95%置信区间为〔0.691,0.709〕;
• 另一个调查声称有70%的比例反对该种观点, 还说总体中反对该观点的置信区间也是 〔0.691,0.709〕.
§5.1 用估计量估计总体参数
• 点估计<point estimation>,即用估计 量的实现值来近似相应的总体参数.
• 区间估计<interval estimation>;它 是包括估计量在内〔有时是以估计量 为中心〕的一个区间;该区间被认为 很可能包含总体参数.
【精品】实验5--抽样估计的SPSS应用汇总

实验5--抽样估计的S P S S应用汇总实验5 抽样估计的SPSS应用5.1实验目的根据随机抽样资料,掌握对总体指标做出具有一定可靠性的估计或推断的SPSS实验,并对实验结果做出解释。
5.2相关知识5.2.1. 抽样方法:重复抽样和不重复抽样。
SPSS软件中所采用的抽样方法为不重复抽样,本实验采用不重复抽样方法。
5.2.2. 抽样组织:按照抽取样本单位时是否遵循随机原则,抽样技术可以分为概率抽样和非概率抽样。
其中,概率抽样又称为随机抽样,即按照随机原则抽取样本。
随机抽样的组织形式有:简单随机抽样、类型抽样、等距抽样、整群抽样等,本实验采用简单随机抽样形式。
5.2.3抽样估计方法:点估计和区间估计1. 点估计:用样本统计量的值直接作为总体参数的估计值。
如用样本均值直接作为总体均值的估计值,用样本比率(或成数)直接作为总体比率(或成数)的估计值,用样本方差直接作为总体方差的估计值等。
常用的点估计方法包括:(1)矩估计法;(2)极大似然估计法(3)稳健估计法,本文采用矩估计法。
2. 区间估计:是在点估计的基础上,给出总体参数估计的一个范围,所以区间估计相对于点估计更加精确,要优于点估计。
5.3 实验内容5.3.1建立SPSS数据文件5.3.2利用SPSS软件抽取随机样本,抽样比率为30%。
5.3.3运用SPSS软件,对总体均值进行点估计和区间估计。
5.3.4运用SPSS软件,对各个班级成绩的均值进行点估计和区间估计5.3.5 运用SPSS软件,对总体比率(成数)进行点估计和区间估计。
5.3.6 撰写实验报告。
5.4 实验要求5.4.1准备实验数据2009级财管专业111名学生的概率论课程成绩,见“表5-1 2009级财管学生概率课成绩.xls”。
5.4.2 完成实验任务,对实验结果做出简要分析。
1.依据样本学生的概率论成绩,采用点估计和区间估计的方法,推断学生总体概率论课程的平均成绩,置信水平为90%。
SPSS第5章 总体分布、样本分布与参数估计(修改)解读

思考:请举出总体均值和总体方差的合适估计量。
§ 5.2 统计量与统计量的分布
一、统计量的定义
统计量:统计量是不含未知参数的,随机样本X1,X2,· · · , Xn的函数。 统计量的值: 统计量的值是不含未知参数的, 样本观测值x1, x2,· · · ,xn的函数.
二、几个重要统计量分布:2、t 与 F分布 1、 2(n)分布
第五章 总体分布、 样本分布与参数估计
§ 5.1 总体分布与样本分布
一、总体与总体分布 总体:反映总体特征的随机变量的取值的全体。 总体分布:反映总体特征的随机变量的概率分布。 二、随机样本与样本观测值 1、随机样本
表征n次抽取个体的随机抽样的一组随机变量X1,X2,· · · , Xn 。
2、样本观测值(样本数据)
频率
频率 累积
%
接收
3、样本(累积)分布函数
设样本观测值x1 x2 ,· · · , xn,ki为小于xi+1的样本值出现的累积频 次, n为样本容量,则可得样本累积频率分布函数如下:
0 当x x1 Fn ( x ) k i / n 当xi x xi 1 1 当x n x
重要性质:
1 F1 (m, n) F (n, m)
三、由一般正态分布的随机样本所构成的若干重要统计量的分布
定理:若X1,X2,· · · , Xn 是正态总体N(, 2)的一个随机样本, 则: (1) X ~N(, 2 / n)
(2) X 与 S2 相互独立。
(3) (4) (5)
频率 累积 %
Q:若有放回地抽取2次,请画出两次均值的分布图。
频率
有放回(with replacement)抽样
SPSS第5章 总体分布、样本分布与参数估计(修改)解读

X Y n
~ t(n )
其中,X ~ N(0,1),Y ~2(n)分布,且X与Y相互独立。 密度函数为:
n 1 ) 2 n 1 x 2 fn(x ) (1 ) 2 n n (n / 2) x
(
t 分布图
3、F 分布
F
U m V n
~ F (m ,n )
频率
频率 累积
%
接收
3、样本(累积)分布函数
设样本观测值x1 x2 ,· · · , xn,ki为小于xi+1的样本值出现的累积频 次, n为样本容量,则可得样本累积频率分布函数如下:
0 当x x1 Fn ( x ) k i / n 当xi x xi 1 1 当x n x
{X i , X j }
X
10 5
8
{7,8} 7.5 {10,8} 9
{8,7} 7.5 {7,7} 7 {10,7} 8.5
一个样本统计量的概率分布被称为该统计量的抽样分布
样本均值抽样分布 直方图
10 150.00% 100.00% 5 50.00% 0 6 7 8 9 10 其他 0.00%
样本(累积)分布函数Fn(x)是对总体的累积分布函数F(x)的近似, n越大, Fn(x)对F(x)的近似越好。
格利文科 ( Glivenko )定理
当样本容量 n 趋于无穷大时,Fn(x)以概率1(关于 x )均匀地收敛于F(x).
P(lim sup
n x
Fn ( x) F ( x) 0) 1
ˆ ˆ( X , X ,, X ) 1 2 n 则称ˆ 为的估计量。
若得到一组样本观测值x1,x2,· · · ,xn ,就可得出的估计 ˆ ˆ( x , x ,, x ) 。 值,记: 1 2 n 总体分布参数 的点估计,就是求出 的估计值。
手把手教你SPSS实现随机抽样的两种方法

手把手教你SPSS实现随机抽样的两种方法我们在进行科学研究时,常常会强调一个非常重要的概念——“随机化”。
随机化的过程主要分为两大类:随机抽样和随机分组,它们在样本选取和分组方案中占有至关重要的地位。
随机化按照数学概率的原理,使研究对象有同等的机会被抽中或被分配到某一处理组,结果不受人为因素的干扰和影响。
如果没有遵循随机化的原则,抽取了一个有偏的样本,或者分组不均衡,这样即使得出了结论,也无法推论到总体,因此随机化是提高样本代表性及组间均衡性的重要方法,随机化过程的优劣直接关系到研究结果的可靠性。
随机化的概念虽然早已深入人心,但是在具体的随机化操作过程中,很多研究者往往误把“随便”“随意”当成“随机化”,从而形成“伪随机化”的假象,归根结底还是因为大家并不清楚到底该如何有效的实现随机化。
为此,小咖打算专门用几期的内容,向大家分别介绍一下随机抽样和随机分组的内容以及软件实现过程。
随机抽样随机抽样,即遵循随机化原则,保证总体中每个个体都有独立的、已知的、非零的概率被抽中作为研究对象。
若样本量足够大,数据代表性好,随机化效果好,调查结果则会更可靠,可以将抽样结果推论到总体。
常用的随机抽样方法主要包括简单随机抽样、系统抽样、分层抽样、整群抽样和多阶段抽样。
1. 简单随机抽样(也叫单纯随机抽样,simple random sampling)简单随机抽样是最简单、最基本的抽样方法。
它是从总体N个样本的抽样框中,不考虑样本之间的任何关系,完全随机地依次地抽取n 个样本,构成一个抽样样本。
它的特点是:每个样本被抽中的概率相等,样本之间完全独立,彼此没有一定的关联性和排斥性。
简单随机抽样方法是其它各种抽样形式的基础,通常用在总体之间差异程度较小,且总体数量有限、数目不是太大的情况下。
如果总体数量太大,编号工作就较为繁重,抽到的样本也较为分散,导致资料收集困难。
2. 系统抽样(也叫机械抽样或等距抽样,systematic sampling)系统抽样就是先将总体(N)的各个样本按照一定的顺序进行排列,根据抽样容量(n)的要求来确定抽样间隔(K=N/n),然后在第一组中随机确定一个起点,从该起点开始机械地每间隔K个距离依次抽取样本,直到抽够n个样本为止。
实验五 SPSS数据文件管理

示的是第二个文件中与第一个文件相同的变量,【+】表示该变量是第二个合并文件的变 量。选择数据合并方式,并指定【关键变量】。(关键变量为两个文件合并的依据)
横向合并数据方式
SPSS有三种横向合并数据的方式:
1、 两个文件都提供个案 SPSS的默认方式,指合并后的数据包括原来两个文件的数据。 2、外部文件是关键表 这种合并方式,在当前数据编辑窗口中的数据基础上,仅合并第二个文件 的变量,而不合并数据,合并后文件中的数据为第一个文件的数据。 3、工作数据文件是关键表 这种合并方式,是在第二个文件的基础上,将目前数据编辑窗口中的其它变 量合并进来,合并后文件中的数据为第二个文件的数据。
统计学实验—SPSS与R软件应用与实例-第16章抽样调查理论与方法-R
2020/3/3
2
x
n
《统计学实验》第16章抽样调查理 论与方法
16-10
【软件操作】
用Sampling程序包里的srswr( )函数作简单随机抽样
library(sampling) # 调入sampling程序包
library(lpSolve) # 调入lpSolve程序包
setwd("D:/R-Statistics/data/chap-16") # 设定工作路径
2020/3/3
《统计学实验》第16章抽样调查理 论与方法
16-25
16.4 整群抽样方法
【例16.4】(数据文件为li16.1.txt) 某大学会计学院 为了解学生月平均生活水平的基本情况,准备用整
群抽样方法从全学院 N2850个学生中抽选100个
学生组成的样本进行调查。
TRUE),matrix(rep("09",550),550,1,byrow=TRUE), matrix(rep("10",650),650,1,byrow=TRUE), matrix(rep("11",1050),1050,1,byrow=TRUE)) # 产生一列标示变量,
2020/3/3
《统计学实验》第16章抽样调查理 论与方法
s=UPsystematic(pik) # 依据编号的入选概率作系统 抽样
as.vector(name[s= =1]) # 列出选中学生的姓名
2020/3/3
《统计学实验》第16章抽样调查理 论与方法
16-24
运行结果
运行后抽选的100名学生为 [1] "严子云" "李建伟" "张映琼" "陈泓卓" "曹颖"
统计学实验—SPSS与R软件应用与实例-第8章抽样调查理论与方法-SPSS
2. 统计软件SPSS16.0或更高版本。
01.04.2021
《统计学实验》第8章抽样调查理
8-4
论与方法
三、实验内容
1. 简单随机抽样调查方法 2. 分层随机抽样调查方法 3. 等距抽样调查方法 4. 整群抽样调查方法
cases→Delete unselected cases→Sample→Exactly 然后在左边的空白框里输入1,右边的空白框里输入
01.04.2021
《统计学实验》第8章抽样调查理 论与方法
8-24
图8.13 四个年级100个学生组成的分层随机抽样样本图
01.04.2021
《统计学实验》第8章抽样调查理 论与方法
8-25
分层随机抽样步骤的菜单方式
第四步:先调查每个年级(层)抽出学生的月平均生活水平,见 数据文件li8.2.1.1、li8.2.2.1、li8.2.3.1和li8.2.4.1;再利用 SPSS软件得出每个年级学生月平均生活水平的标准差;最后 根据公式计算分层随机抽样的抽样平均误差。
《统计学实验》第8章抽样调查理 论与方法
8-31
【统计理论】
等距抽样是将总体中的所有单元(抽样单元) 按一定顺序排列,在规定的范围内随机地抽 取一个单元作为初始单元,然后按事先规定 好的规则确定其它样本单元。这种抽样方法 又称为机械抽样,一般也称为系统抽样( Systematic sampling)。
选择Data→Merge Files→Add Cases→Browse
打开外部SPSS数据文件li8.2.2.1.sav→点击Continue→点击 OK。即可得到2019级和2009级抽选出的50个学生组成的随机 样本
SPSS操作归纳总结(全)
SPSS操作归纳总结一、成绩分析(集中量和差异量)如:某校高一甲板40名学生的化学测验分数操作:Analyze——Descriptive Statistics—Frequencies(频数)二、相关量1、积差相关系数如:40名学生的数学和化学成绩操作:Analyze——Correlate(相关)——BIvariate(双变量)结论:在0.01水平上学生的化学成绩与生物成绩相关,也就是说我们有99%的把握说学生的化学成绩与生物成绩密切相关。
分析:若Sig.(2-tailed)的值<0.05,则相关程度密切若Sig.(2-tailed)的值<0.01,则相关程度非常密切若Sig.(2-tailed)的值>0.05,则相关程度不密切2、点双列相关系数如:求若干名考生的生物成绩与性别之间的相关系数,并判断他们之间有无相关关系?操作:Analyze——Correlate(相关)——BIvariate(双变量)分析:Sig.(2-tailed)的值>0.05,则相关程度不密切。
结论:在0.05水平上学生的生物成绩与性别无密切相关,也就是说我们没有95%的把握说学生的生物成绩与性别密切相关,或者说学生的生物成绩和性别无密切关系。
3、等级相关系数如:高考总分与生物等级、化学等级的相关操作:Analyze ——Correlate (相关)——BIvariate (双变量)注:相关系数为负值,说明为负相关,正值为正相关,而且绝对值越大,相关性越大。
该题中男表示为1,女表示为0,该结果为负值,说明女的成绩好,而男的成绩不好。
分析:Sig.(2-tailed)的值>0.05,则相关程度不密切。
结论:在0.05水平上学生的三科总分与物理等级无密切相关,也就是说我们没有95%的把握说学生的三科总分与物理等级密切相关,或者说学生的三科总分与物理等级无密切关系。
补充:“物理等级”转换成“等级数”操作:Transform——Recode——Into different variables三、考试质量的分析1、难度分析(P)Analyze——Descriptive Statistics—Frequencies结论:客观题的难度P ——直接看得分的valid percent主观题的难度P——mean 除以该题的总分值2、区分度分析(1)用相关系数法求试题的区分度某一题的得分与该生总分的相关程度作为该题的区分度。
spss实验报告总结
spss实验报告总结SPSS实验报告总结引言:SPSS(Statistical Package for the Social Sciences)是一款广泛应用于社会科学领域的统计分析软件。
本实验报告将对使用SPSS进行数据分析的过程进行总结,包括实验设计、数据收集、数据处理和结果分析等方面。
实验设计:本次实验旨在研究A市不同年龄段居民的消费习惯。
为此,我们采用了问卷调查的方法,设计了一份包含消费项目和年龄段的问卷,并在A市不同地区随机抽取了500名居民作为样本。
数据收集:在数据收集阶段,我们在A市的各个社区设置了问卷发放点,向居民发放了问卷并进行了解答。
为了提高问卷的有效性,我们还进行了问卷前的预测试,对问卷进行了修改和完善。
数据处理:在数据处理阶段,我们首先对收集到的问卷进行了筛选和整理,剔除了填写不完整或无效的问卷。
然后,我们使用SPSS软件将问卷数据进行了录入和清洗,确保数据的准确性和完整性。
结果分析:在结果分析阶段,我们使用SPSS软件对数据进行了描述性统计和推断性统计分析。
首先,我们计算了不同年龄段居民在各个消费项目上的平均消费金额,并绘制了柱状图进行可视化展示。
然后,我们使用t检验和方差分析等方法,对不同年龄段居民的消费习惯进行了比较和分析。
根据我们的分析结果,我们得出了以下几点结论:1. 不同年龄段居民在消费习惯上存在差异。
年轻人更倾向于消费电子产品和时尚服饰,而中年人更注重家庭生活和教育支出,老年人则更关注健康和养老等方面。
2. 年龄段对消费金额的影响存在显著差异。
通过t检验分析,我们发现不同年龄段居民在某些消费项目上的平均消费金额存在显著差异,这对商家的市场定位和推广活动具有重要意义。
3. 不同地区的消费习惯存在差异。
通过方差分析,我们发现不同地区居民在某些消费项目上的平均消费金额存在显著差异,这可能与地区的经济发展水平和文化背景等因素有关。
结论:通过本次实验,我们利用SPSS软件对A市不同年龄段居民的消费习惯进行了研究和分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验5 抽样估计的SPSS应用5.1实验目的根据随机抽样资料,掌握对总体指标做出具有一定可靠性的估计或推断的SPSS实验,并对实验结果做出解释。
5.2相关知识5.2.1. 抽样方法:重复抽样和不重复抽样。
SPSS软件中所采用的抽样方法为不重复抽样,本实验采用不重复抽样方法。
5.2.2. 抽样组织:按照抽取样本单位时是否遵循随机原则,抽样技术可以分为概率抽样和非概率抽样。
其中,概率抽样又称为随机抽样,即按照随机原则抽取样本。
随机抽样的组织形式有:简单随机抽样、类型抽样、等距抽样、整群抽样等,本实验采用简单随机抽样形式。
5.2.3抽样估计方法:点估计和区间估计1. 点估计:用样本统计量的值直接作为总体参数的估计值。
如用样本均值直接作为总体均值的估计值,用样本比率(或成数)直接作为总体比率(或成数)的估计值,用样本方差直接作为总体方差的估计值等。
常用的点估计方法包括:(1)矩估计法;(2)极大似然估计法(3)稳健估计法,本文采用矩估计法。
2. 区间估计:是在点估计的基础上,给出总体参数估计的一个范围,所以区间估计相对于点估计更加精确,要优于点估计。
5.3 实验内容5.3.1建立SPSS数据文件5.3.2利用SPSS软件抽取随机样本,抽样比率为30%。
5.3.3运用SPSS软件,对总体均值进行点估计和区间估计。
5.3.4运用SPSS软件,对各个班级成绩的均值进行点估计和区间估计5.3.5 运用SPSS软件,对总体比率(成数)进行点估计和区间估计。
5.3.6 撰写实验报告。
5.4 实验要求5.4.1准备实验数据2009级财管专业111名学生的概率论课程成绩,见“表5-1 2009级财管学生概率课成绩.xls”。
5.4.2 完成实验任务,对实验结果做出简要分析。
1.依据样本学生的概率论成绩,采用点估计和区间估计的方法,推断学生总体概率论课程的平均成绩,置信水平为90%。
2.依据样本信息,推断该课程成绩80分及以上的学生比率,置信水平为90%。
3.分析实验结果,提交实验报告。
5.5实验步骤5.5.1 建立SPSS数据文件通过SPSS软件打开Excel表,即表“5-1 2009级财管学生概率成绩.xls”。
第一步:选择菜单“文件→打开→数据”,弹出如图5-1所示的“打开数据”对话框。
图5-1 “打开数据”对话框→在“文件类型(T):”中选择“Excel”,在“查找范围(L):”中找到要读取的Excel文件“5-1 2009级财管学生概率成绩.xls”→单击【打开】按钮第二步:在打开的SPSS数据编辑窗口的变量视图下定义变量的类型→单击工具栏的“保存”,在弹出的“将数据保存为”对话框(如图5-2)中,在“查找范围(L):”中找到要保存文件的位置,在“文件名(N):”中输入要保存的文件名“5-1成绩”,单击【保存】按钮,至此完成SPSS数据文件“表5-1,2009财管1-4班概率成绩.sav ”的建立与保存。
图5-2 “将数据保存为”对话框5.5.2抽取随机样本用简单随机不重复抽样方法抽样,抽样比例为30%。
SPSS的随机抽样抽取的方式有两种:其一,近似抽样:即用户给出一个百分比数值,SPSS将按照这个比例自动从数据编辑窗口中随机抽取相应百分比数目的个案,抽取的个案数不一定精确地等于用户指定的百分比,会有小的偏差,但这种偏差不会对数据分析产生重要影响。
其二,精确抽样:要求用户给出两个参数,第一个参数是希望选取的个案数,第二个参数是指定在前几个个案中选取。
本实验在这里选择“近似抽样”的方式抽取随机样本。
第一步:打开数据文件“表5-1,2009财管1-4班概率成绩.sav ”,在菜单选择“数据”→“选择个案”,得到“选择个案”对话框→选择【随机个案样本】按钮,如图5-3。
图5-3 “选择个案”对话框第二步:在“选择个案”对话框中,单击【样本(S…)】按钮,得到“选择个案:随机样本”对话框→选择【大约(A)】选项,输入数字“30”→点击[继续]按钮,如图5-4。
图5-4 选择个案:随机样本对话框第三步:在“选择个案”对话框中,在“输出”框中选择【将选定个案复制到新数据集(O)】按钮→在“数据集名称(S):”后面的框内输入文件名字“样本”→点击【确定】按钮,如图5-5。
图5-5 “选择个案”对话框此时将得到新生成的样本数据文件,将此文件进行保存到指定的位置,且命名为“样本.sav”。
综上,通过采用近似随机抽样方法,从111名学生中抽样30%的学生作为样本,得到SPSS样本数据文件,即“2009级财管学生概率成绩样本数据文件.sav ”,样本容量为42。
5.5.3对总体均值进行点估计和区间估计第一步:打开SPSS样本数据文件“2009级财管学生概率成绩样本数据文件.sav”,依次选择【分析】→【描述统计】→【探索】按钮,得到“探索”对话框。
将“成绩”选入“因变量列表”框内,在“输出”框内选择“统计量”选项,如图5-6。
图5-6 “探索”对话框第二步:单击【统计量】按钮,选择“描述性”选项,在“均值的置信区间(C):”框内输入“90”,单击【继续】按钮,如图5-7。
(注意:如果只进行点估计,不需要给出置信度,因此就不需要此步骤了)图5-7 探索:统计量对话框第三步:再返回到“探索”对话框中,如图5-8。
图5-8 “探索”对话框第四步:单击【确定】按钮,系统输出结果如表5-1。
从表5-1可以看出,样本均值为85.7857,根据统计学原理,在合理估计的假设前提下,点估计是把样本均值或是成数直接作为总体的均值或是成数。
因此,以上计算的样本均值85.7857分可以作为总体均值的估计值,即估计的111名学生的概率论课程成绩为85.7857分;在90%的置信度下,对2009级111名财管专业学生的概率论课程平均成绩进行区间估计,其区间范围在[82.6593,88.9121]之间。
5.5.4对各个班级成绩的均值进行点估计和区间估计如果按某一标志分组(如以班级为标志分组)的各班进行参数估计,这为各个班级之间的比较提供了方便。
平均成绩的区间估计实现有“频率”、“描述”、“探索”、“均值”等过程,学生自行练习“描述”过程的操作方法(“描述”过程的操作路径为:“分析”→“描述统计”→“描述”)。
(注意:在“频率”、“描述”实现方法中只能对总体进行估计,不能一步实现对各班进行估计,“探索”则可以一步实现各班的估计。
)这里主要介绍“均值”过程的实现方法。
第一步:打开样本数据文件“2009级财管学生概率成绩样本数据文件.sav”,”,依次选择“分析”→“比较均值”→“均值”,得到“均值”对话框。
图5-9 “均值”对话框→将“成绩”选入“因变量列表(D):”框内→将“班级”选入“自变量列表”框内,如图5-10。
图5-10 “均值”对话框第二步:单击【选项(O)…】按钮,得到“均值:选项”对话框,图5-11 “均值:选项”对话框→在“统计量(S):”框中,将“均值、方差、标准差”选入到“单元格统计量(C):”框中→单击【继续】按钮。
图5-12 “均值:选项”对话框第三步:在“均值”对话框中,单击【Bootstrap(B)…】按钮,得到“Bootstrap”对话框,图5-13 “Bootstrap”对话框→在“Bootstrap”对话框中,选择“执行bootstrap”→在“样本数(N):”框中输入“42”→在“置信区间”中的“水平(%)(D):”框中输入“90”→在“抽样”框内选定“分层(T)”选项,在“变量(V):”中将变量“班级”移入到右边的“分层变量(R):”框中→单击【继续】按钮(说明:本次样本容量为42,置信水平为90%)图5-14 “Bootstrap”对话框第四步:再返回到“均值:选项”对话框中,单击【确定】按钮,输出结果见表5-2。
由表5-2可以看出:(1)选取容量为42的样本,以90%的置信水平下,对2009级111名财管专业学生的概率论课程平均成绩进行区间估计,其区间范围为[83.2840,88.1233];(2)还可以看出对各个班级的概率论课程平均成绩的区间估计结果:财管1班平均成绩的区间范围为[92.4880,95.7162],财管2班平均成绩的区间范围为[85.3753,92.6667],财管3班平均成绩的区间范围为[71.0687,81.2197],财管4班平均成绩的区间范围为[71.1796,89.5364]。
可见,以上实验过程不仅给出了总体的参数估计结果,同时还给出了按某一变量分组(如以班级为变量分组)的各班参数估计值,这为各个班级之间成绩的比较提供了方便。
5.5.5对总体比率(成数)进行点估计和区间估计(该估计由学生自己完成)估计总体比率(成数),需要对成绩分组,其方法有两种:“可视离散化”和“重新编码”过程进行组距式分组。
在此以“可视离散化”方法为例,说明总体比率(成数)的估计过程。
1. 用“可视离散化”方法对成绩分组,说明总体比率(成数)的估计过程。
Step①:打开样本数据文件“2009级财管学生概率成绩的SPSS样本数据文件.sav””。
在SPSS界面的数据编辑菜单中,选择【转换(T)】→【可视离散化(B)】,进入“可视化封装”变量选择(对话框略)。
Step②:选择“成绩”变量进入“要离散的变量(B)”框中(对话框略)→单击【继续】按钮,进入到“可视化封装”分割点设置对话框(对话框略)。
Step③:给分组后的变量命名。
在“可视化封装”分割点设置对话框中,在分割点设置对话框的“离散的变量(B):”两个框后,分别输入“成绩分组(或成绩分段)”和“成绩(离散化)”作为离散化变量的名称和标签。
在右下方处“上端点”点击“排除(E)( < )”(对话框略)。
Step④:设置分割点。
直接点击分割点设置对话框右下方的【生成分割点(M)…】按钮,得到“生成分割点”对话框(窗口略)→在“生成分割点”对话框中,在“等宽度间隔(E)”下的“第一个分割点的位置(F)”后的框中输入80,在“分隔点数量(N)”后的框中输入1,在“宽度(W)”后的框中输入20,单击【应…】按钮(对话框略)。
Step⑤:生成分组标签。
在分割点设置对话框的“网络(G)”区域的“值(V)”第一列输如分割点值80,在“标签”第一列输入值“0”;在“值(V)”第二列“HIGH”位置处输如分割点值80,在“标签”第二列输入值“1”。
单击“可视化封装”对话框中右下方的【生成标签(A)】按钮,系统自动生成分组标签。
(对话框略)。
Step⑥:单击【确定】按钮,弹出图5-15 的对话框,单击【确定】按钮,即可在数据文件中生成新变量“成绩分组”。
图5-15对话框Step⑦:回到数据编辑界面,在数据编辑菜单中点击菜单“分析(A)”→描述统计→频率(F)(对话框略)→将“成绩(已离散化)【成绩…”选进“变量(V)”框中,见图5-16所示。