spss统计软件练习题及答案

spss统计软件练习题及答案
spss统计软件练习题及答案

1、去年某企业每天平均生产元件105个,今年改进了生产技术随机抽取15天进行测量,结果为 208 112 202 108 210 106 206 204 118 112

116 210 114 104 214

假定生产从正态分布,能否判断今年的产量是否是去年的两倍(a=0.05)

步骤:输入数据后,从菜单栏选择“分析”→“比较均值”→“单样本T检验”命令,打开“单样本T检验”

对话框。

(1)将变量产量选入“检验变量”列表框。

(2)在“检验值”框中输入已知去年元件产量的平均数105。

(3)单击“确定”按钮,完成设置并执行上述操作。

单个样本统计量

N 均值标准差均值的标准误

元件个数15 156.27 50.005 12.911

分析:样本数量为15,均值为156.27,标准差为50.005,均值的标准误差为12.911

分析:显著性水平为0.001小于0.05,所以认为今年的产量不是去年的两倍。

2、一生产商想比较两种汽车轮胎A和B的磨损质量。在比较中,选A和B型轮胎组成一对后任意安装在7辆汽车的后轮上,然后让汽车运行指定的英里数,记录下每只轮胎的磨损量。数据如下:

汽车 1 2 3 4 5 6 7

轮胎A 9.6 10.8 11.3 10.7 8.2 9.0 11.2

轮胎B 8.2 9.4 11.8 9.1 9.3 11.0 13.1

这两种轮胎的平均磨损质量存在显著差异吗?

步骤:

(1)输入数据,执行“分析”→“比较均值”→“配对样本T检验”命令,打开“配对样本T检验”对话框。(2)在“置信区间百分比”框内输入置信度95%,然后单击“继续”按钮确认,返回主对话框。

(3)单击“确定”按钮,完成设置并执行配对样本T检验。

轮胎A的均值10.114 小于轮胎B的均值10.271。

成对样本相关系数

N 相关系数Sig.

对 1 轮胎A & 轮胎B 7 .457 .303

相关系数为0.457,认为轮胎之间相关性大

显著性水平为0.804,大于0.01,接受原假设,认为两个轮胎的平均磨损质量之间无显著性差异。

3、某地一年级12名女大学生的身高、体重与肺活量数据如下,试建立体重与身高、肺活量间的线性回归方程。

操作步骤:

(1)从菜单栏中选择“分析”→“回归”→“线性”,将“体重”选入“因变量”,将“身高”“肺活量”选入“自变量”。

(2)单击“统计量”按钮,选择“置信区间”输入95,选择“描述性”和“个案诊断”并选择“所有个案”,单击继续。

(3)单击“绘制”按钮,选用DEPENDENT和*ZPEAD,并选择“直方图”和“正态概率图”,单击继续。

(4)单击“确定”按钮,并进行线性回归分析。

体重和身高分析:

描述性统计量

均值标准偏差N

体重49.4167 5.08935 12

身高160.5833 3.77692 12

肺活量 2.8942 .41745 12

体重的均值为49.41,身高的均值为160.58,肺活量的均值为2.89

相关性

体重身高肺活量

Pearson 相关性体重 1.000 .771 .800

身高.771 1.000 .640

肺活量.800 .640 1.000

Sig. (单侧)体重. .002 .001

身高.002 . .012

肺活量.001 .012 .

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级 xxx班姓名 xxx 学号 xxx 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。

分析: 描述统计量 性别N极小值极大值均值标准差 男数学477.0085.0082.2500 3.77492有效的 N (列表状态)4 女数学1667.0090.0078.50007.09930有效的 N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

统计学作业答案

1. 一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该 电信的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务 的大客户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前 好。试在95%的置信水平下对大客户中认为营业厅现在的服务质量较两年前 好的比率进行区间估计。 4.据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房 者中本地人购房比率p 的区间估计,在置信水平为10%下,其允许误差E = 0.08。则: (1)这80名受访者样本中为本地购房者的比率是多少? (2)若显著性水平为95%,则要保持同样的精度进行区间估计,需要调查 多少名购房者。 解:这是一个求某一属性所占比率的区间估计的问题。根据已知n =30,2 /αz =1.96,根据抽样结果计算出的样本比率为%30309?==p 。 总体比率置信区间的计算公式为: ()n p p z p ?1??2/-±α 计算得: ()n p p z p ?1??2/-±α=30%()30 %301%3096.1-??± =(13.60%,46.40%) 5、某大学生记录了他一个月31天所花的伙食费,经计算得出了这个月平均每天 花费10.2元,标准差为2.4元。显著性水平为在5%,试估计该学生每天平 均伙食费的置信区间。 解:由已知:=x 10.2,s =2.4,96.1025.0=z ,则其置信区间为: 314 .296.12.10025.0?±=±n s z x =〔9.36,11.04〕。 该学生每天平均伙食费的95%的置信区间为9.36元到11.04元。

6、据一次抽样调查表明居民每日平均读报时间的95%的置信区间为〔2.2,3.4〕 小时,问该次抽样样本平均读报时间t 是多少?若样本量为100,则样本标准 差是多少?若我想将允许误差降为0.4小时,那么在相同的置信水平下,样 本容量应该为多少? 解:样本平均读报时间为:t = 24.32.2+=2.8 由()96 .121002.24.322.24.305.0?-=?-==s n s z E =3.06 2254 .006.396.122 22205.02=?=?=E s z n 7、某电子邮箱用户一周内共收到邮件56封,其中有若干封是属于广告邮件,并 且根据这一周数据估计广告邮件所占比率的95%的置信区间为〔8.9%, 16.1%〕。问这一周内收到了多少封广告邮件。若计算出了20周平均每周收 到48封邮件,标准差为9封,则其每周平均收到邮件数的95%的置信区间 是多少?(设每周收到的邮件数服从正态分布) 解:本周收到广告邮件比率为:p =2 161.0089.0+=0.125 收到广告邮件数为:n ×p =56×0.125=7封 根据已知:x =48,n =20,s =9,093.2)19(025.0=t ()199 093.24819025.0?±=±n s t x =[43.68,52.32] 8、为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅 办理该业务的柜台办理每笔业务的时间,随机记录了15名客户办理业务的时间,测得平均办理时间为t =12分钟,样本标准差为s =4.1分钟,则: (1)其95%的置信区间是多少? (2)若样本容量为40,而观测的数据不变,则95%的置信区间又是多少? 解:(1)根据已知有()145.214025.0=t ,n =15,t =12,s =4.1。 置信区间为:()151 .4145.21214025.0?±=±n s t t =〔9.73,14.27〕

心理和教育统计学课后题答案解析

张厚粲现代心理与教育统计学第一章答案 1名词概念 (1 )随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。 (2)总体 答:总体(population )又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability), 概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理 与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论 找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计 算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主 要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观 事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。 凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理 与教育现象是一种客观存在的事物,它也有数量的表现。虽然心理与教育测量具有多变性而 且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的。因此,在进行 心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与 教育统计就是对心理与教育问题进行定量分析的重要的科学工具。 ③广大心理与教育工作者学习心理与教育统计学的具体意义。 a. 可经顺利阅读国内外先进的研究成果。 b. 可以提高心理与教育工作的科学性和效率。

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级XXX 班姓名XXX 学号XXX ____________ 1. 2. 考试时间为100分钟; 3. 每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav ;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav ”与“学生成绩二.sav ”合并,并保存为“成绩.sav. ” (2)对所建立的数据文件“成绩.sav ”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X > 85),良(75 < X < 84),中(X < 74),并对优良中的人数进行统计

分析: (2) 描述统计量

性别:rj sxcj 11391.0090.0061.00242.0D 1.00 r 214女91.0090.0061 Q0242,00 1.D0 31女95.0079.0065.00239.03200匸4Q女95.0079.0065 00239.00 2.D0 53立92.00B4.0062.00230.00200 S 4 女92.0084.0062 00238.00 2.00 79女眨00S2.0062.00236.00200 310女92.0002.0062 0023G.OO 2 DO 95男39.00S5.0D69 00233.03 1.00 10E男39.0085.0059 00233.00 1.00 1111立9U.OO SO.OO60.00230.0J200「1212女90.0080.0060 00230.00 2.00 1319立眨0075.0062.00229.03200 20女92.0076.00G2 00229.00 2 DO 1 1516男SB.00B2.0053.00220.03200 15男38.0077.0068 00223.00200 1 1717女91.0071.00 61 00223.00 3.00 女91.0071.0061 00223.03 3.00 1016 1 19 1女89.0067.0059 00215.00 3.00 202女39.0067.0069 00215.0J 3. DO 注:成绩优良表示栏位sxcj 优为1良为2中为3 由表统计得,成绩为优的同学有4人,占总人数的20%良的同学有12人,占总人数的60%中的同学有4人,占总人数的40% 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进 行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调 查.exe ”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查.Sav ”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

教育统计学复习题及答案

《教育统计学》复习题及答案一、填空题 1.教育统计学的研究对象是.教育问题。 2.一般情况下,大样本是指样本容量.大于30 的样本。 3.标志是说明总体单位的名称,它有.品质标志和数量标志两种。 4.统计工作的三个基本步骤是:、和。 5.集中量数是反映一组数据的趋势的。 6.“65、66、72、83、89”这组数据的算术平均数是。 7.6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是。 8.若某班学生数学成绩的标准差是8分,平均分是80分,其标准差系数是。 9.参数估计的方法有和两种。 10.若两个变量之间的相关系数是负数,则它们之间存在。 11.统计工作与统计资料的关系是和的关系。 12.标准差越大,说明总体平均数的代表性越,标准差越小,说明总体平均数的代表性越。 13.总量指标按其反映的内容不同可以分为和。 二、判断题 1、教育统计学属于应用统计学。()

2、标志是说明总体特征的,指标是说明总体单位特征的。() 3、统计数据的真实性是统计工作的生命() 4、汉族是一个品质标志。() 5、描述一组数据波动情况的量数称为差异量数。() 6、集中量数反映的是一组数据的集中趋势。() 7、在一个总体中,算术平均数、众数、中位数可能相等。() 8、同一总体各组的结构相对指标数值之和不一定等于100%。() 9、不重复抽样误差一定大于重复抽样误差。() 10. 一致性是用样本统计量估计统计参数时最基本的要求。() 三、选择题 1.某班学生的平均年龄为22岁,这里的22岁为( )。 A.指标值 B.标志值 C.变量值 D.数量标志值 2.统计调查中,调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3.统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4.下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5.统计抽样调查中,样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中,b表示( )。 增加1个单位,y增加a的数量增加1个单位,x增加b的数量 增加1个单位,x的平均增加量增加1个单位,y的平均增加量 7.下列统计指标中,属于数量指标的有() A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍 四、简答题 1.学习教育统计学有哪些意义?

统计分析及SPSS的应用课后练习答案解析

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第4章SPSS基本统计分析 1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。 分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。 Statistics 户口所在 地 职业年龄 N Valid282282282 Missing000 户口所在地 Frequency Percent Valid Percent Cumulative Percent Valid 中心城市200 边远郊区82 Total282 职业 Frequency Percent Valid Percent Cumulative Percent Valid 国家机关24商业服务业54文教卫生18公交建筑业15经营性公司18学校15一般农户35种粮棉专业 户 4

种 果菜专业 户 10 工商运专业 户 34 退役人员17 金融机构35 现役军人3 Total282 年龄 Frequency Percent Valid Percent Cumulative Percent Valid 20岁以下4 20~35岁146 35~50岁91 50岁以上41 Total282

分析:本次调查的有效样本为282份。常住地的分布状况是:在中心城市的人最多,有200人,而在边远郊区只有82人;职业的分布状况是:在商业服务业的人最多,其次是一般农户和金融机构;年龄方面:在35-50岁的人最多。由于变量中无缺失数据,因此频数分布表中的百分比相同。 2、利用第2章第7题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进行对比。进一步,对不同常住地储户存款金额的基本特征进行对比分析。 分析——描述统计——描述,选择存款金额到变量中。点击选项,勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表,点击继续——确定。 分析:由表中可以看出,有效样本为282份,存(取)款金额的均值是,标准差为,峰度系数为,偏度系数为。与标准正态分布曲线进行对比,由峰度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出,此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大。

spss期末大数据分析报告

SPSS在教育研究中的应用某大学学生对本校的满意度调查 学院:教育学院 专业:课程与教学论 学号:201411000156 姓名:李平 2014年12月13日

目录 一、研究问题的提出 (3) 二、研究内容与方法 (3) (一) 研究内容 (3) (二) 研究方法 (3) 三、调查对象及人数 (4) 四、问卷分析 (5) (一)回收情况 (5) (二)信度分析 (5) 五、数据统计与分析 (6) (一)数据输入 (6) (二)数据分析 (7) 1.描述统计 (7) (1)多选题描述统计 (7) (2)单选题描述统计 (9) 2.推断统计 (12) (1)独立样本T检验 (12) (2)单一样本T检验 (15) (3)单因素方差分析 (17) (4) X2检验 (21) 3.相关分析 (22) (1)变量间相关分析 (22) (2)维度间相关分析 (23) 六、结论 (27) 七、附录 (28)

一、研究问题的提出 学生的学校生活和成长密切相关。我们通过对他们的大学生活满意度的调查结果向有关部门提出建议,并希望能引起学校对这一系列问题的关注,最终希望大学生对其大学的满意度有所提升,大学生是一个庞大的群体,特别是近几年,随着高校的扩招,我国越来越多人能够上大学。上大学是很多人的梦想,他们都憧憬着大学校园的生活,然而当他们进了大学后才发现大学生活并非所想的美好,取而代之的却是对校园生活的不满,大学生是十分宝贵的人才资源,他们对校园生活的体验和感受,与他们的更好的学习。 二、研究内容与方法 (一)研究内容 了解学生对于学校的师资水平、环境、日常管理等各方面的满意度。 (二)研究方法 1.问卷编制 本研究采用自编问卷,问卷共由两部分组成:基本情况部分包括被调查者的性别、年级等,问卷主体部分包括师资水平、学校环境、日常管理三大维度,细分为12个三级指标(见表2-1),问卷采用五点制计分法,即“非常满意”、“满意”、“一般”、“不满意”、“非常不满意”,分别赋值5分、4分、3分、2分、1分。 表2-1 某大学学生对本校的满意度测评指标体系 一 级指标 二级指标(潜在变量)三级指标(观测变量) 对自己师资水平对教师教学方法、对教师工作态 度、对教师人品修养、对师资配备 学校的意学校环境对学习环境、对就餐环境、对居住 环境、对校园绿化环境 满度指数日常管理对专业课时安排、对收费标准、对 奖、助学金制度、对学校治安

教育统计学课后练习参考答案

教育统计学课后练习参考答案 第一章 1、教育统计学,就是应用数理统计学的一般原理和方法,对教育调查和教育实验等途径所获得的数据资料进行整理、分析,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。 教育统计学既是统计科学中的一个分支学科,又是教育科学中的一个分支学科,是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看,教育统计学属于教育科学体系的一个方法论分支;从学科性质来看,教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理,计算出简单明白的统计量数来描述庞大的资料,以显示其分布特征的统计方法。 推断统计又叫分析统计,它根据统计学的原理和方法,从我们所研究的全体对象(即总体)中,按照等可能性原则采取随机抽样的方法,抽出总体中具有代表性的部分个体组成样本,在样本所提供的数据的基础上,运用概率理论进行分析、论证,在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,这类现象称为随机现象。 随机现象具的特点: (1)一次条件完全相同的实验有多种可能的结果(这样的实验称为随机实验); (2)在实验之前不能确切知道哪种结果会发生; (3)在相同的条件下可以重复进行这样的实验。 4、总体,也叫做母体或全域,是指具有某种共同特征的个体的总和。 当所研究的总体数量非常大时,可以从总体中抽取其中一部分个体来观测,由此来推断总体的信息,从总体中抽出的这部分个体就称为样本,它是用以表征总体的个体的集合。 通常将样本中样本个数大于或等于30个的样本称为大样本,小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后,仍放回原总体,然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数,简称参数。反映样本特征的量数叫做样本统计量,简称统计量。 参数是总体的真正数值,是固定的常量,理论上应该通过计算总体中全部个体的数值而获得,但由于总体中个体的数量通常很大,总体参数往往很难获得,在统计分析中一般通过样本的数值来估计。在进行推断统计时,就是根据样本统计量来推断总体相应的参数。 第二章 1、按照数据的来源,可分为计数数据和度量数据;按照数据的取值情况,可分为间断性数据和连续性数据;按照数据的测量水平,可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了;表的层次要清晰;主谓分明。 4、连续性数据:(2),(3);间断性数据:(1),(4)。 5、略 6、(1)50;(2)75;(3)34;(4)5;(5)45

SPSS期末考试整理

●一。变量的赋值 1.乘方(**),例如二的三次方:2**3 2.不同规则的赋值:转换→计算变量(如果),每一个规则的赋值都要重新进行此步骤(但注意每一遍的变量名都不变,并且他都会问你要不要替换成新的变量,你选是就行了) 3.不同规则的赋值:(1)转换→重新编码为不同变量:输入变量,输出变量,要点击“变化量”才可保存输出变量→新值和旧值:值(直接选取取值)、范围(最大到最小的范围,包含端点值),点击“添加”成功保存新值和旧值→所有不同取值规则都完成后点击继续、确定,则在变量视图多出一个新变量(2)若不想包含端点值,可以采取小数的方式变换,eg. 899.9(小数位比该变量属性的小数位多一位就行了) (3)这种要先把BMI按照男女分开,然后再分组的,可以在对话框中点击“如果”选项进行设置,并且要分别对男女进行上述操作(一共做两遍)。 二。离散化 1可视离散化:转换→可视分箱,分割点:所以想生成几组,就定义几个分割点;填写第一个分割点的时候就必须填写最小值;一定要选中上端点排除。 三。排序 1.转换→自动重新编码:不分组,从头到尾排序 2.转换→个案排秩(1)多层次数据:基于A变量对B变量进行排序。(例如,基于职称对收入进行排序,就是不同职称各自组内排工资的高低)(2)设置秩1;绑定值 四。时间序列:转换→变动值 五。查找与计数:转换→对个案内的值计数(查找“基本工资800-900女职工”,生成新变量,满足这个条件的标为1,不符合这个标准的标为0,男职工标为缺失。范围:包含上限下限) ●六。数据→个案排序:把变量顺序完全按照你想要的标准排序,所有的变量顺序都会改变 七。拆分文件:要分男女进行数据统计:数据→拆分文件→比较组/按组输出,分组依据。不分男女进行数据统计:数据→拆分文件→分析所有个案 八。选择个案(例如只选择三年级的变量进行分析):数据→选择个案→如果条件满足:如果;随机个案样本;基于时间或个案范围;使用过滤变量(例如要把身高为缺失值和值为0的剔除)→输出:过滤(不符合条件的数据会画上“/”,原始数据并未删除);将选定个案复制到新数据集(形成一个新的SPSS数据文件,原始数据并未删除);删除未选定的个案(删除原始数据,不建议使用)→之后在分析的时候就只会分析三年级的变量。不想只分析三年及,记得重新做这一步。 九。加权个案:数据→加权个案(例。100分的有5人)。不想加权了,记得重新做这一步。 十。分类汇总(1)例如算不同年级的人的身高的均值、方差…(只能计算函数)(2)数据→汇总,分界变量(分类标准变量),变量摘要(计算变量),函数:选择计算变量函数,变量名称与标签:定义新生成变量的名称与标签 ●十一。长宽数据的转换 1.长数据变宽数据:索引变量消失变成score的尾缀 (1)数据→重组(重构)→个案重组为变量,标识变量,索引变量,电脑会自动帮你选出是xx xx要重构(不同疗程值不同的变量)。选完上述这些之后就一直点下一步&完成&立即重构&确定即可 (2)注意:当有多个变量需要重构时要自己决定“新变量组的顺序”。(A1A2B1B2;A1B1A2B2) 2.宽数据变长数据:score的尾缀消失变成索引变量 (1)数据→重组(重构)→变量重组为个案,个案组标识:使用选定变量,固定变量(手动选择,电脑不会自动帮你选出了),要转置的变量即值不固定的要重构的变量(手动选择,电脑不会自动帮你选出了)。选完上述这些之后就一直点击下一步&完成&立即重构数据&确定就行了 (2)当有多个变量需要重构时,这块的操作要特别注意:○1首先在“变量组数目”中选择“多个”○2然后在“选择变量”里要对于不同的“目标变量”分别定义“要转置的变量”(在本题中,即对于kidid目标变量定义一遍要转置的变量;对于age目标变量在定义一遍要转置的变量。其中,这两个要转置的变量必须是完全不同的)。但只需要定义一次“个案组标识”&“固定变量”(固定变量是相对于kidid & age都固定的那些变量;而不是说在对kidid进行转置的时候,age就是固定变量了;因此,固定变量只用定义一次且固定变量可以为空)。并且,你要特别注意,“个案组标识”里选择的变量& n个“要转置的变量”里选择的变量&“固定变量”里选择的变量都必须是完全不相同的。

统计学课程作业及答案2

统计学作业2 单项选择题 第1题某地区有10万人口,共有80个医院。平均每个医院要服务1250人,这个指标是()。 A、平均指标 B、强度相对指标 C、总量指标 D、发展水平指标 答案:B 第2题某企业2002年工业总产值比1992年增长了3倍,则该公司1992-2002年间工业总产值平均增长速度为() A、11.61% B、14.87% C、13.43% D、16.65% 答案:A 第3题某工业企业的某种产品成本,第一季度是连续下降的。1月份产量750件,单位成本20元;2月份产量1000件,单位成本18元;3月份产量1500件,单位成本15元。则第一季度的平均成本为()。 A、17.67 B、17.54 C、17.08 D、16.83 答案:C 第4题已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应该采用()。 A、简单算术平均数 B、加权算术平均数 C、加权调和平均数 D、几何平均数 答案:C

第5题如果分配数列把频数换成频率,那么方差()。 A、不变 B、增大 C、减小 D、无法预期变化 答案:A 第6题某厂5年的销售收入如下:200万、220万、250万、300万、320万,则平均增长量为()。 A、120/5 B、120/4 C、320/200的开5次方 D、320/200的开4次方 答案:B 第7题直接反映总体规模大小的指标是()。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 答案:C 第8题计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 答案:C 多项选择题 第9题下列统计指标属于总量指标的是()。 A、工资总额

2017年秋教育统计学答案(20200627082742)

综合作业20170802 1. (单选题)从含有N 个元素的总体中抽取n 个元素作为样 本,使得总体中的每一个元素都有相同的机会(概率)被抽中, 这样的抽样方式称为( )(本题6.0分) 简单随机抽样 整群抽样 系统抽样(等距抽样) 分层抽样(类型抽样) 学生答案:A 标准答案:A 解析: 得分:6 2. (单选题)从含有N 个元素的总体中抽取n 个元素作为样 本,使得总体中的每一个样本量为 n 的样本都有相同的机会(概 率)被抽中,这样的抽样方式称为( )(本题6.0分) A 、简单随机抽样 3 B 、整群抽样 B c 、系统抽样(等距抽样) D 、分层抽样(类型抽样) B 、

学生答案:A 标准答案:D 解析: 得分:0 3. (单选题)从总体中抽取一个元素后,把这个元素放回到总 体中再抽取第二个元素,直至抽取n 个元素为止,这样的抽样方 法称为()(本题6.0分) 重复抽样 不重复抽样 整群抽样 分层抽样(类型抽样) 学生答案:A 标准答案:A 解析: 得分:6 4. (单选题)一个元素被抽中后不再放回总体, 然后再从所剩 下的元素中抽取第二个元素, 直至抽取n 个元素为止,这样的抽 样方法称为()(本题6.0分) B 、

3 A 、重复抽样 3 B 、不重复抽样 3 c 、整群抽样 d D 、 分层抽样(类型抽样) 学生答案:B 标准答案:B 解析: 得分:6 5. (单选题)在抽样之前先将总体的元素划分为若干类,然后 为()(本题 6.0分) 简单随机抽样 整群抽样 系统抽样(等距抽样) 分层抽样(类型抽样) 学生答案:D 标准答案:D 解析: 得分:6 从各类中抽取一定数量的元素组成一个样本, 这样的抽样方式称 B 、

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级xxx班姓名xxx 学号xxx 题号一二三四五六总成绩成绩 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。

分析: (2) 描述统计量 性别N 极小值极大值均值标准差 男数学 4 77.00 85.00 82.2500 3.77492 有效的N (列表状态) 4 女数学16 67.00 90.00 78.5000 7.09930 有效的N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

教育统计学答案

(0282)《教育统计学》复习思考题答案 一、填空题 1. 统计学是研究统计原理和方法的科学。 2.我们所研究的具有某种共同特性的个体总和称为总体。 3.一般情况下,大样本是指样本容量超过30 的样本。 4.表示总体的数字特征的特征量称为参数。 5.要了解一组数据的集中趋势,需计算该组数据的集中量。 6. “65、69、72、87、89”这组数据的算术平均数是76.4 。 7. “78、69、53、77、54”这组数据的中位数是69 。 8. 6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是145厘米。 9. 要了解一组数据的差异程度,需计算该组数据的差异量。 10.有7个学生的语文成绩分别为:80、65、95、70、55、87、69分,他们的全距是40分。 11.若某班学生数学成绩的标准差是5分,平均分是85分,其差异系数是5.88% 。 12.比较某班学生在身高和体重两方面的差异程度,要把学生身高和体重的标准差转化为差异系数。 13.两个变量之间不精确、不稳定的变化关系称为相关关系。 14.要描述两个变量之间变化方向及密切程度,需要计算相关系数。 15. 若两个变量之间存在正相关,则它们的相关系数是正数。 16.若两个变量之间的相关系数是负数,则它们之间存在负相关。 17.质与量的相关分析的方法主要包括二列相关、点二列相关和多系列相关。 18.品质相关的分析方法包括四分相关、Φ相关和列联相关。 20. 某班50个学生中有30个女生,若随机抽取一个同学,抽到男生的概率是2/5。 21.某一种统计量的概率分布称为抽样分布。 22.平均数差异显著性检验中需要判断两个样本是相关样本还是独立样本。 23. 单纯随机抽样能保证抽样的随机性和独立性。 24. χ2检验的数据资料是点计数据。 25. 单向表是把实测的点计数据按一种分类标准编制而得的表。 26. 单向表χ2检验是对单向表的数据进行χ2检验,即单因素的χ2检验。 27. 双向表是把实测的点计数据按两种分类标准编制而得的表。 28. 双向表χ2检验是对双向表的数据进行的χ2检验,即双因素的χ2检验。 29.假设检验的方法包括参数检验和非参数检验。 30.符号秩次检验属于非参数检验。 31.标准正态曲线在Z=0处为最高点。 32.直条图是表示间断变量的统计图。 33.直方图是表示连续变量的统计图。 34.教育统计资料的来源主要是经常性资料和专题性资料。 35.教育调查从范围来看,可分为全面调查和非全面调查。 36.对数据进行统计分类的标志按照形式可分为性质类别和数量类别。 二、简述题 1.简述教育统计学的研究对象和内容。 教育统计学的主要任务是研究如何搜集、整理、分析有关教育研究和教育实践工

spss期末考试上机复习题(含答案)75709

江苏理工学院2017—2018学年第1学期 《spss软件应用》上机操作题库 1.随机抽取100人,按男女不同性别分类,将学生成绩分为中等以上及中等以下两类,结果 如下表。问男女生在学业成绩上有无显著差异? 中等以上中等以下 男 女 性别* 学业成绩交叉制表 计数 学业成绩 中等以上中等以下 合计 性别男23 17 40 女38 22 60 合计61 39 100 根据皮尔逊卡方检验,p=0.558〉0.05 所以男生女生在学业成绩上无显著性差异。 2.为了研究两种教学方法的效果。选择了6对智商、年龄、阅读能力、家庭条件都相同的儿童进行了实验。结果(测试分数)如下。问:能否认为新教学方法优于原教学方法(采用非参数检验)? 序号新教学方法原教学方法 1 83 78

2 3 4 5 6 69 87 93 78 59 65 88 91 72 59 答:由威尔逊非参数检验分析可知p=0.08〉0.05,所以不能认为新教学方法显著优于原教学方法。 3.下面的表格记录了某公司采用新、旧两种培训前后的工作能力评分增加情况,分析目的是比较这两种培训方法的效果有无差异。考虑到加盟公司时间可能也是影响因素,将加盟时间按月进行了记录。 方法加盟时间分数方法加盟时间分数 旧方法 1.5 9 新方法 2 12 旧方法 2.5 10.5 新方法 4.5 14 旧方法 5.5 13 新方法7 16 旧方法 1 8 新方法0.5 9 旧方法 4 11 新方法 4.5 12 旧方法 5 9.5 新方法 4.5 10 旧方法 3.5 10 新方法 2 10 旧方法 4 12 新方法 5 14 旧方法 4.5 12.5 新方法 6 16 (1)分不同的培训方法计算加盟时间、评分增加量的平均数。 (2)分析两种培训方式的效果是否有差异? 答:(1) 描述统计量 N 极小值极大值均值标准差 培训方法 = 1 (FILTER) 9 1 1 1.00 .000 加盟时间9 .50 7.00 4.0000 2.09165 分数增加量9 9.00 16.00 12.5556 2.60342 有效的 N (列表状态)9 所以新方法的加盟时间平均数为4 分数增加量的平均数为12.5556

《统计学原理》作业参考答案

《统计学原理》作业(三) (第五~第七章) 一、判断题 1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。(×) 2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(×) 3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。(√) 4、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。(×) 5、抽样极限误差总是大于抽样平均误差。(×) 6、相关系数是测定变量之间相关关系的唯一方法(×) 7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高(√)。 8、利用一个回归方程,两个变量可以互相推算(×)。 9、估计标准误指的就是实际值y与估计值y c的平均误差程度(√)。 10、抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的。(×) 11、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。(√) 12、在一定条件下,施肥量与收获率是正相关关系。(√) 二、单项选择题 1、在一定的抽样平均误差条件下(A)。 A、扩大极限误差范围,可以提高推断的可靠程度 B、扩大极限误差范围,会降低推断的可靠程度 C、缩小极限误差范围,可以提高推断的可靠程度 D、缩小极限误差范围,不改变推断的可靠程度 2、反映样本指标与总体指标之间的平均误差程度的指标是(C)。 A、抽样误差系数 B、概率度 C、抽样平均误差 D、抽样极限误差 3、抽样平均误差是(C)。 A、全及总体的标准差 B、样本的标准差 C、抽样指标的标准差 D、抽样误差的平均差 4、当成数等于(C)时,成数的方差最大。 A、1 B、0 c、0.5 D、-1 5、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是(C)。 A、等于78% B、大于84% c、在此76%与84%之间D、小于76% 6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差(A)。 A、甲厂比乙厂大 B、乙厂比甲厂大 C、两个工厂一样大 D、无法确定

教育统计学和答案

《教育统计学》作业 本课程作业由两部分组成。第一部分为“客观题部分”,由15个选择题组成,每题1分,共15分。第二部分为“主观题部分”,由简答题和论述题组成,共15分。作业总分30分,将作为平时成绩记入课程总成绩。 客观题部分: 一、选择题(每题1分,共15题) 1、下列分布中哪一种是单峰对称分布?( ) A. F分布 B. χ2分布 C. t分布 D.二项分布 2、当一组数据用中位数来反映集中趋势时,这组数据最好用哪种统计量来表示离散程度?( ) A.全距 (差异量) B.四分位距(差异量) C.方差(差异量) D.标准差(差异量) 3、总体不呈正态分布,从该总体中随机抽取容量为1000的一切可能样本的平均数的分布接近于:( ) A.二项分布 B. F分布 C.t分布 D.正态分布 4、检验某个频数分布是否服从正态分布时需采用:( ) A. Z检验 B. t检验 C.χ2 检验 D. F检验 5、对两组平均数进行差异的显著性检验时,在下面哪种 情况下不需要进行方差齐性检验?( ) A. 两个独立样本的容量相等且小于30; B. 两个独立样本的容量相等且大于30; C. 两个独立样本的容量不等,n1小于30,n2大于30; D. 两个独立样本的容量不等,n1大于30,n2小于30。 6、下列说法中哪一个是正确的?( )

A.若r1=0.40,r2=0.20,那么r1就是r2的2倍; B.如果r=0.80,那么就表明两个变量之间的关联程度达到80%; C.相关系数不可能是2; D.相关系数不可能是-1。 7、当两列变量均为二分变量时,应计算哪一种相关?( ) A.积差相关(两个连续型变量) B.φ相关 C.点二列相关(一个是连续型变量,另一个是真正的二分名义变量) D.二列相关 (两个连续型变量,其中之一被人为地划分成二分变量。) 8、对多组平均数的差异进行显著性检验时需计算:( ) A.F值 B. t值 C. χ2 值 D.Z值 9、比较不同单位资料的差异程度,可以采用何种差异量?() A.差异系数 B.方差 C.全距 D.标准差 10、教育统计学科的基本结构是() A. 描述统计学、量化统计学 B. 描述统计学、推断统计学、量化统计学 C. 描述统计学、推断统计学、多元统计 D. 描述统计学、多元统计、量化统计学 11、统计分析包括() A. 多元分析与方差分析 B. 回归分析与区间分析 C. 方差分析与区间分析 D. 回归分析与方差分析 12、从自变量的一个取值去估计因变量的相应取值的完整分析与计算过程称为() A. 多元分析 B. 回归分析 C. 方差分析 D. 区间分析 13、回归分析的基本原理是() A. 最小二乘法 B. 点二列相关 C. 二列相关 D. 标准差 14、当一个测验多次测量的结果一致时,它就被认为是可靠的,这一个概念指是统计学中的() A. 信度 B. 效度 C. 一致性 D. 准确性 15、估计测量一致性程度的指标指的是() A.效度 B.一致性

相关文档
最新文档