[vip专享]《统计软件及应用》第三章作业参考答案

合集下载

《统计分析与SPSS的应用(第五版)》课后练习答案(第3章)

《统计分析与SPSS的应用(第五版)》课后练习答案(第3章)第三章：统计分析与SPSS的应用(第五版) 课后练习答案第一节：描述性统计在本章的课后习题中，我们将通过SPSS软件进行一系列的统计分析。

本节将提供第三章的课后习题答案，通过展示实际的数据和分析结果，帮助读者更好地理解统计分析的应用和SPSS软件的操作。

1. 描述性统计分析题目：使用某城市2019年1月至12月的气温数据，计算月平均气温、最高气温和最低气温的描述性统计指标。

答案：通过SPSS导入数据，选择变量"月份"和"气温"，并进行描述性统计分析。

结果显示，2019年1月至12月的气温数据的月平均气温、最高气温和最低气温的描述性统计指标如下：月平均气温：- 平均值：20°C- 标准差：2°C- 最小值：15°C- 最大值：25°C最高气温：- 平均值：28°C- 标准差：3°C- 最小值：22°C- 最大值：35°C最低气温：- 平均值：12°C- 标准差：2°C- 最小值：8°C- 最大值：18°C根据以上结果，我们可以得出结论：2019年该城市的月平均气温在20°C左右，最高气温在28°C左右，最低气温在12°C左右。

气温的变化范围相对较小，波动性较小。

这些结果可以帮助我们对该城市的气候情况进行初步了解。

2. 相关性分析题目：使用某企业2018年1月至12月的销售额和广告投入数据，计算销售额和广告投入之间的相关性。

答案：通过SPSS导入数据，选择变量"销售额"和"广告投入"，并进行相关性分析。

结果显示，2018年1月至12月的销售额和广告投入之间的Pearson 相关系数为0.85，表明二者呈现强正相关关系。

应用统计学课后习题与参考答案

应用统计学课后习题与参考答案第一章一、选择题1．一个统计总体（D）。

A．只能有一个标志B．只能有一个指标C．可以有多个标志D．可以有多个指标2．对100名职工的工资收入情况进行调查，则总体单位是（D）。

A．100名职工B．100名职工的工资总额C．每一名职工D．每一名职工的工资3．某班学生统计学考试成绩分别为65分、72分、81分和87分，这4个数字是（D）。

A．指标B．标志C．变量D．标志值4．下列属于品质标志的是（B）。

A．工人年龄B．工人性别C．工人体重D．工人工资5．某工业企业的职工数、商品销售额是（C）。

A．连续变量B．离散变量C．前者是离散变量，后者是连续变量D．前者是连续变量，后者是离散变量6．下面指标中，属于质量指标的是（C）。

A．全国人口数B．国内生产总值C．劳动生产率D．工人工资7．以下指标中属于质量指标的是（C）。

A．播种面积B．销售量C．单位成本D．产量8．下列各项中属于数量指标的是（B）。

A．劳动生产率B．产量C．人口密度D．资金利税率二、简答题1．一项调查表明，消费者每月在网上购物的平均花费是200元，他们选择在网上购物的主要原因是“价格便宜”。

（1）这一研究的总体是什么？总体是“所有的网上购物者”。

（2）“消费者在网上购物的原因”是定类变量、定序变量还是数值型变量？分类变量。

（3）研究者所关心的参数是什么？所有的网上购物者的月平均花费。

（4）“消费者每月在网上购物的平均花费是200元”是参数还是统计量？统计量。

（5）研究者所使用的主要是描述统计方法还是推断统计方法？推断统计方法。

2．要调查某商场销售的全部冰箱情况，试指出总体、个体是什么？试举若干品质标志、数量标志、数量指标和质量指标。

总体：该商店销售的所有冰箱。

总体单位：该商店销售的每一台冰箱。

品质标志：型号、产地、颜色。

数量标志：容量、外形尺寸；数量指标：销售量、销售额。

质量指标：不合格率、平均每天销售量、每小时电消耗量。

《统计软件及应用》第三章作业参考答案

P86第一题3. 将“ch3_Child.txt”转为Stata文件cd C:\stata11\ado\homework //我自己建立了一个工作目录，把“ch3_Child.txt”拷到这里insheet using ch3_Child.txt,clear4. 将数据以“ch3_Child.dta”为名保存save ch3_Childdes5. 压缩数据，并比较前后数据占用空间的变化compressdes6.描述数据共有多少个变量，多少个观察值共有7个变量，26个观察值。

7.描述变量weight 的基本内容：. codebook weighttype:numeric (double)range: [11,59.4] units: .1unique values: 24 missing .: 1/26mean: 33.284std. dev: 15.8639percentiles: 10% 25% 50% 75% 90%13.6 21 32 44.4 55.6（1）变量的存储形式：double（双精度）（2）取值范围：最大值59.4，最小值11。

（3）独特取值个数：24个（4）测量单位（unit)：0.1（5）缺失值：1个（6）均值：33.284（7）标准差：15.86392（8）第10、25、50、75、90百分位情况10% 13.625% 2150% 3275% 44.490% 55.6样本的平均体重为33.284kg，有10%的样本体重在13.6kg以下；90%的样本体重在55.6kg 以下。

8.描述每个变量各有多少个缺失值。

age，sex和id 无缺失值；yrsch 和enroll各有10个缺失值；height 和weight各有1个缺失值9.将数据按照变量age的取值排序sort age10.将变量按首字母顺序排列aorder 或order_all, alpha11.将变量按照id,age,sex,yrsch,enroll,height, weight 的顺序排列order id age sex yrsch enroll height weight12.浏览数据的基本情况browse第二题1.将数据输入stata中并以zuove2.1命名，再进行压缩（用compress 命令）2、将变量math 和chinese 转换为字符型变量，然后转换为数值型变量（1）由数值型转为字符型tostring math chinese, replace（2）由字符型转为数值型destring math chinese,replace3.为数据库zuove2.1添加标签“学生成绩”，为math添加标签“数学成绩”，为gender添加标签1为“male”0为“female”（1）为数据库添加标签“学生成绩”label data “学生成绩”(2)为math添加标签“数学成绩”label var math “数学成绩”(3)为gender添加标签1为“male”0为“female”label define gender1 0“male”1“female”label value gender gender14.将数据库用两种命令按数学成绩排序sort math 或gsort math第三题本章使用的数据为ch6_Child.dta.先给b2、b4、yrschfm和goods1分别贴上标签。

应用统计学课后答案

应用统计学课后答案1. 简介本文档是针对应用统计学课程的相关习题和问题的答案汇总。

通过这些答案，学生可以更好地理解和应用统计学的方法和概念，提高解决实际问题的能力。

2. 统计基础2.1 描述性统计1.描述性统计是指对收集到的数据进行总结、表达和描述的统计方法。

它包括数据的中心趋势和离散程度的度量。

2.常见的描述性统计指标包括均值、中位数、众数、标准差、百分位数等。

3.均值是指一组数据的平均值，是描述数据中心趋势的最常用指标。

计算均值时，将所有数据相加后除以数据的个数。

2.2 概率与概率分布1.概率是指某个事件发生的可能性。

它的取值范围在0到1之间，0表示不可能发生，1表示一定发生。

2.概率分布是指随机变量取不同值的可能性分布。

常见的概率分布有正态分布、均匀分布、泊松分布等。

3.正态分布是一种重要的概率分布，它有唯一的均值和标准差。

许多自然现象和统计数据都符合正态分布。

3. 统计推断3.1 参数估计1.参数估计是指利用样本数据来估计总体参数的方法。

常见的参数估计方法有点估计和区间估计。

2.点估计是指通过样本数据来估计总体参数的具体数值。

常见的点估计方法有样本均值、样本方差等。

3.区间估计是指通过样本数据来估计总体参数的取值范围。

常见的区间估计方法是利用置信区间来给出总体参数的范围估计。

3.2 假设检验1.假设检验是用来判断一个统计推断是否可以接受的方法。

主要包括设置假设、选择检验统计量、确定显著性水平和计算p值等步骤。

2.假设检验可以用于检验总体均值、总体比例、总体方差等参数的假设。

4. 回归分析4.1 简单线性回归1.简单线性回归是一种用来研究自变量和因变量之间关系的方法。

它可以通过拟合直线来描述两个变量之间的线性关系。

2.在简单线性回归中，自变量只有一个，因变量可以通过自变量的线性组合来预测。

3.简单线性回归模型可以通过最小二乘法来求解，找出最佳拟合直线。

4.2 多元线性回归1.多元线性回归是一种用来研究多个自变量与因变量之间关系的方法。

第三章测验及答案

第三章测验及答案第三章测验一、判断1. 文档不属于软件,所以不重要。

()2. 软件学是专门研究软件开发的学科。

()3. 通常把计算机软件分为系统软件和应用软件。

()4. 所谓系统软件就是购置计算机时，计算机供应厂商所提供的软件。

()5. 当前流行的操作系统是Windows系列及Office系列。

()6. Word属于系统软件，因为它在多个行业、部门中得到广泛的使用。

()7. Oracle是一数据库软件，属于系统软件。

()8. “软件工程”的概念出现在计算机软件发展的第三阶段。

()9. 一般只有硬件、没有软件的计算机被称为“裸机”。

()10. 计算机操作系统自举完成后，操作系统的所有程序常驻内存。

()11. Windows操作系统可以在任意的计算机上安装。

()12. Linux操作系统是Unix简化后的新版本。

()13. 机器语言程序是直接运行在裸机上的最基本的系统软件。

()14. 汇编语言是面向机器指令系统的机器语言。

()15. 计算机硬件就是组成计算机的各种物理设备的总称。

()16. 同一个程序在解释方式下的运行效率比在编译方式下的运行效率低。

()17. 编译程序仅是指从高级语言到机器语言的翻译程序。

()18. 在设计程序时一定要选择一个时间代价和空间代价都是最小的算法，而不用考虑其它问题。

()19. 离散数学的主要研究对象是连续的数据结构。

()20. 数据结构的内容包括数据的逻辑结构、存储结构以及在这些数据上定义的运算的集合。

()21.链接表是以指针方式表示的“线性表结构”。

()22. 程序与算法不同，程序是问题求解规则的一种过程描述。

()23. 软件产品的设计报告、维护手册和用户使用指南等不属于计算机软件。

()24. 支持多用户、多任务处理和图形用户界面是Windows的特点。

()25. 程序设计语言按其级别可以分为硬件描述语言、汇编语言和高级语言三大类。

()26.源程序通过编译处理可以一次性地产生高效运行的目标程序，并把它保存在外存储器上，可供多次执行。

东北大学《应用统计X》在线平时作业3答案

《应用统计X》在线平时作业3试卷总分:100 得分:100一、单选题(共20 道试题,共60 分)1.一个用来估计总体参数的数称为：A.点估计B.区间估计C.假设检验D.样本均值答案:A2.某生物科技研究所，想了解磷肥的实施是否影响玉米的产量，下面做法可行的是：A.收集某个种植区实施磷肥的量与玉米的产量进行研究B.收集某几个种植区实施磷肥的量与玉米的产量进行研究C.选取若干块土地种植玉米，并都实施磷肥，然后收集实施磷肥的量与玉米产量进行分析D.选取若干块土地种植玉米，随机的选取其中部分土地实施磷肥，并保证其他的种植条件都一样，然后收集实施磷肥的量与玉米产量进行分析答案:D3.在有5张记有1、2、3、4、5的卡片中，现无放回的抽取两次，一次一张，则第二次取到奇数卡的概率为：A.4/25B.3/5C.9/25D.1/3答案:B4.研究两个或者更多变量之间的关系问题时，最难回答的问题是：A.从数据来看变量间有关系吗B.如果变量间有关系，这个关系有多强C.是否不仅在样本中，而且在总体中也有这种关系D.这个关系是不是因果关系答案:D5.和我们所熟悉的日常生活有关变量称为（）A.经验变量B.理论变量C.定型变量D.定量变量答案:A6.不同小吃中的热量除了受脂肪含量的影响外，还受许多其他变的影响。

其他这些变量称为（），这些变量和脂肪共同决定了食物中热量的含量。

A.残差变量B.公共变量C.虚拟变量D.连续变量答案:A7.为了解我市初三女生的体能状况，从某校初三的甲、乙两班中各抽取27名女生进行一分钟跳绳次数测试，测试数据统计结果如表 4.1, 如果每分钟跳绳次数³105次的成绩即为优秀，那么甲、乙两班的优秀率的关系是：{图}A.甲＜乙B.甲＞乙C.甲＝乙D.无法比较答案:A8.在一组数据中，出现次数最多的数称为：A.参数B.频数C.众数D.组数答案:C9.参考估计量的评价标准，总体均值的一个好的估计是：A.中位数B.样本均值C.众数D.以上都是答案:B10.方差分析中，自变量平方和比上总变量平方和称为R2，它的含义是什么？A.自变量与因变量之间的关系强度B.由于自变量产生的变异占总变异的比例C.由于残差变量产生的变异占总变异的比例D.残差变量与因变量之间的关系强度答案:B11.如图4.1是对37位妇女的结婚年龄的调查而得到的直方图，由图可以得出这些妇女结婚年龄的众数为：{图}A.27.5B.25C.30D.20答案:A12.相关分析是：A.研究变量之间的变动关系B.研究变量之间的数量关系C.研究变量之间相互关系的密切程度D.研究变量之间的因果关系答案:C13.当抛掷一个硬币100次时，差不多会得到50次正面向上，50次反面向上，这说明抛掷硬币这个事件具有某种：A.随机性B.不可预见性C.确定性D.规律性答案:D14.为了控制贷款规模，某商业银行有个内部要求，平均每项贷款数额不能超过60 万元。

应用统计学课后习题参考答案

统计学课后习题答案+模拟题库2套选择题第一章统计学及其基本概念----（孙晨凯整理）一、单项选择题1. 推断统计学研究（）。

(知识点：1.2 答案：D)A．统计数据收集的方法B．数据加工处理的方法C．统计数据显示的方法D．如何根据样本数据去推断总体数量特征的方法2. 在统计史上被认为有统计学之名而无统计学之实的学派是（）。

(知识点：1.3 答案：D)A．数理统计学派B．政治算术学派C．社会统计学派D．国势学派3. 下列数据中哪个是定比尺度衡量的数据（）。

(知识点：1.4 答案：B)A．性别B．年龄C．籍贯D．民族4. 统计对现象总体数量特征的认识是（）。

(知识点：1.6 答案：C)A．从定性到定量B．从定量到定性C．从个体到总体D．从总体到个体5. 调查10个企业职工的工资水平情况，则统计总体是（）。

(知识点：1.6 答案：C)A.10个企业B.10个企业职工的全部工资C.10个企业的全部职工D.10个企业每个职工的工资6. 从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体是（）.(知识点：1.6 答案：A)A. 样本B. 总体单位C. 个体D. 全及总体7. 三名学生期末统计学考试成绩分别为80分、85分和92分，这三个数字是（）。

(知识点：1.7 答案：D)A. 指标B. 标志C. 变量D. 标志值8. 以一、二、三等品来衡量产品质地的优劣，那么该产品等级是（）。

(知识点：1.7 答案：A)A. 品质标志B. 数量标志C. 质量指标D. 数量指标9. （）表示事物的质的特征，是不能以数值表示的。

(知识点：1.7 答案：A)A. 品质标志B. 数量标志C. 质量指标D. 数量指标10. 在出勤率、废品量、劳动生产率、商品流通费用额和人均粮食生产量五个指标中，属于数量指标的有几个（）。

(知识点：1.7 答案：B)A. 一个B. 二个C. 三个D. 四个二、多项选择题1．“统计”一词通常的涵义是指（）。

东大22春《应用统计X》在线平时作业3【参考答案】

《应用统计X》在线平时作业3【参考答案】试卷总分:100 得分:100一、单选题 (共 20 道试题,共 60 分)1.一家小食品加工厂，为了了解一种新产品是否受欢迎，以问卷形式做了市场调查，请问这种以问卷形式做市场调查的方法属于统计学中的那类：A.收集数据B.分析数据C.计算数据D.由数据作出决策标准答案:A2.下列那种图形不是用来表示数值变量的：A.点线图B.盒形图C.直方图D.饼图标准答案:D3.在作散点图时，图中的点从左下角到右上角有明显的直线趋势，这时可以认为这两个变量A.负相关B.正相关C.不相关D.无法确定标准答案:B4.甲乙两个俱乐部都分别有100名会员，其中甲俱乐部有女会员51人，男会员49人，而乙俱乐部有女会员99人，男会员1人，则甲乙俱乐部会员性别变量的众数为：A.甲：女，乙：女B.甲：女，乙：男C.甲：男和女，乙：女D.甲：无法确定，乙：女标准答案:A5.为了解我市初三女生的体能状况，从某校初三的甲、乙两班中各抽取27名女生进行一分钟跳绳次数测试，测试数据统计结果如表4.1, 如果每分钟跳绳次数³105次的成绩即为优秀，那么甲、乙两班的优秀率的关系是： {图}A.甲＜乙B.甲＞乙C.甲＝乙D.无法比较标准答案:A6.当自变量分类变量，因变量是数值变量时，适用那种统计方法进行分析：A.卡方分析B.方差分析C.秩方法D.相关与回归分析标准答案:B7.某商场每月销售某商品的数量服从参数为3的泊松分布，则下月该商场买出5件该产品的概率为：A.{图}B.{图}C.{图}D.{图}标准答案:A8.在检验不服从正态分布的配对数据的总体均值是否相等时，应用检验方法是：A.t检验B.F检验C.卡方检验D.符号检验标准答案:D9.度量两个有数量值的顺序变量的相关程度的统计量称为：A.相关系数B.顺序秩相关系数C.回归系数D.样本系数标准答案:B10.在实验中控制实验对象而收集得到的数据称为：A.观测数据B.实验数据C.分组数据D.频数标准答案:B11.对于电视节目, 收视率是个重要的指标. 一个对1500人的电话调查表明, 在某一节目播出的时候, 被访的正在观看电视的人中有23%的正在观看这个节目. 现在想知道, 这是否和该节目的制作人所期望的π0= 25% 有显著不足。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

P86
第一题
3. 将“ch3_Child.txt”转为Stata文件
cd C:\stata11\ado\homework //我自己建立了一个工作目录，把“ch3_Child.txt”拷到这里
insheet using ch3_Child.txt,clear
4. 将数据以“ch3_Child.dta”为名保存
save ch3_Child
des
5. 压缩数据，并比较前后数据占用空间的变化
compress
des
6. 描述数据共有多少个变量，多少个观察值
共有7个变量，26个观察值。

7. 描述变量weight 的基本内容：
. codebook weight
type:numeric (double)
range:[11,59.4]units: .1
unique values:24missing .: 1/26
mean:33.284
std. dev:15.8639
percentiles:10% 25%50% 75% 90%
13.6 2132 44.4 55.6
（1）变量的存储形式：double（双精度）
（2）取值范围：最大值59.4，最小值11。

（3）独特取值个数：24个
（4）测量单位（unit)：0.1
（5）缺失值：1个
（6）均值：33.284
（7）标准差：15.86392
（8）第10、25、50、75、90百分位情况
10% 13.6
25% 21
50% 32
75% 44.4
90% 55.6
样本的平均体重为33.284kg，有10%的样本体重在13.6kg以下；90%的样本体重在55.6kg 以下。

8. 描述每个变量各有多少个缺失值。

age，sex和id 无缺失值；yrsch 和enroll各有10个缺失值；height 和weight各有1个缺失值
9. 将数据按照变量age的取值排序
sort age
10. 将变量按首字母顺序排列
aorder 或order_all, alpha
11. 将变量按照id,age,sex,yrsch,enroll,height, weight 的顺序排列
order id age sex yrsch enroll height weight
12. 浏览数据的基本情况
browse
第二题
1.将数据输入stata中并以zuove
2.1命名，再进行压缩（用compress 命令）
2、将变量math 和chinese 转换为字符型变量，然后转换为数值型变量
（1）由数值型转为字符型
tostring math chinese, replace
（2）由字符型转为数值型
destring math chinese,replace
3. 为数据库zuove2.1添加标签“学生成绩”，为math添加标签“数学成绩”，为gender添加标签1为“male”0为“female”
（1）为数据库添加标签“学生成绩”
label data “学生成绩”
(2) 为math添加标签“数学成绩”
label var math “数学成绩”
(3)为gender添加标签1为“male”0为“female”
label define gender1 0“male” 1“female”
label value gender gender1
4. 将数据库用两种命令按数学成绩排序
sort math 或gsort math
第三题
本章使用的数据为ch6_Child.dta.
先给b2、b4、yrschfm和goods1分别贴上标签。

并将yrschfm定义为一个分类变量
use ch6_Child.dta
label var b2 "父母亲是否在业"
label var b4 "具体职业"
label var yrschfm "父母亲的受教育年限"
label var goods1 "家庭耐用消费品拥有量"
将yrschfm定义为分类变量：
replace yrschfm =0 if yrschfm<=6
replace yrschfm =1 if yrschfm>=7 & yrschfm<=9
replace yrschfm =2 if yrschfm>=10 & yrschfm<=12
replace yrschfm =3 if yrschfm>=13 & yrschfm<=17
replace yrschfm=. if yrschfm==.
label define edu 0 "小学" 1 "初中" 2 "高中" 3 "大学及以上"
label values yrschfm edu
1.了解数据的基本情况：该数据一共有多少个变量、多少个观察值
des
该数据共有13个变量，2341个观察值，
2. （1）将sex命名为girl。

将sex原有的取值1替换为0，代表男孩；原有的取值2替换为1，代表女孩。

rename sex girl
replace girl = 0 if girl==1
replace girl = 1 if girl==2
(2) 变量urban的名称不变，但将其原有的取值2替换为0，代表农村；原有取值1保持不变，代表城镇
replace urban= 0 if urban==2
(3)分别给这两个变量的取值贴上标签
label define girl1 0 “男孩” 1 “女孩”
label values girl girl1
label define city 0 “农村” 1 “城镇”
label values urban city
3. 给age girl urban生成各自的频数分布表，并回答：
（1）样本中孩子的年龄分布情况
tab1 age girl urban
样本中孩子年龄在0到19岁之间，7岁和14-15岁左右分布较为密集。

（2）男孩和女孩所占比例
（3）城市样本和农村样本比例
男孩占51.6%，女孩占48.4%。

性别分布较为均匀。

城市样本占样本总量的26.95%，农村样本占73.05%。

接近四分之三的样本来自农村。

4. 在7岁及以上的人群中，给变量yrsch edulevel enroll 生成各自的频数分布表，并回答以下问题（注意各自的缺失值）：
tab1 yrsch edulevel enroll if age>=7
（1）受教育年限多集中在9年及以下，受8-9年教育的人占的比例最大（29.31%），受教
育年限不少于9年的比例为32.33%，同时有11.36%的人只受过1年教育。

其中存在615
个缺省值。

（2）受过小学、初中、高中、大学教育的孩子所占比例分别为
47.45%，38.18%，13.85%，0.52%。

将大学作为一个独立分类没有明显的统计意义，因为
最大年龄只统计到19岁，使得大学这一分类比例极小，可以与高中共同归为“高中及以上”。

当然，样本中存在615个缺省值。

（3）在学的孩子占87.33%，不在学的孩子占12.67%。

当然有620个缺省值。

不在学的7
岁以上年龄的孩子所占比例比较高，该问题应当引起关注，可进一步分析这些孩子是农村
还是城市户口、具体年龄分布等问题。