统计学作业及答案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)现象的总体规律,通常是以平均数的形式表现出来。
(3)所研究的现象总体包含的单位愈多,平均数也就愈能够正确地反映出这些现象的规律性。
(4)各单位的共同倾向(表现为主要的、基本的因素)决定着平均数的水平,而各单位对平均数的离差(由次要的、偶然的因素所产生的影响),则由于足够多数单位的汇总综合结果,而相互抵消,趋于消失。通过平均化的结果以抵消偶然因素的个别影响,描述现象的典型水平,并进一步推断总体的数量特征,这些都是在大数定律的作用下进行的。应该指出,大数定律的作用是帮助我们通过偶然性达到发现的必然性,认识现象规律的表现形式的目的,但它并不能说明现象的本质,这又须借助相关实质性学科的知识来解释现象的本质及其内在联系。
172
174
168
173
幼儿组
68
69
68
70
71
73
72
73
74
75
(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么?离散系数
(2)比较分析哪一组的身高差异大?
成年组身高平均数幼儿组身高平均数:71.3
172.7777778
成年组身高标准差:成人组身高离散系数:4.201851444/172.7777778=0.024319397
(5)计算变异系数标准差/平均数=0.254969981
(6)计算偏态系数和峰态系数
偏态系数:-0.926935366峰态系数:0.927784856(分别用SKEW、KURT函数算)
2.在某地区抽取120家企业,按利润进行分组,结果如下:
按利润额分组(万元)
企业数(个)
200~300
19
300~400
(2)推断统计就是充分利用有用信息,采用科学的概率理论,对未知的现象总体或事物的未来进行有一定把握的估计和预测,属于事前统计。
2.试论大数定律在统计研究中的方法论意义。
(1)现象的某种总体规律只有当具有这些现象的足够多数的单位汇总综合在一起的时候,才能显示出来。因此只有从大量现象的总体中,才能研究这些现象的规律性。
3.一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。
(1)这一研究的总体是什么?
所有IT从业者
(2)月收入是分类变量、顺序变量还是定量变量?定量变量
(3)消费支付方式是分类变量、顺序变量还是定量变量?分类变量
2.简述众数、中位数和平均数的特点和应用场合。
(1)众数:一组数据中出现次数最多的变量值,适合于数据量较多时使用,不受极端值的影响,一组数据可能没有众数或有几个众数,适用于分类数据、顺序数据和定量数据。
(2)中位数:排序后处于中间位置上的值,不受极端值的影响,主要用于定量数据,各变量值与中位数的离差绝对值之和最小
85
85
81
75
85
97
96
60
69
64
54
85
65
60
96
82
98
60
77
46
60
86
71
60
19
97
84
(1)根据上面数据进行适当分组,编制频数分布表
(2)绘制直方图
(3)计算众数、中位数、四分位数
众数:60(用MODE函数算)中位数:78(用MEDIAN函数算)四分位数:
(4)计算平均数和标准差平均数:72.54761905标准差:18.49746506(分别用AVERAGE、STDEV函数算)
A.只能作为总体B.既能作为总体,也能作为总体单位C.只能作为总体单位D.以上都不能
5.下列中,属于定量变量的是()
A.职工的性别B.职工的籍贯C.职工的受教育程度D.职工的身高
简答题
1.如何区分描述统计和推断统计。
(1)描述统计:利用统计指标、统计表格、统计图形等,对现象总体的总量规模、结构比例、发展速度等状况进行刻画,、陈述、表达,是事前统计;
判断题
1.根据组距数列计算的平均数,只是一个近似值。对
2.各变量值与其平均数的离差之和为最小值。错
3.两变量和的平均数等于两变量平均数的和。错
4.分类数据可以用平均数度量集中趋势。对
简答题
1.一组数据的分布特征可以从哪几个方面进行测度?
说明其集中趋势的平均指标(数值平均数、众数、中位数、四分位数),说明其离散程度的变异指标(变异全距、平均差、标准差和方差、变异系数)
(1)是男生的体重差异大还是女生的体重差异大?女生
(2)粗略地估计一下,男生中有百分之几的人体重在55kg~65kg之间68%
(3)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间95%
4.对10名成年人和10名幼儿的身高进行抽样调查,结果如下:
成年组
166
169
172
177
180
170
3.在编制等距数列时,如果全距为56,组数为6,为统计分析的方便,组距应取()为宜
A. 6 B. 9 C. 9.3D. 10
3.下面统计量最容易受极端值影响的是()
A.中位数B.众数C.平均数D.四分位数
4.在等距数列中,各组的频数分布与频数密度的分布()
A.一致B.有关系,但不一致C.有时一致,有时不一致D.毫无关系
5.变量数列中,各种的频率之和应该()
A.大于1 B.小于1C.等于1D.等于零
6.下面不属于概率抽样的是()
A.分层抽样B.配额抽样C.整群抽样D.多阶段抽样
7.下面不属于非概率抽样的是()
A.判断抽样B.方便抽样C.自愿样本D.系统抽样
判断题
1.无回答误差不会影响对统计分析结论。错
2.抽样误差是可以消除的。错
(4)这一研究涉及截面数据还是时间序列数据?截面数据
4.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?所有消费者
(2)“消费者在网上购物的原因”是分类变量、顺序变量还是定量变量?分类变量
(3)研究者所关心的参数是什么?消费者每月在网上购物的平均花费
(1)互斥原则:商场把服装先分成童装和成人服装两类,然后每类再分男女,如果不这样分的话,男装女装童装之间有重复,互斥原则即不能重复原则。
(2)穷尽原则。即不重不漏原则,例如,从业人员按文化程度分组,分为小学毕业、中学毕业(含中专)和大学毕业三组,那么,那些文盲或识字不多的以及大学以上的学历者则无组可归。如果将分组适当调整为:文盲及识字不多、小学毕业、中学毕业(含中专)、大学及大学以上,这样分组,就可以包括全部从业人员的各种不同层次的文化程度,符合了分组的穷尽原则。
(3)平均数:也称为均值,集中趋势的最常用测度值,体现了数据的必然性特征,易受极端值的影响,有简单平均数和加权平均数之分
根据总体数据计算的,称为平均数,记为μ;根据样本数据计算的,称为样本平均数,记为¯x
分析计算题
1.某班级经济学成绩如下:
24
60
73
51
60
79
81
Байду номын сангаас83
55
83
82
86
92
89
52
3.样本量越大,抽样误差越大。错
4.总体的变异性越大,抽样误差越大。对
简答题
1.请简单比较一下概率抽样和非概率抽样。
概率抽样:依据随机原则抽选样本,样本统计量的理论分布存在,可根据调查的结果推断总体
非概率抽样:不是依据随机原则抽选样本,样本统计量的分布是不确定的,无法使用样本的结果推断总体
2.举例说明统计分组应该遵循的原则。
30
400~500
42
500~600
18
600~700
11
合计
120
(1)计算120家企业利润额的平均数和标准差
平均数:(19*250+30*350+42*450+18*550+11*650)/120约等于427
标准差:
(2)计算分布的偏态系数和峰态系数
3.一项关于大学生体重状况的研究发现,男生的平均体重为60kg,标准差为5kg,女生的平均体重为50kg,标准差为5kg。
(4)“消费者每月在网上购物的平均花费是200元”是参数还是统计量?参数
(5)研究者所使用的主要是描述统计方法还是推断统计方法?推断统计方法
选择题
1.抽样调查应遵循的原则是()
A.准确性原则B.可靠性原则C.随机性原则D.灵活性原则
2.统计分组时,在全距一定的情况下()
A.组距越大,组数越多B.组距越大,组数越少C.组距大小与组数多少无关D.组距大小与组数多少成正比
4.201851444
幼儿组身高标准差:幼儿组身高离散系数:2.496664441/71.3=0.035016332
2.496664441
所以幼儿组身高差异大
作业
选择题
1.统计总体的特征是()
A.大量性总体性数量性B.总体性数量性变异性C.同质性大量性变异性D.数量性同质性变异性
2.变量是说明()特征的名称
A.总体B.总体单位C.总体单位量的D.总体单位质的
3.下列中,属于定性变量的是()
A.工人的年龄B.工人的工资C.工人的工种D.工人的产品数量
4.某个个体的自然人在社会经济统计研究中,一般()
选择题
1.市场上有两种不同价格的水果,则各买一斤和各买一元的平均价格()
A.两者相等B.前者低于后者C.前者高于后者D.无法判断
2.当样本均值>中位数>众数时,总体的频数分布状况为()
A.左偏斜钟形分布B.右偏斜钟形分布C.对称的钟形分布D.正态分布
3.下面统计量最容易受极端值影响的是()
A.中位数B.众数C.平均数D.四分位数
(3)所研究的现象总体包含的单位愈多,平均数也就愈能够正确地反映出这些现象的规律性。
(4)各单位的共同倾向(表现为主要的、基本的因素)决定着平均数的水平,而各单位对平均数的离差(由次要的、偶然的因素所产生的影响),则由于足够多数单位的汇总综合结果,而相互抵消,趋于消失。通过平均化的结果以抵消偶然因素的个别影响,描述现象的典型水平,并进一步推断总体的数量特征,这些都是在大数定律的作用下进行的。应该指出,大数定律的作用是帮助我们通过偶然性达到发现的必然性,认识现象规律的表现形式的目的,但它并不能说明现象的本质,这又须借助相关实质性学科的知识来解释现象的本质及其内在联系。
172
174
168
173
幼儿组
68
69
68
70
71
73
72
73
74
75
(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么?离散系数
(2)比较分析哪一组的身高差异大?
成年组身高平均数幼儿组身高平均数:71.3
172.7777778
成年组身高标准差:成人组身高离散系数:4.201851444/172.7777778=0.024319397
(5)计算变异系数标准差/平均数=0.254969981
(6)计算偏态系数和峰态系数
偏态系数:-0.926935366峰态系数:0.927784856(分别用SKEW、KURT函数算)
2.在某地区抽取120家企业,按利润进行分组,结果如下:
按利润额分组(万元)
企业数(个)
200~300
19
300~400
(2)推断统计就是充分利用有用信息,采用科学的概率理论,对未知的现象总体或事物的未来进行有一定把握的估计和预测,属于事前统计。
2.试论大数定律在统计研究中的方法论意义。
(1)现象的某种总体规律只有当具有这些现象的足够多数的单位汇总综合在一起的时候,才能显示出来。因此只有从大量现象的总体中,才能研究这些现象的规律性。
3.一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。
(1)这一研究的总体是什么?
所有IT从业者
(2)月收入是分类变量、顺序变量还是定量变量?定量变量
(3)消费支付方式是分类变量、顺序变量还是定量变量?分类变量
2.简述众数、中位数和平均数的特点和应用场合。
(1)众数:一组数据中出现次数最多的变量值,适合于数据量较多时使用,不受极端值的影响,一组数据可能没有众数或有几个众数,适用于分类数据、顺序数据和定量数据。
(2)中位数:排序后处于中间位置上的值,不受极端值的影响,主要用于定量数据,各变量值与中位数的离差绝对值之和最小
85
85
81
75
85
97
96
60
69
64
54
85
65
60
96
82
98
60
77
46
60
86
71
60
19
97
84
(1)根据上面数据进行适当分组,编制频数分布表
(2)绘制直方图
(3)计算众数、中位数、四分位数
众数:60(用MODE函数算)中位数:78(用MEDIAN函数算)四分位数:
(4)计算平均数和标准差平均数:72.54761905标准差:18.49746506(分别用AVERAGE、STDEV函数算)
A.只能作为总体B.既能作为总体,也能作为总体单位C.只能作为总体单位D.以上都不能
5.下列中,属于定量变量的是()
A.职工的性别B.职工的籍贯C.职工的受教育程度D.职工的身高
简答题
1.如何区分描述统计和推断统计。
(1)描述统计:利用统计指标、统计表格、统计图形等,对现象总体的总量规模、结构比例、发展速度等状况进行刻画,、陈述、表达,是事前统计;
判断题
1.根据组距数列计算的平均数,只是一个近似值。对
2.各变量值与其平均数的离差之和为最小值。错
3.两变量和的平均数等于两变量平均数的和。错
4.分类数据可以用平均数度量集中趋势。对
简答题
1.一组数据的分布特征可以从哪几个方面进行测度?
说明其集中趋势的平均指标(数值平均数、众数、中位数、四分位数),说明其离散程度的变异指标(变异全距、平均差、标准差和方差、变异系数)
(1)是男生的体重差异大还是女生的体重差异大?女生
(2)粗略地估计一下,男生中有百分之几的人体重在55kg~65kg之间68%
(3)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间95%
4.对10名成年人和10名幼儿的身高进行抽样调查,结果如下:
成年组
166
169
172
177
180
170
3.在编制等距数列时,如果全距为56,组数为6,为统计分析的方便,组距应取()为宜
A. 6 B. 9 C. 9.3D. 10
3.下面统计量最容易受极端值影响的是()
A.中位数B.众数C.平均数D.四分位数
4.在等距数列中,各组的频数分布与频数密度的分布()
A.一致B.有关系,但不一致C.有时一致,有时不一致D.毫无关系
5.变量数列中,各种的频率之和应该()
A.大于1 B.小于1C.等于1D.等于零
6.下面不属于概率抽样的是()
A.分层抽样B.配额抽样C.整群抽样D.多阶段抽样
7.下面不属于非概率抽样的是()
A.判断抽样B.方便抽样C.自愿样本D.系统抽样
判断题
1.无回答误差不会影响对统计分析结论。错
2.抽样误差是可以消除的。错
(4)这一研究涉及截面数据还是时间序列数据?截面数据
4.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?所有消费者
(2)“消费者在网上购物的原因”是分类变量、顺序变量还是定量变量?分类变量
(3)研究者所关心的参数是什么?消费者每月在网上购物的平均花费
(1)互斥原则:商场把服装先分成童装和成人服装两类,然后每类再分男女,如果不这样分的话,男装女装童装之间有重复,互斥原则即不能重复原则。
(2)穷尽原则。即不重不漏原则,例如,从业人员按文化程度分组,分为小学毕业、中学毕业(含中专)和大学毕业三组,那么,那些文盲或识字不多的以及大学以上的学历者则无组可归。如果将分组适当调整为:文盲及识字不多、小学毕业、中学毕业(含中专)、大学及大学以上,这样分组,就可以包括全部从业人员的各种不同层次的文化程度,符合了分组的穷尽原则。
(3)平均数:也称为均值,集中趋势的最常用测度值,体现了数据的必然性特征,易受极端值的影响,有简单平均数和加权平均数之分
根据总体数据计算的,称为平均数,记为μ;根据样本数据计算的,称为样本平均数,记为¯x
分析计算题
1.某班级经济学成绩如下:
24
60
73
51
60
79
81
Байду номын сангаас83
55
83
82
86
92
89
52
3.样本量越大,抽样误差越大。错
4.总体的变异性越大,抽样误差越大。对
简答题
1.请简单比较一下概率抽样和非概率抽样。
概率抽样:依据随机原则抽选样本,样本统计量的理论分布存在,可根据调查的结果推断总体
非概率抽样:不是依据随机原则抽选样本,样本统计量的分布是不确定的,无法使用样本的结果推断总体
2.举例说明统计分组应该遵循的原则。
30
400~500
42
500~600
18
600~700
11
合计
120
(1)计算120家企业利润额的平均数和标准差
平均数:(19*250+30*350+42*450+18*550+11*650)/120约等于427
标准差:
(2)计算分布的偏态系数和峰态系数
3.一项关于大学生体重状况的研究发现,男生的平均体重为60kg,标准差为5kg,女生的平均体重为50kg,标准差为5kg。
(4)“消费者每月在网上购物的平均花费是200元”是参数还是统计量?参数
(5)研究者所使用的主要是描述统计方法还是推断统计方法?推断统计方法
选择题
1.抽样调查应遵循的原则是()
A.准确性原则B.可靠性原则C.随机性原则D.灵活性原则
2.统计分组时,在全距一定的情况下()
A.组距越大,组数越多B.组距越大,组数越少C.组距大小与组数多少无关D.组距大小与组数多少成正比
4.201851444
幼儿组身高标准差:幼儿组身高离散系数:2.496664441/71.3=0.035016332
2.496664441
所以幼儿组身高差异大
作业
选择题
1.统计总体的特征是()
A.大量性总体性数量性B.总体性数量性变异性C.同质性大量性变异性D.数量性同质性变异性
2.变量是说明()特征的名称
A.总体B.总体单位C.总体单位量的D.总体单位质的
3.下列中,属于定性变量的是()
A.工人的年龄B.工人的工资C.工人的工种D.工人的产品数量
4.某个个体的自然人在社会经济统计研究中,一般()
选择题
1.市场上有两种不同价格的水果,则各买一斤和各买一元的平均价格()
A.两者相等B.前者低于后者C.前者高于后者D.无法判断
2.当样本均值>中位数>众数时,总体的频数分布状况为()
A.左偏斜钟形分布B.右偏斜钟形分布C.对称的钟形分布D.正态分布
3.下面统计量最容易受极端值影响的是()
A.中位数B.众数C.平均数D.四分位数