统计学第四章习题答案贾俊平

合集下载

统计学(贾俊平)第五版课后习题答案(完整版)

统计学(贾俊平)第五版课后习题答案(完整版)

统计学(第五版)贾俊平课后习题答案(完整版)第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。

1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。

1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。

它也是有类别的,但这些类别是有序的。

(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。

实验数据:在实验中控制实验对象而收集到的数据。

统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。

时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。

1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。

变量也可以分为随机变量和非随机变量。

经验变量和理论变量。

1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。

统计学第四章习题答案 贾俊平

统计学第四章习题答案 贾俊平

第四章 统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下: 2 4 7 10 10 10 12 12 14 15 要求:(1)计算汽车销售量的众数、中位数与平均数。

(2)根据定义公式计算四分位数。

(3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。

解:Statistics汽车销售数量 10 Missing0 Mean 9、60 Median 10、00Mode10 Std 、 Deviation 4、169 Percentiles25 6、25 50 10、00 75单位:周岁19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 3117 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布与累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。

Q1位置=25/4=6、25,因此Q1=19,Q3位置=3×25/4=18、75,因此Q3=27,或者,由于25与27都只有一个,因此Q3也可等于25+0、75×2=26、5。

(3)计算平均数与标准差;Mean=24、00;Std、Deviation=6、652(4)计算偏态系数与峰态系数:Skewness=1、080;Kurtosis=0、773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6、652、呈右偏分布。

如需瞧清楚分布形态,需要进行分组。

1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4、3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图::一种就是所有颐客都进入一个等待队列:另—种就是顾客在三千业务窗口处列队3排等待。

贾俊平第四版统计学-第四章-习题

贾俊平第四版统计学-第四章-习题

第四章习题一、选择题1. 一组数据中出现频数最多的变量值称为()。

A.众数B.中位数C.四分位数D.均值2.一组数据排序后处于中间位置上的变量值称为()。

A.众数B.中位数C.四分位数D.均值3. n个变量值乘积的n次方根称为()。

A.众数B.中位数C.四分位数D.几何平均数4. 非众数组的频数占总频数的比率称为()。

A.异众比率B.离散系数C.平均差D.标准差5. 一组数据的最大值与最小值之差称为()。

A.平均差B.标准差C.极差D.四分位差6. 如果一个数据的标准分数是-2,表明该数据()。

A.比平均数高出2个标准差B.比平均数低2个标准差C.等于2倍的平均数D.等于2倍的标准差7. 一组数据的标准分数,其()。

A.均值为1,方差为0 B.均值为0,方差为1C.均值为0,方差为0 D.均值为1,方差为18. 经验法则表明,当一组数据对称分布式,在均值加减1个标准差的范围内大约有()。

A.68%的数据B.95%的数据C.99%的数据D.100%的数据9. 离散系数的主要用途是()。

A.反映一组数据的离散程度B.反映一组数据的平均水平C.比较多组数据的离散程度D.比较多组数据的平均水平10. 两组数据相比较()。

A.标准差大的离散程度也大B.标准差大的离散程度也小C.离散系数大的离散程度也大D.离散系数大的离散程度也小11. 某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。

在上面的描述中,众数是()。

A.1200 B.经济管理学院C.200 D.理学院12. 对于分类数据,测度其离散程度使用的统计量主要是()。

A.众数B.异众比率C.标准差D.均值13. 对于右偏分布,均值、中位数和众数之间的关系是()。

A.均值>中位数>众数B.中位数>均值>众数C.众数>中位数>均值D.众数>均值>中位数14. 在某行业中随即抽取10家企业,第一季度的利润额(单位:万元)分别为72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。

《统计学》(贾俊平第七版)课后题及答案-统计学 贾俊平第七版

《统计学》(贾俊平第七版)课后题及答案-统计学 贾俊平第七版

第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。

2.解释描述统计与推断统计。

描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。

推断统计研究的是如何利用样本数据来推断总体特征的统计方法。

3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。

4.解释分类数据、顺序数据和数值型数据的含义。

分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。

5.举例说明总体、样本、参数、统计量、变量这几个概念。

总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。

6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。

分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。

7.举例说明离散型变量和连续型变量。

离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。

第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。

使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。

2.比较概率抽样和非概率抽样的特点。

举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。

统计学第四章习题答案-贾俊平

统计学第四章习题答案-贾俊平

第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数.(2)根据定义公式计算四分位数。

(3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。

解:Statistics10Missing0Mean9.60Median10.00Mode10Std. Deviation4。

169Percentiles256。

255010.0075单位:周岁19152925242321382218302019191623272234244120311723要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。

Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18。

75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0。

75×2=26.5。

(3)计算平均数和标准差;Mean=24。

00;Std。

Deviation=6。

652(4)计算偏态系数和峰态系数:Skewness=1。

080;Kurtosis=0。

773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。

如需看清楚分布形态,需要进行分组。

1、确定组数: ()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 — 最小值)÷ 组数=(41-15)÷6=4。

3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图::一种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。

为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客.得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。

统计学教材课后答案 第三版 袁卫 庞皓 曾五一 贾俊平主编

统计学教材课后答案  第三版 袁卫 庞皓 曾五一 贾俊平主编

第四章、参数估计1.简述评价估计量好坏的标准答:评价估计量好坏的标准主要有:无偏性、有效性和相合性。

设总体参数θ的估计量有1ˆθ和2ˆθ,如果()1ˆE θθ=,称1ˆθ是无偏估计量;如果1ˆθ和2ˆθ是无偏估计量,且()1ˆD θ小于()2ˆD θ,则1ˆθ比2ˆθ更有效;如果当样本容量n →∞,1ˆθθ→,则1ˆθ是相合估计量。

2.说明区间估计的基本原理答:总体参数的区间估计是在一定的置信水平下,根据样本统计量的抽样分布计算出用样本统计量加减抽样误差表示的估计区间,使该区间包含总体参数的概率为置信水平。

置信水平反映估计的可信度,而区间的长度反映估计的精确度。

3.解释置信水平为95%的置信区间的含义答:总体参数是固定的,未知的,置信区间是一个随机区间。

置信水平为95%的置信区间的含义是指,在相同条件下多次抽样下,在所有构造的置信区间里大约有95%包含总体参数的真值。

4.简述样本容量与置信水平、总体方差、允许误差的关系答:以估计总体均值时样本容量的确定公式为例:()22/22z n E ασ= 样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比。

练习题:●1.解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25,(1)样本均值的抽样标准差σ5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96,于是,允许误差是E =α/2Z 6×0.7906=1.5496。

●2.解:(1)已假定总体标准差为σ=15元,则样本均值的抽样标准误差为x σ15=2.1429(2)已知置信水平1-α=95%,得 α/2Z =1.96,于是,允许误差是E=α/2Z 6×2.1429=4.2000。

(3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96,这时总体均值的置信区间为±α/2x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。

统计学第五版课后答案(贾俊平)之欧阳术创编

统计学第五版课后答案(贾俊平)之欧阳术创编

第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。

(2)根据定义公式计算四分位数。

(3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。

解:Statistics10Missing 0Mean 9.60Median 10.00Mode 10Std. Deviation 4.169Percentiles 25 6.2550 10.00754.2 随机抽取25个网络用户,得到他们的年龄数据如下:单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄数Me=23。

(2)根据定义公式计算四分位数。

Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。

(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。

如需看清楚分布形态,需要进行分组。

为分组情况下的直方图:为分组情况下的概率密度曲线: 分组:1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=62、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:4.3 某银行为缩短顾客到银行办理业务等待的时间。

统计学第四章习题答案 贾俊平

统计学第四章习题答案 贾俊平

第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 710 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数.(2)根据定义公式计算四分位数。

(3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。

解:Statistics10Missing0Mean9.60Median10.00Mode10Std。

Deviation4。

169Percentiles25 6.255010.0075单位:周岁19152925242321382218302019191623272234244120311723要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。

Q1位置=25/4=6。

25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5.(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652(4)计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。

如需看清楚分布形态,需要进行分组。

1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k =6 2、确定组距:组距=( 最大值 — 最小值)÷ 组数=(41-15)÷6=4。

3,取53、分组频数表网络用户的年龄 (B in ned)分组后的直方图::一种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。

为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。

(2)根据定义公式计算四分位数。

(3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。

解:Statistics10Missing0MeanMedianMode10Std. DeviationPercentiles255075单位:周岁19152925242321382218302019191623272234244120311723要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。

Q1位置=25/4=,因此Q1=19,Q3位置=3×25/4=,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+×2=。

(3)计算平均数和标准差;Mean=;Std. Deviation=(4)计算偏态系数和峰态系数:Skewness=;Kurtosis=(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=、呈右偏分布。

如需看清楚分布形态,需要进行分组。

1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。

为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。

得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。

第二种排队方式的等待时间(单位:分钟)如下:5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8要求:(1)画出第二种排队方式等待时间的茎叶图。

第二种排队方式的等待时间(单位:分钟) Stem-and-Leaf PlotFrequency Stem & LeafExtremes (=<6 . 6787 . 1347 . 88Stem width:Each leaf: 1 case(s)(2)计算第二种排队时间的平均数和标准差。

Mean7Std. DeviationVariance(3)比较两种排队方式等待时间的离散程度。

第二种排队方式的离散程度小。

(4)如果让你选择一种排队方式,你会选择哪—种试说明理由。

选择第二种,均值小,离散程度小。

4.4 某百货公司6月份各天的销售额数据如下:单位:万元257276297252238310240236265278271292261281301274267280291258272284268303273263322249269295要求:(1)计算该百货公司日销售额的平均数和中位数。

(2)按定义公式计算四分位数。

(3)计算日销售额的标准差。

解:Statistics百货公司每天的销售额(万元)30Missing0 MeanMedianStd. DeviationPercentiles255075乙的低成本的产品多。

(1)计算120家企业利润额的平均数和标准差。

(2)计算分布的偏态系数和峰态系数。

解:Statistics120Missing0MeanStd. DeviationSkewnessStd. Error of SkewnessKurtosisStd. Error of Kurtosis100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1 000名7~17岁的少年儿童作为样本。

请回答下面的问题,并解释其原因。

(1)两位调查人员所得到的样本的平均身高是否相同如果不同,哪组样本的平均身高较大(2)两位调查人员所得到的样本的标准差是否相同如果不同,哪组样本的标准差较大(3)两位调查人员得到这l 100名少年儿童身高的最高者或最低者的机会是否相同如果不同,哪位调查研究人员的机会较大解:(1)不一定相同,无法判断哪一个更高,但可以判断,样本量大的更接近于总体平均身高。

(2)不一定相同,样本量少的标准差大的可能性大。

(3)机会不相同,样本量大的得到最高者和最低者的身高的机会大。

4.8 一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。

请回答下面的问题:(1)是男生的体重差异大还是女生的体重差异大为什么女生,因为标准差一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。

(2)以磅为单位(1ks=2.2lb),求体重的平均数和标准差。

都是各乘以,男生的平均体重为60kg×=132.6磅,标准差为5kg×=11.05磅;女生的平均体重为50kg×=110.5磅,标准差为5kg×=11.05磅。

(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间计算标准分数:Z1=x xs-=55605-=-1;Z2=x xs-=65605-=1,根据经验规则,男生大约有68%的人体重在55kg一65kg之间。

(4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间计算标准分数:Z1=x xs-=40505-=-2;Z2=x xs-=60505-=2,根据经验规则,女生大约有95%的人体重在40kg一60kg之间。

4.9 一家公司在招收职员时,首先要通过两项能力测试。

在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。

一位应试者在A项测试中得了115分,在B项测试中得了425分。

与平均分数相比,该应试者哪一项测试更为理想解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。

Z A=x xs-=11510015-=1;Z B=x xs-=42540050-=因此,A项测试结果理想。

4.10 一条产品生产线平均每天的产量为3 700件,标准差为50件。

如果某一天的产量低于或高于平均产量,并落人士2个标准差的范围之外,就认为该生产线“失去控制”。

下面(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量为什么均值不相等,用离散系数衡量身高差异。

(2)4.12 一种产品需要人工组装,现有三种可供选择的组装方法。

为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。

下面是15个工人分别用三种方法在相同的时间内组装的产品数量:164167168165170165164168164162163166167166165129130129130131]30129127128128127128128125132125126126127126128127126127127125126116126125要求:(1)你准备采用什么方法来评价组装方法的优劣均值不相等,用离散系数衡量身高差异。

(2)如果让你选择一种方法,你会作出怎样的选择试说明理由。

解:对比均值和离散系数的方法,选择均值大,离散程度小的。

方法A方法B方法C平均平均平均标准差标准差标准差离散系数:V A=,V B= ,V C=均值A方法最大,同时A的离散系数也最小,因此选择A方法。

4.13 在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。

预期收益率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高。

下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。

在股票市场上,高收益率往往伴随着高风险。

但投资于哪类股票,往往与投资者的类型有一定关系。

(1)你认为该用什么样的统计量来反映投资的风险标准差或者离散系数。

(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票选择离散系数小的股票,则选择商业股票。

(3)如果进行股票投资,你会选择商业类股票还是高科技类股票考虑高收益,则选择高科技股票;考虑风险,则选择商业股票。

相关文档
最新文档