《统计学》(贾俊平第七版)课后题及答案-统计学 贾俊平第七版

合集下载

统计学课后答案(贾俊平版)人大出版之欧阳引擎创编

统计学课后答案(贾俊平版)人大出版之欧阳引擎创编

第三章节:数据的图表展示 (1)欧阳引擎(2021.01.01)第四章节:数据的概括性度量 (15)第六章节:统计量及其抽样分布 (26)第七章节:参数估计 (28)第八章节:假设检验 (38)第九章节:列联分析 (41)第十章节:方差分析 (43)3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。

服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。

调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B CBCEDBCCBC要求:(1)指出上面的数据属于什么类型。

顺序数据(2)用Excel 制作一张频数分布表。

用数据分析——直方图制作:(3)绘制一张条形图,反映评价等级的分布。

用数据分析——直方图制作:(4)绘制评价等级的帕累托图。

逆序排序后,制作累计频数分布表:接收 频数 频率(%) 累计频率(%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A 14 14 1003.2 某行业管理局所属40个企业2002年的产品销售收入数据如下:152124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 9788123115119138112146113126要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计接收频率E 16 D 17 C 32 B 21 A14算出累积频数和累积频率。

贾俊平《统计学》章节题库(假设检验)详解【圣才出品】

贾俊平《统计学》章节题库(假设检验)详解【圣才出品】
A.H0:μ=100,H1:μ≠100 B.H0:μ≤100,H1:μ>100 C.H0:μ≥100,H1:μ<100 D.H0:μ>100,H1:μ≤100 【答案】B
3 / 58
圣才电子书 十万种考研考证电子书、题库视频学习平台

【解析】通常把观察现象原来固有的性质戒没有充分证据丌能轻易否定的命题设为原假 设;通常把该观察现象新的性质戒丌能轻易肯定的结论设为备择假设。题中,实际统计的日 销售量为 99.32 吨,即无法轻易肯定广告可使每天的销售量达到 100 吨,则原假设和备择
8.超人电池制造商宣称他所制造的电池可使用超过 330 小时,为检验这一说法是否属 实,研究人员从中抽叏了 12 个电池迚行测试,建立的原假设和备择假设为 H0:μ≤330, H1:μ>330。检验结果是没有拒绝原假设,这表明( )。[浙江工商大学 2011 研;安 徽财经大学 2012 研]
A.有充分证据证明电池的使用导命小亍 330 小时 B.电池的使用导命小亍等亍 330 小时 C.没有充分证据表明电池的使用导命超过 330 小时
假设应该为: H0 : μ 100 , H1 : μ 100
7.在假设检验中,两个总体 X~N(μ1,σ12),Y~N(μ2,σ22),其中 μ1,μ2 未知, 检验 σ21 是否等亍 σ22 应用( )。[浙江工商大学 2011 研]
A.μ 检验法 B.t 检验法 C.F 检验法 D.χ2 检验法 【答案】C 【解析】在两个正态总体条件下,样本方差除以总体方差乊比服从 F 分布,所以检验两 个总体方差是否相等,应用 F 检验法。
A.B 公叵交货日期比 A 公叵短 B.B 公叵交货日期比 A 公叵长 C.B 公叵交货日期丌比 A 公叵短 D.B 公叵交货日期丌比 A 公叵长 【答案】C 【解析】通常把研究者要证明的结论作为备择假设。由亍海山集团倾向亍向 B 公叵订 货,故备择假设应为 B 公叵交货日期比 A 公叵短;而原假设不备择假设互斥,故原假设为 B 公叵交货日期丌比 A 公叵短。

贾俊平《统计学》课后习题及详解(统计量及其抽样分布)【圣才出品】

贾俊平《统计学》课后习题及详解(统计量及其抽样分布)【圣才出品】

第6章 统计量及其抽样分布一、思考题1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设是从总体中抽取的容量为的一个样本,如果由此样本构造一个函数,不依赖于任何未知参数,则称函数是一个统计量。

(2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。

为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。

(3)统计量是样本的一个函数。

由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。

2.判断下列样本函数哪些是统计量?哪些不是统计量?12n X X X ,,…,X n 12()n T X X X ,,…,12()n T X X X ,,…,1121021210310410()/10min()T X X X T X X X T X T X μμσ=+++==-=-…,,…,()/答:统计量中不能含有未知参数,故、是统计量,、不是统计量。

3.什么是次序统计量?答:设是从总体中抽取的一个样本,称为第个次序统计量,它是样本满足如下条件的函数:每当样本得到一组观测值…,时,其由小到大的排序中,第个值就作为次序统计量的观测值,而称为次序统计量,其中和分别为最小和最大次序统计量。

4.什么是充分统计量?答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。

统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。

5.什么是自由度?答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。

统计学习题答案-贾俊平

统计学习题答案-贾俊平

第四章统计数据的概括性度量4. 1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下: 2 4 7 10 10 10 12 12 14 15要求:(1) 计算汽车销售量的众数、中位数和平均数。

(2) 根据定义公式计算四分位数。

(3) 计算销售量的标准差。

(4) 说明汽车销售量分布的特征。

解:汽车销售数量StatisticsNValid 10Missing0 Mean9.60Median10.00Mode10Std. Deviation4.169 Percentiles25 6.255010.007512.504. 2随机抽取25个网络用户,得到他们的年龄数据如下:单位:周岁19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 31 17 23要求;(1) 计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:LI2.557.5 10汽车销售数量12.5 15Mean =9.6Std. Dev. =4.169N =10Histogram32网络用尸的年龄FrequencyPercent Cumulative FrequencyCumulative PercentValid15 14.0 14.016 1 4.0 2 8.0 17 1 4.0 3 12.0 18 1 4.0 4 16.0 19 3 12.0 7 28.0 20 2 8.0 9 36.0 21 1 4.0 10 40.0 22 2 8.0 12 48.0 233 12.0 15 60.0 24 2 8.0 17 68.0 25 1 4.0 18 72.0 27 1 4.0 19 76.0 29 1 4.0 20 80.0 30 1 4.0 21 84.0 31 1 4.0 22 88.0 34 1 4.0 23 92.0 38 1 4.0 24 96.0 41 1 4.0 25100.0Total25100.0从频数看出,众数 Mo 有两个:19、23;从累计频数看,中位数 Me=23。

贾俊平《统计学》章节题库(含考研真题)(数据的图表展示)【圣才出品】

贾俊平《统计学》章节题库(含考研真题)(数据的图表展示)【圣才出品】
2.下面哪个方图 B.茎叶图 C.条形图 D.箱线图 【答案】B
1 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台

【解析】茎叶图是保留并反映原始数据分布的图形,它由茎和叶两部分构成,其图形是 由数字组成的。ACD 三项都需要对原始数据进行处理,求得一些测度值之后再作出图形。
8.对于 100 名学生某一门课程的成绩,若想得到四分之一分位数、中位数与四分之三 分位数,以下哪种描述统计的办法更有效?( )[中山大学 2012 研]
A.直方图 B.茎叶图 C.饼图 D.点图
4 / 33
圣才电子书

【答案】B
十万种考研考证电子书、题库视频学习平台
12.饼图的主要用途是( )。 A.反映一个样本或总体的结构 B.比较多个总体的构成 C.反映一组数据的分布 D.比较多个样本的相似性 【答案】A 【解析】饼图是用圆形及圆内扇形的角度来表示数值大小的图形。它主要用于表示一个 样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。
【解析】直方图、饼图描述的数值型数据是分组数据,而茎叶图描述的是未分组的数值
型数据,点图描述的是两个变量之间的关系。茎叶图保留了原始数据的信息,可以计算其分
位数。
9.某外商投资企业按工资水平分为四组:1000 元以下,1000~1500 元;1500~2000 元;2000 元以上。第一组和第四组的组中值分别为( )。[首经贸 2009 研]
圣才电子书 十万种考研考证电子书、题库视频学习平台

第 3 章 数据的图表展示
一、单项选择题 1.对于大批量的数据,最适合描述其分布的图形是( )。[中国海洋大学 2018 研] A.条形图 B.茎叶图 C.直方图 D.饼图 【答案】C 【解析】在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。 条形图是用宽度相同的条形的高度或长短来表示数据多少的图形;饼图是用圆形及圆内扇形 的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占 全部数据的比例。

贾俊平《统计学》配套题库 【章节题库】详解 第13章~第14章【圣才出品】

贾俊平《统计学》配套题库  【章节题库】详解  第13章~第14章【圣才出品】
5.时间序列在长时期内呈现出来的某种持续向上或持续下降的变动称为( )。 A.趋势 B.季节性 C.周期性
2 / 90
圣才电子书

D.随机性
十万种考研考证电子书、题库视频学习平台
【答案】A
【解析】趋势是指时间序列在长期内呈现出来的某种持续上升或持续下降的变动,也称
长期趋势。时间序列中的趋势可以是线性的,也可以是非线性的。
16.指数平滑法适合于预测( )。 A.平稳序列 B.非平稳序列 C.有趋势成分的序列 D.有季节成分的序列 【答案】A 【解析】平稳时间序列通常只含有随机成分,其预测方法主要有简单平均法、移动平均 法和指数平滑法等,这些方法主要是通过对时间序列进行平滑以消除其随机波动。
11.环比增长率是( )。 A.报告期观察值与前一时期观察值之比减 l B.报告期观察值与前一时期观察值之比加 l C.报告期观察值与某一固定时期观察值之比减 l D.报告期观察值与某一固定时期观察值之比加 l 【答案】A 【解析】增长率可分为环比增长率和定基增长率。环比增长率是报告期观察值与前一时 期观察值之比减 1,说明现象逐期增长变化的程度。
9.从下面的图形可 C.周期性 D.趋势和随机性 【答案】D 【解析】趋势是指时间序列在长期内呈现出来的某种持续上升或持续下降的变动,也称 长期趋势。随机波动是时间序列中除去趋势、季节变动和循环波动之后的随机波动。随机波
4 / 90
圣才电子书 十万种考研考证电子书、题库视频学习平台

动通常是夹在时间序列中,致使时间序列产生一种波浪形或振荡式变动。从图中可以看出, 该时间序列中存在着持续向上的线性趋势以及明显的随机波动。
10.增长率是时间序列中( )。 A.报告期观察值与基期观察值之比 B.报告期观察值与基期观察值之比减 l C.报告期观察值与基期观察值之比加 l D.基期观察值与报告期观察值之比减 l 【答案】B 【解析】增长率也称增长速度,它是时间序列中报告期观察值与基期观察值之比减 1 后的结果,用%表示。

贾俊平《统计学》复习笔记课后习题详解及典型题详解(时间序列分析和预测)【圣才出品】

贾俊平《统计学》复习笔记课后习题详解及典型题详解(时间序列分析和预测)【圣才出品】

第13章时间序列分析和预测13.1 复习笔记一、时间序列及其分解1.时间序列(1)概念:时间序列是同一现象在不同时间上的相继观察值排列而成的序列,也称动态数列或时间数列。

(2)时间序列的两要素任何一个时间序列都具有两个基本要素:一是统计指标所属的时间,也称为时间变量;二是统计指标在特定时间的具体指标值。

(3)研究时间序列的目的①在编制时间序列的基础上,可以计算平均发展水平,进行动态水平分析;②可以计算各种速度指标,进行速度分析;③利用相关的数学模型,对现象的变动进行趋势分析。

2.时间序列的类型(1)平稳序列它是基本上不存在趋势的序列。

这类序列中的各观察值基本上都在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律,其波动可以看成是随机的。

(2)非平稳序列它是包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能含有几种成分,因此非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。

3.时间序列的4种成分(1)趋势(T)也称长期趋势,它是时间序列在长时期内呈现出来的某种持续上升或持续下降的变动。

时间序列中的趋势可以是线性的,也可以是非线性的。

(2)季节性(S)也称季节变动,它是时间序列在一年内重复出现的周期性波动。

季节性中的“季节”一词是广义的,它不仅仅是指一年中的四季,其实是指任何一种周期性的变化。

(3)周期性(C)也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动。

(4)随机性(I)也称不规则波动,它是时间序列中除去趋势、周期性和季节性之后的偶然性波动。

4.时间序列的分解模型将时间序列分解成长期趋势、季节变动、周期变动和随机变动四个因素后,可以认为时间序列Y t是这四个因素的函数,即Y t=f(T t,S t,C t,I t),其中较常用的是加法模型和乘法模型,其表现形式为:加法模型:Y t=T t+S t+C t+I t乘法模型:Y t=T t×S t×C t×I t注意:时间序列组合模型中包含了四种因素,这是时间序列的完备模式,但是并不是在每个时间序列中这四种因素都同时存在。

贾俊平《统计学》配套题库 【课后习题】详解 第11章~第12章【圣才出品】

贾俊平《统计学》配套题库  【课后习题】详解  第11章~第12章【圣才出品】

第11章一元线性回归一、思考题1.解释相关关系的含义,说明相关关系的特点。

答:变量之间存在的不确定的数量关系,称为相关关系。

相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个。

对这种关系不确定的变量是不能用函数关系进行描述的。

2.相关分析主要解决哪些问题?答:相关分析就是对两个变量之间线性关系的描述与度量,它要解决的问题包括:(1)变量之间是否存在关系;(2)如果存在关系,它们之间是什么样的关系;(3)变量之间的关系强度如何;(4)样本所反映的变量之间的关系能否代表总体变量之间的关系。

3.相关分析中有哪些基本假定?答:在进行相关分析时,对总体主要有以下两个假定:(1)两个变量之间是线性关系;(2)两个变量都是随机变量。

4.简述相关系数的性质。

答:相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。

若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ;若是根据样本数据计算的,则称为样本相关系数,记为r 。

相关系数的性质:(1)r 的取值范围在-1~+1之间,即-1≤r ≤1。

若0<r ≤1,表明x 与y 之间存在正线性相关关系;若-1≤r <0,表明x 与y 之间存在负线性相关关系;若r =+1,表明x 与y 之间为完全正线性相关关系;若r =-1,表明x 与y 之间为完全负线性相关关系。

可见当|r |=1时,y 的取值完全依赖于x ,二者之间即为函数关系;当r =0时,说明y 的取值与x 无关,即二者之间不存在线性相关关系。

(2)r 具有对称性。

x 与y 之间的相关系数xy r 和y 与x 之间的相关系数yx r 相等,即xy r =yx r 。

(3)r 数值大小与x 和y 的原点及尺度无关。

改变x 和y 的数据原点及计量尺度,并不改变r 数值大小。

(4)r 仅仅是x 与y 之间线性关系的一个度量,它不能用于描述非线性关系。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章 导论 1. 什么是统计学? 统计学是搜集、处理、分析、解释数据并从中得出结论的科学。 2. 解释描述统计与推断统计。 描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。推断统计研究的是如何利用样本数据来推断总体特征的统计方法。 3. 统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。 4. 解释分类数据、顺序数据和数值型数据的含义。 分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。 5. 举例说明总体、样本、参数、统计量、变量这几个概念。 总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合, 参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。 6. 变量可分为哪几类? 变量可分为分类变量、顺序变量和数值型变量。分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。 7. 举例说明离散型变量和连续型变量。 离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。

第二章 数据的搜集 1. 什么是二手资料?使用二手资料需要注意些什么? 与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。 2. 比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样:指遵循随机原则进行的抽样,总体中每一个单位都有一定的机会被选入样本。当用样本对总体进行估计时,要考虑每个单位样本被抽中的概率。技术含量和成本都比较高。如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样。 非概率抽样:指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求, 采用某种方式从总体中抽取部分单位对其进行实施调查。操作简单、时效快、成本 低。而且对于抽样中的统计学专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。 3. 调查中搜集数据的方法主要有自填式、面访式、电话式。除此之外,还有哪些搜集数据的方法? 试验式和观察式。 4. 自填式、面访式、电话式调查各有什么利弊? 自填式优点:调查组织者管理容易;成本低,可进行大规模调查;减少被调查者回答敏感问题的压力。缺点:返回率低;调查内容有限;调查周期长;在数据搜集过程中遇见问题不能及时调整。 面访式优点:回答率高;数据质量高;在调查过程中遇见问题可以及时调整。缺点: 成本比较高;搜集数据的方式对调查过程的质量控制有一定难度;对于敏感问题, 被访者会有压力。 电话式优点:对调查员比较安全;对访问过程的控制比较容易。缺点:实施地区有限;调查时间不能过长;使用的问卷要简单;被访者不愿回答时,不易劝服。 5. 你认为应当如何控制调查中的回答误差? 对于理解误差,我会学习一些心理学知识;对于记忆误差,我会尽量去缩短所涉及的时间范围;对于有意识误差,要做好被调查者的心理工作,要遵守职业道德,为被调查者保密,尽量在问卷中不涉及敏感问题。 6. 怎样减少无回答?请通过一个例子说明你所考虑到的减少无回答的具体措施。 对于随机误差,要提高样本容量;对于系统误差,只有做好准备工作并做好补救措施。

第三章 数据的图表展示 1. 数据的预处理包括哪些内容? 数据审核(对于原始数据:完整性和准确性;对于二手数据:实用性和实效性)、数据筛选和数据排序。 2. 分类数据和顺序数据的整理和图示方法各有哪些? 分类数据:制作频数分布表,用比例、百分比和比率等进行描述性分析,可用条形图、帕累托图、饼图和环形图进行图示分析。 顺序数据:制作频数分布表,用比例、百分比、比率、累计频数和累计频率等进行描述性分析,可用条形图、帕累托图、饼图、累计评书分布图和环形图进行分析。 3. 数值型数据的分组方法有哪些?简述组距分组的步骤。 分组方法:单变量值分组和组距分组,组距分组又分为等距分组和异距分组。分组步骤:①确定组数②确定组距③根据分组整理成频数分布表。 4. 直方图与条形图有何区别? 条形图使用的长度表示各类别频数的多少,其宽度固定;直方图用面积表示各组频数,矩形的高度表示魅族的频数或频率,宽度表示组距。直方图各矩形连续排列, 条形图分开排列。直方图主要展示数值型数据。 5. 绘制线图应注意哪些问题? 时间在横轴,观测值在纵轴。一般是长宽比例 10:7 的长方形,纵轴下端一般从 0 开始,数据与 0 距离过大的话用折断符号折断。 6. 饼图和环形图有什么不同? 饼图只能显示一个样本或总体各部分所占比例,环形图可以同时绘制多个样本或总 体的数据系列。 7. 茎叶图与直方图相比有什么优点?他们的应用场合是什么? 茎叶图既能给出数据的分布情况,又能给出每个原始数据,即保留了原始数据的信息。茎叶图通常适用于小批量数据,直方图适用于大批量数据。 8. 鉴别图表优劣的准则有哪些? 显示数据;有助于洞察问题的本质;使复杂的观点得到简明、确切、高效的阐述; 快速高效地给读者提供大量的信息;多维的;表述数据的真实情况。 9. 制作统计表时应注意哪几个问题? 合理安排统计表结构;表头一般包括表号、总标题和表中数据的单位等内容;在使用统计表时,必要时可在下方加注释注明数据来源。

第四章 数据的概括性度量 1. 一组数据的分布特征可以从哪几个方面进行测度? 可以从数据分布的集中趋势、离散程度和分布的偏态与峰态三个方面进行测量。集中其实反映了各数据向其中心支靠拢或聚集的程度;离散程度反映了各数据原理其中心值的趋势;偏态与峰态反映了数据分布的图像形状。 2. 简述众数、中位数和平均数的特点和应用场合。 众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。众数只有在数据量较多时才有意义。主要适合作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受极端值影响,当数据分布的偏斜较大时,可以使用中位数。主要适合作为顺序数据的集中趋势测度值。 平均是是针对数值型数据计算的,而且利用了全部数据信息。当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时应选平均数作为集中趋势的代表值。但平均数的主要缺点是易受极端值的影响;对于偏态分布的数据,平均数的代表性较差。 3. 简述异众比率、四分位差、方差或标准差的应用场合。 异众比率主要用于测量分类数据的离散程度;四分位差主要用于测量顺序数据的离散程度;方差或标准差主要用于测量数值型数据的离散程度。 4. 标准分数有哪些用途? 标准分数给出了一组数据中各数值的相对位置。在对多个具有不同量纲的变量进行处理时,常需要对各变量进行标准化处理。它还可以用来判断一组数据是否有离群数据。 5. 为什么要计算离散系数? 方差和标准差是反映数据离散程度的绝对值,一方面其数值大小受原变量值本身水平高低的影响;另一方面,他们与原变量的计量单位相同,采用不同计量单位的变量值,其离散程度的测度值也就不同。 6. 测度数据分布形状的统计量有哪些? 对于分布形状的测度有偏态和峰态。测度偏态的统计量是偏态系数;测度峰态的统计量是峰态系数。 𝑖=1 𝑖

第五章 概率与概率分布 1. 频率与概率有什么关系? 在相同条件下随机试验𝑛次,某事件出现𝑚次,则比值𝑚称为该事件发生的频率。随 𝑛

着𝑛的增大,该频率围绕某一常数𝑝波动,且波动幅度逐渐减小,趋于稳定,这个频率的稳定值即为该事件的概率。

第六章 统计量及其抽样分布 1. 什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 统计量:设𝑋1, 𝑋2,···, 𝑋𝑛是从总体𝑋总抽取的容量为𝑛的一个样本,如果由此样本构造一个函数𝑇(𝑋1, 𝑋2,···, 𝑋𝑛),不依赖于任何未知参数,则称函数𝑇(𝑋1, 𝑋2,···, 𝑋𝑛

)是一个

统计量。 由样本构造具体的统计量,实际上是对样本信息进行加工并集中到统计量的取值上, 便于通过统计量推断总体参数。 由于样本已经抽出,故统计量总是知道的,因此统计量不含有任何未知参数。 2. 简述𝜒2分布、𝑡分布、F 分布及正态分布之间的关系。

正态分布:𝑍 = 𝑋−𝜇 ~𝑁(0,1),则𝑋~𝑁(𝜇, 𝜎2)

𝜎

𝜒2分布:设随机变量𝑋1, 𝑋2,···, 𝑋𝑛 相互独立,且𝑋𝑖(𝑖 = 1,2,···, 𝑛)服从标准正态分布 𝑁(0,1),则他们的平方和∑𝑛 𝑋2服从自由度为𝑛的𝜒2分布。

𝑡分布:设随机变量𝑋~𝑁(0,1),𝑌~𝜒2(𝑛),且𝑋与𝑌独立,则𝑡 = 𝑋 √𝑌/𝑛 其分布称为𝑡分

布。 𝐹分布:设随机变量𝑌与𝑍相互独立,且𝑌与𝑍分别服从自由度为𝑚和𝑛的𝜒2分布,则

𝑋 = 𝑌/𝑚 = 𝑛𝑌 ~𝐹(𝑚, 𝑛) 𝑍/𝑛 𝑚𝑍

3. 什么是抽样分布? 在总体𝑋的分布类型已知时,若对任一自然数𝑛,都能导出统计量𝑇 = 𝑇(𝑋1, 𝑋2,···, 𝑋𝑛

)

的分布的数学表达式,这种分布称为精确的抽样分布。 4. 简述中心极限定理的意义。 中心极限定理:设从均值为𝜇,方差为𝜎2的一个文艺总体中抽取容量为𝑛的样本,当 𝑛充分大时,样本均值的抽样分布近似服从均值为𝜇,方差为𝜎2/𝑛的正态分布。 意义:是数理统计学和误差分析的理论基础,指出了大量随机变量之和近似服从正态分布的条件。

第七章 参数估计 1. 解释估计量和估计值。 估计量:用于估计总体参数的随机变量。 估计值:估计参数时计算出来的统计量的具体值。

相关文档
最新文档