贾俊平《统计学》考研真题(含复试)与典型习题详解(数据的概括性度量)【圣才出品】
贾俊平《统计学》复习笔记课后习题详解及典型题详解(参数估计)【圣才出品】

∧
定义:点估计是用样本统计量θ的某个取值直接作为总体参数 θ 的估计值。 局限性:一个点估计值的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点 估计值无法给出估计的可靠性的度量,因此不能完全依赖于一个点估计值,而应围绕点估计 值构造总体参数的一个区间。 (2)区间估计 区间估计的基本思想:在点估计的基础上,给出总体参数估计的一个区间范围,该区间 通常由样本统计量加减估计误差得到。进行区间估计时,根据样本统计量的抽样分布能够对 样本统计量与总体参数的接近程度给出一个概率度量。 置信区间:在区间估计中,由样本统计量所构造的总体参数的估计区间。
著性水平表示区间估计的不可靠概率。置信度愈大(即估计的可靠性愈大),则置信区间相
应也愈大(即估计准确性愈小)。
3.评价估计量的标准
2 / 57
圣才电子书
(1)无偏性
十万种考研考证电子书、题库视频学习平台
指估计量抽样分布的数学期望等于被估计的总体参数。
∧
∧
∧
设总体参数为 θ,所选择的估计量为θ,若有 E(θ)=θ,则称θ为 θ 的无偏估计量。
1 / 57
圣才电子书 十万种考研考证电子书、题库视频学习平台
置信下限:置信区间的最小值。
置信上限:置信区间的最大值。
置信水平(也称为置信度或置信系数):将构造置信区间的步骤重复多次,置信区间中
包含总体参数真值的次数所占的比例。
∧
∧
区间估计的数学定义:若用两个统计量θ1(x1,x2,…,xn)和θ2(x1,x2,…,xn)
存在“可能包含”或“可能不包含”的问题。
③在实际问题中,进行估计时往往只抽取一个样本,此时所构造的是与该样本相联系的
贾俊平《统计学》复习笔记课后习题详解及典型题详解(数据的搜集)【圣才出品】

第2章数据的搜集2.1 复习笔记一、数据的来源1.数据的直接来源数据的直接来源是指通过直接调查或实验活动直接获得一手数据,直接来源的数据又分为调查数据和实验数据。
它们的不同之处在于:(1)调查数据为通过调查方法得到的数据,而实验数据为通过实验方法得到的数据。
(2)调查数据通常是针对社会现象而获取的,而实验数据大多是针对自然现象而获取的;(3)调查数据通常取自有限总体,即总体所包含的个体单位是有限的;而实验数据是指在实验中通过控制实验对象所搜集到的变量的数据。
2.数据的间接来源(1)间接来源的数据(二手资料)如果与研究内容有关的原信息已经客观存在,只是对这些原信息重新加工、整理,使之成为进行统计分析可以使用的数据,则称为间接来源的数据。
(2)二手资料的优点搜集方便;数据采集快;采集成本低。
(3)二手资料的作用分析所要研究的问题;提供研究问题的背景,帮助研究者更好地定义问题,检验和回答某些假设和疑问,寻找研究问题的思路和途径。
(4)二手资料的局限性针对性不够;资料的相关性不够;口径可能不一致;数据也许不准确,也许过时等。
(5)对二手资料进行评估的内容①资料是谁搜集的?数据搜集者的实力和社会信誉度会在一定程度上影响数据说服力;②搜集的目的是什么?为了某种特殊的利益而搜集的数据是值得怀疑的;③数据是怎样搜集的?搜集数据的方法有很多,不同方法所采集到的数据,其解释力和说服力都是不同的。
如果不了解搜集数据所用的方法,很难对数据的质量做出客观的评价。
数据的质量来源于数据的产生过程;④什么时候搜集的?过时的数据的说服力会受到质疑。
(6)使用二手数据的注意事项使用二手数据,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。
在引用二手数据时,应注明数据的来源,以尊重他人的劳动成果。
二、调查方法1.概率抽样和非概率抽样(1)概率抽样概率抽样(随机抽样):指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
贾俊平《统计学》(第五版)考研真题(含复试)与典型习题详解 分类数据分析

合计
赞成
35
30
65
反对
15
20
35
合计
50
50
100
如果要检验男女教师对教师体制改革的看法是否相同,提出的原假设为( )。
A.H0:π1=π2=35 B.H0:π1=π2=50 C.H0:π1=π2=65
6 / 19
圣才电子书
D.H0:π1=π2=0.65
十万种考研考证电子书、题库视频学习平台
156 162
圣才电子书
A.0.6176
十万种考研考证电子书、题库视频学习平台
B.1.2352
C.2.6176
D.3.2352
【答案】B
【解析】 2 检验可以用于变量间拟合优度检验和独立性检验,可以用于测定两个分类 变量之间的相关程度。用 fo 表示观察值频数,用 fe 表示期望值频数,则 2 统计量为:
圣才电子书
十万种考研考证电子书、题库视频学习平台
第 9 章 分类数据分析
一、单项选择题
1.列联分析是利用列联表来研究( )。
A.两个数值型变量的关系
B.两个分类变量的关系
C.两个数值型变量的分布
D.一个分类变量和一个数值型变量的关系
【答案】B
【解析】列联表是由两个以上的变量进行交叉分类的频数分布表,列联分析是利用列联
【解析】表中的行是态度变量,这里划分为三类,即赞成,中立和反对;表中的列是单 位变量,这里划分为两类,即男同学和女同学,即 3×2 列联表。
5.一所大学为了解男女学生对后勤服务质量的评价,分别抽取了 300 名男学生和 240
名女学生进行调查,得到的结果如表 9-2 所示。
表 9-2 关于后勤服务质量评价的调查结果
贾俊平《统计学》复习笔记课后习题详解及典型题详解(数据的图表展示)【圣才出品】

②列联表和交叉表
由两个或两个以上变量交叉分类的频数分布表也称为列联表。
二维的列联表(两个变量交叉分类)也称为交叉表。
③比例(构成比)、百分比和比率
比例是一个样本(或总体)中各个部分的数据与全部数据之比,通常用于反映样本(或
二、品质数据的整理与展示 1.分类数据的整理与图示 分类数据本身就是对事物的一种分类,为对数据及其特征有一个初步的了解,在整理时 首先列出所分的类别,然后计算出每一类别的频数、频率或比例、比率等,形成一张频数分 布表,最后根据需要选择适当的图形进行展示。 (1)频数与频数分布 ①频数与频数分布 频数又称为次数,是各组占有的单位个数,将总体所有单位按一定标志进行归类排列, 称为频数分布。频数(频率)愈大的组所对应的标志值,它对于总体标志平均水平所起的作 用也愈大;反之,频数(频率)愈小的组所对应的标志值对于总体标志平均水平所起的作用
总体)的构成或结构。将比例乘以 100 得到的结果称为百分比,用%表示。比率是样本(或
总体)中各不同类别数据之间的比值,其比值可能大于 1。
(2)分类数据的图示
统计图是统计数据直观的表现形式,可以将复杂的数据用生动的图形表现出来,因而绘
制并使用好统计图就成为统计分析的基本功。常见的分类数据展示图形有条形图、帕累托图、
三、数值型数据的整理与展示 1.数据分组
4 / 52
圣才电子书 十万种考研考证电子书、题库视频学习平台
(1)数据分组的概念和目的 数据分组是根据统计研究的需要,为了观察数据的分布特征,将原始数据按照某种标准 划分成不同的组别,分组后的数据称为分组数据。经分组后再计算出各组中数据出现的频数, 就形成了一张频数分布表。在分组时,如果按照性别、质量等级等定性指标分组,称为按品 质标志分组;如果按照数量或数值等定量指标分组,称为按数量标志分组。 (2)数据分组的方法 ①单变量值分组:把每一个变量值作为一组,这种分组通常只适合离散变量,且在变量 值较少的情况下使用; ②组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。 在组距分组中,一个组的最小值称为下限;一个组的最大值称为上限。适用于连续变量或变 量值较多的情况。 (3)分组和编制频数分布表的具体步骤 ①确定组数 一般情况下,一组数据所分的组数不应少于 5 组且不多于 15 组,即 5≤K≤15。实际应 用时,可根据数据的多少和特点及分析的要求来确定组数。 ②确定各组的组距 组距是一个组的上限与下限的差。组距可根据全部数据的最大值和最小值及所分的组数 来确定,即组距=(最大值-最小值)÷组数。 注意:为便于计算,组距宜取 5 或 10 的倍数,而且第一组的下限应低于最小变量值, 最后一组的上限应高于最大变量值。 ③根据分组整理成频数分布表 (4)组距分组的注意事项
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)-第四章至第六章【圣才出品】

第4章数据的概括性度量4.1考点归纳【知识框架】【考点提示】(1)集中趋势、离散趋势的度量指标,包括每个指标的含义、计算公式、特点、意义、适用范围(选择题、简答题、计算题考点);(2)众数、中位数和平均数三个指标的特点和应用场合,偏态分布下三个指标的关系(选择题、简答题、计算题考点);(3)分布形状的测度指标:偏态系数和峰态系数的数值含义(选择题、简答题考点)。
(4)标准分数的计算公式及应用(选择题、简答题、计算题考点);(5)经验法则、切比雪夫不等式的具体应用(选择题考点)。
【核心考点】考点一:集中趋势的度量表4-1集中趋势度量指标【注意】不同偏态程度的分布中集中趋势度量指标的关系:①对称分布中,众数、中位数和平均数相等;②左偏分布中,数据存在极小值,拉动平均数向极小值一方靠,而众数和中位数不受极值的影响,有_x<M e<M o;③右偏分布中,数据存在极大值,必然拉动平均数向极大值一方靠,因此M o<M e<_x。
【知识拓展】不同的教材分位数的计算公式不同,除了表中的计算公式,一种比较精确的计算公式:下四分位数Q L的位置=(n+1)/4,上四分位数Q U的位置=(3n+1)/4。
【真题精选】假定标志值所对应的权数都缩小1/10,则算术平均数()。
[浙江财经大学2019研]A.不变B.无法判断C.缩小百分之一D.扩大十倍【答案】A【解析】假设标志值为x,其对应的权数为f,则算术平均数为_x=∑xf/∑f;若各权数都缩小1/10,则新的算术平均数为110110xf xf x x f f '===∑∑∑∑考点二:离散程度的度量数据的离散程度反映了各变量值远离其中心值的程度,离散程度越小,代表性就越好。
表4-2离散程度的度量指标【注意】①表中方差和标准差的计算公式均为样本数据的方差和标准差。
若为总体数据,则分母应为n。
②标准差系数,也称变异系数或离散系数。
③表中平均差、样本方差、样本标准差仅给出了未分组数据的计算公式,分组数据的计算公式实质是等于未分组数据的计算公式,会运用即可。
贾俊平《统计学》章节题库(含考研真题)(数据的图表展示)【圣才出品】

1 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
【解析】茎叶图是保留并反映原始数据分布的图形,它由茎和叶两部分构成,其图形是 由数字组成的。ACD 三项都需要对原始数据进行处理,求得一些测度值之后再作出图形。
8.对于 100 名学生某一门课程的成绩,若想得到四分之一分位数、中位数与四分之三 分位数,以下哪种描述统计的办法更有效?( )[中山大学 2012 研]
A.直方图 B.茎叶图 C.饼图 D.点图
4 / 33
圣才电子书
【答案】B
十万种考研考证电子书、题库视频学习平台
12.饼图的主要用途是( )。 A.反映一个样本或总体的结构 B.比较多个总体的构成 C.反映一组数据的分布 D.比较多个样本的相似性 【答案】A 【解析】饼图是用圆形及圆内扇形的角度来表示数值大小的图形。它主要用于表示一个 样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。
【解析】直方图、饼图描述的数值型数据是分组数据,而茎叶图描述的是未分组的数值
型数据,点图描述的是两个变量之间的关系。茎叶图保留了原始数据的信息,可以计算其分
位数。
9.某外商投资企业按工资水平分为四组:1000 元以下,1000~1500 元;1500~2000 元;2000 元以上。第一组和第四组的组中值分别为( )。[首经贸 2009 研]
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 3 章 数据的图表展示
一、单项选择题 1.对于大批量的数据,最适合描述其分布的图形是( )。[中国海洋大学 2018 研] A.条形图 B.茎叶图 C.直方图 D.饼图 【答案】C 【解析】在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。 条形图是用宽度相同的条形的高度或长短来表示数据多少的图形;饼图是用圆形及圆内扇形 的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占 全部数据的比例。
统计学(第五版)贾俊平_课后思考题和练习题答案(最终完整版)

第一部分 思考题
第一章思考题 1.1 什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得 出结论。 1.2 解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3 统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果, 数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这 些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件 下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4 解释分类数据,顺序数据和数值型数据 答案同 1.3 1.5 举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百 个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的 数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是 统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6 变量的分类 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7 举例说明离散型变量和连续性变量 离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度” 。 1.8 统计应用实例 人口普查,商场的名意调查等。 1.9 统计应用的领域 经济分析和政府分析还有物理,生物等等各个领域。
贾俊平《统计学》(第7版)考研真题与典型题详解-第4章 数据的概括性度量【圣才出品】

第4章数据的概括性度量一、单项选择题1.一组数据的峰度系数为3.5,则该数据的统计分布应具有的特征是()。
[中央财经大学2018研]A.扁平分布B.尖峰分布C.左偏分布D.右偏分布【答案】B【解析】峰度系数用来度量数据在中心的聚集程度。
在正态分布情况下,峰度系数值是3。
大于3的峰度系数说明观察量更集中,有比正态分布更短的尾部;小于3的峰度系数说明观测量不那么集中,有比正态分布更长的尾部,类似于矩形的均匀分布。
2.某企业男性职工占80%,月平均工资为450元,女性职工占20%,月平均工资为400元,该企业全部职工的平均工资为()。
[中央财经大学2015研] A.425元B.430元C.435元D.440元【答案】D【解析】企业全部职工的平均工资=男性职工比例×男性月平均工资+女性职工比例×女性月平均工资=80%×450+20%×400=440(元)。
3.15位同学的某门课程考试成绩中,70分出现3次,80分出现4次,85分出现6次,90分出现2次,则他们成绩的众数为()。
[华中农业大学2015研] A.80B.85C.81.3D.90【答案】B【解析】众数是一组数据中出现次数最多的变量值。
题中,85分出现次数最多,故成绩的众数为85分。
4.一组样本的变异系数(CV)等于10,样本均值为5,则样本方差为()。
[厦门大学2014研]A.2B.4C.0.5D.2500【答案】D【解析】变异系数是一组数据的标准差与其相应的平均数之比,因而样本标准差=样本均值×变异系数=5×10=50,样本方差=50×50=2500。
5.现抽取了10个同学,每个同学的月生活费数据排序后为:660,750,780,850,960,1080,1250,1500,1630,2000。
则中位数的位置为()。
[重庆大学2013研]A.5.5B.5C.4D.6【答案】A【解析】中位数是将样本排序后处于中间位置的数据,总共有10个样本,因此中位数的位次=(1+10)/2=5.5。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.统计学期中考试非常简单,为了评估简单程度,教师记录了 9 名学生交上考试试卷
的时间如下(分钟)
33 29
45 60 42 19 52 38 36[东北财经大学
2012 研]
(1)这些数据的极差为( )。
A.3.00
B.-3.00
C.41.00
D.-41.00
【答案】C
【解析】数据按从小到大排序结果如下:
A.0.38
B.0.40
C.0.54
D.2.48
【答案】A
【解析】离散系数也称为变异系数,它是一组数据的标准差与其相应的平均数之比。其
计算公式为: vs
s x
。得到 vs
22.85 0.38 。 12.45
9.已知某工厂生产的某零件的平均厚度是 2 厘米,标准差是 0.25 厘米。如果已知该 厂生产的零件厚度为正态分布,可以判断厚度在 1.5 厘米到 2.5 厘米之间的零件大约占 ( )。[浙江工商大学 2011 研]
圣才电子书 十万种考研考证电子书、题库视频学习平台
5.随机变量 X 的方差为 2,随机变量 Y=2X,那么 y 的方差是( )。[中央财经大学 2011 研]
A.1 B.2 C.4 D.8 【答案】D
【解析】Var(cX ) c2Var(X ) 22 2 8
7.设 X1,X2,…,X n 为随机样本,则哪个统计量能较好地反映样本值的分散程度( )。
[中山大学 2012 研] A.样本平均 B.样本中位数 C.样子书
【答案】C
十万种考研考证电子书、题库视频学习平台
【解析】集中趋势是指 一 组 数 据 向 某 一 中 心 值 靠 拢 的 程 度 ,它 反 映 了 一 组 数 据 中 心
A.有一半学生分数小于 95
2 / 43
圣才电子书 十万种考研考证电子书、题库视频学习平台
B.有 25%的学生分数小于 70 C.中间一半学生分数介于 100 到 120 之间 D.出现频次最高的分数是 95 【答案】B 【解析】一半学生分数小于中位数,即 100;中间一半学生分数介于下四分位到上四分 位之间,即介于 70 到 120 之间;出现频次最高的分数是众数,即 75。下四分位数是指该 样本中所有数值由小到大排列后第 25%的数字,从题干中可知有 25%的学生分数小于 70。
【解析】预期收入 1000(4%0.3 5%0.5 6%0.1 7%0.1) 50 (元)
预期收入的方差
(1000 4% 50)2 0.3 (10005% 50)2 0.5 (1000 6% 50)2 0.1 (1000 7% 50)2 0.1 80(元2 )
3 / 43
4.投资某项目的收益率 R 是随机变量,其分布见表 4-1;某位投资者在该项目上投资 1000 元,他的预期收入和收入的方差分别为( )元和( )(元)2。[中山大学 2011 研]
A.50,10 B.1050,10 C.1050,80 D.50,80
表 4-1 某投资项目收益率概率分布表
【答案】D
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 4 章 数据的概括性度量
一、单项选择题
1.哪种频数分布状态下平均数、众数和中位数是相等的( )。[东北财经大学 2011
研]
A.对称的钟形分布
B.左偏的钟形分布
C.右偏的钟形分布
D.U 形分布
【答案】A
【解析】在频数对称且单峰分布的状态下,平均数、众数、中位数相等。
D.-29.60
【答案】B
【解析】方差开方后即得到标准差。
(4)这些数据的离散系数为( )。
A.3.81
B.-0.31
C.-3.81
D.0.31
【答案】D
【解析】离散系数也称为变异系数,它是一组数据的标准差与其相应的平均数之比。其
计算公式为: vs
s x
。
3.现有一份样本,为 100 名中学生的 IQ 分数,由此计算得到以下统计量:样本平均 (mean)=95,中位数(median)=100,下四分位数(lower quartile)=70,上四分位数(upper quartile)=120,众数(mode)=75,标准差(standard deviation)=30。则关于这 100 名中 学生,下面哪一项陈述正确?( )。[中山大学 2011 研]
6.已知数列{1,3,3,5,5,7,7,9,122},下面说法错误是( )。[中央财经大 学 2011 研]
A.算数平均数是 18 B.中位数是 5 C.众数是 5 D.极差是 121 【答案】C 【解析】众数是一组数据中出现次数最多的数值,有时众数在一组数中有好几个。由题 干可知,众数是 3,5,7。
【解析】设样本方差为 S2,根据未分组数据和分组数据计算样本方差的公式分别为:
n
2
k
2
未分组数据: s2 i1 xi x ;分组数据 s2 i1 Mi x fi
n 1
n 1
代入数据即得答案 A。
(3)这些数据的除以样本自由度的标准差为( )。
A.29.60
B.12.25
C.-12.25
A.95% B.89%
5 / 43
圣才电子书
C.68%
十万种考研考证电子书、题库视频学习平台
D.99%
【答案】A
点 的 位 置 所 在 。 其反映数据集中趋势的统计量有平均数、中位数、众数和四分位数;离散
程度反映的是各变量值远离其中心值的程度,反映数据离散程度的统计量有异众比率、方差、
标准差和四分位差等。
8.对一组数据的描述统计分析表明,样本均值=12.45 美元,中位数=9.21 美元,方
差=22.85。由此可以计算样本数据的离散系数为( )。[中央财经大学 2012 研]
19 29 33 36 38 42 45 52 60
故,极差=60-19=41。
(2)这些数据的除以样本自由度的方差为( )。
1 / 43
圣才电子书 十万种考研考证电子书、题库视频学习平台
A.150.00
B.-150.00
C.-260.00
D.260.00
【答案】A