2017年青岛大学统计学原理(同等学力加试)之统计学原理复试实战预测五套卷

2017年青岛大学统计学原理（同等学力加试）之统计学原理复试实战预测五套卷（一） (2)

2017年青岛大学统计学原理（同等学力加试）之统计学原理复试实战预测五套卷（二） (9)

2017年青岛大学统计学原理（同等学力加试）之统计学原理复试实战预测五套卷（三） (19)

2017年青岛大学统计学原理（同等学力加试）之统计学原理复试实战预测五套卷（四） (26)

2017年青岛大学统计学原理（同等学力加试）之统计学原理复试实战预测五套卷（五） (36)

2017年青岛大学统计学原理（同等学力加试）之统计学原理复试实战预测五套卷（一）说明：本资料为2017复试学员内部使用，终极模拟预测押题，实战检测复试复习效果。————————————————————————————————————————一、简答题

1．利用相关系数如何判断变量之间相关的方向和相关关系的密切程度？

【答案】相关系数r的取值范围在之间。若表明变量之间存在正线性相关关系；若表明x与y之间存在负线性相关关系；若表明x与y之间为完全正线性相关关系；若表明x与y之间为完全负线性相关关系。可见当时，y的取值完全依赖于X，二者之间即为函数关系；当r=0时，说明两者之间不存在线性相关关系，但可能存在其他非线性相关关系。

当说明两个变量之间的线性关系越强说明两个变量之间的线性关系越弱。对于一个具体的r取值，根据经验可将相关程度分为以下几种情况：当时，可视为高度相关

时.可视为中度相关；时。视为低度相关；当时，说明两个变量之间的相关程度极弱，可视为不相关。但这种解释必须建立在对相关系数的显著性检验的基础之上。

2．简述均值、众数和中位数三者之间的关系及其在实际中的应用。

【答案】（1）众数、中位数和平均数的关系

从分布的角度看，众数始终是一组数据分布的最高峰值，中位数是处于一组数据中间位置上的值，而平均数则是全部数据的算术平均。

对于具有单峰分布的大多数数据而言，众数、中位数和平均数之间具有以下关系：

①如果数据的分布是对称的，众数中位数和平均数必定相等，即

②如果数据是左偏分布，说明数据存在极小值，必然拉动平均数向极小值一方靠，而众数和中位数由于是位置代表值，不受极值的影响，因此三者之间的关系表现为：

③如果数据是右偏分布，说明数据存在极大值，必然拉动平均数向极大值一方靠，则

（2）众数、中位数和平均数在实际中的应用

①众数是一组数据分布的峰值，不受极端值的影响。其缺点是具有不唯一性，一组数据可能有一个众数，也可能有两个或多个众数，也可能没有众数。众数只有在数据量较多时才有意义，当数据量较少时，不宜使用众数。众数主要适合作为分类数据的集中趋势测度值。

②中位数是一组数据中间位置上的代表值，不受数据极端值的影响。中位数主要适合作为顺序数据的集中趋势测度值。

③平均数是对数值型数据计算的，而且利用了全部数据信息，它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时，3个代表值相等或接近相等，这时则应选择平均数作为集中趋势的代表值。但平均数的主要缺点是易受数据极端值的影响，对于偏态分布的数据，平均数的代表性较差。因此，当数据为偏态分布，特别是当偏斜程度较大时，可以考虑选

择众数或中位数。

3．什么是置信区间估计和预测区间估计？二者有何区别？

【答案】（1）置信区间估计，它是对x的一个给定值_求出y的平均值的估计区间，这一区间称为置信区间；预测区间估计，它是对x的一个给定值求出y的一个个别值的估计区间，这一区间称为预测区间。

（2）置信区间估计和预测区间估计的区别：置信区间估计是求y的平均值的估计区间，而预测区间估计是求y的一个个别值的估计区间；对同一个这两个区间的宽度也是不一样的，预测区间要比置信区间宽一些。

4．解释总平方和、回归平方和、残差平方和的含义，并说明它们之间的关系。

【答案】（1）总平方和（S^T）是实际观测值与其均值的离差平方和，即

（2）回归平方和（^狀）是各回归值与实际观测值的均值y的离差平方和，即

其反映了在y的总变差中由于x与y之间的线性关系引起的y的变化部分，它是可以由回归直线来解释的变差部分。

（3）残差平方和（SSE）是各实际观测值与回归值的离差平方和，即它是除了

的线性影响之外的其他因素对变差的作用，是不能由回归直线来解释的变差部分。其又称为误差平方和。

（4）三者之间的关系

5．简述指数平滑法的基本含义。

【答案】指数平滑法是对过去的观察值加权平均进行预测的一种方法，该方法使得第期的预测值等于期的实际观察值与第期预测值的加权平均值。指数平滑法是加权平均的一种特殊

形式，观察值时间越远，其权数也跟着呈现指数的下降，因而称为指数平滑。

使用指数平滑法时，关键的问题是确定一个合适的平滑系数因为不同的会对预测结果产生

不同的影响。当时，预测值仅仅是重复上一期的预测结果；当时，预测值就是上一期实际

值越接近1，模型对时间序列变化的反应就越及时，因为它对当前的实际值赋予了比预测值更大的权数；同样越接近0,意味着对当前的预测值赋予更大的权数，因此模型对时间序列变化的反应就越慢。一般而言，当时间序列有较大的随机波动时，宜选较大的以便能很快跟上近期的

变化，当时间序列比较平稳时，宜选较小的但实际应用时，还应考虑预测误差，这里仍用误差均方来衡量预测误差的大小，确定时，可选择几个进行预测，然后找出预测误差最小的作为最后的值。

6．简述平稳序列和非平稳序列的含义。

【答案】（1）平稳序列是基本上不存在趋势的序列。这类序列中的观察值基本上在某个固定

的水平上波动，虽然在不同的时间段波动的程度不同，但并不存在某种规律。其波动可以看成是随机的。

（2）非平稳序列包含趋势、季节性或周期性的序列，它可能只含有其中的一种成分，也可能是几种成分的组合。因此，非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。

二、计算题

7．某技术部门招工需经过四项考核，设能够通过第一、二、三、四项考核的概率分别为

和各项考核是独立的。每个应招者都要经过全部四项考核，只要有一项不通过即被淘汰。求：（1）这项招工的淘汰率；（2）通过一、三项考核但是仍被淘汰的概率；（3）假设考核按顺序进行，被考核人员一旦经某项考核不合格即被淘汰（不再参加后面的考核），求这种情况下的淘汰率。

【答案】令B为最终通过考核，表示分别通过第一、第二、第三、第四项考核。

（1）因为各项考核是相互独立的，所以这项招工的通过率为：

因此该项招工的淘汰率为：

（2）在通过一、三考核的情况下考核全部通过的概率为：

因此，通过一、三项考核但是仍被淘汰的概率为：

（3）在考核按顺序进行的情况下，淘汰率为：

8．某地区1996?2000年国民生产总值数据如表1所示。

表1

（1）计算并填写表1中所缺数字；

（2）计算该地区1997?2001年间的国民生产总值；

（3）计算该地区1998?2001年间国民生产总值的平均发展速度和平均增长速度。

【答案】（1）由于1998年的环比增长速度为10.3%，所以该年的国民生产总值为：