应用统计学总复习

应用统计学总复习
应用统计学总复习

应用统计学总复习

教师:严洁

2012年6月

[本课件专为北大政府管理学院《应用统计学》课程所设计,限于选修本课程的学生使用,

未经作者允许请勿以任何方式传播。]

第一部分:重要概念、知识点

一、 应用统计学全景

1.1描述统计:是指用归纳性的数值对一个已知的样本或者总体的数量特征

进行概括

1.2 推断统计:是从样本信息推论到总体数量特征的统计技术

1.3. 测量尺度

1.3.1定类尺度:每一种不同的数字或符号代表着不同的类别或标记的一

种度量方法。是测量定类变量所使用的尺度。

1.3.2定序尺度:每一种数字或符号代表着有序的选项,但各选项之间不

必是等距关系的一种度量方法。

1.3.3定距尺度:是指有一个固定的数字区间贯穿于一个度量序列之中的

度量方法。每个数字之间是等距的,并且0只代表等距序列中的一

个位置,而不是代表“一无所有”。

1.3.4定比尺度:是指数字的赋值能够具有所有算术特征的一种度量方法。

0就代表“一无所有”。

二、 描述统计

2.1 平均值mean:用于定距及以上变量的集中趋势的描述。

2.2 众数mode:出现次数最多的值,用于任一层次的变量集中趋势的描述。

2.3 中位值median:数据序列中处于中央位置的值,用于定序及以上变量的

集中趋势的描述。

2.4方差variance、标准差std.deviation: 观察值与其平均值之差的平方

和除以全部观察总数。方差的平方根就是标准差。标准差越大,平均值

的代表性越小。它表示数据的离散程度。

2.5集中趋势:均值、中位数、众数;离散趋势:方差、标准差、四分位差、

极差。

2.6列联表:通过将两个变量交互分类,旨在发现变量之间是否存在某种联

系的频次/频率分布表。适用于定类、定序变量。

2.6.1 列联表的卡方检验:检验变量之间是否独立。在sig<0.05的情况下,

说明变量之间不独立。

2.6.2 列联强度系数:表示变量之间关系的强弱。在sig<0.05的情况下,

绝对值越接近于1,说明变量之间关系越强。

2.6.3 定类变量:ф系数、C系数、 V系数、λ系数(lambda)、τ系数

(Goodman & Kruksal Tau-y)

2.6.4 定序变量:斯皮尔曼等级相关系数ρ、Gamma系数、 Kendall’s Tau

系数、d系数

三、 推断统计

3.1概率分布:回答的是随机现象一共有多少种结果以及每种结果所伴随的

概率是多少。

3.2抽样分布:是样本统计量

.....的概率分布。对一个固定的总体,在确定的样本设计和样本量的条件下,样本统计量的所有可能取值及其出现概率的

序列就是该统计量的抽样分布。

3.3 正态分布:

3.3.1正态分布的两个参数——均值和标准差一旦确定,正态分布的具体

形态也就唯一确定。

3.3.2 3σ 法则:在正态分布中,有68.3%的变量值落在以平均数为中心

的一个标准差范围内;有95.4%的变量值落在以平均数为中心的两

个标准差范围内;有99.7%的变量值落在平均数为中心的三个标准

差范围内。

3.4 标准正态分布:标准差为1,均值为0的正态分布N(0, 1)称为标准正态

分布。

3.5中心极限定理:从任意一个总体中随机抽出规模为n 的样本,随着n 的

扩大(n>=30),样本均值的抽样分布会近似服从正态分布。

3.6 统计推论分为两类:参数估计和假设检验

3.7参数估计:是根据一个随机样本的统计值来估计总体的参数值。包括点

估计和区间估计。

3.8 点估计:用样本的统计值估计总体的参数值。

3.8.1 从总体中随机抽取n 个样本,随着n 的增大,所有样本均值的平均

值是总体均值的无偏估计。

3.8.2 从总体中随机抽取n 个样本,随着n 的增大,所有的样本成数(比

例)的平均值是总体成数(比例)的无偏估计。

3.8.3 从总体中随机抽取n 个样本,随着n 的增大,所有的样本方差的平

均值是总体方差的无偏估计。

3.8.4 样本方差和总体方差的计算公式有区别,样本方差要以n-1为分母。

这样计算出来的所有样本方差的平均值才是总体方差的无偏估计。

3.9 区间估计:用样本统计值来推测总体参数的可能范围。

3.9.1 区间估计的思想是寻找两个统计量,分别来估计总体参数的上限和

下限,使得总体参数落在上下限之间内的概率为1-α。 1- α就是

估计区间包括真值的概率,称为置信概率/置信水平/置信系数。这

个区间就叫做“在1- α置信水平下参数的置信区间”。区间的边界叫置信上限和置信下限。α是事先给定的小正数。

σ

μ?=X z

3.10 样本均值的标准差叫做均值标准误。

3.10.1标准差和标准误的区别:

标准差(standard deviation):根据原始的观察值计算,反映的是

一组原始数据的离散程度;

标准误(standard error):是指样本统计量的标准差。根据样本统

计量计算的,反映的是统计量的离散程度;比如,样本均值的标准误差根据多个样本的样本均值计算,反映样本均值的离散程度。

n e s σ

=..

3.11 假设检验:是指通过样本的统计值和结果来检验事先对总体的情况所做

出的假设。包括原假设和备择假设。

3.11.1 原假设:又称虚无假设、无差异假设。备择假设:就是与原假设相

反的假设。

3.11.2假设检验的基本思想:首先假设变量之间无差异,如果由此得出在

一次观测中发生小概率事件,那么就拒绝无差异假设,接受备择假

设。换句话说,经过随机抽样从总体中得到一个样本,如果根据计

算发现样本的统计量在原假设成立的条件下几乎是不可能发生的,

那么就拒绝原假设。

3.12 小概率原理:概率较小的事件,在一次观察中是几乎不可能出现的。但

是如果在一次观察中恰恰发生了小概率事件,那么合理的想法是否定原有事件具有小概率的假设。

3.13 假设检验的种类:双侧(双边,双尾)和单侧(单边,单尾)。

四、 统计分析方法

4.1 统计分析步骤:确定研究目的→根据理论假设转换成研究假设→数据整

理→变量探测性、描述性分析→选择数据分析方法→检验因果关系、各种条件关系、辨别虚假关系等→对分析结果进行解释

4.2 统计推论的逻辑:借助中心极限定理、小概率原理,将样本统计量通过

抽样分布与总体参数联系起来,进行统计推论。

4.3 一元单因素方差分析(ANOVA):因变量为一个定距/定比变量,自变量

为一个定类变量。

4.3.1分析目的:比较不同群体在某一个测量上的平均水平是否有显著差

异。

4.3.2基本思想:把推测的全部误差分为两个部分——可以被自变量解释

的部分,没有被解释的部分,然后从二者比值的大小检验两个变量

是否相关。

4.3.3原假设:任意两个组的均值都相等;备择假设:至少有一对均值不

相等.

4.3.4假设检验:sig.<0.05,表示统计显著,说明在95%的置信水平下,

因变量在自变量的各组平均值上存在显著差异。

4.4 一元多因素方差分析(Univariate):因变量为一个定距/定比变量,自

变量为多个定类变量。

4.4.1分为饱和模型和非饱和模型,只有模型中的所有项目都显著才能做

出有显著差异的结论。

4.4.2 两个变量的交互效应如果统计显著,说明在一个变量的不同类别上

的因变量均值会在另外一个变量的不同类别上有显著的差异

4.5 多元方差分析(Multivariate):因变量为多个定距/定比变量,自变量

为多个定类变量。

4.6 相关分析(correlate):反映现象之间存在的但关系数值不固定的相互

依存关系。

4.6.1按相关的程度可分为完全相关、不完全相关和不相关;按相关的形

式可分为线性相关和非线性相关;按研究变量的多少可分为单相关、

偏向关和复相关。

4.6.2 相关系数(Pearson r)是用来说明变量之间在直线相关条件下,相

关关系密切程度和方向的统计分析指标。其定义公式为:

式中: x为自变量,y为因变量。

4.7 一般线性回归分析(linear regression):用变量的观察数据拟合所关

注的变量和影响它变化的变量之间的线性关系式,检验影响变量的显著程度和比较它们作用大小,进而用两个或多个变量的变化解释和预测另一个变量的变化。

4.7.1 因变量:一个定距/定比变量;自变量:一个或者多个定距/定比变

量(也可以包括由定类变量转换的虚拟变量)

4.7.2 回归系数B:表示在至少95%的置信水平下,在控制了其他变量的情

况下,自变量每增加一个单位时,因变量随之增加B个单位。其符

号表示作用方向,绝对值表示变化的幅度。

4.7.3 标准化的回归系数Beta:去除自变量的物理单位,将各个自变量对

因变量的作用力进行相对比较,该系数绝对值最大的自变量说明其

对因变量的解释作用最大。

4.7.4 确定系数R2:表示回归方程中的所有自变量所解释的因变量的变化

(因变量的方差)的百分比。越接近于1,说明模型中的变量对y

的解释能力越强。调整后的确定系数Adjusted R2 :排除自变量数

目过多的影响。当n远大于自变量的个数时, Adjusted R2 约等于

R2 。

4.7.5回归系数不显著的原因:样本量太小或者变量太多;自变量变化范

围太小;自变量之间高度相关,即出现了多重共线性问题;自变量

与因变量之间是非线性关系。 检验多重共线性的指标是方差膨胀因

子(VIF)或者容忍度(Tolerance)

4.7.6虚拟变量:以编码“1”和“0”表示案例的类别归属。该变量的平

均数表示编码为1的一类案例占样本的比例。虚拟变量的回归系数

表示编码为“1”的类别与参照类(编码均为0)的因变量均值之差。

4.7.7残差表示因变量的预测值与观测值之间的差。

4.7.8 一般线性回归的假定条件包括:总体误差项的零均值、方差齐、正

态分布、误差项无序列相关、误差项与自变量无关。

4.7.9 Durbin-Watson 系数用来检验误差项是否存在序列相关;标准化的

残差图用来检验方差齐、误差项与字变量相关等假定条件。

4.8 逻辑斯蒂回归:是非线性概率模型的一种,它将收益递减规律纳入模型。

利用Logistic 函数的特点,将事件发生的概率进行Logit 转换后,将Logit p 以自变量和回归系数进行线性表达。

4.8.1 因变量:虚拟变量;自变量:一个或者多个定距/定比变量(也可以

包括由定类变量转换的虚拟变量)

4.8.2 事件发生比(odds)Ω =p/(1-p)

发生比率(odds ratio):发生比之比 Ω*/Ω =e b

4.8.3 回归系数的解释:当b=0.693,则e bi =2,表示自变量每增加一个单位,

因变量新的发生比是原来的2倍。如果e bi =0.8,则表示新的发生比

是原来的80%。如果自变量为虚拟变量, e bi =1.6,则表示,取值为

1的那一类的发生比是参照类的1.6倍。

1122ln(...1i i p a b x b x b x p

=++++?

4.8.4 标准化的回归系数:可以比较各因素对因变量的作用的相对重要性。

Beta=b*s/1.8138

b:回归系数; s:自变量的标准差; 1.8138:Logistic分布的标准差

4.8.5整体检验:

通过对数似然函数值(Log Likelihood)进行检验,SPSS报告“-2

log Likelihood(-2LL)”指标,该指标越大,说明回归方程的拟合

程度越差。该报告值越小,意味着回归方程的拟合程度越好。

与截距模型进行比较:比较二者的拟合水平是否有显著提高。前后

两模型的-2LL的差值在“Model Chi-Square ”中给出,卡方检验

中sig<0.05,则说明统计显著。

类确定系数R2:越接近于1,说明模型的变量对因变量的解释能力

越强,但揭示了因变量的什么值则无从判定。

模型正确预测的百分比:用回归模型对样本案例因变量值正确估计

的样本数占总样本数的比例。

4.8.6多分类变量的逻辑斯蒂回归:

4.8.7序列变量的逻辑斯蒂回归:

4.9 因子分析:通过研究众多变量之间的内部依赖关系,探求观测数据中的

基本结构,并用少数共同因素(公因子)来表示基本的数据结构。其主要目的是浓缩数据和寻求变量的基本结构。。

4.9.1 因子负载:连接观测变量和公因子的纽带,相当于公因子和观测变

量之间的相关系数。(SPSS 输出表的表头为Component Matrix)

4.9.2公因子方差(也叫共同度):观测变量中由公因子决定的比例,公因

子的方差越大,变量能被因子说明的程度越高。(SPSS 输出表的表

头为Communalities)

4.9.3因子贡献率:每个公因子所解释的方差占所有变量总方差的比例。

(SPSS 输出表的表头为Total Variance Explained)

4.9.4 检验原有变量是否适合作因子分析:计算KMO检验统计量,KMO越

接近1,意味着变量间的相关性越强,原有变量越适合做因子分析。

0.9以上表示非常适合,0.8表示适合,0.7表示一般,0.6以下表

示不适合。

五、 数据质量评估

5.1 抽样调查的一般程序:概念→理论假设→操作化→研究设计(问卷设计、

抽样设计、实施程序设计)→抽样→实地调查→建立数据库→分析数据

→假设检验→得出结论(研究报告)

5.2 概率抽样:按照一定的概率以随机原则抽取样本,每一个单元都有一定

的机会被抽中并且它们被抽中的概率是已知的。包括简单随机抽样、系

统抽样、概率与规模成比例的抽样;分层抽样、整群抽样、多阶段抽样

等等。

5.3 非概率抽样:抽取样本时不是按照随机原则,而是根据主观判断有目的、

有意识地进行,或者根据方便原则进行。包括配额抽样,滚雪球抽样,

街头偶遇抽样等等。

5.4 抽样中的基础概念:

5.4.1研究总体:在理论上明确界定的总体;调查总体:对研究总体的进

一步界定,是从中抽取样本的总体

5.4.2 个体:收集信息的基本单位,构成总体

5.4.3 样本:从总体中按照一定规则和程序抽出来的个体的集合

5.4.4 抽样单位:包含个体,用来抽选个体进入样本,在一个抽样过程中,

第一阶段抽取的抽样单位称为初级抽样单位

5.4.5 抽样框:是从中抽取样本的抽样单位的名单。抽样框的数目与抽样

单位的层次相对应。

5.4.6 抽样误差:用样本的统计值去推算总体的参数值时总会有差异,这

个差异就是抽样误差。

5.4.7 偏差:按照某一抽样方案反复抽样时,估计值与参数值之间的系统

性差异。

5.5 某变量的覆盖误差由未覆盖总体占研究总体的比例,未覆盖总体与覆盖

总体在该变量上的取值差异所决定。

5.6 某变量的回答误差由未回答样本占总样本的比例,未回答样本与回答样

本在该变量上的取值差异所决定。

5.7 复杂抽样设计下的某变量标准误的正确计算方法要考虑抽样单位、权

重、分层等因素。

5.8 信度:是指使用相同研究技术重复测量同一个对象时,得到相同研究结

果的可能性。信度往往以相关系数来加以计算。通常计算的方法有再测信度系数、复本信度系数、折半信度系数、内部一致性系数(alpha 系数)。

5.9 效度:是指实证测量在多大程度上反映了概念的真实含义,即测量工具

能测出其所要测量的概念的程度。效度又分为内容效度、准则效度、建构效度(通常用因子分析法);或者分为内在效度和外在效度。

5.10 用因子分析的结果判断结构效度

5.10.1要依据被测量的概念及其层次和结构

5.10.2如果概念在设计的时候是单维的,那么,我们期待只提取一个公因

子,因子贡献率很高,至少要高于55%,每个条目与公因子的因子

负载彼此接近,都高于0.7(底线是大于0.55),公因子共同度至少

高于0.55

5.10.3如果概念在设计的时候是多维的,那么,我们期待公因子的个数与

设计的维度数一致,累计因子贡献率很高,至少要高于55%;公因

子与某些条目的组别与设计的维度类别一致;某公因子与该组条目

的因子负载彼此接近,都高于0.7(底线是大于0.55),公因子共同

度至少高于0.55

六、 定量研究论文、数据报告与研究报告

6.1 科学研究的过程

6.2 定量研究论文主要内容:研究目标、文献综述、理论假设、分析方法和

分析模型、数据来源和数据描述、数据分析/模型检验、得出结论(理

论拓展或政策建议或实际应用)

6.2.1 关于数据来源的介绍至少包括以下内容: 数据的采集方式、质量控

制方法、样本的抽样方式(介绍分层的标准、PSU的定义、数量、

抽样方法等)、样本的有效回答率、样本量;数据采集的执行机构、

数据使用的授权机构等

I.第二部分:考试题型

一、 填空题:

** “本项研究中,我们假设人们的年龄会对人们的婚姻观念有显著的影响……”,请问这个假设中,需要测量的因变量是 人们的婚姻观念 ,自变量是 人们的年龄 。

** “请问您家去年的总收入是多少元?”,这个题目是用了____________测量尺度?

二、 选择题:

** _______是指实证测量在多大程度上反映了概念的真实含义,即测量工具能测出其所要测量的概念的程度。

A. 信度

B. 效度

C. 显著度

D. 自由度

** 如果用列联表来度量两个定类变量之间的列联强度,那么,应该选择下面哪一种相关系数?______________

A. Lambda

B. Tau-b/ Tau-c

C. Pearson

D. Eta

** 一项逻辑斯蒂回归分析的结果中,性别变量的发生比率为0.436***,其中男性的编码为1,女性的编码为0,请问,性别变量对因变量(是否去旅游)的作用是?____________

三、 判断对错题:

【 】总体是正态分布,样本也服从正态分布

【 】标准误也被称为标准差

【 】进行方差分析时,因变量要使用定类变量

四、 简答题:

(一)请参照下表回答问题

表5不同年龄组的受访人对“中国电视应该优先播放中国电影和节目”的态度(%)

18-29

30-39岁40-49岁50-59岁60-70岁

非常同意 13.020.024.829.433.2

比较同意 33.740.249.148.546.4

中立 10.08.0 6.57.0 4.8

不太同意 38.827.717.212.514.3

非常不同意 4.6 4.0 2.3 2.6 1.3

有效回答人数 632833818656461 (Chi-Squre = 252.0 P<0.001;Gamma = -0.2, P<0.001)

(1)卡方检验的结果说明什么?

(2)Gamma的结果说明了什么?

(二)

有一个抽样方案这样写着:调查组在某县的所有镇和乡中,按照概率与人口规模成比例的抽样方法,抽取了1个镇和1个乡。然后在每个入选的乡、镇中各抽取了5个村,每个村根据村委会户籍资料名单随机抽取20个育龄妇女进行调查。

1、初级抽样单位是什么?

2、受访人的资格特征是什么?

3、是否分层了?如果是,那么分层的标准是什么?

4、在该县一共抽到的样本规模是多少?

5、这个抽样方案的最大弱点是什么?(从psu的数量和分布的角度来

考虑)

五、 论述题:

解读下面的统计分析结果。

注:*** p(sig)<0.001 ** p(sig)<0.01 * p(sig)<0.05

注意解释:

理论假设是什么

模型之间的区别

自变量对因变量的作用

模型整体的解释力

基本结论

注意统计意义和现实意义的联系

应用统计学复习重点

应用统计学 定义:统计学是研究数据收集、整理、显示与分析方法(或公式)的科学。目的是探索数据内在数量规律性,以达到对客观事物总体的科学认识。 1、参数(parameter):指用于说明总体的指标。 均值—μ, 标准差—σ,方差—σ2,率—P 2、统计量(statistics):指用于说明样本的指标。 均值—。标准差— s。方差— s2 ,率—p 数据的计量尺度 1列名尺度nominal scale (1)定义:按事物的某种属性对事物进行平行分类或分组。 划分的各类别之间无大小或优劣之分,且次序可以改变。 (2)适用:取值只能大体进行平行分类的品质型标志(变量)。 (3)记录方式: 变量名称:类别名罗列或用无意义数字表示。 例:性别:男/ 女 性别:(1)男(2)女 2顺序尺度ordinal scale (1)定义:按事物的某种属性对事物进行分类或分组基础 上,再将类别等级由大到小或由小到大排序。 (2)适用:取值可以进行分类且各类别具有等级差异的品质 型标志(变量)。 (3)记录方式: 品质变量名:类别名序号由大到小或由小到大排列。 例:文化程度(1)文盲(2)小学(3)初中(4)高中以上 3间隔尺度interval scale (1)定义:选定一个测量单位,对数值变量在分类 排序基础上测量其间距(差距)。测量出的数 值有加、减意义,无乘除意义。 (2)适用:可用数值记录其值而无比率意义的数值 型标志。 (3)记录形式: 数值变量名:________ 例:语文成绩:________ **表述语:甲(60分)比乙(30分)高30分 4比例尺度ratio scale (1)定义:选定一个测量单位,对数值型标 志(变量)在测量间距基础上,测量其比率。 (2)适用:可用数值记录其值且有比率意义的数值 型变量。 (3)记录形式:

应用统计学期末复习

应用统计学期末复习重点(按题型整理) 一、填空题(10分) 1.统计学的三种含义:统计工作;统计数据或统计信息;统计学 2.统计学的研究对象是群体现象 3.根据统计方法的构成不同,可将统计学分为描述统计学和推断统计学,根据统计方法研究和应用的侧重不同,可将统计学分为理论统计学和应用统计学。 4.统计研究的基本方法:大量观察法,实验设计法,统计描述法和统计推断法 5.标志是说明总体单位特征的,而指标是说明总体特征的, 6.标志按其性质不同分为数量标志和品质标志两种。按其变异情况可以分为不变标志和可变标志,可变标志称为变量。 7.统计总体具有三个基本特征,即同质性、大量性和变异性。 8.统计指标按其作用可分为总量指标、相对指标、平均指标,按所反映总体的内容不同,可以分为数量指标和质量指标。 9.总量指标指在一定时间、地点条件下说明现象总体的规模和水平的指标,其表现形式为绝对数。 10.总量指标按其反映时间状况不同,可以分为时点指标和时期指标,按指标数值采用的计量单位不同可以分为实物指标,价值指标,劳动量指标。总量指标按其说明总体内容不同,可分为总体标志总量和总体单位总量 11.平均指标说明分配数列中各变量值分布的集中趋势,变异指标说明

各变量值分布的离中趋势 12.计量尺度的类型有定类尺度,定序尺度,定距尺度,定比尺度,根据四种计量尺度计量结果,可将统计数据分为三种类型:名义级数据,顺序级数据,刻度级数据。 13.对名义级数据通常是计算众数,对顺序级数据,通常可以计算众数、中位数;对刻度级数据,同样可以计算众数和中位数,还可以计算平均数。 14.全面调查方式有统计报表制度,普查;非全面调查有重点调查、典型调查、抽样调查。 15.常用的抽样调查组织形式有简单随机抽样,类型随机抽样,机械随机抽样,整群随机抽样,阶段随机抽样。 16.统计分组的关键在于正确选择分组标志和合理划分各组界限 17.按分组标志的多少,统计分组可以分为简单分组和复合分组;按分组标志性质不同,统计分组可以分为品质分组和数量分组;按分组作用和任务不同,有类型分组、结构分组和分析分组。 18.离散变量可作单项式分组或组距式分组,连续变量只能做组距式分组。 19.从统计表的内容看:统计表由主词和宾词两部分构成,从统计表的形式看:统计表包括总标题、横行和纵栏标题、数字资料 20.平均指标可分为两类:计算均值和位置均值。 21.根据算术平均数、众数和中位数的关系,次数分布可以分为对称分布,左偏分布,右偏分布。

应用统计学试题和复习资料分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==?n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4) 附: 10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 179005 1 2 =∑=i x i 1043615 1 2 =∑=i y i 424305 1 =∑=y x i i i 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--=)(22 1x x n y x xy n β ==-??-?290 217900572129042430554003060 =0.567 =-= ∑∑n x n y ββ 1 0144.2 – 0.567×58=111.314 估计的回归方程为:y =111.314+0.567x ② 计算判定系数: 22 212 2 ()0.5671080 0.884392.8 () x x R y y β-?= ==-∑∑

统计学专业及其应用领域的介绍

一、统计学专业介绍 统计学专业主要培养具有良好的数学、计算机与经济学素养,掌握统计学的基本理论和方法,能熟练地运用计算机分析数据,能在企业、事业单位和经济、管理部门从事统计调查、统计信息管理、数量分析等开发、应用和管理工作。 在偶然中寻求必然是应用统计技术的核心。统计方法作为一种为决策提供依据的工具,可以帮助企业进行数据分析,了解产品质量状态的分布情况,找出问题、缺陷及原因,有针对性地采取措施,提高产品和服务的质量。有不少著名企业在市场分析、产品开发与设计、工艺设计、生产控制与营销策略方面应用统计技术,结果使得其产品成本下降,产品质量和市场占有率提高,公司经济效益显著提高。 二、统计学的应用 1、企业发展战略 发展策略是一个企业长远的发展方向。控制发展战略一方面需要及时的了解和把握整个宏观经济的状况及发展变化趋势,另一方面还要对企业进行合理的市场定位,把握企业自身的优势和劣势。所有这些都需要统计提供可靠的数据,利用统计方法进行科学的数据分析和预测。 2、产品质量管理 质量是企业的生命,是企业持续发展的基础。质量管理中离不开统计的应用。在一些知名的跨国公司, 6准则已经成为一种重要的管理理念。质量控制应经成为统计学在生产领域中的一项重要应用。各种统计质量控制图被广泛应用于监测生产过程。 3、市场研究 企业要在激烈的市场竞争中取得优势,首先必须了解市场,要了解市场就需要进行广泛的市场统计调查,取得所需信息,并对这些信息进行统计分析,以便作为生产和营销的依据。 4、财务分析 上市公司的财务数据是股民投资的重要参考依据。一些投资咨询公司主要是

根据上市公司提供的财务和统计数据进行分析,为股民提供参考。企业自身的投资也离不开对财务数据的分析,其中要用到大量的统计方法。 5、经济预测 企业要对未来市场状况进行预测。比如:对产品的市场潜力进行预测,及时调整生产计划。这就需要利用统计方法进行收集、整理和分析数据。 6、人力资源管理 利用统计方法对企业员工的年龄、性别、受教育程度、工资等进行分析,并作为企业制度工资计划、奖惩程度的依据。

统计学专业职业生涯规划

职业生涯规划书 一、职业规划对自我的意义 从专业角度来看,职业生涯规划是指个人与组织相结合,在对一个人职业生涯的主客观条件进行测定、分析、总结的基础上,对自己的兴趣、爱好、能力、特点进行综合分析与权衡,结合时代特点,根据自己的职业倾向,确定其最佳的职业奋斗目标,并为实现这一目标做出行之有效的安排。职业设计的目的绝不仅是帮助个人按照自己的资历条件找到一份合适的工作,达到与实现个人目标,更重要的是帮助个人真正了解自己,为自己定下事业大计,筹划未来,拟定一生的发展方向,根据主客观条件设计出合理且可行的职业生涯发展方向。 于我自身而言,职业生涯规划就是有计划的规划自己的未来,一步一个脚印的去实现自己的职业理想。学习了职业生涯规划,让我更加清晰的认清了自己的发展方向,让我更加明白这条路该如何走。 二、自我分析 1.兴趣爱好:自己的性格有时候比较活泼开朗,有时候又比较内向,不太善和同学交流;喜欢听歌,但不会唱歌;还是比较喜欢运动,比如篮球、足球都还挺喜欢的,但对于舞蹈不太感冒;平时就上上网啊,看看电影,玩玩游戏,时不时出去游玩;对于学习,通常是前半学期比较积极,后半学期就开始懒惰了,导致成绩总是不理想。 2.性格特征:具有双重性的,在做事方面通常都是很认真但不太积极,有时存在一定的惰性,在理智中又存在着盲目。现在来到学校我想主动去观察已经代替了过去在高中的那种被动的接受,自己在清醒的面对现实时又多少带有一种脱离实际的幻想。在以后的学习工作中,我要努力改进自己的不足,发扬自己的长处,让自己变的更优秀。 3.学习方面:有点马虎不认真,造成学习成绩的不理想,以后这方面应该积极的改进,在以后我将以积极的态度努力学习,争取以优异的成绩完成学业。 4. 自我潜能分析:我想每个人都有自己的潜能,只是发挥没发挥出来的问

应用统计学期末练习题+答案

班级: 课程名称: 应用统计学 一、单选题 1.统计指标按其计量单位不同可分为( A ) A、实物指示和价值指标 B、数量指标和质量指标 C、时点指标和时期指标 D、客观指标和主观指标 2.下列中属于比较相对指标的是( D )。 A.女性人口在总人口中的比例B.医生人数在总人口中的比重 C.党团员在总人口中的比例 D.北京人口相当于上海人口的百分比 3.当相关关系的一个变量动时,另一个变量相应地发生变动,但这种变动是不均等的,这称为( C )。 A、线性相关 B、直线相关 C、非线性相关 D、非完全相关 4.数量指标指数和质量指标指数,是按其( C )不同的划分的。 A.反映对象范围的 B.对比的基期的 C.所表明的经济指标性质的 D.同度量因素的 5.平均发展速度的计算方法有( D ) A、简单算术平均数 B、加权算术平均数 C、调和平均数 D、几何平均法 E、方程法 6.某地区生活品零售价格上涨6%,生活品销售量增长8%,那么生活品销售额是( D )。 A.下降114.48% B.下降14.48% C.增长114.48% D.增长14.48% 7.2000年北京市三次产业比重分别是3.7%、38.0%和58.3%,这些指标是( D ) A、动态相对指标 B、强度相对指标 C、平均指标 D、结构相对指标 8.能形成连续变量数列的数量标志有( B ) A、企业的从业人员数量 B、企业的生产设备台数 C、企业的工业增加值 D、企业从业人员工资总额 E、企业的利税总额 9.对某市100个工业企业全部职工的工资状况进行调查,则总体单位是( B )。 A.每个企业 B.每个职工 C.每个企业的工资总额 D.每个职工的工资水平 10.抽样估计就是根据样本指标数值对总体指标数值做出( B )。 A、直接计算 B、估计和推断 C、最终结论 D、一定替代 11.对比分析不同水平的变量数列之间标志变异程度,应使用( D )。 A.全距B.平均差 C.标准差 D.变异系数 12.两个变量之间的变化方向相反,一个上升而另一个是下降,或者一个下降而另一个是上升,这是 ( B )。

应用统计学期末试卷

南京邮电大学 2010 /2011 学年第 一 学期 《应用统计》期末 试卷(A ) 院(系) 班级 学号 姓名 一、单项选择题(每题2分,共10题,合计20分) (1)一个旅游景点的管理员根据以往的经验,有80%游客照相留念,则接下来的两名游客都照相留念的概率是( )。 A.0.65 B.0.36 C.0.5 D.0.4 (2)从一个装有3个红球2个白球的盒子摸球(不放回),则连续两次摸到红球的概率为( )。 A.0.6 B.0.3 C.0.5 D.0.4 (3)下面属于时期指标的是( )。 A.商品销售额 B.商场数量 C.商品价格 D.营业员人数 (4)平均发展速度是( )。 A. 定基发展速度的算术平均数 B. 环比发展速度的算术平均数 C. 环比发展速度的几何平均数 D. 增长速度加上100% (5)在回归直线Y =a +bx 中,回归系数b 的意义为( )。 A .x =0时,Y 的期望值 B .X 每变动一个单位引起的Y 的平均变动量 C .Y 每变动一个单位引起的X 的平均变动量 D .X 每变动一个单位时Y 的变动总量 (6)设随机变量2~(3,)X N σ,且(36)0.4P X <<=,则( )0P X <=( )。 A .0.1 B .0.4 C .0.6 D .1 (7)某企业生产某种产品,其产量每年增加5万吨,则该产品的产量环比增长速度( )。 A . 年年下降 B . 年年增长 C . 年年保持不变 D . 无法做结论 (8)设()~X P λ,已知()()12P X P X ===,则()3P X =的数值为( )。 装 订 线 内 不 要 答 题 自 觉 遵 守 考 试 规 则,诚 信 考 试,绝 不 作 弊

《应用统计学》复习题库48832

第一章思考题及练习题 (一)填空题 1.统计工作与统计资料的关系是和的关系。 2.统计工作与统计学的关系是和的关系。 3.统计活动具有. . .和的职能。 4.统计指标反映的是的数量特征,数量标志反映的是的数量特征。5.在人口总体中,个体是“”,“文化程度”是标志。 6.统计研究过程的各个阶段,运用着各种专门的方法,如大量观察法. .综合指标法.和统计推断法等。 7.统计标志是总体中各个体所共同具有的属性或特征的名称。它分为和两种。 8.要了解一个企业的产品质量情况,总体是.个体是。9.性别是标志,标志表现则具体为或两种结果。 10.一件商品的价格在标志分类上属于。 11.一项完整的统计指标应该由. .. . 和等构成。 12.统计指标按所反映的数量特点不同,可以分为和。 13.反映社会经济现象相对水平或工作质量的指标称为指标。 14.统计活动过程通常被划分为. 和三个阶段。 15.经过余年的发展,形成了今天的统计学。 16.古典统计学时期有两大学派,它们分别是和。 17.《关于死之表的自然和政治观察》一书的作者是,他第一次编制了“生命表”。 18. 提出了著名的误差理论和“平均人”思想。 19.统计研究的数量性是指通过数来反映事物的量的.量的.量的和量的。 20.统计学包括和两部分内容。 21.总体中所包含的个体数量的多少称为;样本中所包含的个体数量的多少称为。 22.总体中的一个组或类,可被称为一个研究域或。 23.从总体中随机抽取的一部分个体所组成的集合称为。 24.统计理论与方法,事实上就是关于的理论和方法。 25.总体的三大特征是. 和。 26.总体的差异性要求体现在至少具有一个用以说明个体特征的。 27.企业性质标志适用的测定尺度是,产品质量等级标志适用的测定尺度是,企业利润标志适用的测定尺度是,企业产量标志适用的测定尺度是。 28.可变的数量标志的抽象化称为。它按其所受影响因素不同,可分为和两种,按其数值的变化是否连续出现,可分为和两种。 29.个体是的承担者。 30.统计指标按其反映现象的时间状态不同,可以分为和两种。 31.若干互有联系的统计指标组成的有机整体称为,其中一个很重要的反映国民经济和社会发展状况的基本统计指标体系是。 32. 统计研究的一大任务就是要用的样本指标值去推断 的总体指标值。 (二)单项选择题 1.社会经济统计的研究对象是()。 A.抽象的数量关系 B.社会经济现象的规律性 C.社会经济现象的数量方面 D.社会经济统计认识过程的规律和方法 2.某城市进行工业企业未安装设备普查,个体是()。

应用统计学专业大数据方向人才培养方案

应用统计学专业(大数据方向)人才培养方案 学科门类:理学 二级类:统计学类 专业代码:071202 英文名称:Applied Statistics(Big data) 一、专业培养目标 本专业培养德、智、体、美全面发展,掌握数学、统计学和经济学等相关学科的基本理论和知识,具备运用统计方法和大数据处理技术,利用计算机处理和分析数据的能力,能在企事业、经济、金融、保险等部门从事数据采集、预处理、数据挖掘、大数据应用分析及开发、数据可视化等工作的高素质应用型人才。 二、专业培养规格 1、知识结构 (1)掌握计算机的基础知识。 (2)掌握中外文资料查询、文献检索及运用现代信息技术获取相关信息的基本方法。 (3)熟练掌握一门外语,能顺利阅读本专业的外文资料和撰写外文摘要。 (4)具有社会学、文学、哲学和历史学等社会科学基本知识。 (5)掌握经济学、管理学的基本理论知识。 (6)掌握政治、形式与政策、思想道德修养与法律基础等基本知识。 (7)具有坚实的数学理论基础。 (8)了解与统计学相关的自然学科的基本知识,具有坚实的统计学和经济学理论基础。 (9)掌握统计学的基本思想和方法,熟悉统计政策和法规; (10)理解大数据技术领域的基本理论和基本知识。 (11)掌握大数据科学与技术的基本思维方法和研究方法,了解大数据技术的应用前景、以及相关行业最新进展与发展动态。 (12)具有分布式数据库原理与应用、大数据技术框架、数据分析与方法、数据挖掘技术、数据可视化技术、并行与分布式计算原理、大数据编程技术等专

业知识。 2、能力结构 (1)具有一定的语言文字表达能力,掌握资料查询,文献检索及运用现代信息技术获得相关信息的能力,能够跟踪统计学领域最新技术发展趋势。 (2)具备自主学习、对终身学习有正确的认识,具有不断学习和适应发展的能力。 (3)具有运用统计方法进行数据采集、处理、分析、推断和预测的能力。 (4)能熟练使用统计软件并具备一定的编程能力,并且能正确利用统计思想和方法分析判断软件的计算结果。 (5)具备应用统计方法解决企事业、经济、金融、保险等领域实际问题的能力。 (6)了解相关的技术标准,具有数据处理、分析、呈现等应用技能,具备大数据项目的组织与管理能力。 (7)具有大数据行业领域相关软件产品的应用、大数据系统分析、设计、部署以及维护和管理能力。 (8)具备一定的创新意识和从事大数据领域科学研究的初步能力,有获取最新科学技术知识和信息的基本能力。 (9)具有一定的独立工作能力、人际交往能力和团队合作能力。 3、素质结构 (1)掌握马列主义、毛泽东思想、邓小平理论和“三个代表”重要思想的基本原理,树立辩证唯物主义、历史唯物主义和科学发展观的基本观点。 (2)具有良好的道德品质、社会公德、职业道德和良好的文化素养。 (3)具有爱岗敬业、艰苦奋斗、团结合作的优秀品质。 (4)具有健全的人格、健康的体魄、良好的心理素质和积极乐观的人生态度,养成健全的职业人格和对统计的热爱态度以及良好的体育锻炼习惯, 达到国家规定的大学生体育合格标准和军事训练标准。 三、专业培养规格实现矩阵

《应用统计学》期末考试试题++a+)+卷

一、单项选择题(每题 2分,共30分) △ 1.在编制等距数列时,如果全距等于56,组数为6,为统计运算方便,组距取( B )。 A 、9.3 B 、9 C 、6 D 、10 2.某商业局对其所属商店的销售计划完成百分比采用如下分组, 请指出哪项是正确的( C )。 A 、80—89% 90—99% 100—109% 110%以上 B 、80%以下 80.1—90% 90.1—100% 100.1—110% C 、90%以下 90—100% 100—110% 110%以上 D 、85%以下 85—95% 95—105% 105—115% 3.以下是根据8位销售员一个月销售某产品的数量制作的茎叶图 3 02 6785 5654 则销售的中位数为( C ) 。 A. 5 B. 45 C. 56.5 D. 7.5 4.按使用寿命分组的产品损坏率一般表现为( D )分布。 A 、钟型 B 、对称 C 、J 型 D 、U 型 5.某11位举重运动员体重分别为:101斤、102斤、103斤、108 斤、102斤、105斤、102斤、110斤、105斤、102斤,据此计 算平均数,结果满足( D )。 A 、算术平均数=中位数=众数 B 、众数>中位数>算术平均数 C 、中位数>算术平均数>众数 D 、算术平均数>中位数>众数

6.甲数列的标准差为7.07,平均数为70,乙数列的标准差为3.41, 平均数为7,则( D )。 A 、甲数列平均数代表性高; B 、乙数列平均数代表性高; C 、两数列的平均数代表性相同; D 、甲数列离散程度大; 7.某银行想知道平均每户活期存款余额和估计其总量,根据存折 账号的顺序,每50本存折抽出一本登记其余额。这样的抽样组 织形式是( C ) A 、类型抽样 B 、整群抽样 C 、机械抽样 D 、纯随机抽样 8.在方差分析中,检验统计量F 是( B )。 A 、组间平方和除以组内平方和 B 、组间均方和除以组内均方 C 、组间平方和除以总平方和 D 、组内均方和除以组间均方 9. 回归方程中,若回归系数为正,则( A )。 A 、表明现象正相关 B 、表明现象负相关 C 、表明相关程度很弱 D 、不能说明相关的方向和程度 △10.已知某工厂甲产品产量和生产成本有直线关系,在这条直 线上,当产量为1000时,其生产成本为30000元,其中不随产量 变化的成本为6000元,则成本总额对产量的回归方程是( A ) A 、x y 246000?+= B 、x y 24.06?+= C 、x y 624000?+= D 、x y 600024?+= 11.速度和环比发展速度的关系是( A )。 A 、两个相邻时期的定基发展速度之商等于相应的环比发展速度 B 、两个相邻时期的定基发展速度之差等于相应的环比发展速度

应用统计学复习试题

应用统计学复习题 一简述 1.统计调查的方法有那几种 答:三种主要调查方式:普查,抽样调查,统计报表。实际中有时也用到重点调查和典型调查。 2.表示数据分散程度的特征数有那几种 答:全距(又称极差),方差和标准差,交替标志的平均数和标准差,变异系数,标准分数3为什么对总体均值进行估计时,样本容量越大,估计越精确 答:因为总体是所要认识的研究对象的全体,它是具有某种共同性质或特征的许多单位的集合体.总体的单位数通常用N来表示,N总是很大的数.样本是总体的一部分,它是从总体中随机抽取出来、代表总体的那部分单位的集合体.样本的单位数称为样本容量,通常用n表示。样本容量n越大,就越接近总体单位数N,样本均值就越接近总体均值,对总体均值进行估计时,估计越精确。 4.区间估计与点估计的结果有何不同 答:点估计是使用估计量的单一值作为总体参数的估计值;区间估计是指定估计量的一个取值范围都为总体参数的估计。 5.在统计假设检验中,如果轻易拒绝了原假设会造成严重后果时,应取显著性水平较大还是较小,为什么 答:取显著性水平较小,因为如果轻易拒绝了原假设会造成严重后果,那就说明在统计假设检验中,拒绝原假设的概率要小,而假设检验中拒绝原假设的概率正是事先选定的显著性水平α 6.简述算术平均数、几何平均数、调和平均数的适用范围。 答:几何平均数主要适用于比率的平均。一般地说,如果待平均的变量x与另外两个变量f 和m 有fx=m 的关系时,若取f为权数,应当采用算术平均方法;若取m 为权数,应当采用调和平均方法。 7.对总体均值的假设检验中,如何通过确定样本容量大小以控制两类错误 答:要控制两类错误就要减小误差,也就是提高精确性,决定样本大小的影响因素主要有:(1)总体方差σ2的大小.总体方差大,抽样误差大,则应多抽一些样本容量.问题是实际工作中我们往往不知道总体方差,因而必须作试验性调查,或以过去的历史资料作参考.(2)可靠性程度的高低.要求可靠性越高,所必需的样本容量就越大.(3)允许误差的范围.这主要由研究目的而定.若要求推断比较精确,允许误差范围应该小一些,随之抽取的样本单位数就要多一些. 可用最大允许抽样误差e 来表示区间估计的准确程度,其中 /2 e Z α = 对于无限总体, 22 /2 2 Z n e α σ = ;对于有限总体, 2 22 2 /2 n e Z N α σ σ = + ,

应用统计学公式复习

12-13.1统计学公式复习 A.设各组的组中值为:x 1 ,x 2 ,… ,x k 相应的频数为:f 1 , f 2 ,… ,f k 样本加权平均: i k i i i k i k k k f f x f f f f x f x f x x 11212211==∑∑= ++++++=ΛΛ 样本方差 1 )(1212 -∑-∑= ==i k i i i k i f f x x s 样本标准差 1 )(121-∑-∑= ==i k i i i k i f f x x s B .离散系数 x s v s = 及其应用。 总体均值的区间估计 C. 1.假定条件:大样本(n ≥ 30)或正态分布,总体方差σ 2已知。 总体均值 μ 在1-α 置信水平下的置信区间为 n z x σα2/μ或 n s z x 2 /αμ(σ未知) D. 2.假定条件:正态分布,小样本 (n < 30), 总体方差σ 2未知, 总体均值 μ 在1-α置信水平下的置信区间为 n s n t x ) 1(2/-αμ 总体比例的区间估计 假定条件:np ≥5,n (1-p )≥5, 总体比例π在1-α置信水平下的置信区间为 n p p z x )1(2 /-αμ 估计总体均值时样本量的确定 估计总体均值时样本量n 为 2 2 22/D z n σα=其中n z D σα2/= E.估计总体比率时样本量的确定 估计总体比率时样本量n 为 2 22/) 1(D z n ππα-= 其中n z D )1(2 /ππα-= 总体均值μ的假设检验 假设建立:明确的命题设为原假设H 0,模糊的命题设为备择假设H 1。 F. 1.假定条件:大样本(n ≥ 30)或正态分布,总体方差σ 2已知, (一)建立假设a .H 0 : μ=μ0 H 1 : μ≠μ0 b .H 0 : μ≥μ0 H 1 : μ<μ0 c .H 0 : μ≤μ0 H 1 : μ>μ0 (二)检验统计量 n x z /0σμ-= 或n s x z /0 μ-=(σ未知) (三)拒绝域:a . 2/αz z ≥ b . αz z -< c . αz z > (四)拒绝域成立时,拒绝原假设;否则,不能拒绝原假设。 G . 2.假定条件:正态分布,小样本 (n < 30), 总体方差σ 2未知 (一)建立假设a .H 0 : μ=μ0 H 1 : μ≠μ0 b .H 0 : μ≥μ0 H 1 : μ<μ0 c .H 0 : μ≤μ0 H 1 : μ>μ0 (二)检验统计量 n s x t /0 μ-= (三)拒绝域:a . )1(2/-≥n t t α b . )1(--n t t α (四)拒绝域成立时,拒绝原假设;否则,不能拒绝原假设。 总体比例π的假设检验 假定条件:n π 0≥5,n (1-π 0)≥5, (一)建立假设a .H 0 : π =π 0 H 1 : π ≠π 0 b .H 0 : π ≥π 0 H 1 : π <π 0 c .H 0 : π ≤π 0 H 1 : π >π 0 (二)检验统计量

统计学期末复习-公式汇总

统计报表 专门调查 普查 抽样调查 典型调查 重点调查 按调查的组织方式不同分为 按调查时间是否连续分为 按调查单位的范围大小分为 全面调查 非 全面调查 一次性调查 经 常性调查 统计学复习 第一章 1.“统计”的三个涵义:统计工作、统计资料、统计学 2.三者之间的关系:统计工作和统计资料是工作与工作成果的关系; 统计资料和统计学是实践与理论的关系 3.统计学的特点:数量性,总体性,具体性,社会性(广泛性) 4.统计工作的过程一般分为统计调查、统计整理和统计分析三个阶段 5.总体与总体单位的区分:统计总体是客观存在的,在同一性质基础上结合起来的许多个别单位的整体,构成总体的这些个别单位称为总体单位。(总体或总体单位的区分不是固定的:同一个研究对象,在一种情况下是总体,在另一种情况下可能成了总体单位。) 6.标志:总体单位所具有的属性或特征。 A 品质标志—说明总体单位质的特征,不能用数值来表示。如:性别、职业、血型色彩 B 数量标志—标志总体单位量的特征,可以用数值来表示。如:年龄、工资额、身高 指标:反映社会经济现象总体数量特征的概念及其数值。 指标名称体现事物质的规定性,指标数值体现事物量的规定性 第二章 1.统计调查种类 2.统计调查方案包括六项基本内容: 1)确定调查目的;(为什么调查) 2)确定调查对象与调查单位;(向谁调查) 调查对象——社会现象的总体 调查单位——调查标志的承担者(总体单位) 填报单位——报告调查内容,提交统计资料 3)确定调查项目、拟定调查表格;(调查什么) 4)确定调查时间和调查期限 5)制定调查的组织实施计划; 6)选择调查方法。

应用统计学期末考试试题A卷

一 、单项选择题(每题2分,共30分) △1.在编制等距数列时,如果全距等于56,组数为6,为统计运算方便,组距取( B )。 A 、 B 、9 C 、6 D 、10 2.某商业局对其所属商店的销售计划完成百分比采用如下分组,请指出哪项是正确的 ( C )。 A 、80—89% 90—99% 100—109% 110%以上 B 、80%以下 —90% —100% —110% C 、90%以下 90—100% 100—110% 110%以上 D 、85%以下 85—95% 95—105% 105—115% 3.以下是根据8位销售员一个月销售某产品的数量制作的茎叶图 3 02 6785 5654 则销售的中位数为( C )。 A. 5 B. 45 C. D. 4.按使用寿命分组的产品损坏率一般表现为( D )分布。 A 、钟型 B 、对称 C 、J 型 D 、U 型 5.某11位举重运动员体重分别为:101斤、102斤、103斤、108斤、102斤、105斤、 102斤、110斤、105斤、102斤,据此计算平均数,结果满足( D )。 A 、算术平均数=中位数=众数 B 、众数>中位数>算术平均数 C 、中位数>算术平均数>众数 D 、算术平均数>中位数>众数 6.甲数列的标准差为,平均数为70,乙数列的标准差为,平均数为7,则( D )。 A 、甲数列平均数代表性高; B 、乙数列平均数代表性高; C 、两数列的平均数代表性相同; D 、甲数列离散程度大; 7.某银行想知道平均每户活期存款余额和估计其总量,根据存折账号的顺序,每50本 存折抽出一本登记其余额。这样的抽样组织形式是( C ) A 、类型抽样 B 、整群抽样 C 、机械抽样 D 、纯随机抽样 8.在方差分析中,检验统计量F 是( B )。 A 、组间平方和除以组内平方和 B 、组间均方和除以组内均方 C 、组间平方和除以总平方和 D 、组内均方和除以组间均方 9. 回归方程中,若回归系数为正,则( A )。 A 、表明现象正相关 B 、表明现象负相关

应用统计学专业学位培养方案

应用统计学专业学位培养方案

应用统计硕士专业学位研究生培养方案 适用专业:应用统计专业 一、学科概况 应用统计专业属于统计学学科领域,是上个世纪以来迅速发展起来的专业,在统计学领域中占有重要的地位,在金融工程、经济规划和管理、产品质量控制、经营管理、医药卫生、交通工程、人文科学和社会科学等领域有着广泛应用。随着人类社会活动体系的日益庞大、复杂、精密,以及计算机的广泛使用,应用统计将发挥越来越重要的作用。 广西师范大学统计学科拥有一支学历、年龄、职称结构合理的学术队伍。现有教师25人,其中博士生导师2人,教授11人,副教授8人,教师全部具有研究生以上学历。学科带头人杨善朝教授为中国概率统计学会理事、国务院政府津贴专家、广西优秀专家、入选广西十百千人才工程;秦永松教授是中国现场统计研究会理事、入选广西十百千人才工程。近两年来, 本学科承担国家自然科学基金10项,国家社科基金3项,广西自然科学基金项目10余项,公开发表论文200余篇,其中被SCI、EI、ISTP收录70余篇,获得2项省部级科研成果奖。我校统计学科在长期办学过程中与国家统计局广西调查总队、广西气象局、广西统计局、桂林电器科学研究所等单位建立了良好的合作关系。广西师范大学概率论与数理统计专业于1982年开始招收硕士研究生,2000年获得硕士学位授予权,是广西最早培养统计人才的硕士点。广西师范大学于2010年在全国首批获得统计专业硕士学位授权,并于当年开始招生。在国务院学位委员会和教育部于2011年3月颁布的新的“学位授予和人才培养学科目录(2011年)”中,统计学成为“理学”门类下的一级学科,我校当年获统计学一级学科硕士授予权。 二、培养目标 培养具备良好的政治思想素质和职业道德素养,具有良好的统计学背景,系统掌握数据采集、处理、分析和开发的知识与技能,具备熟练应用计算机处理和分析数据的能力,能够在国家机关、党群团体、企事业单位、社会组织及科研教学部门从事统计调查咨询、数据分析、决策支持和信息管理的高层次、

《应用统计学》期末考试试题及答案(第一套)

《应用统计学》期末考试试题(第一套) 参考答案及评分细则 一、单项选择题(在备选答案中只有一个是正确的,将其选出并把它的英文标号写在题后括号内。不答题或者答错题既不得分,也不倒扣分。每题1分,共10分) 1、某城市工业企业未安装设备普查,总体单位是( B)。 A.工业企业全部未安装设备B.工业企业每一台未安装设备 C.每个工业企业的未安装设备D.每一个工业企业 2、属于数量指标的是( A )。 A.粮食总产量 B.粮食平均亩产量 C.人均粮食生产量 D.人均粮食消费量 3、某市工业企业2006年生产经营成果年报呈报时间规定在2007年1月31日, 则调查期限为( B )。 A.一日B.一个月C.一年D.一年零一个月 4、某管理局对其所属企业的生产计划完成百分比采用如下分组,请指出下列哪项 是正确的( C ) A.80-89%B.80%以下C.90%以下D.85%以下 90-99%80.1-90%90-100% 85-95% 100-109% 90.1-100% 100-110% 95-105% 110%以上 100.1-110%110%以上 105-115% 5、某企业2005年职工平均工资为5200元,标准差为110元,2006年职工平均 工资幅长了40%,标准差增大到150元,职工平均工资的相对变异( B )A.增大 B.减小C.不变D.不能比较6、权数对算术平均数的影响作用,实质上取决于( A ) A.作为权数的各组单位数占总体单位数比重的大小 B.各组标志值占总体标志总量比重的大小 C.标志值本身的大小 D.标志值数量的多少 7、已知各期环比增长速度为2%、5%、8%和7%,则相应的定基增长速度的计算方 法为( A )

应用统计分析复习要点和答案.doc

《应用统计学》复习要点 (要求:每人携带具有开方功能的计算器) 一、名词解释 1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。 2.方差分析:是通过分析数据的误差判断各总体均值是否相等,研究分类型自变量对数值型因变量的影响,分为单因素方差分析和双因素方差分析。 3.假设检验:是事先对总体参数或分布形式做出某种假设,然后利用样本信息来判断原假设是否成立。分为参数假设检验和非参数假设检验。一般采用逻辑上的反证法,依据统计上的小概率原理。 4.置信区间:是指由样本统计量所构成的总体参数的估计区间。在统计学中,一个概率样本的置信区间是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的成都。 5.置信水平:是指总体参数值落在样本统计值某一区内的概率。 6.抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统计推断的理论基础。 7.方差分析:是通过分析数据的误差判断各总体均值是否相等,研究分类型自变量对数值型因变量的影响,分为单因素方差分析和双因素方差分析。(重复啦) 8.相关分析:是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度是研究随机变量之间的相关关系的一种统计方法。 9.推断统计:是研究如何利用样本数据来推断总体特征的统计方法。包含两个内容:参数估计,即利用样本信息推断总体特征;假设检验,即利用样本信息判断对总体的假设是否成立。 二、计算题 1.在某地区随机抽取 120 家企业,按照利润额进行分组后结果如下: 按利润额分组(万元)企业数(个) 300 以下19 300~400 30 400~500 42 500~600 18 600 以上11 合计120 计算 120 家企业利润额的平均数和标准差(注:第一组和最后一组的组距按相邻组计算)。 解:

432统计学应用统计专业硕士考试大纲

432统计学(应用统计专业硕士)考试大纲 参考书目 [1]《统计学》第二版,贾俊平编著, 清华大学出版社出版, 2006。 [2]《概率论与试验统计》第三版,余家林,朱倩军,高等教育出版社,2009. I.考查目标 应用统计硕士专业学位《统计学》考试是为我校招收应用统计硕士生入学设置的资格考试科目。其目的是科学、公平、有效地测试考生是否具备攻读应用统计硕士专业学位所必须具备的基本素质、应用能力和培养潜能,以利选拔优秀人才入学, 为国家的经济建设培养具有优良的职业道德、法制观念、国际视野、及较强分析与解决实际问题能力的高层次、应用型、复合型统计专业人才。 考试要求是测试考生掌握数据处收集、处理和分析的一些基本统计方法。具体考试要求是: 1. 掌握基本的概率论知识、原理和方法。 2. 掌握数据收集、统计分析、统计处理的基本原理和方法。 3. 具有统计建模及用统计方法解释数据的基本能力。 II.考试形式和试卷结构 一、试卷总分及考试时间 试卷总分为150分,考试时间180分钟。 二、答题方式 答题方式为闭卷、笔试。允许使用计算器(仅具备四则运算和开方运算功能的计算器)。不得使用带有公式和文本存储功能的计算器。 三、试卷内容与题型结构 概率论60分,由以下三种题型构成; 单项选择题10题,每小题2分,共计20分。 简答题4题,每小题5分,共计20分。 计算与证明题2题,每小题10分,共计20分。

统计学90分,由以下三种题型构成 单项选择题15题,每小题2分,共计30分。 简答题4题,每小题5分,共计20分。 计算与分析题4题,每小题10分,共计40分。 III.考查内容 一、概率论 1. 事件的关系、运算及运算性质; 2. 概率的计算公式及计算性质; 3. 全概率公式、条件概率、乘法公式、贝叶斯公式; 4. 随机变量、概率分布列、分布函数的概念; 5. 离散型随机变量及其分布:(0-1)分布,二项分布、泊松分布、几何分布、超几何分布; 6. 连续型随机变量及其分布:均匀分布、指数分布、正态分布; 7. 随机变量及随机变量函数的数学期望的性质及计算; 8. 随机变量的方差的性质及计算; 9. 协方差、相关系数; 10. 大数定律,中心极限定理。 二、统计学 1. 概率抽样方法和非概率抽样方法; 2. 调查的组织和实施; 3. 常见统计量:样本均值、样本方差、样本标准差、样本k阶原点矩、样本k阶中心矩、样本中位数、样本极差、样本相关系数、样本偏度、峰度、变异系数、经验分布函数; 4. 众数、分位点的概念及性质; 5. 正态总体下抽样分布的结论; 6. 矩估计和极大似然估计方法; 7. 点估计的简单评价:无偏性、有效性; 8. 区间估计及其评价; 9. 假设检验的基本原理; 10. 参数假设检验方法; 11. 非参数假设检验方法; 12. 单因素、双因素方差分析;

统计学期末复习重点

统计总体:统计总体是根据一定目的确定的所要研究事物的全体,它是客观存在,并在某一相同性质基础上结合起来的由许多个别事物组成的整体,简称总体。 样本:是指在全及总体中按随机原则抽取的那部分单位所构成的集合体。 算术平均数:算术平均数是统计中最基本、最常用的一种平均数,它的基本计算形式是用总体的单位总数去除总体的标志总量。 调和平均数:是根据变量值的倒数计算的,是变量值倒数的算术平均数的倒数,也叫倒数平均数。 简单分组:是指对所研究的总体按一个标志进行分组。 复合分组:复合分组是指对所研究的总体按两个或两个以上的标志进行的多层次分组。 结构相对指标:结构相对指标是表明总体内部的各个组成部分在总体中所占比重的相对指标,也叫比重指标。 强度相对指标:是指两个性质不同,但有一定联系的总量指标数值之比。 类型抽样:又称分类抽样或分层抽样,它是先将总体按某个主要标志进行分组(或分类),再按随机原则从各组(类)中抽取样本单位的一种抽样方式。 机械抽样:它是将总体各单位按某一标志顺序排列,然后按固定顺序和相等距离或间隔抽取样本单位的抽样组织方式。 综合指数:凡是一个总量指标可以分解为两个或两个以上的因素指标时,为观察某个因素指标的变动情况,将其他因素指标固定下来计算出的指数称为综合指数。 平均指数:平均指数法是以个体指数为基础来计算总指数,根据选用的权数不同,平均指数法可以进一步分为加权算术平均法,加权调和平均法,固定权数加权平均法。 相关关系:是指现象之间客观存在的,在数量变化上受随机因素的影响,非确定性的相互依存关系。 回归分析:现象之间的相关关系,虽然不是严格的函数关系,但现象之间的一般关系值,可以通过函数关系的近似表达式来反映,这种表达式根据相关现象的实际对应资料,运用数学的方法来建立,这类数学方法称为回归分析。 统计调查:就是根据统计研究的目的、要求和任务,运用各种科学的调查方法,有计划、有组织的搜集有关现象的各个单位的资料,对客观事实进行登记,取得真实可靠的调查资料的活动过程。 统计指数:广义指数泛指社会经济现象数量变动的比较指标,及用来表明同类现象在不同空间、不同时间,实际与计划对比变动情况的相对数。狭义指数仅指反应不能直接想家的复杂社会经济现象在数量上综合变动情况的相对数。 简单随机抽样:简单随机抽样也叫纯随机抽样,它对总体单位不做任何分类排队,而是直接从总体中随机抽取一部分单位来组成样本的抽样组织方式。 季节分析的含义:是指某些现象由于自然因素和社会条件的影响在一年之内比较有规律的变动。 总量指标:是指反映一定时间、地点和条件下某种现象总体规模或水平的统计指标。 相对指标:是指说明现象之间数量对比关系的指标,用两个或两个以上有联系的指标数值对比来求得,其结果表现为相对数,故也将相对指标称为相对数。 平均指标:是同类社会经济现象总体内,各单位某一数量标志在一定时间、地点和条件下,数量差异抽象化的代表性水平指标,其数值表现为平均数。 1计算运用总量指标的原则。 (1)在计算实物指标时,应注意现象的同类性 (2)统计总量指标时要有明确的统计含义和合理的统计方法

相关文档
最新文档