统计学重点整理

统计学重点整理
统计学重点整理

参数(parameter):描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。所关心的参数主要有总体均值、标准差、总体比例等。总体参数通常用希腊字母表示

统计量(statistic):用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数。所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等。样本统计量通常用小写英文字母表示

1、概率抽样:简单随机抽样(SRS)、系统抽样(SYS)、分层抽样(STS)、整群抽样(STS)、多阶段抽(MSS)

简单随机抽样(SRS)

特点:总体中每一个样本点均有相同机率被抽中、抽出某个样本后不影响另一个样本抽出的机率(独立性)、经常先列样本名册后用计算机产生随机数或随机表抽选

放回和不放回:放回(重复)抽样;无放回(不重复)抽样

系统抽样(SYS)

等距抽样:将所有样本列册以序号排列,先随机抽取第一个样本,接着每隔K个样本抽取下一个样本;间隔K的求法:Population size/ Sample size;常用于电话抽样(类似于简单随机抽样)

分层抽样(STS)

将总体区分为数个层(strata):层之间互斥且周延、层内性质相近、层与层之间差异明显

从每一层中简单随机抽取若干样本作为该层的代表,再将所有层总结集合

整群抽样(STS)

将总体区分为多个群集clusters:群集间互斥且周延、群集与群集间差异小、群集内类似总体

随机抽取数个clusters

将抽中的群集内每个样本均调查

多阶段抽样(MSS)

第一阶段:分群——整群抽样

第二阶段:分层——分层抽样

第三阶段……

整群抽样的优点是实施方便、节省经费;整

群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。

2、抽样所产生的误差:抽样误差(sampling error)和非抽样误差(non-sampling error)

抽样误差(理论上不可避免):由于抽样的随机性所带来的误差(偶然性)

所有样本可能的结果与总体真值之间的平均性差异

影响抽样误差大小的因素:样本量的大小、总体的变异性

普查无抽样误差,但是普查误差可能比抽样误差大

非抽样误差:除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异

存在于所有的调查之中:概率抽样,非概率抽样,全面性调查

包括:抽样框误差、回答误差、无回答误差、调查员误差、测量误差

回答误差:理解误差、记忆误差、有意识误差

无回答误差:应答率的问题:酒吧打架致死事件,90%是被打死的那个人先动手的

?误差的控制

抽样误差可计算和控制

非抽样误差的控制:合理选择抽样框、改良问卷、调查过程控制(调查结果进行检验、评估;现场调查人员进行奖惩的制度)

茎叶图Stem-and-leaf plot for YEAR(结婚年龄)(唯一一个没有丢失原始数据的统计表)

3、画表的一般原则:

合理安排统计表的结构、总标题内容应满足3W 要求、数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明、表中的上下两条横线一般用粗线,其他线用细线、通常情况下,统计表的左右两边不封口、表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一、对于没有数字的表格单元,一般用“—”表示、必要时可在表的下方加上注释

4、集中趋势表示:均值、中位数、众数、几何平均数

众数:出现次数最多的变量值

不受极端值的影响、一组数据可能没有众数或有几个众数、主要用于定性数据,也可用于定量数据

未分组数据:无众数(原始数据: 1 2 3 4 5 6 7 )、一个众数(原始数据: 1 2 3 3 3 4 5 )、

多于一个众数(原始数据: 1 2 3 3 4 4 5 ,此时众数为二者平均3.5)

分组数据:先在次数表中找出次数最多的那一组,称为「众数组」,一般以Mo来表示。若取众数组的组中点为众数,则称为粗众数。Czuber插补法

中位数(median):将一组数字由大排至小,位居中间的数值为该组数字的中位数。一般以Me来表示

各观察值与中位数差异的绝对值总和为最小。

以下列公式求出中位数:

均值(mean):集中趋势的最常用测度值、一组数据的均衡点所在

事实上,各个观察值与平均数差的总和为0、各个观察值与平均数差的平方和为最小

几何平均数(geometric mean):n 个变量值乘积的n 次方根

数据必须为正值才能计算几何平均数

主要用于计算平均百分比(percentages)、比率(ratios)、指数(indexes)、成长率(growth rates)的计算

分位数:除了将数据作半切割外,我们也可以将数据切成四等分、十等分、或一百等分

切尾均值(trimmed Mean):去掉大小两端的若干数值后计算中间数据的均值

离散趋势:极差(四分位距)、方差(总体方差样本方差)、标准差(总体标准差、样本标准差)、离散系数

四分位距(Interquartile Range):也称为内距。上四分位数与下四分位数之差(IQR = Q3 –Q1)

反映了中间50%数据的离散程度。不受极端值的影响

离散系数(coefficient of variation CV):标准差与其相应的均值之比

分布偏度与峰度的测度

偏度(skewness):Pearson于1895年首次提出。数据分布偏斜程度的测度:

偏态系数=0为对称分布偏态系数< 0为左偏分布偏态系数> 0为右偏分布

峰度(kurtosis) :Pearson于1905年首次提出。数据分布扁平程度的测度

峰态系数=0扁平峰度适中峰态系数<0为扁平分布峰态系数>0为尖峰分布

统计量的分布就是抽样分布

标准误(error):统计量的标准差.样本均数的标准差。

5、影响区间宽度的因素

总体数据的离散程度,用s 来测度

样本容量

置信水平(1 - a),影响z 的大小

抽样组织形式

抽样方法

计算题

6、如何正确理解置信区间

由样本估计量所构造的总体参数的估计区间称为置信区间。

统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间

用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值。我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个。

置信区间又称为估计区间,是用来估计参数的适用范围的。其值是一个变量本身所具有的真实值。置信区间展现的是这个参数真值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度。

7、抽样n需要考虑的因素

(1)研究对象的变化程度、(2)所要求或允许的误差大小(即精度要求)、(3)要求推断的置信程度。

也就是说,当所研究的现象越复杂,差异越大时,样本容量要求越大;当要求的精度越高,可推断性要求越高时,样本量越大。

样本容量n与总体方差?2、边际误差E、可靠性系数Z或t之间的关系为

8、第一类错误(弃真错误):原假设为真时拒绝原假设。第一类错误的概率为αa,即显著性水平;(1-αa )则置信水平

第二类错误(取伪错误),原假设为假时没有拒绝原假设。第二类错误的概率为βb(Beta)

在其他条件不变的情况下,减少犯第一类的可能性势必增加犯第二类错误的可能性,反之必然。

原假设:研究者想收集证据予以反对的假设。总是有等号==, <= 或>= 3

备择假设:研究者想收集证据予以支持的假设。总是有不等号: ≠1, << 或>

9、P 值:

如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率

左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积

右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积

P值常常作为观察到额数据域原假设不一致程度的度量。统计量检验采用事先确定显著性水平a,来控制犯第一类错误的上限,P值可以有效的补充a提供的关于检验可靠性的有限信息。

P值检验的优点在于,他提供了更多的信息,让人们可以选择一定的水平来评估结果是否具有统计上的显著性。

如果P值越小,则我们可以拒绝原假设

计算题

10、相关与回归的关系

相关分析与回归分析区别:

(1)相关分析中,变量x 变量y 处于平等的地位;回归分析中,变量y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化

(2)相关分析中所涉及的变量x 和y 都是随机变量;回归分析中,因变量y 是随机变量,自变量x 可以是随机变量,也可以是非随机的确定变量

(3)相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x 对变量y 的影响大小,还可以由回归方程进行预测和控制

相关分析与回归分析联系

(1)理论和方法具有相似性;

(2)无相关就无回归,相关程度越高,回归越好

(3)线性回归时,相关系数和回归系数方向一致,可以互相推算

回归系数含义是说当其他因素不变时自变量的以单位变化引起的因变量的变化程度

计算题

可决系数(coefficient of determination)

可决系数越大,说明在总变差中由模型作出了解释的部分占的比重越大,模型拟合优度越好。反之可决系数小,说明模型对样本观测值的拟合程度越差。

可决系数是测定多个变量间相关关系密切程度的统计分析指标,它也是反映多个自变量对因变量的联合的影响程度。可决系数越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。

判定系数为可解释变异量占总变异量的比例,表示X对Y的变异之解释能力。R2愈大,表示X对Y的解释能力愈强

可决系数有如下特点:

1.可决系数是非负的统计量

2.可决系数的取值范围:0<=R^2<=1

3.可决系数是样本观测值的函数,可决系数R^2是随机抽样而变动的随机变量。为此,对可决系数的统计可靠性也应进行检验。

未知数,可用样本s代替,从而得到t分布

t 检验总体斜率

时间数列的基本要素:时间和指标数值

发展速度:环比发展速度、定基发展速度

关系:

定期发展速度(总速度)=相应时期的环比发展速度之积。

两个相邻的定基发展速度,用后者除以前者,等于相应的环比发展速度。

增长速度:

环比增长速度=环比发展速度—1

定基增长速度=定基发展速度—1

平均增长速度= 平均发展速度—1

平均发展速度的计算

几何平均法(水平法)以xi 表示环比发展速度,根据环比发展速度与总速度的关系,计算平均发展速度应该采用几何平均法:

时间序列及其的构成要素

(1)长期趋势T (A图)

现象在较长时期内持续发展变化的一种趋向或状态;由影响时间序列的基本因素作用形成;是时间序列中最基本的构成要素;可分为上升趋势、下降趋势、水平趋势

(2)季节变动S (B图)

是一种使现象以一定时期(如一年、一月、一周等)为一周期呈现较有规律的上升、下降交替运动的影响因素。

通常表现为现象在一年内随着自然季节的更替而发生的较有规律的增减变化,有旺季和淡季之分;是一种周期性的变化;周期长度小于一年;形成原因——有自然因素,也有人为因素(3)循环变动C (C图)

这种因素的影响使现象呈现出以若干年为一周期、涨落相间、扩张与紧缩、波峰与波谷相交替的波动。

不同于长期趋势:表现为单一方向的持续变动、C表现为波浪式的涨落交替的变动。

又不同于季节周期:周期长度不同、模型识别的难易程度不同、形成原因不同

(4)不规则变动I

包括随机变动和突然变动。

随机变动—现象受到各种偶然因素影响而呈现出方向不定、时起时伏、时大时小的变动,突然变动—战争、自然灾害或其它社会因素等意外事件引起的变动。影响作用无法相互抵消,影响幅度很大。一般只讨论有随机波动而不含突然异常变动的情况。

测量长期趋势的几种方法:移动平均方式、指数平滑法、二次曲线、指数曲线

11、测定季节变动的意义

(1)分析与测定过去的季节变动规律

(2)对未来现象季节变动作出预测

(3)消除季节变动对时间序列的影响

方法:原始资料平均法:

计算各年同期(月或季)的平均数

计算全部数据的总平均数

计算季节比率

季节比率特性:其总和等于季节周期L (=12或=4)

12、同度量因素原理:

(1)引入同度量因素解决加总问题

(2)固定同度量因素的时期正确地反映问题

意义:解决了简单综合指数的两个局限

同度量因素的两个作用:

(1)同度量

(2)权数

(拉式)(派式)计算

三者之间的相对数关系135.44%=125.34%×108.06%

三者之间的绝对量关系4490(元)=3210(元)+ 1280(元)

结论:2002年与2001年相比,三种商品的销售额增长35.44%,增加销售额4490元。其中由于:

价格变动使销售额增长8.06%,增加销售额1280元;

销售量变动使销售额增长25.34%,增加销售额3210元

统计学重点

统计学整理笔记

● 例1:某企业计划规定劳动生产率比上年提高10%,实际提高15%。试计算劳动生产率计划完成百分数。 ● ● 例2:某企业计划规定某产品单位成本降低5%,实际降低7%,试计算成本计划完成指标。 ● 答案: 答案: 答案: 起重量(吨)X 台数f 起重总量(吨)xf 40 1 40 25 2 50 10 3 30 5 4 20 合计 10 140 起重量(吨) 起重机台数构成(%) (吨) 40 10 4 25 20 5 10 30 3 5 40 2 合计 100 14 技术级别 月工资(元) 工资总额(元) 1 146 730 2 152 2280 3 160 1880 4 170 1700 5 185 370 合计 —— 7960

答案: 答案: 某地区国内生产总值的资料 单位:亿元 答案: 某企业2014年第三季度职工人数:6月30日435人,7月31日452人,8月31日462人,9月30日576人,要求计算第三季度平均职工人数. 答案如右图 计划完成程度(%) 组中值(%) 企业数 实际完成数(万元) 计划任务数(万元) 90—100 95 5 95 100 100—110 105 8 840 800 110—120 115 2 115 100 合计 — 15 1050 1000 日产量 (公斤) 工人数(人)f 组中值 (公斤)x xf 20—30 10 25 250 30—40 70 35 2450 40—50 90 45 4050 50—60 30 55 1650 合计 200 — 8400 2009年 2010年 2011年 2012年 2013年 2014年 18530.7 21617.8. 26635.4 34515.1 45005.8 57733

统计学计算题整理

: 典型计算题一 1、某地区销售某种商品的价格和销售量资料如下: 根据资料计算三种规格商品的平均销售价格。 解: 36== ∑∑ f f x x (元) 点评: 第一,此题给出销售单价和销售量资料,即给出了计算平均指标的分母资料,所以需采用算术平均数计算平均价格。第二,所给资料是组距数列,因此需计算出组中值。采用加权算术平均数计算平均价格。第三,此题所给的是比重权数,因此需采用以比重形式

表示的加权算术平均数公式计算。 2、某企业1992年产值计划是1991年的105%,1992年实际产值是1991的的116%,问1992年产值计划完成程度是多少? 解: %110% 105% 116=== 计划相对数实际相对数计划完成程度。即1992年计划完成程度为 110%,超额完成计划10%。 点评:此题中的计划任务和实际完成都是“含基数”百分数,所以可以直接代入基本公式计算。 3、某企业1992年单位成本计划是1991年的95%,实际单位成本是1991年的90%,问1992年单位成本计划完成程度是多少? 解: 计划完成程度 %74.94% 95% 90==计划相对数实际相对数。即92年单位成本计划完成程度是 94.74%,超额完成计划5.26%。 点评:本题是“含基数”的相对数,直接套用公式计算计划完成程度。 4、某企业1992年产值计划比91年增长5%,实际增长16%,问1992年产值计划完成程度是多少? 解: 计划完成程度%110% 51% 161=++= 点评:这是“不含基数”的相对数计算计划完成程度,应先将“不含基数”的相对数还原成“含基数”的相对数,才能进行计算。 5、某企业1992年单位成本计划比1991年降低5%,实际降低10%,问1992年单位成

统计学原理计算题试题及答案(最新整理)

电大专科统计学原理计算题试题及答案 计算题 1某单位40名职工业务考核成绩分别为 68 89 8884 86 87 75 73 72 68 75 82 9758 81 54 79 76 95 76 71 60 9065 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60 — 70分为及格,70 — 80分为中,80 — 90 分为良,90 — 100分为优。 要求: (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)分析本单位职工业务考核情况。 解:(1) (2)分组标志为”成绩",其类型为" 的开放组距式分组,组限表示方法是重叠组限; (3)本单位的职工考核成绩的分布呈两头小,中间大的”正态分布”的形态, 说明大多数职工对业务知识的掌握达到了该单位的要求。 2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下 价格(元/斤) 甲市场成交额(万元) 乙市场成交量(万斤) 品种

试问哪一个市场农产品的平均价格较高?并说明原因 解:先分别计算两个市场的平均价格如下: 甲市场平均价格 X m 5.5 1.375 (元 /斤) m/x 4 乙市场平均价格 X xf 5.3 1.325 (元 / 斤) f 4 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场 平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同 3. 某车间有甲、乙两个生产组,甲组平均每个工人的日产量为 36件, 标准差为9.6件;乙组工人日产量资料如下:

基础统计学笔记 统计学基础笔记整理

一、统计学概论 分理论统计和应用统计 应用统计分为描述统计学和推断统计学。 描述统计为一组数据的中(位置均值、中位数)、散(极差、方差、标准差)、形|(偏度)描述。 推断统计分为参数估计和假设检验。技能 1、经验——数据收集加工——画成图形——数理(规律)(数据不等于数字) PPT 原则用图不用表、用表不用栏、用栏不用字实际问题 5M1E ——组成过程——产品(结果)——属性(包括几何(形位方尺)、物理、生化、人文)——集合统计问题 ——(构成)总体——样本——数据——类型分计数型(离散性)和计量型(连续性),即概率分布为计量型分布和技术型分布)——规律分描述和推断。

1、总体与样本中间有一种学问抽样验收抽样、统计抽样样本量 2、样本和数据中间有一门测量技术MSA 3、分布规律 总体参数平均值() 标准差() 总位数() 比例(p ) 样本统计量的特点随机变化,不要轻易用样本下结论。拉丁字母在数学上用于总体参数阿拉伯字母表示样本统计量希腊字母表示计算 总体参数统计分参数统计和非参数统计。推断统计分 估计总体总体某参数未知,用对应的样本统计量去猜测。检验假设总体某参数已知,用对应的样本统计量去验证。 二统计数据收集与整理1、数据不等于数字 2、数据的两种类型 描述性分类——响应变量(因变量)和预报因子(独立变量)如性别叫因子,男女叫水平。 四种尺度定类、定序、定距、定比

3.数据管理的7个层次无假不乱浅深系4.软件每一列表示一个变量,每一行表示一个样本鱼骨图只适用于一个为什么, 变量程序图IPO 适用于多个为什么。 I (变量)P O 水质烧开水色香味器皿材质火燃料风压强 目的要抓住关键的变量。 2、统计数据的表现形式绝对数——时期数和时点数相对数——比例部分比总体比率部分比部分 统计的数据来源直接来源和间接来源。 1、数据收集分被动收集(利用历史和现场)和主动收集(DOE 试验设计)现场收集数据是被动收集,分临时数据和常态数据。试验是临时数据。 数据好的特征。。。。 数据不好的7个陷阱缺少假混窄异病

统计学期末以及考研复习知识点内容详细

统计学知识点 第一章绪论 1、今天,“统计”一词有三种含义: ⒈统计工作:搜集、整理和分析统计数据的活动。 ⒉统计数据:统计工作的成果。 ⒊统计学:指导统计工作的理论。如数理统计学,社会统计学,经 济统计学,应用统计学等。 统计三个含义的关系十分密切:统计工作与统计数据是过程与成果的关系;统计工作与统计学是实践与理论的关系。 2、第一部统计学著作是英国人威廉·配第(1623—1687)的《政治算 术》(1690)一书。 3、统计学是一门搜集、整理、显示和分析统计数据的科学,其目的 是探索数据内在的数量规律性。 4、统计工作全过程一般可以划分为四个环节: 统计设计、统计调查、统计整理、统计分析 5.统计的基本方法 大量观察法、综合分析法(整理、分析)、归纳推断法(分析) 6、统计学与其他学科的关系 (一)统计学与数学的关系 区别:首先,数学研究抽象的数,统计学则研究具体事物的数量; 其次,数学使用纯粹的演绎方法,而统计学则使用演绎与归纳相结合的逻辑方法。

(二)统计学与其他学科的关系 凡涉及处理实质性数据的学科都要以统计方法为工具。可以说,统计学是其他学科的工具。 第二章调查与整理 1、目前,数据的计量尺度由粗略(低级)到精确(高级)分为四个层次,即列名尺度、顺序尺度、定距尺度和定比尺度。 1.列名尺度:按照事物的某种属性对其进行平行的分类。例如,人按性别分为男、女,……。该尺度的数据不能比较大小、优 劣。 2.顺序尺度:对事物之间等级差或顺序差别的一种测度。例如,考试成绩可分为优、良、中、……。该尺度的数据能比较优劣,不能进行数学运算。 3.定距尺度:对事物之间等级差或顺序差别较精确地定量测度。 如考试成绩的95 分、86 分、……;天气温度的50C、00C、-50C、……。该尺度的“0”表示一个水平。该尺度的数据能 进行加、减运算。 4.定比尺度:用来表明数值中存在绝对零点状况下数量特征的描述尺度。例如,企业利润、产品数量等。该尺度的“0”表示“没有”或“不存在”。该尺度的数据能进行加、减、乘、除运算。 2、数据的类型 1.定性数据。也称品质数据,由列名尺度或顺序尺度计量形成,说明事物品质特征,通常用文字描述。

统计学(计算题部分)

统计学原理期末复习(计算题) 1 ?某单位40名职工业务考核成绩分别为: 68 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60—70分为及格,70—80分为中,80—90 分为良,90—100分为优。 要求: (1)将参加考试的职工按考核成绩分组并编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)根据整理表计算职工业务考核平均成绩; (4)分析本单位职工业务考核情况。 解:(1 ) (2)分组标志为"成绩",其类型为"数量标志”;分组方法为:变量分组中的开放组距式分组,组限表示方法是重叠组限; (3)平均成绩: - xf 3080 x 77 f 40(分) (4)本单位的职工考核成绩的分布呈两头小,中间大的”正态分布”的形态,平均成绩为 77分,说明大多数职工对业务知识的掌握达到了该单位的要求。 2 ?某车间有甲、乙两个生产组,甲组平均每个工人的日产量为36件, 标准差为件;乙组工人日产量资料如下: 要求:⑴计算乙组平均每个工人的日产量和标准差; ⑵比较甲、乙两生产小组哪个组的日产量更有代表性 解: (1 )

丄15 15 25 3835 34 45 1329.5。(件) X

上限=x 77 3.34 80.3(分) (2)利用标准差系数进行判断: V 甲 9.6 X 36 0.267 V 乙 8.986 0.305 X 29.5 因为 > 故甲组工人的平均日产量更有代表性。 3?采用简单随机重复抽样的方法,在 2000件产品中抽查200件,其中合格品190件. 要求:(1)计算合格品率及其抽样平均误差 (2) 以%的概率保证程度(t=2)对合格品率和合格品数量进行区间估计。 (3) 如果极限误差为%,则其概率保证程度是多少 解:(1)样本合格率 p = n1/ n = 190/200 = 95% 抽样平均误差: (2)抽样极限误差△ p= tp = 2X % = % 下限:X △ p=95%% = % 上限:x △ p=95%+% = % 贝总体合格品率区间:(% %) 总体合格品数量区间( %x 2000=1838件 %X 2000=1962件) (3)当极限误差为%时,则概率保证程度为 % (t=A/^ ) 4 ?某单位按简单随机重复抽样方式抽取 40名职工,对其业务情况进行考核, 考核成绩 平均分数77分,标准差为10。54分,以%的概率保证程度推断全体职工业务考试成绩的区 间范围。 解: 计算抽样平均误差: 计算抽样极限误差: 2 1.67 3.34 全体职工考试成绩区间范围是: 下限=X x 77 3.34 73.66(分) 8.986 (件) P ) ■- n 10.54 40 1.67 X )2 f p

统计学复习笔记

统计学复习笔记 第七章 一、 思考题 1. 解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2. 简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3. 怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4. 解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。 5. 简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=

统计学期末考试试题整理

2009---2010学年第2学期 统计学原理 课程考核试卷(B ) 一、填空题(每空1分,共15分) 1、观测数据、实验数据 2、自填式、面访式和电话式 3、1153.3、1020 4、2 a b +、2 ()12b a - 5、-56、0、1 7、F 8、有效性、一致性 1、按照统计数据的收集方法,可以将其分为 和 。 2、收集数据的基本方法是 、 和 。 3、在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据:1080,750,780,1080,850,960,2000,1250,1630(单位:元),则人均月收入的平均数是 , 中位数是 。 4(a,b)内取值,且X 服从均匀分布,其概率密度函数为0()1f x b a ??=??-? 则X ,方差为 。 5、设随机变量X 、Y 的数学期望分别为E(X)=2,E(Y)=3,求E(2X-3Y)= 。 6、概率是___ 到_____ 之间的一个数,用来描述一个事件发生的经常性。 7、对回归方程线性关系的检验,通常采用的是 检验。 8、在参数估计时,评价估计量的主要有三个指标是无偏性、 和 。 五、计算题(第1题7分、第2题8分,第3题8分,第4题12分,第5题15分,总共50分) 1、设X~N (9,4),试描述10X 的抽样分布。(7分) 1、解:2 ~(9,2)X N ,根据数学期望的性质10X 也服从正态分布, 由于 E (10X )=10E (X )=90 D (10X )=100D (X )=100×4=400 所以 10~(90,400X N 2、某城市想要估计下岗职工中女性所占的比例,采取重复抽样方法随机抽取了100名下岗职工,其中65人为女性。试以95%的置信水平估计该城市下岗职工中女性所占比例的置信区间。(2 1.96z α=)(8分) 2、解:已知100n =,2 1.96z α=,6565%100 p == 根据公式得:

统计学计算题汇总

第二章 六、计算题. 1.下面是某公司工人月收入水平分组情况和各组工人数情况: 月收入(元)工人数(人) 400-500 20 500-600 30 600-700 50 700-800 10 800-900 10 指出这是什么组距数列,并计算各组的组中值和频率分布状况。 答:闭口等距组距数列,属于连续变量数列,组限重叠。各组组中值及频率分布如下: 2.抽样调查某省20户城镇居民平均每人全年可支配收入(单位:百元)如下: 88 77 66 85 74 92 67 84 77 94 58 60 74 64 75 66 78 55 70 66 ⑴根据上述资料进行分组整理并编制频数分布数列 ⑵编制向上和向下累计频数、频率数列 答:⑴⑵ 某省20户城镇居民平均每人全年可支配收入分布表

第三章 六、计算题. ⒈某企业生产情况如下: 要求:⑴填满表内空格. ⑵对比全厂两年总产值计划完成程度的好坏。 解:⑴某企业生产情况如下:单位:(万元) ⑵该企业2005年的计划完成程度相对数为110.90%,而2006年只有102.22%,所以2005年完成任务程度比2006好。 ⒉某工厂2006年计划工业总产值为1080万吨,实际完成计划的110%,2006年计划总产值比2005年增长8%,试计算2006年实际总产值为2005年的百分比? 解:118.8% 3.某种工业产品单位成本,本期计划比上期下降5%,实际下降了9%,问该种产品成本

计划执行结果? 解:95.79% 4.我国“十五”计划中规定,到“十五”计划的最后一年,钢产量规定为7200万吨,假设“八五”期最后两年钢产量情况如下:(万吨) 根据上表资料计算: ⑴钢产量“十五”计划完成程度; ⑵钢产量“十五”计划提前完成的时间是多少? 解:⑴102.08%;⑵提前三个月 5.某城市2005年末和2006年末人口数和商业网点的有关资料如下: 计算:⑴平均每个商业网点服务人数; ⑵平均每个商业职工服务人数; ⑶指出是什么相对指标。 解: 某城市商业情况 ⑶上述两个指标是强度相对指标。 6.某市电子工业公司所属三个企业的有关资料如下:

基础统计学笔记统计学基础笔记整理

基础统计学笔记统计学基础笔记整理 一、统计学概论: 分理论统计和应用统计: 应用统计分为描述统计学和推断统计学。 描述统计为一组数据的中(位置:均值、中位数)、散(极差、方差、标准差)、形|(偏度)描述。 推断统计分为参数估计和假设检验。技能: 1、经验——数据收集加工——画成图形——数理(规律) (数据不等于数字) PPT 原则:用图不用表、用表不用栏、用栏不用字实际问题: 5M1E ——组成过程——产品(结果)——属性(包括:几何(形位方尺)、物理、生化、人文)——集合统计问题:

——(构成)总体——样本——数据——类型:分计数型(离散性)和计量型(连续性),即概率分布为计量型分布和技术型分布)——规律分描述和推断。 1、总体与样本中间有一种学问:抽样:验收抽样、统计抽样样本量 2、样本和数据中间有一门测量技术:MSA 3、分布规律 总体参数:平均值() 标准差() 总位数() 比例(p ) 样本统计量的特点:随机变化,不要轻易用样本下结论。拉丁字母在数学上用于总体参数阿拉伯字母表示样本统计量希腊字母表 示计算 总体参数统计分参数统计和非参数统计。推断统计分 估计:总体总体某参数,用对应的样本统计量去猜测。检验:假设总体某参数已知,用对应的样本统计量去验证。 二:统计数据收集与: 1、数据不等于数字

2、数据的两种类型: 描述性分类——响应变量(因变量)和预报因子(独立变量)如性别叫因子,男女叫水平。 四种尺度:定类、定序、定距、定比 3.数据管理的7个层次:无假不乱浅深系 4.软件每一列表示一个变量,每一行表示一个样本鱼骨图只适用于一个为什么, 变量程序图IPO 适用于多个为什么。 I (变量) P O 水质烧开水色香味器皿材质火燃料风压强 目的要抓住关键的变量。 2、统计数据的表现形式:绝对数——时期数和时点数相对数——比例:部分比总体比率:部分比部分 统计的数据:直接和间接。

统计学期末复习重点

统计总体:统计总体是根据一定目的确定的所要研究事物的全体,它是客观存在,并在某一相同性质基础上结合起来的由许多个别事物组成的整体,简称总体。 样本:是指在全及总体中按随机原则抽取的那部分单位所构成的集合体。 算术平均数:算术平均数是统计中最基本、最常用的一种平均数,它的基本计算形式是用总体的单位总数去除总体的标志总量。 调和平均数:是根据变量值的倒数计算的,是变量值倒数的算术平均数的倒数,也叫倒数平均数。 简单分组:是指对所研究的总体按一个标志进行分组。 复合分组:复合分组是指对所研究的总体按两个或两个以上的标志进行的多层次分组。 结构相对指标:结构相对指标是表明总体内部的各个组成部分在总体中所占比重的相对指标,也叫比重指标。 强度相对指标:是指两个性质不同,但有一定联系的总量指标数值之比。 类型抽样:又称分类抽样或分层抽样,它是先将总体按某个主要标志进行分组(或分类),再按随机原则从各组(类)中抽取样本单位的一种抽样方式。 机械抽样:它是将总体各单位按某一标志顺序排列,然后按固定顺序和相等距离或间隔抽取样本单位的抽样组织方式。 综合指数:凡是一个总量指标可以分解为两个或两个以上的因素指标时,为观察某个因素指标的变动情况,将其他因素指标固定下来计算出的指数称为综合指数。 平均指数:平均指数法是以个体指数为基础来计算总指数,根据选用的权数不同,平均指数法可以进一步分为加权算术平均法,加权调和平均法,固定权数加权平均法。 相关关系:是指现象之间客观存在的,在数量变化上受随机因素的影响,非确定性的相互依存关系。 回归分析:现象之间的相关关系,虽然不是严格的函数关系,但现象之间的一般关系值,可以通过函数关系的近似表达式来反映,这种表达式根据相关现象的实际对应资料,运用数学的方法来建立,这类数学方法称为回归分析。 统计调查:就是根据统计研究的目的、要求和任务,运用各种科学的调查方法,有计划、有组织的搜集有关现象的各个单位的资料,对客观事实进行登记,取得真实可靠的调查资料的活动过程。 统计指数:广义指数泛指社会经济现象数量变动的比较指标,及用来表明同类现象在不同空间、不同时间,实际与计划对比变动情况的相对数。狭义指数仅指反应不能直接想家的复杂社会经济现象在数量上综合变动情况的相对数。 简单随机抽样:简单随机抽样也叫纯随机抽样,它对总体单位不做任何分类排队,而是直接从总体中随机抽取一部分单位来组成样本的抽样组织方式。 季节分析的含义:是指某些现象由于自然因素和社会条件的影响在一年之内比较有规律的变动。 总量指标:是指反映一定时间、地点和条件下某种现象总体规模或水平的统计指标。 相对指标:是指说明现象之间数量对比关系的指标,用两个或两个以上有联系的指标数值对比来求得,其结果表现为相对数,故也将相对指标称为相对数。 平均指标:是同类社会经济现象总体内,各单位某一数量标志在一定时间、地点和条件下,数量差异抽象化的代表性水平指标,其数值表现为平均数。 1计算运用总量指标的原则。 (1)在计算实物指标时,应注意现象的同类性 (2)统计总量指标时要有明确的统计含义和合理的统计方法

统计学整理

总体:根据研究目的所确定的同质的观察单位的全体。具体到特征指标。 样本:从总体中随机抽取有代表性的一部分。抽样:从总体中抽取样本的过程(动 样本容量:指一个样本的必要抽样单位数目 同质:同一总体内,性质相同或相似。变异:同质观察单位之间的差异。 异质:不同总体间的差异。 定性变量:按某种属性,清点每一类的个数。分类变量:变量的取值无具体意义。 有序变量或等级变量:变量的取值表示各类别之间的等级(大小)关系; 定量变量:说明数量大小,记录指标值本身,一般有度量衡单位。 离散型变量:变量的取值只能为整数;连续型:变量取值可为实数轴上任何数值 参数:描述总体特征的统计指标; 统计量:描述样本特征的统计指标。 统计工作的步骤:①设计②收集③整理④统计分析 统计描述:统计表;统计图;统计指标。 统计推断:参数估计(点估计,区间估计)、假设检验。 1、描述定量资料的统计表与统计图(统计表同下) 直方图:①在频率表的基础上,绘制频率直方图。 ②图的标题位于图的下端居中;文字等要求同频率分布表。 ③纵轴为频率(%),横轴为组段值。要在横纵轴的端点处或轴的中 部写标目和单位。 ④矩形直条的起点无须从原点开始。 ⑤横纵轴长度适中,横七直五。 2、描述定量资料集中趋势的统计指标有哪些?各自的定义、计算及适用条件; a) 算术均数。样本均数记为 ,总体均数记为 。 直接法: 间接法(加权法)——针对频率表: 适用于正态资料。 b) 几何均数 直接法: 间接法(加权法)——针对频率表: 适用于呈倍数关系的资料。即成指数关系的数据资料。 c) 中位数。将原始观察值排序后(从小到大或从大到小均可),位次居中的 那个数。 直接法 间接法(百分位数percentile 法): 普适。偏峰分布资料有极值,或分布末端缺失。 X μn X n X X X X n i i n ∑==+++=1 21Λ∑∑∑=====K i i K i i i K i i i f f X n f X X 1 1 010n n X X X G Λ21=]log [log 1n X G ∑-=]*log [log ]*log [log 11n f X f f X G ∑∑∑ --==?????+=++.),(21.,*12*2*21为偶数为奇数n X X n X M n n n )%(L x f x n f i L P -?+=

应用统计分析复习笔记

应用统计分析复习笔记 BY 东海 2009年12月1日星期二 第一章 导论 1、统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。内容:收集数据(取得数据);处理数据(整理与图表展示);分析数据(利用统计方法分析数据);数据解释(结果的说明);得到结论(从数据分析中得出客观结论)。 2、统计研究的循环过程:实际问题—收集数据—处理数据—分析数据—数据解释—实际问题。 4、描述统计:研究数据收集、整理和描述的统计学分支。内容:收集数据;整理数据;展示数据;描述性分析。目的:描述数据特征;找出数据的基本规律。 5、推断统计:研究如何利用样本数据来推断总体特征的统计学分支。内容:参数估计;假设检验。目的:对总体特征做出推断。 6、描述统计与推断统计的关系: 7、统计数据的类型 (1)按计量层次:分类数据、顺序数据、数值型数据(2)按收集方法:观测数据和实验数据(3)按时间状况:截面数据和时间序列数据 8、总体:所研究的全部个体(数据) 的集合,其中的每一个个体也称为元素。分为有限总体和无限总体。 样本:从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量或样本量。 9、参数:描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。所关心的参数主要有总体均值(μ )、标准差(σ)、总体比例(π)等。总体参数通常用希腊字母表示。 10、统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数。所关心的样本统计量有样本均值(x )、样本标准差(s)、样本比例(p)等。样本统计量通常用小写英文字母来表示。 变量:说明现象某种特征的概念,如商品销售额、受教育程度、产品的质量等级等。变量的具体表现称为变量值,即数据变量可以分为:(1)分类变量(说明事物类别的名称)、顺序变量(说明事物有序类别的名称)和数值型变量(说明事物数字特征的名称)。其中数值型变量又分离散变量(取有限个值)和连续变量(可以取无穷多个值)。(2)经验变量(所描述的是我们周围可以观察到的事物)和理论变量(由统计学家用数学方法所构造出来的一些变量,比如,z 统计量、t 统计量、χ2统计量、F 统计量等)。(3)随机变量和非随机变量。 11、随机现象的一个特点是:不确定性。随机现象也存在其固有的量的规律性,人们把这一规律性称为随机现象的统计规律性。 对随机现象的观察称为随机试验,并简称试验,用以研究随机现象的统计规律性。随机试验的特点:可重复性、可观察性和随机性。统计中的抽样过程其实就是一次随机试验。因而可以利用概率论的技巧来分析推断统计方法。而样本其实就是随机变量。 12、常见分布:二项分布、几何分布、指数分布、正态分布。 13、统计学中泛称统计量(或枢轴量)的分布为抽样分布。讨论抽样分布的途经有两种:1)精确地求出抽样分布,并称相应地统计推断为小样本统计推断;2) 让样本容量趋于无穷,并求出抽样分布的极限分布。以极限分布作为抽样分 统计方法 描述统计 推断统计 参数估计 假设检验 点估计 区间估计

统计学知识点梳理

复习提纲:(计算部分全用红色标注了!其他红色的是我的推断,可能出什么题型;有下划线的重点记忆!当然整理的知识点都是重点!都要背和理解!Fighting!) 第一章绪论 一.统计的含义 即统计工作、统计资料和统计学 统计工作:统计实践活动,搜集,整理,分析和提供关于社会现象数字资料工作总称 统计资料:统计实践活动过程中所取得的各项资料,包括原始资料和加工整理资料 统计学:关于认识客观现象总体数量特征和数量关系的科学 二.统计工作过程 就一次统计活动来讲,一个完整的认识过程一般可以分为统计调查、统计整理和统计分析三个阶段。

统计调查:第一阶段,是认识客观经济现象的起点,是统计整理和统计分析的基础。 统计整理:第二阶段,处于统计工作的中间环节,起着承前启后的作用。 统计分析:第三阶段,通过第三阶段,事物由感性认识上升到理性认识。 三.总体与总体单位(会辨析总体与总体单位即可) 总体,亦称统计总体,是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体;构成总体的这些个别单位称为总体单位。 总体由总体单位构成,要认识总体必须从总体单位开始,总体是统计认识的对象。 例如:所有的工业企业就是一个总体,其中的每一个工业企业就是一个总体单位。 四.标志和指标 标志是用来说明总体单位特征的名称。 指标,亦称统计指标,是说明总体的综合数量特征的。一个完整的统计指标包括数量指标名称和指标数值两部分。(以上内容理解即可) 1.指标和标志的区别和联系(简答) 指标与标志的区别:(1)指标是说明总体特征的,而标志是说明总体单位特征的;(2)指标都能用数值表示,而标志中的品质标志不能用数值表示,是用属性表示的;(3)指标数值是经过一定的汇总取得的,而标志中的数量标志不一定经过汇总,可直接取得;(4)一个完整的统计指标,一定要讲时间、地点、范围,而标志一般不具备时间、地点等条件。 指标与标志的联系:(1)有许多统计指标的数值是从总体单位的数量标志值汇总而来的;(2)两者存在着一定的变换关系,即由于研究目的不同,原来的统计总体如果变成总体单位了,则相应的统计指标也就变成数量标志了。 2.标志与标志值(会区分) 标志分为品质标志和数量标志,数量标志用来说明总体单位量的特征,可以用数值表示,即为标志值(如:年龄、工资额、身高) 3.变异与变量(会什么是变异,什么是变量) 变异:品质标志在总体单位之间的不同具体表现。如:性别表现为男、女,民族表现为汉、满、蒙等。 变量:数量标志抽象化即为变量,而数量标志的不同具体表现则称为变量值(或标志值)。如:某职工的年龄是42岁,月工资2200元。 4.统计指标的划分 (1)统计指标按其所反映的总体内容的不同,可分为数量指标和质量指标。数量指标指说明总体规模和水平的各种总量指标。质量指标指反应现象总体的社会经济效益和工作质量的各种相对指标和平均指标。 (2)统计指标按其作用和表现形式的不同,有总量指标(绝对数)、相对指标(绝对数)、平均指标(平均数)三种。 第二章统计调查与整理 一.统计调查的含义 统计调查是统计工作过程的第一阶段。它是按照统计任务的要求,运用科学的调查方法,有组织的向社会实际搜索各项原始资料的过程。统计调查是整个统计认识活动的基础,决定着统计认识过程及其结果的成败。 二.统计调查方案设计的内容+调查对象、调查单位的含义 ⒈确定调查目的;(为什么调查) 根据实际需要和可能确定

统计学整理笔记

例1:某企业计划规定劳动生产率比上年提高10%,实际提高15%。试计算劳动生产率计划完成百分数。 例2:某企业计划规定某产品单位成本降低5%,实际降低7%,试计算成本计划完成指标。 答案: 答案: 答案: 起重量(吨)X台数f起重总量(吨)xf 40140 25250 10330 5420 合计10140 起重量(吨)起重机台数构成(%)(吨) 40104 25205 10303 5402 合计10014 技术级别月工资(元)工资总额(元) 1146730 21522280 31601880 41701700 5185370 合计——7960

答案: 答案: 某地区国内生产总值的资料 单位:亿元 答案: 某企业2014年第三季度职工人数:6月30日435人,7月31日452人,8月31日462人,9月30日576人,要求计算第三季度平均职工人数. 答案如右图 计划完成程度(%) 组中值(%) 企业数 实际完成数(万元) 计划任务数(万元) 90—100 95 5 95 100 100—110 105 8 840 800 110—120 115 2 115 100 合计 — 15 1050 1000 日产量 (公斤) 工人数(人)f 组中值 (公斤)x xf 20—30 10 25 250 30—40 70 35 2450 40—50 90 45 4050 50—60 30 55 1650 合计 200 — 8400 2009年 2010年 2011年 2012年 2013年 2014年 . 57733

某工厂成品仓库中某产品在2009年库存量如下: 单位:台 答案 如右图: 某厂某年一月份的产品库存变动记录资料如下: 单位:台 答案 如右图: 某企业2014年计划产值和产值计划完成程度的资料如下表,试计算该企业年产值计划平均完成程度指标。 答案 如右图 我国1985—1990年社会劳动者(年底数)人数如下表,试计算“七五”时期第三产业人数在全部社会劳动者人数中的平均比重。 单位:万 年份 1985 1986 1987 1988 1989 1990 社会劳动者人数b 49873 51282 52783 54334 55329 56740 第三产业人数a 8350 8819 9407 9949 10147 10533 第三产业人数的比重(%)c 答案: 日期 库存量 38 42 24 11 60 0 日期 1日 4日 9日 15日 19日 26日 31日 库存量 38 42 39 23 2 16 0 季度 1 2 3 4 计划产值(万元)b 860 887 875 898 计划完成(%)c 130 135 138 125

统计学_第三章_统计整理

第三章统计整理 (一)填空题 1、统计整理是统计工作的第三阶段。在这一阶段,通过对原始资料进行科学的加工,可以得出反映事物总体特征的资料。 2、统计整理在统计分析中起着承前启后的作用,它既是统计调查的必然继续,又是统计分析的基础和前提条件。 3、统计分组实质上是在统计总体内部进行的一种定性分类。 4、对原始资料审核的重点是真实性。 5、区分现象质的差别是统计分组的根本作用。 6、标志是统计分组的依据,是划分组别的标准。 7、根据分组标志的特征不同,统计总体可以按品质分组,也可以按数量分组。 8、对所研究的总体按两个或两个以上的标志结合进行的分组,称为复合分组。 9、次数分布数列根据分组标志特征的不同,可以分为品质分布数列和数量分布数列两种。 10、变量数列是单项变量分组、组距式分组所形成的次数分布数列。 11、按品质标志分组的结果,形成品质分布数列。 12、组限是组距变量数列中表示各组数量界限的变量值,其中下限是指最小值的变量值,上限是指最大值的变量值。 13、组距变量数列的组距大小与组数的多少成反比。与全距的大小成正比。 14、组距变量数列的分布可以用次数分布曲线图表示。 15、划分连续变量的组限时,相邻组的组限必须重叠;划分离散型变量的组限时,相邻组的组限可以重叠,也可以不重叠。 16、统计资料的整理方法主要有统计分组和统计汇总两种。 17、钟形分布、U形分布和J形分布是次数分布的三种主要类型。 18、统计分组体系有品质标志分组和数量标志分组两种。 19、统计表按主词是否分组和分组的程度可分为简单表、简单分组表和复合分组表三种。 20、统计表从内容结构上看,是由主词和宾词两部分构成。 (二)单项选择题(在每小题备选答案中,选出一个正确答案) 1、统计分组的结果表现为( A ) A. 组内同质性,组间差异性 B. 组内差异性,组间同质性 C. 组内同质性,组间同质性 D. 组内差异性,组间差异性 2、统计分组的依据是( A ) A、标志 B、指标 C、标志值 D、变量值 3、下面属于按品质标志分组的有( C ) A. 企业按职工人数分组 B. 企业按工业总产值分组 C. 企业按经济类型分组 D. 企业按资金占用额分组 4、统计分组的关键在于( A ) A、正确选择分组标志 B、正确划分各组界限 C、正确确定组数和组限 D、正确选择分布数列种类 5、下面属于按数量标志分组的有( B ) A. 工人按政治面貌分组 B. 工人按年龄分组 C. 工人按工种分组 D. 工人按民族分组

统计学期末复习重点

1.统计主体:是统计所要研究对象的全体,是由客观存在的、具有某种共同性质的许多个别事物构成的整体 总体单位:构成总体的每一个个别事物 总体容量:总体中总体单位的数量 (定义及相关联系) 2.标志:总体各单位所共同具有的属性或特征 标志表现:总体单位个标志的具体体现 及其分类 (品质,数量; 可变性) 可变标志可以视为变量 (定义及其相关关系 3.指标:概念:统计活动按照一定的统计方法,对总体单位数、总体各单位的标志表现进行记录、核算、汇总、综合而形成的,用于反映统计总体某一综合数量特征的科学范畴 、特征:数量性,综合性,具体性 六要素:指标概念,指标数值,计算方法,计算单位,时间规定性,空间规定性 分类(质量(相对数)、数量(绝对数) 、时期、时点:) 4.指标、标志的区别联系:统计指标说明的是总体数量特征,而标志是说明总体单位特征的名称;指标都可以用数值表示,而标志有不能用数值表示的品质标志和能用数值表示的数量标志;统计指标是对总体单位数、总体单位标志表现经过一定处理后得到的 5.描述性统计:是研究如何取得反映客观现象的数据,并将收集的数据进行加工处理,通过表格、图形或数值形式显示,进而通过综合、概括与分析得出反映客观现象总体的数量特征、数量关系和数量规律 推断统计:是主要研究如何根据样本数据来推断总体的数量特征。主要包括参数估计的方法、假设检验的方法、方差分析的方法、相关与回归分析的方法等(了解) 第二章 1.数据的测量值 (将尽量尺度从低级到高级、由粗略到精确分为定类,定序,定距,定比) 2.统计调查方式 (报表:全面调查、全面报表、定期 普查:普查是为了某种特定目的而专门组织的一次性的全面调查 特点:一次性或周期性;需要规定统一的标准调查时间;数据比较准确;范围比较狭窄 、抽样:是对样本单位进行调查的一种专门组织的非全面调查。有随机抽样和非随机抽样两种 随机抽样:按随机原则从统计总体中抽取部分的单位进行实际调查,并根据样本信息对总体数量特征做出具有一定可靠程度的判断 重点调查:是了解基本情况的非全面调查 典型调查:是根据调查目的和要求,有意识地选择有代表性的单位,进行深入调查的方法)(基本概念,特点) 3.抽样调查:(调查对象:

统计学原理读书笔记

统计学原理读书笔记 1、统计工作是指对社会经济现象数量方面进行搜集、整理和分析工作的总称,它是一种社会调查研究活动。统计资料也即统计信息,是统计部门或单位进行工作所搜集、整理、编制的各种统计数据资料的总称,它是进行国民经济宏观调控的决策依据,是社会公众了解国情、国力和社会经济发展状况的信息主题。统计学是关于统计过程的理论和方法的科学。 2、统计学在研究社会经济现象时,首先从定性研究开始,即在搜集原始统计资料(统计调查)之前,就要根据所要研究对象的性质和研究任务、目的,确定调查对象的范围,规定分析这个对象的统计指标、指标体系和分组方法。——定性工作,为定量分析做准备。在定量分析基础上再达到认识社会经济现象的本质、特征或规律。 3、质——量——质 4、统计学特点: ①数量性(用大量数字资料说明事物的规模、水平、结构、比例关系、差别程度、普遍程度、发展速度、平均规模和水平、平均发展速度等) ②总体性(针对总体,研究过程是从个体到总体,即必须对足够大量的个体进行登记、整理和综合,是它过度到总体的数量方面,从而把握社会经济现象的总规模、总水平及其变化与发展的总趋势。 ③具体性(一定的质规定一定的量,一定的量表现一定的质。) ④社会性 5、统计工作的基本任务 ①全面、准确、及时地提供有关社会经济发展情况的资料为决策管理服务。 会议记录 买单率X 客单价 ‖‖ 商圈人流X20%=进店客流X(买单人数/进店客流数)X(营收/买单人数)=营收 进店客流少——行销品牌问题 买单率低——产品组合问题 客单价高——商圈和选址问题 选址在远离市区,开大商场,要求开车来,这样买单率和客单价会高,件单价会低,一买一车。选址在市内,开便利店,要求件单价高,客单价低,客流大。 人口变项——目的是做市调 人口结构——消费结构。 人口 品 项

统计学期末复习重点分析

统计学期末复习重点 一、选择、填空、判断题型: 1、统计一词通常有三种含义:即统计工作、统计资料、统计学。 2、统计学的特点:数量性、总体性、具体性。 3、就一次统计活动来讲,一个完整的认识过程一般可分为统计调查、统计整理 和统计分析三个阶段。 4、标志可分为品质标志和数量标志。 5、统计调查是统计工作中的基础环节。 6、统计调查工作要力求达到准确性和及时性这两个基本要求。 7、统计调查按调查对象所包括范围不同,可分为全面调查和非全面调查。 8、统计调查的组织形式分为统计报表制度和专门调查。 9、统计调查按登记事物的连续性不同,分为经常调查和一时调查。 10、统计整理的关键是统计分组,统计分组的工作是正确的选择分组标志。 11、统计分组的三方面作用是分别从类型分组、结构分组和分析分组角度来 说明的。 12、根据分组标志的不同,分配数列可分为两种:品质分配数列(简称品质 数列);变量分配数列(简称变量数列)。品质数列由各组名称和次数组成。 变量数列也是由各组名称(由变量值表示)和次数(或频率)组成。 13、组距数列根据组距是否相等,分为等距数列和异距数列两种。 14、次数分布有三种主要类型:钟型分布、U型分布,J型分布。 15、总量指标按其反映的内容不同,分为总体单位总量和总体标志总量。 16、总量指标按其反映时间状况不同,分为时期指标和时点指标。 17、根据客观现象的性质不同,5年计划指标数值的规定有水平法和累计法。 18、注意两个对比指标的可比性 19、平均指标能反映总体变量值的集中趋势。 20、动态数列由两个基本要素构成:一个是资料所属的时间;另一个是各时间上的统计指标数值,习惯上称之为动态数列中的发展水平。 21、如果掌握的权数资料是基本公式的母项数值,则采用算术平均数形式;如果掌握的权数资料是基本公式的子项数值,则采用调和平均数形式。 22、动态数列按统计指标的性质不同,可以分为绝对数动态数列、相对数动态数列、平均数动态数列三种。 23、保证数列中各个指标之间的可比性,就成为编制动态数列应遵守的基本原则。 24、动态数列影响因素按其性质和作用大致归为:长期趋势(T)、季节变动(S

相关文档
最新文档