贾俊平统计学知识点
贾俊平统计学知识点

统计学知识点导论部分描述统计及推断统计概念比较,举例说明。
统计数据的类型:有三种分类方式,重点关注(分类数据、顺序数据、数值型数据)这三种的概念和特点。
几个基本概念:总体和样本、参数和统计量、变量(分类变量、顺序变量、数值型变量)概念及举例明。
数据搜集部分数据的间接来源:二手数据的特点数据的直接来源:调查数据和实验数据(实验数据相关知识参见风笑天笔记)调查数据:概率抽样和非概率抽样的比较。
简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样、方便抽样、判断抽烟、滚雪球抽样、配额抽样的概念、优缺点及抽样过程的简单描述。
搜集数据的基本方法:自填式、面谈时、电话式优缺点。
数据误差:抽样误差和非抽样误差(系统误差和随机误差)。
抽样框误差、回答误差、无回答误差、测量误差概念。
误差的控制方法。
数据的概括性度量集中趋势:众数、中位数、平均数概念、计算方法、分布上的关系、各自特点和应用场合。
离散趋势:异众比率、四分位差、方差和标准差、离散系数的概念、计算、特点等。
偏态和峰态的概念。
概率部分(全部是概念)随机事件及其概率:随机事件、必然事件、不可能事件、基本事件、独立事件和条件概率。
离散型随机变量及其分布:随机变量及其分类、泊松分布。
连续型随机变量及其分布:概率密度、正态分布的曲线及其性质统计量和抽样分布部分(参数估计的基础)常用统计量抽样分布的概念正态分布及由正态分布导出的几个分布及其特点(正态、卡方、t、F)。
另外标准正态分布和正态分布的概念特点,条件分布的概念。
中心极限定理样本均值的分布、样本比例的分布、样本均值之差的分布、样本方差的分布从下面开始就要做题了,每章的例题都要做三遍,课后习题有选择的做一些。
参数估计部分参数估计、点估计、区间估计的概念及基本原理、置信区间的概念及解释、评价估计量的标准。
一个总体参数的估计(均值、比例、方差),两个总体参数的区间估计(均值之差、比例之差、方差之比)、样本量的确定(估计均值时的、估计比例时的)假设检验部分建设检验、原假设、备择假设的概念、假设检验的基本流程和决策准则。
贾俊平《统计学》考研考点大全

目录第一章导论(2)第一节统计及其应用领域(2)第二节统计数据类型(4)第三节统计学的常用基本概念(4)第二章数据的搜集(6)第一节数据的来源(6)第二节调查数据(7)第三节数据的误差(10)第三章数据的图表展示(12)第一节数据的预处理(12)第二节品质数据的整理与展示(13)第三节数值型数据的整理与展示(18)第四节合理使用图表(24)第四章数据的概括性度量(26)第一节集中趋势的度量(26)第二节离散程度的度量(31)第三节偏态与峰态的度量(34)第五章概率与概率分布(36)第一节随机事件及概率(36)第二节概率的性质与运算法则(39)第三节离散型随机变量及其分布(44)第四节连续型随机变量的概率分布(49)第六章统计量及其抽样分布(54)第一节统计量(54)第二节由正态分布导出的几个重要分布(55)第三节样本均值的分布(58)第四节样本方差和样本比例的分布(61)第七章参数估计(62)第一节参数估计的基本原理(62)第二节一个总体参数的区间估计(66)第三节两个总体参数的区间估计(70)第四节样本量的确定(73)第八章假设检验(75)第一节假设检验的基本问题(75)第二节一个总体参数的检验(80)第三节两个总体参数的检验(85)第九章列联分析(91)第一节分类数据与列联表(91)第二节χ2检验(93)第三节列联表中的相关测量(95)第十章方差分析(99)第一节方差分析引论(99)第二节单因素方差分析(102)第三节双因素方差分析(110)第十一章一元线性回归(116)第一节变量间关系的度量(116)第二节一元线性回归(121)第三节利用回归方程进行预测(128)第四节残差分析(129)第十二章多元线性回归(132)第一节多元线性回归模型(132)第二节回归方程的拟合优度(133)第三节显着性检验(134)第四节多重共线性(136)第五节变量选择与逐步回归(138)第十三章时间序列分析和预测(140)第一节时间序列及其分解(140)第二节时间序列的描述性分析(142)第三节时间序列预测的程序(145)第四节平稳序列的预测(149)第五节趋势型序列的预测(154)第六节复合型序列的分解预测(162)第十四章指数(168)第一节基本问题(168)第二节总指数编制方法(169)第三节指数体系(174)第四节几种典型的指数(176)第五节综合评价指数(179)课程简介统计学是一门关于大量数据如何进行搜集、整理和分析的方法论科学,它是统计学专业的一门专业基础课程,也是经济学类和工商管理类各专业的一门核心课程,众多学科必备的考研专业课程,主要介绍如何运用统计方法对社会经济现象的总体特征和发展规律进行描述、分析,包括:统计指标、数字特征、动态分析、指数分析和简单的趋势模型及抽样推断、相关和回归分析等。
统计学复习概念重点贾俊平

1. 描述统计:研究数据收集处理汇总图表描述概括与分析等统计方法。
2. 推断统计:研究如何利用样本数据来推断总体特征的统计方法。
3. 分类数据:只能归于某一类别的非数字型数据。
4. 顺序数据:只能归于某一有序类别的非数字型数据。
5. 数值型数据:按数字尺度测量的观察值。
6. 观测数据:通过调查或观测而收集到的数据。
7. 实验数据:在实验中控制实验对象而收集到的数据。
8. 截面数据:在相同或近似相同的时间点上收集的数据。
9. 时间序列数据:在不同时间上收集到的数据,这类数据按时间顺序收集到的。
10. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,根据样本调查结果来推断总体特征的数据收集方法。
11. 普查:为特定目的而专门组织的全面调查。
12. 总体:包含所研究的全部个体(数据)的集合。
13. 样本:从总体中抽取的一部分元素的集合。
14. 样本容量:也称样本量,是构成样本的元素数目。
15. 参数:用来描述总体特征的概括性数字度量。
16. 统计量:用来描述样本特征的概括性数字度量。
17. 变量:说明现象某种特征的概念。
18. 分类变量:说明事物类别的一个名称。
19. 顺序变量:说明事物有序类别的一个名称。
20. 数值型变量:说明事物数字特征的一个名称。
21. 离散型变量:只能取可数值的变量。
23. 调查数据:通过调查方法获得的数据24. 实验数据:通过实验方法获得的数据25. 概率抽样:随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
26. 非概率抽样:不随机,根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
27. 简单随机抽样:从包括总体的N个单位的抽样框中随机,一个个抽取n个单位作为样本,每单位等概论。
28. 抽样框:用于抽选样本的总体单位信息,是概率抽样中所不可缺29. 分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同层中独立、随机地抽取样本。
统计学(贾俊平版)重点

统计学(贾俊平版)重点第一章统计:收集、处理、分析、解释数据并从数据中得出结论的科学。
数据1. 分类数据对事物进行分类的结果数据,表现为类别,用文字来表述.例如,人口按性别分为男、女两类2. 顺序数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等3. 数值型数据对事物的精确测度,结果表现为具体的数值.例如:身高为175cm ,168cm,183cm总体–所研究的全部元素的集合,其中的每一个元素称为个体–分为有限总体和无限总体.有限总体的范围能够明确确定,且元素的数目是有限的.无限总体所包括的元素是无限的,不可数的样本–从总体中抽取的一部分元素的集合–构成样本的元素数目称为样本容量参数:描述总体特征。
有总体均值( )、标准差(σ)总体比例(π)统计量:描述样本特征。
样本标准差(s),样本比例(p)变量:说明现象某种特征,分类,顺序,数值型:离散型,连续型。
经验,理论变量描述统计研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计是研究如何利用样本数据进行推断总体特征第二章间接数据(查询的)与直接数据:调查(通常是对社会现象而言的)普查信息全面完整。
再一个是实验。
概率抽样:也称随机抽样。
按一定的概率以随机原则抽取样本,抽取样本时使每个单位都有一定的机会被抽中–每个单位被抽中的概率是已知的,或是可以计算出来的–当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样:从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的分层抽样:优点:保证样本的结构与总体的结构比较相近将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,从而提高估计的精度–组织实施调查方便–既可以对总体参数进行估计,也可以对各层的目标量进行估计整群抽样:将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查优点:抽样时只需群的抽样框,可简化工作量–调查的地点相对集中,节省调查费用,方便调查的实施–缺点是统计的精度较差系统抽样:将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位–先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位操作简便,可提高估计的精度多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查–群是初级抽样单位,第二阶段抽取的是最终抽样单位。
统计学公式-贾俊平-精华版

()()()()()扁平尖峰分布;,3s *n 组数*X-分组峰态系数正值,右偏分布越大偏斜越大,,该组的中值;s *n 组数*X -SK 分组s*2-n 1-n X-n SK 未分组偏态系数04.%99/%95/%68个标准差3/2/1经验法则:.03,越大,离散系数越大X s小)离散系数(衡量差异大-离散程度标准差/数值型数据:方差顺序数据:四分位差总频数(众数频数)f -1V 分类数据:异众比率离散程度02.x几何平均X 加权平均数.01443333s mr n<>===±====∑∑∑∏∑∑ii i i iii M K SK M M X V G W X W PS :()0.3P x μ-≤=x P ⎛⎫≤≤ 双侧:H 0≠A无显著差异,同α/2比较 左单侧:希望数值越大越好H 0 μ ≥A右单侧:希望数值越小越好 H 0μ ≤A ;同α比较P 值检验方法,求出Z ,若x >μ,计算P (Z>Z 值)值 双侧:P<α/2 拒绝原假设单侧P<α 拒绝原假设 运用置信区上下限比较nZ σα2(边际误差)=∇(单侧为α)n总体标准差抽样标准误差=若∇>0-x μ,则拒绝H 若σ未知,用s 代替,使用t 分布()()遇小数点向前进一)()1(定估计比例时样本量的确.22(边际误差):定一个估计时样本量的确.211-n 自由度s )1n (s )1n (总体方差.13)1(总量)的区间估计(样本样本比率.12)1(方差未知,小样本,总体正态)2(置信区间为。
即,该样本平均或:未知/大样本且方差已知)1(计一个总体均值的区间估.1122222222222/12222/2222EP P Z n n Z E E Z n nP P Z P P nS n t X nSZ X -⋅=⎪⎪⎭⎫⎝⎛==-≤≤--±÷-±∂±-αααααααασσλλσλσ()()(),则不拒绝1-n 1-n 1总体方差的检验:.33)1(:总体比例检验统计量321自由度,/:未知小样本,,/已知小样本,,/或:大样本一个参数的假设检验.3122/222/1222ααλλλσλπππμσσμσσμ≤≤-=--=-=-=-=-=-S n nP Z n nS X t nX Z nS X Z()()()()()()()()()()()⎪⎪⎭⎫ ⎝⎛=≤≤-+-±--±±-⎪⎪⎭⎫ ⎝⎛+-⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛+=⎪⎪⎭⎫ ⎝⎛+±-≠≠⎪⎪⎭⎫ ⎝⎛+-+±-=≠-+-+-=⎪⎪⎭⎫ ⎝⎛+-+±-=+±-≥--212/212/12/1222122212/2221222111221d 2d22222212121222212122212122121212221212122121212122221122122122121222121212121n ,n 1n ,n s /s /s /s 两个总体方差比.13)1()1(:两个总体比例之差.12ns )1(d 小样本2ns d 大样本1的总平均数为每一组对应样本之差d 本)的估计,两个总体之差(匹配样).5(1s 1s s s v s s )v (,未知,正态,,小样本)4(s s )2(,未知,正态,,小样本)3(2s 1s 1s 11s )2(,未知正态,,小样本)2(s s 可以互换/未知/已知,),30,(大样本)1(:独立样本)的区间估计(两个总体均值之差.11ααααααααααασσσσσσσσσσσF F F F n p p n p p Z p pn t Z n n n n n n n n t X Xn n n n n n t X X n n n n n nn n n n t X Xn n Z X X S n n pp()()()()()()()()222121221122211121021212121222121212121212122121212221212121222112221222212221总体方差的相似性:.33)1()1(d)0(多设为d 、样本比例11)1(、:两个总体比率之差32)比较1n (t 同,n s ˆ匹配样本:计算)4(值自由度同左,s s X小样本,)3()2(自由度,11X小样本,)2(,XZ 大样本)1(两个参数的假设检验.31边际误差)1()1(p 5.0;21定估计比例时样本量的确.22n n :量的确定两个估计均值差时样本21ππππσμμσσμμσσσσμμσσαα=++=⎪⎪⎭⎫⎝⎛-+---==-⎪⎪⎭⎫⎝⎛+--==-=⎪⎪⎭⎫⎝⎛+---=≠-+⎪⎪⎭⎫⎝⎛+---==+---=-⋅-====+==S S F n n p n p n p n p p n p p p p Z B n n p p p p Z A V n n X t n n n n S X t n n X E Ep p p Z n p p n n EZ p连列分析连列表:条件频数/行百分数/列百分数/总百分数 期望值:行百分数x 条件总值方差分析:检验各个总体的均值是否相等,判断分类自变量对数值因变量的影响()()()()()()()()()()1-c ,1-r min *n 相关系数.5nc 列联相关系数.4越大,相关程度越大,cd ab排列:d b c a d c b a bc-ad n相关系数.3比较df 同)总数列总和行总和(依赖关系)独立性检验(是否存在.2,拒绝原假设df 比较,若df 同)1-)(列数1-(行数自由度:两数之间相关程度.1期望值频数)观察值频数(2222222222220λλλϕλϕλλλλλλααα=+=+++++==+=-=>=-=∑∑V CTRT f f f ff f ff f e e e ee e 1.单因素方差分析关系是比较每两组数据间的,拒绝,有显著差异-X ,k -n 自由度为11最小显著差异.3占总的自变量对因变量的影响,关系量强度.2,拒绝若,统计量.1k-n SSE组内均方_;1-k SSA 组间均方MSA 1-n 自由度;的误差)的平方的总和x :(每一个观测值与k-n 自由度的总和)的平方)的误差x 均值:(每组内频数与组平1-k 自由度和的误差)的平方))总x ((各组间平均值与*(组内频数:组的个数k 总数,n 个值,:其中第个条件;:第总平均数x 一个条件组的平均数;x ,组内误差,,组间误差总平方和(总误差)j i j i222LSD LSD X n n MSE t LSD R SSESSAR F F MSEMSAF MSE SST SSE SSA j j i i SSE SSA SST >⎪⎪⎭⎫⎝⎛+==>===αα2.双因素方差分析 A.独立双因素22i j 的影响占总的这两个自变量对因变量,关系量强度.2,拒绝,即差异显著若))1k )(1r (,1-r (~列因素显著性))1k )(1r (,1-k (~行因素显著性.1同理、,1)1k )(1r (;随机误差平方和)1-r ( df ,列因素误差和),1-k (df ,行因素误差和1-kr :df ,自由度总平方和(总误差)为总平均数x ;x ,每行平均i ,因素k 行数;x ,每列平均值j ,因素r 列数R SSTSSCSSR R F F F MSEMSCF F MSE MSRF MSE MSC K SSRMSR SSESSC SSR SST df SSE SSC SSR SST C R +=>--=--=-=++=--α B.交互作用双因素K,个行因素;m ,行因素数值的行数 R,个列因素;n ,观察值总数误差来源 平方和 自由度 均方 F 值行因素 SSR K-1 MSR MSR/MSE 列因素 SSC R-1 MSC MSC/MSE 交互左右 SSRC (K-1)(R-1) MSRC/MSE 误差 SSE KR(M-1) 总和 SST N-1()()()()()()()()y预测y ˆ,y ˆ-y 标准化残差y ˆ-y e 残差.56x x x x n1**)1(y y 时,得到的置信区间估计,取值y .55n1,t 回归系数1-k -n 自由度;自由度2-n ,1~线性关系线性关系显著性检验.54估计标准误差:越大拟合越好,拟合优度.53强度的线性关系r 拒绝,即存在,,t 若)2-n (~r-12-n rt2右偏分布r 较大,负值,左偏r 较大,正值,总体相关系数1的显著性检验,r ,无关0负线性相关;,0,正线性相关;0度,两个关系间的关系强r 相关系数.52,:和截距估计的回归方程的斜率:程估计的简单线性回归方一元线性回归模型.5100ei 002i20200022ˆˆ222122ee I I ee iiii i S Z S n t X X X S S S AB SSE K SSR F MSEMSRF MSES SSTSSRR t t xb y A n xx n y x y x B Bx A y ==--+-±-=-====>==<>-=--=+=∑∑∑∑∑∑∑∑αββααρ()),拒绝,即存在1-k -n (若均数,各个自变量之间相关系多重共线性判定.64)1-k -n (~S t 回归系数:)1,(~)1/(/显著性检验:线性关系.63估计标准误差:k ,自变量数量n 样本数量1k 111修正的多重判定::多重判定系数拟合优度.62:之间的关系,,:多元回归方程:多元线性回归模型.612iii 22222110ααββεββββt t k n k F k n SSE KSSR F MSES n n R R SSTSSRR SSESSR SST SSE SSR SST x x x y e a p p >=----==---⋅--==+=++⋅⋅⋅+++=71.时间序列平稳序列非平稳序列(趋势T/季节性S/周期性C/随机性I )平均增长率=环比增长率的几何平均值-1()季节性顺序.75修正指数曲线指数曲线线性趋势趋势型预测.74-F 指数平滑:个值作为一期的平均数选择F 移动平均:Yt1F 简单平均法平稳序列的预测.73和求平均每一个误差平方后的总均方误差和求平均全部误差取绝对值后总平均绝对误差所有预测误差的平均数平均误差,预测值个观测值i 第预测方法评估.72t t t 1t 1t ti1t ii F Y F K MSE MAD ME F Y α+======+++∑回归分析的一些数据P1:MR:相关系数;RS判定系数,ARS调整的判定系数;标准误差s,观测值nP2:df自由度;总平方和SS;均方MS;线性关系F (Ps:回归R,残差E,总计T)P3,:INTER,截距;XV,斜率;t-stat 回归系数P值检验,P >α,不拒绝;<α,拒绝WelcomeTo Download !!!欢迎您的下载,资料仅供参考!。
统计学复习概念重点-贾俊平

n —1
n
'(X -X)2
i-1
n —1
估计总体比例时的样本容 量
加权样
k
2
(Mi-x) fi
iA
n —1
总体均值检验的统计量
(正态总体,匚已知)
加权样 本标准 差
’(Mi-X)2fi
『广n—1
总体比例检验的统计量
判定系 数
相关系 数检验 的统计 量
标准分
数
指数平 滑法预 测
移动平 均法预 测
R2
SSR「(?i-y)2
SST「、⑶-y)2
总体方差检验的统计量
t
~t(n- 2)
-X
一S
Xi
-
散数
离«系
Ft 1Tt(1-〉)Ft
拉氏
权均数售q1又
加平指销P1q划
Y*丫一2•…匕Yt
Ft1二Yt
k
Ip
P(1-P)
1」
N
2 2(n -1)s岂_2岂(n -1)s
P-乙.2
' pg ' qpo
P0q0q'q°P0
21.离散型变量:只能取可数值的变量。
22.连续型变量:可以在一个或多个区间中取任何值的变量。
23.调查数据:通过调查方法获得的数据
24.实验数据:通过实验方法获得的数据
25.概率抽样:随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
26.非概率抽样:不随机,根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施 调查。
nn
年度化
增长率
Y
r?-1
均方预测 误差
n
统计学(贾俊平版)重点

第一章统计:收集、处理、分析、解释数据并从数据中得出结论得科学。
数据1、分类数据对事物进行分类得结果数据,表现为类别,用文字来表述、例如,人口按性别分为男、女两类2、顺序数据对事物类别顺序得测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等3、数值型数据对事物得精确测度,结果表现为具体得数值、例如:身高为175cm ,168cm,183cm总体–所研究得全部元素得集合,其中得每一个元素称为个体–分为有限总体与无限总体、有限总体得范围能够明确确定,且元素得数目就是有限得、无限总体所包括得元素就是无限得,不可数得样本–从总体中抽取得一部分元素得集合–构成样本得元素数目称为样本容量参数:描述总体特征。
有总体均值( )、标准差(σ)总体比例(π)统计量:描述样本特征。
样本标准差(s),样本比例(p)变量:说明现象某种特征,分类,顺序,数值型:离散型,连续型。
经验,理论变量描述统计研究得就是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计就是研究如何利用样本数据进行推断总体特征第二章间接数据(查询得)与直接数据:调查(通常就是对社会现象而言得)普查信息全面完整。
再一个就是实验。
概率抽样:也称随机抽样。
按一定得概率以随机原则抽取样本,抽取样本时使每个单位都有一定得机会被抽中–每个单位被抽中得概率就是已知得,或就是可以计算出来得–当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中得概率简单随机抽样:从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本得概率就是相等得分层抽样:优点:保证样本得结构与总体得结构比较相近将抽样单位按某种特征或某种规则划分为不同得层,然后从不同得层中独立、随机地抽取样本,从而提高估计得精度–组织实施调查方便–既可以对总体参数进行估计,也可以对各层得目标量进行估计整群抽样:将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中得所有单位全部实施调查优点:抽样时只需群得抽样框,可简化工作量–调查得地点相对集中,节省调查费用,方便调查得实施–缺点就是统计得精度较差系统抽样:将总体中得所有单位(抽样单位)按一定顺序排列,在规定得范围内随机地抽取一个单位作为初始单位,然后按事先规定好得规则确定其它样本单位–先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位操作简便,可提高估计得精度多阶段抽样:先抽取群,但并不就是调查群内得所有单位,而就是再进行一步抽样,从选中得群中抽取出若干个单位进行调查–群就是初级抽样单位,第二阶段抽取得就是最终抽样单位。
统计学原理贾俊平期末考试重点

统计学期末(单选、10个填空、5个判断、三个计算、一道论述)第一章导论1、统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
分析数据:分为描述统计方法和推断统计方法两种方法。
描述统计:研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计:是研究如何利用样本数据来推断总体特征的统计方法。
推断统计内容包含参数估计和假设检验2、统计数据的类型:(1)按照采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据与数值型数据。
注意:分类数据和顺序数据都是表现事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因此可以通称为定性数据或品质数据(qualitative data)。
数值型数据说明的是现象的数量特征,通常用数值来表现,因此可以统称为定量数据或数量数据(quantitative data)。
(2)按照统计数据的收集方法,可以将统计数据分为观测数据和实验数据。
(3)按照被描述的现象与时间的关系,可以将统计数据分为截面数据、时间序列数据(和面板数据 panal data)。
3、抽样独立性问题:总体区分为有限总体和无限总体,目的是为了判别在抽样中每次抽取是否独立(类似抽小球是否放回的问题)。
在统计推断中,通常是针对无限总体的,因而通常把总体看做随机变量(random variable)。
统计上的总体通常是一组观测数据,而不是一群人或者一些物品的简单集合。
4、统计指标按其所反映的数量特点和作用不同,分为数量指标、质量指标。
样本(sample)是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。
抽样的目的是根据样本提供的信息推断总体的特征。
5、总体参数(parameter)是用来描述总体特征的概括性数字度量,是研究者想要了解的某种特征值。
样本统计量(statistic)是用来描述样本特征的概括性数字度量,是根据样本数量计算出来的一个量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学知识点
导论部分
描述统计与推断统计概念比较,举例说明。
统计数据的类型:有三种分类方式,重点关注(分类数据、顺序数据、数值型数据)这三种的概念和特点。
几个基本概念:总体和样本、参数和统计量、变量(分类变量、顺序变量、数值型变量)概念及举例明。
数据搜集部分
数据的间接来源:二手数据的特点
数据的直接来源:调查数据和实验数据(实验数据相关知识参见风笑天笔记)
调查数据:概率抽样和非概率抽样的比较。
简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样、方便抽样、判断抽烟、滚雪球抽样、配额抽样的概念、优缺点及抽样过程的简单描述。
搜集数据的基本方法:自填式、面谈时、电话式优缺点。
数据误差:抽样误差和非抽样误差(系统误差和随机误差)。
抽样框误差、回答误差、无回答误差、测量误差概念。
误差的控制方法。
数据的概括性度量
集中趋势:众数、中位数、平均数概念、计算方法、分布上的关系、各自特点和应用场合。
离散趋势:异众比率、四分位差、方差和标准差、离散系数的概念、计算、特点等。
偏态和峰态的概念。
概率部分(全部是概念)
随机事件及其概率:随机事件、必然事件、不可能事件、基本事件、独立事件和条件概率。
离散型随机变量及其分布:随机变量及其分类、泊松分布。
连续型随机变量及其分布:概率密度、正态分布的曲线及其性质
统计量和抽样分布部分(参数估计的基础)
常用统计量
抽样分布的概念
正态分布及由正态分布导出的几个分布及其特点(正态、卡方、t、F)。
另外标准正态分布和正态分布的概念特点,条件分布的概念。
中心极限定理
样本均值的分布、样本比例的分布、样本均值之差的分布、样本方差的分布
从下面开始就要做题了,每章的例题都要做三遍,课后习题有选择的做一些。
参数估计部分
参数估计、点估计、区间估计的概念及基本原理、置信区间的概念及解释、评价估计量的标准。
一个总体参数的估计(均值、比例、方差),两个总体参数的区间估计(均值之差、比例之差、方差之比)、样本量的确定(估计均值时的、估计比例时的)
假设检验部分
建设检验、原假设、备择假设的概念、假设检验的基本流程和决策准则。
两类错误的概念、控制、关系。
显著性水平的概念解释。
P值决策相关概念和原理、准则。
单侧检验的形式和假设建立。
假设检验的具体内容
主要公式
分类数据分析部分
多看课本例题,2014年的真题就是分类数据的分析,弄懂那道题目,本章搞定了大半。
卡方统计量
拟合优度检验和独立性检验的操作
方差分析部分
方差分析的三个基本假定、假设的提法
单因素方差分析的一般流程(不太需要看双因素的)
总平方和、组内方差、组间方差的概念和计算方式。
一元线性回归(一元和多元回归部分多看书中的表格,理解表格,会补充表格)
函数关系、相关关系、相关系数、回归系数的概念
最小二乘法、同方差和异方差
一元线性回归的计算(两个参数),拟合优度的计算,三个平方和、残差的概念,判定系数的计算,标准误差的估计
高斯马尔可夫定理
多元线性回归
多元回归模型
多重共线性概念、对回归模型的影响、多重共线性的识别和处理。