统计学基础

合集下载

统计学基础

统计学基础

答:统计工作即统计实践,是对社会经济现象以及自然现象的总体数量进行搜集、整理和分析的活动过程,包括统计涉及、统计调查、统计整理、统计分析等环节。统计工作是统计一词最基本的含义,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。
2、统计学研究对象的特点?
答:1)数量性 2)总体性 3)变异性 4)具体性
8. 抽样调查:是按随即原则从总体中选取以部分单位进行观察,用以推算总体数量的一种非全面调查。
9. 重点调查:是专门组织的一种非全面调查,它是对所要调查的全部单位选择一部分重点单位进行调查。
10、典型调查:是根据调查的任务目的,对所研究的现象总体进行初步分析的基础上,有意识的选择若干具有代表性的单位进行调查,借以认识事物发展变化的规律。(注意P30的典型调查要全面掌握)
二、 名词解释
1. 标志:是用来说明总体单位特征或属性的名称。
2. 变量:变量标志在总体单位之间的数量差异称为变量,是可变的数量标志的概念,变量所表现得具体数值称为变量值。
3. 不变标志:是在不同的总体单位之间不发生变化的标志。
4. 定性变量:变量的变化呈现一定的规律性,在一定程度上人们可以预知的变量称为定性变量,也称确定性变量。
54、指数体系:在统计中,若干个指数由经济上的相互联系以及数量上保持一定的对等关系而组成的整体,称为指数体系。
55、统计表:是指用纵横交叉的线条所绘制的用以表现统计资料的表格。
56、时点标志:是反映现象在某一时点(或瞬间)上所处状况的总量指标。
57、结构相对指标:是在总体分组的基础上,将总体划分为若干组成部分,以各部分的数值与总体指标数值对比而计算的比重或比率。
9、统计调查的要求是什么?

统计学基础与应用

统计学基础与应用

统计学基础与应用统计学是一门研究如何收集、处理、分析和解释数据的学科。

它可以帮助我们了解数据的本质和特性,更好地理解社会现象和自然现象,从而进行科学决策和有效管理。

在本文中,我们将介绍统计学的基础知识和应用案例,希望对读者有所启发和启示。

一、统计学的基础知识1.总体和样本统计学研究的对象是总体和样本。

总体是指我们要研究的群体或现象的所有个体或实例的集合,例如全国人口、某公司员工等。

样本是从总体中抽取的一部分个体或实例的集合,通常是为了在总体中推断某些性质或特征,例如从某个城市抽取500个居民进行调查。

2.变量和数据类型统计学研究的对象是变量,变量是指我们要研究的总体或样本中具有不同取值的特征,例如身高、体重、收入等。

根据变量的性质和取值方式,我们可以将数据类型分为以下几种:分类数据、顺序数据、数值数据。

分类数据是指没有大小排序和大小关系的变量,例如性别、民族等;顺序数据是指有大小排序但没有确定大小间隔的变量,例如衣服的尺寸、鞋码等;数值数据是指有大小排序和确定大小间隔的变量,例如身高、体重、收入等。

3.统计量和参数统计学研究的目标是从样本中推断总体的性质和特征。

为此,我们需要用统计量来描述样本的特征和性质。

统计量是指样本中的某一个数值,例如样本均值、样本标准差等。

参数是指总体中的某一个数值,例如总体均值、总体标准差等。

统计学通过样本统计量和总体参数之间的比较和推断来揭示总体性质和特征。

二、统计学的应用案例1.医学研究统计学在医学研究中广泛应用。

例如,在药物开发过程中,需要进行药效试验,以确定药物的有效性和安全性。

在这些试验中,统计学可以帮助研究人员设计试验方案、分析试验数据、推断药物效果和副作用的大小以及确定药物的最佳用量。

2.商业决策统计学在商业决策中也扮演着重要的角色。

例如,在市场营销中,统计学可以帮助企业分析消费者需求和市场趋势,从而更好地定位产品和服务;在金融领域,统计学可以帮助银行和保险公司评估风险和利润,精准定价和防范欺诈。

统计学基础知识要点

统计学基础知识要点

统计学基础知识要点统计学是一门研究数据收集、分析和解释的学科,是许多学科和领域中必不可少的工具。

在本文中,将介绍统计学的基础知识要点,帮助读者理解统计学的基本概念和应用。

一、数据类型在统计学中,数据可以分为两种类型:定量数据和定性数据。

定量数据是以数值表示的,可进行数值计算和比较的数据,如身高、体重等;定性数据则是描述个体特征的非数值数据,如性别、颜色等。

了解数据类型对于选择合适的统计方法非常重要。

二、测量尺度测量尺度指的是衡量数据的方式,常见的测量尺度包括名义尺度、序数尺度、区间尺度和比率尺度。

名义尺度仅用于分类,如性别;序数尺度可以排序,但没有固定的数值差异,如教育程度;区间尺度具有固定的数值差异,但没有绝对零点,如温度;比率尺度具有固定的数值差异和绝对零点,如年龄。

三、描述统计学描述统计学是对数据进行整理、总结和描述的方法。

其中常见的统计量包括平均数、中位数、众数和标准差等。

平均数是一组数据的算术平均值,中位数是将一组数据按大小顺序排列后的中间值,众数是数据中出现频率最高的值,标准差衡量数据的离散程度。

四、概率与概率分布概率是用来描述随机事件发生可能性的数值,常用的表示方法是百分比或小数。

概率分布是描述随机变量可能取得各个值的概率的函数或表格。

常见的概率分布包括正态分布、均匀分布和泊松分布等。

五、参数估计与假设检验参数估计是根据样本数据来估计总体特征的方法,常见的参数估计方法包括点估计和区间估计。

假设检验是通过对样本数据进行统计推断来对总体假设进行验证的方法,常用的假设检验方法包括t检验和卡方检验等。

六、相关分析与回归分析相关分析用于研究两个变量之间的关系,可以通过计算相关系数来描述变量之间的相关程度。

回归分析是一种用于预测和解释因果关系的统计方法,可以建立变量之间的数学模型。

七、抽样与调查抽样是从总体中选择出样本的过程,通过对样本进行研究得出对总体的结论。

调查是一种常用的数据收集方法,可以通过问卷调查、访谈等方式获取数据。

统计学理论基础知识(史上最全最完整)

统计学理论基础知识(史上最全最完整)

统计学理论基础知识(史上最全最完整)统计学是一门关于收集、分析、解释和展示数据的学科。

它在许多领域中都发挥着重要作用,包括自然科学、社会科学、商业和医学等。

基本概念- 数据:统计学的研究对象,可以是数值、文字或图像等。

- 总体与样本:总体是我们想要研究的所有个体或事物,而样本是从总体中选择的一部分。

- 参数与统计量:参数是总体的数值特征,统计量是样本的数值特征。

- 频数与频率:频数是某个数值出现的次数,频率是频数与样本大小之比。

描述统计学- 中心趋势:用于衡量数据集中的位置,常用的统计量有平均数、中位数和众数。

- 变异程度:用于衡量数据集中的离散程度,常用的统计量有标准差、方差和四分位数。

- 数据分布:用于描述数据集中每个值的频率分布情况,常用的图表有直方图和箱线图。

推断统计学- 参数估计:通过样本统计量对总体参数进行估计,包括点估计和区间估计。

- 假设检验:根据样本数据对总体参数的假设进行推断性统计分析,包括设置原假设和备择假设,并进行显著性检验。

相关分析- 相关系数:用于衡量两个变量之间的关联程度,常用的相关系数有Pearson相关系数和Spearman等级相关系数。

- 回归分析:用于建立变量之间的数学关系,常用的回归分析有线性回归和多元回归。

统计学软件- 常用统计软件:如SPSS、R、Excel等。

- 数据可视化工具:如Tableau、Power BI等。

这份文档提供了统计学的基础知识概述,包括基本概念、描述统计学、推断统计学、相关分析和统计学软件。

它将帮助读者理解统计学的核心概念和方法,为进一步探索统计学打下坚实的基础。

统计学基础知识

统计学基础知识

统计学基础知识统计学是一门研究收集、整理、分析和解释数据的学科,它在各个领域都有广泛的应用。

无论是在科学研究、经济管理、医学领域还是社会科学等领域,统计学都扮演着重要的角色。

本文将介绍统计学的基础知识,包括数据的类型、统计描述、概率与概率分布以及假设检验等内容。

一、数据的类型在统计学中,数据可以分为两种类型:定量数据和定性数据。

定量数据是用数值表示的,可以进行数学运算,如身高、体重等;而定性数据则是描述性的,通常用文字或符号表示,如性别、职业等。

了解数据的类型对于选择合适的统计方法非常重要。

二、统计描述统计描述是对数据进行概括和总结的过程。

其中最常见的统计描述指标包括均值、中位数、众数、标准差和方差等。

其中,均值是指所有观测值的平均值,中位数是将数据按大小排列后位于中间的数值,众数是数据中出现次数最多的数值。

标准差和方差是用来衡量数据的离散程度。

通过统计描述指标,我们可以更好地了解数据的分布和趋势。

三、概率与概率分布概率是统计学中一个重要的概念,它用来描述一个事件发生的可能性。

概率值介于0和1之间,0表示不可能事件,1表示必然事件。

概率分布则是对所有可能事件及其对应概率的描述。

常用的概率分布包括正态分布、二项分布和泊松分布等。

正态分布是一种最为常见的连续性概率分布,它的特点是均值和标准差完全确定了分布的形状。

二项分布是一种离散性概率分布,用于描述在给定次数的独立重复试验中成功次数的概率。

泊松分布则是一种用于描述单位时间或单位空间内事件发生次数的概率分布。

了解概率与概率分布对于统计学分析和预测具有重要意义。

四、假设检验假设检验是统计学中常用的方法之一,用于通过对样本数据进行分析来对总体进行推断。

假设检验通常包括两类假设:零假设和备择假设。

零假设是一种关于总体参数的陈述,备择假设则是对零假设的否定。

通过对样本数据进行统计分析,我们可以进行假设检验来判断零假设是否成立。

常见的假设检验方法包括t检验、卡方检验和方差分析等。

统计学基础知识点总结

统计学基础知识点总结

统计学基础知识点总结统计学是研究数据收集、分析和解释的科学。

它提供了一种用来了解和解释各种数据的方法和工具。

统计学的基础知识点是学习统计学的基础,下面是一些重要的基础知识点总结:1. 数据类型:统计学中的数据可以分为两类:定量数据和定性数据。

定量数据是可以量化的,例如身高、温度等,而定性数据是描述性质和特征的,例如性别、颜色等。

2. 数据收集:数据收集是统计学的基础,它包括设计问卷、调查、实验等方法来收集数据。

收集数据时需要注意样本的代表性,并尽量避免抽样偏差。

3. 描述性统计:描述性统计是用来总结和描述数据的方法。

常用的描述性统计包括计算平均数、中位数、范围和标准差等指标来衡量数据的集中趋势和离散程度。

4. 概率:概率是研究随机事件发生可能性的数学工具。

它可以用来计算事件发生的概率,从而预测未来事件的可能性。

概率可以分为古典概率和条件概率等不同类型。

5. 概率分布:概率分布是描述随机变量的分布规律的数学模型。

常见的概率分布包括均匀分布、正态分布和泊松分布等。

概率分布可以用来计算随机变量的期望、方差等统计指标。

6. 假设检验:假设检验是统计学中用来验证关于总体参数的假设的方法。

通过对样本数据进行统计分析,可以得出关于总体参数是否符合假设的结论。

假设检验包括设定假设、选择检验统计量、计算显著性水平和做出决策等步骤。

7. 相关分析:相关分析是用来研究两个变量之间关系的方法。

它可以通过计算相关系数来衡量两个变量之间的相关性,并判断相关性是否显著。

常用的相关系数有皮尔逊相关系数和斯皮尔曼相关系数。

8. 回归分析:回归分析是研究因果关系的统计方法。

它通过建立数学模型来描述自变量和因变量之间的关系,并可以用来预测因变量的取值。

常见的回归分析包括线性回归和多元回归等。

9. 抽样分布:抽样分布是指统计量在不同样本中的分布情况。

它可以用来计算统计量的置信区间和显著性水平等,从而对总体参数进行推断。

10. 统计软件:统计软件是进行统计分析的工具。

统计学基础知识

统计学基础知识统计学是一门研究收集、分析、解释和展示数据的学科。

它提供了一种方法,能够更好地理解和应用各种数据。

统计学在各个领域都有重要的应用,不论是在科学研究、商业决策还是社会科学中,都离不开统计学的支持。

本文将介绍统计学的基础知识,包括统计学的定义、常见的统计术语以及常用的统计方法。

一、统计学的定义统计学是一门研究如何收集、整理、分析和解释数据以及从数据中得出结论的学科。

它包括描述性统计和推论统计两个方面。

描述性统计用来总结和描述数据的特征,如平均数、中位数、频率分布等;推论统计则用来根据样本数据推断总体的特征,如置信区间、假设检验等。

二、常见的统计术语1. 总体与样本:总体是指研究对象的全体,样本是从总体中抽取的一部分。

通过对样本进行统计分析,可以得到对总体的推断。

2. 变量:研究对象的属性或特征,可以是数量型(如身高、年龄)或质量型(如性别、颜色)。

3. 数据类型:数据可以分为定性和定量两种类型。

定性数据用来描述特征或分类,如性别、颜色;定量数据用来表示数量或程度,如身高、温度。

4. 频数和频率:频数是指数据中某个取值出现的次数,频率是指某个取值出现的频率,即频数除以总数。

5. 中心趋势:用来描述数据的集中程度,包括平均数、中位数和众数。

平均数是所有观测值的总和除以观测值的个数,中位数是将观测值按大小排序后的中间值,众数是出现次数最多的值。

6. 离散程度:用来描述数据的离散程度,包括极差、方差和标准差。

极差是最大观测值与最小观测值之差,方差是观测值与平均数之差的平方和的平均数,标准差是方差的平方根。

三、常用的统计方法1. 描述性统计:描述性统计用来总结和描述数据的特征。

常见的描述性统计方法包括计数、百分比、平均数、中位数、众数、极差、方差和标准差。

2. 概率分布:概率分布描述了随机变量的取值及其对应的概率。

常见的概率分布包括正态分布、泊松分布和二项分布等。

3. 推论统计:推论统计用来从样本数据中推断总体的特征,并进行统计推断。

统计学基础知识点总结

统计学基础知识点总结1.数据与变量数据是指收集到的一组数字或符号,而变量是指可以变化的数值。

在统计学中,常用的变量类型有两种:定量变量和定性变量。

定量变量是用数字表示的,如身高、体重等;而定性变量是用非数字表示的,如性别、血型等。

2.数据的描述在统计学中,常用的描述性统计方法有中心趋势度量和离散程度度量。

中心趋势度量包括均值、中位数和众数,用来衡量数据的集中程度;离散程度度量包括极差、方差和标准差,用来衡量数据的分散程度。

3.概率与概率分布概率是指在一定条件下某事件发生的可能性,它是统计学中的重要概念。

概率分布是用来描述随机变量可能取值的分布情况的概率分布函数,常见的概率分布有正态分布、均匀分布、二项分布和泊松分布等。

4.统计推断统计推断是指根据样本数据对总体特征进行推断的方法,它包括点估计和区间估计两种方法。

点估计是通过样本数据估计总体参数的数值,而区间估计是通过样本数据估计总体参数的范围。

5.假设检验假设检验是统计学中用来检验总体参数假设的方法,它包括参数假设检验和非参数假设检验两种。

参数假设检验是对总体参数的假设进行检验,常用的方法有t检验、F检验等;非参数假设检验是对总体分布形式的假设进行检验,常用的方法有卡方检验、秩和检验等。

6.相关性与回归分析相关性是指两个变量之间的关系程度,常用的相关性指标有Pearson相关系数和Spearman秩相关系数;回归分析是用来分析自变量与因变量之间的关系的方法,常用的回归分析方法有一元线性回归分析和多元线性回归分析。

7.贝叶斯统计学贝叶斯统计学是一种基于贝叶斯定理的统计学方法,它与频率统计学有所不同。

在贝叶斯统计学中,统计推断是基于先验概率和似然函数进行的,而不是基于频率分布进行的。

8.实验设计实验设计是指在统计实验中如何设计实验方案,以达到准确、可靠、有效地进行统计分析的目的。

常用的实验设计方法有完全随机设计、区组设计和受试者设计等。

以上就是统计学基础知识点的总结,通过学习这些知识点,可以帮助人们更好地理解和应用统计学在各种领域中的实际问题。

统计学基础知识

统计学基础知识一、概述统计学是一门研究收集、整理、分析和解释数据的学科。

它在科学研究、决策制定和社会经济发展中发挥着重要的作用。

本文将介绍统计学的基础知识,包括数据类型、数据收集和整理、统计分析方法等内容。

二、数据类型1. 定性数据定性数据是用描述性词语或符号表示的数据,不能进行数学计算。

例如,性别、国籍、喜好等。

在统计分析中,常用频数和比例来描述定性数据。

2. 定量数据定量数据是用数值表示的数据,可以进行数学计算。

例如,身高、体重、温度等。

在统计分析中,可以使用中心趋势和离散程度等统计指标来描述定量数据。

三、数据收集1. 抽样调查抽样调查是从总体中选择一部分样本进行观测和测量,以推断总体的特征。

常见的抽样方法有随机抽样、系统抽样和分层抽样等。

2. 观察法观察法是通过观察和记录来收集数据,常用于实地调查和实验研究中。

观察法可以采用自然观察、人工观察和实验观察等方式。

四、数据整理1. 数据清理数据清理是指对收集到的数据进行检查、删除错误和不完整数据以及处理缺失值的过程。

数据清理可以提高数据的质量和可靠性。

2. 数据编码数据编码是将收集到的原始数据转化为适合计算机处理的形式。

常用的数据编码方法有数值编码、字符编码和二进制编码等。

五、统计分析方法1. 描述统计描述统计是指根据数据的分布特征,从集中趋势、离散程度和分布形状等角度描述和概括数据。

常用的描述统计方法有频数分布、直方图、均值和标准差等。

2. 推断统计推断统计是指使用样本数据对总体进行统计推断,从而得出结论。

常用的推断统计方法有假设检验、置信区间和方差分析等。

六、应用场景统计学广泛应用于各个领域,如市场调研、医学研究、经济决策等。

统计学可以帮助整理并分析数据,为决策提供科学依据。

七、总结统计学是一门重要的学科,掌握基础知识对于正确理解和应用统计分析方法至关重要。

本文介绍了统计学中的基础知识,包括数据类型、数据收集和整理、统计分析方法等内容。

通过学习和运用统计学,我们可以更好地理解和解释数据,为科学研究和社会发展提供支持。

统计学基础知识

统计学基础知识统计学是一门重要的学科,它运用数理统计方法研究和解释数据,并为决策提供科学依据。

在现代社会中,统计学扮演着重要的角色,许多领域都需要统计学的支持,包括经济学、社会学、医学等。

本文将介绍统计学的基础知识,包括数据类型、描述统计、概率论以及统计推断等。

一、数据类型我们首先要了解不同的数据类型,数据可以分为定性数据和定量数据两种类型。

定性数据是描述性的,如性别、口味偏好等;定量数据则是可量化的,如年龄、收入等。

在统计学中,应根据具体情况选择合适的数据类型进行分析。

二、描述统计描述统计是统计学中最基本的部分,它通过对数据进行整理、分析和展示,揭示数据的规律和特征。

描述统计常用的方法包括频数分布表、直方图、条形图和饼图等。

这些方法能够帮助我们直观地了解数据的分布情况和集中趋势。

三、概率论概率论是统计学中的重要理论基础,它研究随机现象的概率规律。

在概率论中,我们需要了解一些基本概念,如样本空间、事件、概率等。

通过概率论的知识,我们可以预测随机事件的发生概率,并进行合理的决策。

四、统计推断统计推断是通过对样本数据进行分析,推断总体数据的统计特征。

在统计推断中,我们需要了解抽样方法、置信区间、假设检验等概念。

通过统计推断,我们可以根据样本推断总体的特征,并对决策进行科学评估。

五、常见统计方法统计学中有许多常见的统计方法,其中包括相关分析、回归分析、方差分析等。

相关分析用于衡量变量之间的关联程度,回归分析用于研究变量之间的因果关系,方差分析则用于比较不同组之间的差异。

这些方法在实际问题中具有广泛的应用。

六、统计软件为了更好地进行数据分析,许多统计学家和研究人员开发了各种各样的统计软件。

这些软件可以帮助我们进行复杂的统计计算和数据可视化,如SPSS、R、Python等。

掌握合适的统计软件,能够提高工作效率和数据分析的准确性。

七、应用领域统计学在各个领域中都有广泛的应用。

在经济学中,统计学可以用于预测经济发展趋势和分析市场需求;在社会学中,统计学可以用于研究社会现象和调查民意;在医学中,统计学可以用于分析疾病传播规律和评估药物疗效等。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计学基础 杨超
第二章 时间序列
第一节 验证时间序列的平稳性
我们知道,在经典的计量经济学建模过程中,通常是假定经济时间序列是平稳的,假如不平稳,就会引入“伪回归”现象,即变量间本来不存在有意义的关系,但回归结果却得出有意义的错误结论【1】。

所以我们必须进行时间序列平稳性检验,主要有自相关系数检验法和单位根检验。

下面来一一介绍:
(1) 自相关系数检验
设时间序列为n x x x ⋯⋯,,21,分别将其分成(n-k ),对数据k n t x x k t t -⋯⋯=+,,3,2,1),,(,其中k 可取1,2……(n/4).即
当k=1时,),),,(),,(13221n n x x x x x x -⋯⋯(;
当k=2时,),),,(),,(24231n n x x x x x x -⋯⋯(
……
当k=(n/4)时,),),,(),,(2211n k n k k x x x x x x -++⋯⋯(
然后计算每组的自相关系数:
∑∑∑==-=+=⋯⋯=---=n t t n t t k n t k t t k x n x n k x x
x x x x r 1
12_1__1),42,1(,)()
)((其中(, 我们知道,当20≥k 时,若n
r n k 96.196.1≤≤-,则可认为在05.0=α的显著性水平下,时间序列具有随机性特性(96.105.02
==z z α)。

当然我们还可以使用我们前面介绍过的2
χ检验【2】,先计算m 个自相关系数),6(,21m n m r r r m >≥⋯⋯,,设统计量Q 为:∑=⨯=m
k k r n Q 12
将计算得到的k r 代入,则有统计量Q 之观察值,然后查2
χ表,并取自由度为m-1,
将Q 的观察值与查到的)1(2-m αχ比较,若2χ≤Q 时,则认为这m 个值自相关系数与零没有显著区别,接受假设,原时间序列具有随机性,反之则非随机。

我们对上证指数1991-2009年4680个数据进行上述检验,发现当m 值较小时,如m 为100时,显示结果为非随机,而m 值接近n/4,如1000时,显示随机,这个也是显而易见的,因为数据量大的时候,每一小段的变化都可看作平稳变化。

下面给出自相关频数图,我们发现基本都在零附近,即为随机序列。

(2) 单位根检验
下面来介绍单位根检验,假定{}t Y 为一时间序列,若存在前后依存关系,且当前的取值仅与前一期有关,则可用下面的自回归模型来描述这种关系:
t t t Y Y ξϕ+=-1 (1)
常记作AR(1)。

当然实际情况可能t Y 不仅与1-t Y 有关,还和2-t Y 等有关,那么自回归模型的一般形式可写为:
t n t n t t t Y Y Y Y εϕϕϕ++⋯⋯++=---2211 (2)
对于(1),当1=ϕ时,则变为随机游走过程(random walk process ),也称为单位根过程,此时t ε均值为0,方差为2
σ,我们若用布朗运动描述,可得到下图
图二、一维布朗运动模拟图【3】
而实际上t ε可能会发生漂移,此时模型变为
t t t u Y t Y +++=-1βα (3)
其中t u 为平稳过程,如果一阶差分t t t t u Y Y Y =-=∆-1,序列就称为一阶单整序列(integrated process ),在此不详细叙述。

在第一章我们已经知道检验的前提是给出分布和统计量,对于最简单的单位根检验,用OLS 法估计一阶自回归模型,这样就能得到回归系数ϕ的OLS 估计:
∑∑--=2
11^t t
t y y y ϕ (4)
再根据t 统计量^^^ϕσϕ
ϕ-=t 进行ϕ=1的检验,由于t 统计量不服从传统的t 分布,但
其极限分布仍存在,利用这一分布进行的检验称为DF 检验【4】。

在DF 检验中是假设随即扰动项t ε不存在自相关,但这个往往和实际不符,所以进行扩展,称为ADF (Augmented Dickey-Fuller )检验。

我们用Eviews3.0软件对1991-2009上证指数日数据进行检验,发现t 统计量在1%显著性水平下为-1.289,大于Mackinnon10%临界值-2.5674,故不能拒绝假设,是非平稳序列,与前面的自相关检验的结论一致【5】。

图三、ADF 检验数据表【6】
包含非平稳变量的均衡系统,必然意味着这些非平稳变量的某种线性组合是平稳的,这也称为协整性【7】,这么说,必定有影响上证指数的平稳变量的存在(如收益率,交易量,基金持仓比例等),这个问题是未来的探索方向。

第二节 Chow test & Hurst index
这几年来,分形市场一直是非常热门的话题,大有取代有效市场之势,而混沌经济学也顺理成章的进入了我们的视野。

我们先来介绍下什么是有效市场和分形市场。

有效市场其实就是我们一直说的随机游走市场,即股价不可预测,市场买卖还手效率非常高,导致无法套利,但这个只是建立在投资人都是理性投资人和股价完全是经济的反应【8】的前提上,这个前提显然与我们大多数股票市场相违背,于是有了分形市场。

分形市场是建立在有偏(分形)的布朗运动的基础上,即在时间序列上表现为尖峰胖尾【9】,而这种胖尾现象可以说明市场是具有分形结构的非周期性循环的非线性系统【10】,其表现出来的长期记忆性可由Hurst
指数【11】描述。

在进行Hurst指数计算之前,我们先来看下决定结构性突变点的方法——chow test ,这个和自相关检验(DW检验),异方差检验(White检验)
等一同作为模型或时间序列的基本检验【12】,我们假定调整后的2R变化在1%以
上则将该点称为突变点,于是我们找到了下面几个突变点:
下面仅给出各区间的R-S指数分布图,对R-S指数做线性拟合即得到Hurst 指数,很明显可以看出Hurst指数是大于0.5的,即存在正反馈。

图四、上证指数1991-2009涨跌额R-S分布图
图五、上证指数区间二涨跌额R-S Hurst指数
图六、上证指数区间三涨跌额R-S Hurst指数
图七、上证指数区间四涨跌额R-S Hurst指数
图八、上证指数区间五涨跌额R-S Hurst指数
图九、上证指数区间六涨跌额R-S Hurst指数
区间二是中国股市的起步阶段,存在着套利行为,故H指数较大;区间三恰逢亚洲金融危机,出现负反馈也是情理之中;区间四正是04年股改后世界经济泡沫膨胀的时代;而区间五相对的是泡沫破灭后股市巨挫,人心惶惶,疯狂抛售股票阶段;到了区间六又是从谷底回升,进行新的上升周期。

大家看一下这些区间的H指数就很容易理解了。

注意,并不是说下跌时指数就小于0.5,上涨时就大于0.5,大于0.5可能有两种情况,涨了再涨,或者是跌了再跌【14】。

为什么前面先得进行结构性突变点的检验,这个主要是为了说明在结构性突变点构成的区间内,H指数应要比总区间的要更偏离0.5,在最后一个区间中,H 指数还没达到总区间的H值,故推断股票应该会继续上升或者突然下降,实际情况正如我们所料,这里不再叙述。

【1】《计量经济学》科学出版社 266页
【2】由G.E.Box和D.A.Pierce提出
【3】布朗运动程序与说明参见《MATLAB应用》——杨超
【4】由Dickey和Fuller提出
【5】这里应该注意,这里的检验仅证明非平稳,说明有一定趋势性(删)。

【6】Eviews使用方法参见《Eviews与统计分析》——易丹辉
【7】《计量经济学》科学出版社 274页
【8】这个指的是弱式有效市场,中国股市的R-S分析马玖军
【9】分形的解释比较麻烦,涉及到自相似性等,而分形布朗运动则比较容易说明,请参见附录一。

【10】引自Perers的论文
【11】相关定义和程序请参见《Hurst指数及其应用》——杨超
【12】chow test的检验方法可参见《什么是chow test》——杨超
【13】不少人喜欢用收益率的对数做数据,我认为采用涨跌额也可以。

【14】其实算Hurst指数还有其他的方法,为了避免白噪声,如aggvar,per,等,参见《Estimators for long-range dependence: an empirical
study》或其他相关著作。

注:建议使用MATLAB的同学可将自己编写的文件变为P文件,以防丢失,命令为pcode(filename)
附录一:。

相关文档
最新文档