股票成交量的马尔可夫链分析与预测

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

n×n 的 第 j 列 之 和 除 以 各 行 各 列 的 总 和 所 得 到
( 2) =P ( 0) P12= ( 0.198 , 0.343 , 0.287 , 0.167) P ( 3) =P ( 0) P13= ( 0.257 , 0.32 , 0.245 , 0.171) P ( 4) =P ( 0) P14= ( 0.292 , 0.308 , 0.231 , 0.16) P
P
∧ຫໍສະໝຸດ Baidu
=
n
( 2) 可以看出第 28 个交易日的 成交量落于第 2 的概率最大 , 由 P 个区间的概率最大… 结合实测数据 , 统计出下表 4 : 表 4: 误差分析

∑n

χ

= 2∑∑ n | ln
=Á =Á
p
∧ ∧
|
p
( ( n- 1) 2) , 则 可 认 为 Xt 符 合 马 氏 χ >χ2α
T 若给定初始概率向量 P ( 0) = ( p( ,则 1 0) , p( 2 0) , … , p( n 0) )
由 ( 6) 式 可 得 t 模型为:
因此 , 可在已知初始概率向量 ( 即特定时段成交量所处的区 间) 的情况下 , 对之后任意时 段成交量所处区间的概率分布作出 预测。 则 p11=8/ ( 8+2+1) =0.727 p12=2/ ( 8+2+1) =0.182 …
- 13 -
数 , 建立频数矩阵
并将频数矩阵 ( nij) 的值记为 P0j, 即
再记 :
则统计量 ( 当 n 较大时)
服从自由度为 ( n- 1) 2 的 χ2 分 布 。 选 定 置 信 度 α , 查 表 得 ( ( n- 1) 2) , 如 果 χα

性 , 否则认为不是马尔可夫链。如果验证了 Xt 为马尔可夫链 , 则 当前股票的成交量符合随机游走的特性 , 股票成交量的走势包 含和反映了历史信息 , 市场为弱有效 , 可构建马氏链模型分析股 票成交量未来的变化情况。 表 3: 状态转移
2007 年第 17 期 ( 总第 69 期)
职 业 圈
ZHIYE QUAN
股票成交量的马尔可夫链分析与预测
王谨乐
( 合肥工业大学管理学院 , 安徽 合肥 230000)
【 摘 要】 成交量是判断股票走势的重要依据, 投资者对成交 量异常波动的股票应当密切 关注。股票的成交量对于投资者操 作股票具有至关重要的参考意义 , 关系到投资者的 切身经济利 益。文章对股票成交量引入马氏链预测模型 , 通过研究发现 , 在 短期里 , 该模型可以比较准确地预测成交量的变化趋势。 【 关键词】 股票成交量 ; 马尔科夫链 ; 转移概率 【 中图分类号】F830 【 文献标识码】 A 【 文章编号】 ( 2007) 17- 0013- 02 1671- 5969 马尔 可 夫 过 程 是 以 俄 国 数 学 家 Markov 的 名 字 命 名 的 一 种 管理决策、 水文气象等领域应用 随机过程模型, 它在经济预测、 广泛。许多学者也将该方法应用于股价预测并建立预测模型, 但很少有人用马氏链的理论和方法来对股票成交量进行分析 与预测。股价之所以产生各种各样的波浪形态, 主要是由于成 交量变化引起的, 成交量是股价各种走势的形成原因, 所说的 “ 量在价先” 即是这个道理, 成交量往往能先于股价预示出形态 的未来发展方向或运行区间。 所以如果我们理解了成交量各种 变化过程及其对应 K 线走势的本质含义, 就能动态地掌握成交 量的分布变动状况, 预测股价的未来走势, 从而找到短线或中 线的操作机会。股票成交量受诸多随机因素的影响, 而这种影 响常使股票成交量波动很大, 不容忽略。本文运用马氏链理论 建立股票成交量的数学预测模型, 并以此来分析与预测股票成 交量的波动, 希望能使投资者避免盲目和不理性的投资行为, 采取科学的投资策略。
∑ p (n) = 1

设 {Xn, n∈T}为齐次马尔可夫链 , 则 :
二、 运用马尔可夫链预 测 马 钢 股 份 ( 600808) 成 交 量变化趋势
日 到 2007 年 4 月 22 日 的 日 成 交 量 变 化 过 程 进 行 分 析 。 ( 数据
这里, 用马尔可夫链对马钢股份 ( 600808) 2007 年 3 月 16 来 源 : 新 浪 网 财 经 频 道) 分 析 过 程 分 以 下 几 步 : 第 一 步 , 构 造 成 交量变化的分布状态; 第二步, 检验马尔科夫性; 第三步, 马尔 可夫模型的建立和预测; 第四步: 历史数据的预测值和实测值 的误差分析。 ( 一) 构造成交量变化的分布状态
( 三) 马尔可夫模型的建立和预测
根据股市的历史资料 , 统计得出在连续两天 , 前一天成交量 处于 Ei 区 , 而后一天成交量处于 Ej 区的概率 p( ij i, j∈E) , 构造一 步转移概率矩阵 P1= ( pij) 。
Á
其中
p
由 ( 4) 式知 , k 步转移概率矩阵 Pk 为 :
T 记概率向量 P ( t) = ( p( 为第 t 天成交量 1 t) , p( 2 t) , … , p( n t) )
( pij) 称为它在时刻 m 的一步转移概率矩阵 (i, j∈E)。所有 n 步 P1= 移概率矩阵 , 其中 :0≤p( ij n) ≤1 ,
n Pn = P1P(1 n- 1) = P1( n≥1)
( p( 转 移 概 率 p( ij n) 组 成 的 矩 阵 Pn= ij n) ) 为 马 尔 可 夫 链 的 n 步 转
ÃÂ Á Â Á ÃÂ Á Â ÃÂ Á Â Ã Ä Å Á ÂÃ Æ Ç ÃÄÃÁ Â È É Á Â Ã Ä Â Ã
由 表 1 知 , 第 26 个 交 易 日 的 成 交 量 是 548833 , 落 于 第 二 状
(n )
×
n n = n
n
n
n
n
n n n
Min Xt = m0 = 304310 Max Xt = mn = 1085344
( mn- m0) /4= 195258 那么 , Xt 是一个以 E=Ek ( k=1 , 2 , 3 , 4) 为状态空间的随机序 列。分为 4 个价格区间 , 每一区间为一状态 ( 如下表 2) 。 表 1: 状态区间
p( ij m, 1) =P{Xm+1=j| Xm=i} (i, j∈E)
为马氏链 {Xn, n∈T}在 时 刻 m 的 一 步 转 移 概 率 , 简 称 为 转 移 概 率 . 若 对 任 意 的 i, j ∈E , 马 尔 可 夫 链 { Xn, n ∈T}的 转 移 概 率 pij ( m, 1) 与 m 无关 , 则称马氏链是齐次的 , 记 p( ij m, 1) 为 pij 。 同 时 定 义 :系 统 在 时 刻 m 从 状 态 i 出 发 , 经 过 n 步 后 处 于 状 态 j 的概率 p( ij m, n) =P{Xm+n=j|Xm=i} ( i, j∈E , m≥0 , n≥1) ( 3) 为齐次马尔可夫链 {Xn , n∈T}的 n 步转移概率。由齐次性知其与 m 无关 , 故简记为 p( ij n) 。 定义 3:齐次马尔可夫链的所有一步转移概率 pij 组成的矩阵 ( 二) 检验马尔科夫性 用 nij 表示 X1, X2, … , XN 从状态 Ei 经过一步转移到 Ej 的频
 ÃÁ
NO.17, 2007 ( CumulativetyNO.69)
。 ( 4)
一、 马尔科夫链预测原理
马尔可夫过程概述 定义 1:设有随机过程 {Xn, n∈T}, 其时间集合 T={0 , 1 , 2 , … }, 状态空间 E={0 , 1 , 2 , … }, 亦即 Xn 是时间离散和状态离散 的 。 若 对任意的整数 n∈T 及任意的 i0, i1, … , in+1∈E , 条件概率满足
P

=
∑n
= =
∑ ∑n
=
( 5) =P ( 0) P15= ( 0.312 , 0.301 , 0.223 , 0.154) P ( 6) =P ( 0) P16= ( 0.322 , 0.297 , 0.219 , 0.151) P
由P ( 1) 可 以 看 出 , 第 27 个 交 易 日 的 成 交 量 落 于 第 4 区 间
( i=1 , 2 , … , n)
该模型的条件, 即假定对初始向量的认定和转移矩阵概率的不
总之, 在确定了股票成交量的马氏 变化规律, 提高预测可信度。 好的选择。
Pk=P1k
( 5)
链特性后, 应用马氏链分析股票成交量的变化趋势是一个比较
的 绝 对 概 率 向 量 , 其 中 p(i t) 表 示 第 t 个 时 段 股 票 成 交 量 处 于 第 ( k∈T) 的绝对概率向量 t+k 个时段
( 5) 式 知 , 成 交 量 第 E(i Ei∈E) 区 的 绝 对 概 率 , 根 据 全 概 率 公 式 和 ( t+k) =P ( t) Pk=P ( t) P1k P ( 6)
用马尔可夫链对股指分析预测时 , 是假定未知的概率分布与已 在实际中是很难满足的 , 这同样也是导致误差的重要原因。
知的概率分布无太大 出入 , 即市场外界环境比较稳定 , 但这点这
四、 结语
由于马氏链具有 “ 无后效性” , 所以在市场有效的条件下,
=
n
Á
∑n


∑p

=1
预测股票成交量的变化规律比较准确。但是, 应该注意到使用 变, 应根据实际情况对初始向量和转移矩阵做出调整, 以符合
Xt 是代表股票成交量大小 的 随 机 时 间 序 列 , 对 Xt 所 能 取 到
的最小值 m0 和最大值 mn 所限定的区间划分成若干小区间( : m0, ( mk- 1, mk], 则可 m1],( m1, m2], … ,( mn- 1, mn], 其中 mi≥mi- 1。再记 Ek= 视X (t t=1 , 2 , … , N) 为 一 个 以 E=E( k k=1 , 2 , … , n) 为 状 态 空 间 的 随机时间序列 ( 或称随机过程) 。下面根据马钢股份 ( 600808) 这 只 股票成交量的实际情况划分 , 将 2007 年 3 月 16 日到 2007 年 4 月 22 日的日成交量划分为 4 个区域 , 使每一天的成交量仅落 入其中一个区域内 , 每一区域可作为一种状态。需要注意的是 , 由一个标 准划分的各个状态之间应相互独立 , 使预测对象在某 一时间只处于一种状态。
测值相差 2 , 2007 年 4 月 26 日预测值和实测值相差 1 外 , 其他 交 易 日 的 误 差 都 为 0 , 按 照 100% 的 吻 合 率 , 表 3 的 历 史 吻 合 率 预测值与实测值之间的误差取主要决于成交量变化区间的 为 67%。
划分方法 , 本文的成交量 变化区间是均匀划分的 , 可以根据正态 分布的状况把区间划分的更细 , 误差就可以极大的减小。另外应
Á





( 四) 历史数据的预测值和实测值的误差分析
在这 6 个交易日中 , 除了 2007 年 4 月 24 日的预测值和实
态 区 间 , 所 以 用 马 尔 可 夫 链 进 行 预 测 时 , 初 始 概 率 向 量 P(0)= 概率向量分别为 :
( 0 , 1 , 0 , 0) , 则预测第 27 , 28 , 29 , 30 , 31 , 32 交 易 日 的 成 交 量 绝 对 ( 1) =P ( 0) P1= ( 0 , 0.333 , 0.167 , 0.5) P
P{Xn+1 = in+1|X0=i0, X1=i1, … , Xn=in}= P{Xn+1 =in+1| Xn=in}
( 1)
则称 {Xn, n∈T}为马尔可夫链 , 简称马氏链。 ( 1) 式称为过程的马 尔可夫性 ( 或称无后效性) 。它表示若已知系统现在的状态 , 则系 统未来所处状态与过去所处的状态无关。 定义 2: 称条件概率 表 2: 状态区间分布情况 ( 2)
相关文档
最新文档