第1章 金融市场波动概述
1.1 波动率研究背景、问题提出和研究意义
1.1.1 波动率研究背景
对波动率的刻画和预测是学术界与实务界探讨研究的热点问题,因为它与资产定价理论的检验(Aboura and Wagner,2016;Bansal et al.,2014)、*优资产组合的选择(Guidolin and Na,2006)、衍生品套期保值策略(Balcilar et al.,2016;Basher and Sadorsky,2016)以及金融风险的测度和管理(Brownlees and Gallo,2010;Degiannakis et al.,2013)密不可分。波动率建模和预测的相关文献中的第一句话基本写的都是波动率的重要性,例如,Martens在其2002年发表在Journal of Future Markets上的Measuring and forecasting S&P 500 index futures volatility using high-frequeney data中的第一句话“Forecasting financial market volatility is important in the short and the long run”;Poon和Granger(2003)写的是“Volatility forecasting is an important task in financial markets,and it has held the attention of academics and practitioners over the last two decades”;Andersen和Bollerslev(1998)写的是“Volatility permeates finance”;Corsi等(2008)写的是“Volatility plays an important role both in theoretical developments as well as in practical applications in finance”。由此可见,对波动率的刻画、建模及其预测都具有极其重要的理论与现实意义。
对波动率的研究由来已久。早期对波动率的研究主要集中在使用日收益率数据,然后用广义自回归条件异方差(generalized autoregressive conditional heteroskedasticity,GARCH)模型(Bollerslev,1986)、随机波动率(stochastic volatility,SV)模型等来刻画和预测波动率。随后,已有不少学者(Baillie et al.,1996;Davidson,2004)基于新生变量服从的真实分布以及收益率表现的特征拓展和丰富了GARCH模型,当然已有其他学者对SV模型也进行了一定的扩展(Jacquier et al.,2004;Nakajima and Omori,2009)。不可否认的是,这些模型在一定时期内在波动率刻画和预测时取得了一定的成就。然而,Carnero等(2004)、Corsi(2009)等认为用日数据来刻画市场波动率,一方面,损失了日内交易信息,如日收益率的计算公式是相邻两天收盘价的对数差,若这两天的收盘价较为接近,但这相邻的两天内市场发生了较大幅度的波动,从日收益率计算公式中是无法体现出来的,因此,用日数据来刻画金融资产波动率是存在缺陷和不足的。另一方面,这些波动率模型尽管较为成熟,但估计仍存在一定的难度和不便,例如,GARCH(p, q)在选择滞后阶数时,多数文献选择滞后1阶,这是否合理?即使从统计学的角度出发(赤池信息准则(Akaike information criterion,AIC)和施瓦茨准则(Schwarz criterion,SC)),这是否又能真正反映和刻画市场波动率呢?然而,这些都是值得商榷的。另外,由于资产收益率的条件方差并无法直接观测,需要通过极大似然值及马尔可夫链蒙特卡罗(Markov chain Monte Carlo,MCMC)等复杂的方法予以估计模型中设定的参数,尽管随着计算机性能和编程技术的提升,已有不少计量软件(如EVIEWS,RATS)可以对这样的波动率模型进行估计,但这些模型仍存在这样或那样的不足,例如,这些波动率模型并不能很好地刻画资产收益波动率的典型特征,如长记忆性、尖峰厚尾等。
需要特别注意的是,Andersen和Bollerslev(1998)基于日内高频数据提出了已实现波动率(realized volatility,RV)这一新颖的概念,然后Andersen等(2001,2003)及Barndorff-Nielsen和Shephard(2004,2006)作出了开创性的理论和计量工作,认为RV作为市场的真实波动率具有较好的无偏性和稳健性等优点,与用日收益率的平方和极差等相比,具有更少的市场噪声。随后,用RV来刻画真实市场的波动率和用其建模及预测等逐渐成为近年研究波动率的热点方向(Akram et al.,2009;魏宇,2009;马锋等,2015)。另外,RV的定义是所有日内收益率的平方和,即具有无参数、估计简便等优点,这也是进一步促进它成为明星波动率测度方法不可忽视的原因。
基于日极差波动率和Andersen等(2001,2003)、Barndorff-Nielsen和Shephard(2004,2006)的思想启发,Christensen和Podolskij(2006,2007)提出了基于日内高频数据的已实现极差波动率(realized range-based volatility,RRV),在Sciencedirect期刊数据库中以“Realized Range-based Volatility”为关键词进行全文搜索,可检索到几万篇相关的文献(Sou?ek and Todorova,2013)。RRV的计算方法略比RV复杂,然而其计算步骤与日极差的非常类似,唯一不同的是它是日内所有能获取极差收益率的平方和,但该测度方法依旧计算简便,且无参数估计。RRV作为另一种波动率的测度方法,也受到了学术界的广泛关注(Tseng et al.,2012;唐勇和张世英,2006)。
鉴于此,本书将基于上述两种高频数据下计算的波动率统称为非参数波动率,这也是本书前半部分的思想。随后,学术界将两种波动率测度方法进行了各种建模,然后用它们研究描述和预测各市场波动率,进一步拓展到套期保值、投资组合*优、风险控制及测度等研究领域。因此,基于高频数据下的波动率测度形成了一个新的研究视角,极大地丰富了波动率的研究层面和研究内容。而本书正是基于这一研究背景,对它们进行建模以及构建新的变量期望改进已有模型的预测精度,另外结合投资组合的研究视角,进一步提升新构建的波动率模型和新的变量为投资者所带来的经济利益。众所周知,如果一个模型的判断标准仅仅从计量的角度出发,即使它在统计上是*优的,但并未应用于实际,在一定程度上,并不能体现其在资本市场中的应用价值。然而,就笔者目前掌握的国内外文献来看,关于这一方面的研究更多停留在统计学的角度,从统计计量的角度证明波动率具有预测优势。而本书结合Fleming等(2003)、Wang等(2015)的研究成果,希望给予这样的回答:本书新提出的波动率模型和新构建的变量不仅能改善(或提高)波动率模型的预测精度,还能为投资者带来经济收益。
1.1.2 研究问题的提出
1. 对波动率建模和预测重要性的探讨:基于学术期刊的视角
1.1.1节已充分表明了对波动率的准确建模和预测是具有极其重要的理论和实践意义的。不论是上述提及的低频波动率(如GARCH)模型,还是高频波动率模型,已有大量学者从事这方面的研究,足以证明波动率在金融领域研究的重要性。
2. 对RV和RRV高频波动率模型的一点思考:基于跳跃和符号跳跃变差的视角
1.1.1节已经简单阐述了低频波动率模型(如GARCH、SV)与基于高频数据构建的波动率模型相比具有这样或者那样的不足,无论是从模型自身结构改善还是从外在影响波动率因素(宏观和微观因素),GARCH和SV族模型已经被国内外学者广泛研究,为此,本书的研究重点将转移到基于日内高频数据构建的波动率模型中。后续的章节将较为充分地阐述重点波动率模型,即基于异质市场假说(Müller et al.,1993)构建的异质自回归已实现模型(heterogeneous autoregressive model of realized volatility,HAR-RV)和已实现极差波动率模型(heterogeneous autoregressive model of realized range-based volatility,HAR-RRV)。它们具有估计简单,能刻画已实现波动率的长记忆性、尖峰厚尾等典型事实特征。
如何提高波动率模型的预测能力一直是学术界攻克的难点问题。而本书已经表明了关注的波动率模型,即为基于异质市场假说下的HAR-RV模型和HAR-RRV模型。如果仅仅是对比HAR-RV(或HAR-RRV)模型与简单的GARCH族模型和SV族模型及自回归分整移动平均(autoregressive fractional integral moving average,ARFIMA)模型,势必撑不起本书的框架,也并无创新和意义。后续章节将介绍跳跃的重要性和研究跳跃的范畴。已有不少学者将跳跃成分作为解释变量引入HAR-RV模型中,构建新的波动率模型。其中,比较知名的有:①Andersen等(2007)首次将跳跃成分作为解释变量引入HAR-RV模型,构建了含跳跃成分的HAR-RV-J模型;Andersen等(2007)用Z跳跃检验(Huang and Tauchen,2005)将已实现波动率分解为两部分,即连续样本路径方差和离散的跳跃成分,并提出构建了HAR-RV-CJ模型。②Corsi等(2010)利用蒙特卡罗模拟数据和标普500期货指数的真实交易数据发现,当跳跃连续出现时,Huang和Tauchen(2005)提出的Z统计量不能有效地识别这样的跳跃成分,从而这样的跳跃成分会包含在连续成分中,导致低估了跳跃成分对未来波动率的影响。随后,他们利用修正的门限多次幂变差,按照Andersen等(2007)构建模型的思想,提出了基于C_TZ统计量的HAR-RV-TJ模型。鉴于上述分析,本书将探讨跳跃对HAR-RV模型的估计和预测影响。类似于HAR-RV、HAR-RV-J、HAR-RV-CJ等模型的构造思路,已有学者(邵锡栋和殷炼乾,2009;赵华,2012)构建了HAR-RRV,HAR-RRV-J和HAR-RRV-CJ模型。因此,本书也将研究这三种模型,以此探讨跳跃对已实现极差波动率模型的预测能力。而关于跳跃对已实现波动率和已实现极差波动率模型的研究将是第3章和第4章的研究内容。
本书将考虑*近新提出的概念:符号跳跃变差(Patton and Sheppard,2015),主要是通过已实现正负半变差相减得到的。Barndorff-Nielsen等(2010)提出的已实现正负半变差就是按照日内收益率的正负性将RV分解为两部分,正半差就是日内正收益率的平方和,而负半差便是日内负向收益率的平方和。随后,已实现正负变差受到了学者,如Chen和Ghysels(2010)、Sévi(2014)、Duong和Swanson(2015)等的广泛研究。已有不少经济学家测度下行风险,价格下降的分析,正是用的负向收益率的信息,这方面研究的先驱是Barndorff-Nielsen等(2010)。Roy(1952)指出经济学家已经认识了投资者对下行损失和上行收益是不对称的。另外,Markowitz(1959)提出
展开