面对上述种类繁多的ARCH模型,如何选择模型和数据,将是实证研究中必须面对的一个重要问题。同其他经济计量模型的构造一样,我们必须首先分析数据的统计特征,然后再根据数据所表现出来的特征,进行相应模型的构造。一般来说,在构造模型时,为了保证估计参数在不同数据窗口的稳定性,通常要求有足够的数据进行估计。但是,数据越多,就越不可能恰当地反映当前的市场情况。在构造GARCH模型时,也会存在这种置换关系。
实证研究表明,在GARCH模型估计中,通常选择日收益率或者日内收益率数据,因为GARCH效应在更低频率的数据中表现并不是很明显。在估计GARCH模型,选择历史数据的时间跨度时,首先考虑的问题是几年前的重大市场事件能否影响今天的预测能力。因为重大历史事件经常导致市场的急剧波动,这种急剧波动会影响对未来波动性的预测。
由于GARCH模型的所有参数,尤其是截距项,对历史数据是很敏感的,所以,在估计长期波动性时,如果选择的数据区间包括多次市场剧烈运动,那么,波动性的长期估计值就会非常高。这样,在选择数据追溯区间的时候,必须考虑当前的预测是否会受到几年前发生的重大市场事件的影响。
此外,由于ARCH模型的估计一般采用极大似然法,这样,为了确保能够成功进行估计,数据的最小数量应该能够满足模型所定义的似然函数要求。一般来讲,几年时间的数据就可以使模型得到极限解。但是,数据观测值较少可能产生的另外一个问题就是参数估计值很可能是不稳定的。也就是说,当数据窗口按照一定周期向前滚动的时候,GARCH模型的参数估计值很可能是不稳定的。因此,通常通过滚动GARCH回归来检验估计参数的稳定性。
一般来说,最好采取数年的日收益率数据,以便保证当时间窗口滚动时,参数估计值能够保持相对的平稳性。但是,数据选取也不要太多,以免使得参数估计值不能够反映当前市场情况的变化。当数据中存在异常点时,无论距当前多远,它们都会干扰GARCH模型的趋近程度,并且破坏参数估计的有效性。这主要是因为即便一些重大事件发生的时间很长远,但由于波动性的持久性,它们仍然会影响模型的长期波动性预测能力。
在估计GARCH截距项的时候,也可以增加某些限制。在模型估计之前,可以先设定某个固定的长期波动水平。这样,GARCH(1,1)模型就仅仅估计反应参数和持久参数值。通过这种方法,利用GARCH模型,就可以非常容易地把长期波动水平的场景模拟分析推广到整个波动期限结构中。
关于模型选择评价的另外一个问题就是,用GARCH模型来描述实际的条件波动性过程,效果到底如何?如果一个GARCH模型充分把握了波动性聚集现象,那么,一旦我们将收益率用其条件波动性标准化之后,收益率就不会存在显着的自回归条件异方差现象。这也应该是我们评价GARCH模型效果的一个非常重要的标准。
由于前面我们对自回归条件异方差的检验其实就是对收益率平方的自相关性检验,所以,这里可以将收益率平方除以对应的条件波动性预测值,得到标准化之后的收益率平方序列,然后根据前面的Box-Pierce统计量(或者Ljung-BoxQ统计量)来检验自相关系数的显着性。如果自相关系数不显着,那么,构造模型所采取的GARCH形式就是合适的。当几种不同形式的GARCH模型效果一样的时候,最优模型的选取标准应该是在样本后期的预测性检验中,能够提供最高的似然值。
第九章 条件风险收益关系的GARCH类模型研究