相关性最初是统计学意义上的一个概念。考虑两个随机变量的联合密度函数,相关性描述的就是这两个随机变量之间的关联程度,也就是说,根据一个随机变量的信息来获得另外一个随机变量信息的能力。金融理论上的相关性指的是两个收益率序列的协同运动程度。一个很强的正相关性表示,当一个收益率序列向上运动时,另外一个收益率序列也将向上运动;一个很强的负相关性表示,当一个收益率序列向上运动时,另外一个收益率序列将向下运动。
两个随机变量之间一个比较简单的协同度量指标是协方差,也就是联合密度函数均值的一阶乘积矩。
相关系数绝对值越高,表明两个序列之间关系越强,“相互依赖”程度越强。如果两个随机变量在统计上是独立的,那么,它们之间的相关系数估计值应该是不显着异于零的。一般称零相关系数的变量之间是正交的。但是,正交并不意味着独立。因为独立表示两个随机变量之间不存在任何关系,而正交则表示两个随机变量之间不存在线性关系。
金融市场上经常存在着非线性依赖现象,因此,相关系数并不是一个非常合适的度量非线性相互依赖的指标。相关系数在度量依赖性方面的作用是很有限的。这是因为在金融市场上相关系数估计缺乏稳健性,被用来估计的随机变量序列可能不是平稳的。在不平稳的情况下,估计可能会产生谬回归问题。一般认为,收益率序列可以用相关系数来检查其短期相关性;而长期相关性的考察,一般使用长程记忆模型,譬如对价格序列作协整分析。
随着时间变化,相关系数未必是不变的。导致相关系数变化的原因有:(1)资产收益率之间的相互依赖在本质上可能是高度非线性的,而相关系数仅仅是一个线性度量指标;(2)相关系数本质上是一个静态指标,而市场之间的动态关系可能存在某种领先滞后属性;(3)由于时间序列本身的原因,相关系数估计值可能存在跳跃现象。只有当两个平稳收益过程是联合协方差平稳过程的时候,相关系数才是不随时间变化的。我们称此时的相关系数为无条件相关系数。
如果确实存在着某个无条件相关系数,在整个过程中,该相关系数的值是唯一的。那么,由于样本数量越少,样本误差就会越大。这样,随着取样时间不同,样本规模不一样,估计得到的相关系数就会不一样。这种样本相关系数的变化反映的就是样本误差问题。但是,另一方面,我们根据上述统计公式总可以计算得到某些相关系数。这反过来又证明在序列之间存在或不存在某种联合协方差平稳关系。此时,这种稳定性很明显就是一种人为之物。这就提醒我们,在用统计模型分析时,要结合经济意义或者经济理论来进行。
另一种处理方法就是对模型进行放宽,可以考虑随时间变化的相关系数模型。这种模型称为条件相关系数模型,它一般假定收益率联合分布的特征参数是随时间变化的。这类模型的代表是双变量GARCH模型。但这类模型的估计值是非常不稳定的。相关系数也经常表现出很大的跳跃。
n-日历史相关系数可以通过滞后n天的等权重协方差估计除以n天方差估计值乘积的平方根得到,样本规模越大,估计精度越高,这是因为样本误差和样本数量平方根成反比。例如,根据同样的每日样本数据,30天的相关系数估计比60天的相关系数估计更有可能发生变化。无论估计长度为何,或者估计值为何,这里,要估计的历史相关系数总是一个常数。它的不同值变化只能够归因于样本误差。根据上面推理,看起来好像计算时间跨度越长,样本误差越小,从而历史相关系数越精确。但实际上,由于存在极端事件,当时间跨度越长时,极端事件影响的范围越广。极端事件会影响相关系数,就会导致样本相关系数精确度降低。
序列相关性分析不但是研究收益率序列基本特征的一种统计方法,同时也是检验股票市场弱式效率的一种基本方法。这里对上证综指和深证综指收益率的自相关系数进行研究。自相关系数的统计显着性可以通过其标准误来判断。Barlett(1946)认为,如果一个时间序列是纯随机的,也就是如果它是白噪声的,则它的样本自相关函数近似地遵循以零为均值,1/n为方差的正态分布。其中,n为样本容量。在Eviews自相关图中的自相关系数栏,自相关系数线中的散点线近似为两个标准误,即。根据标准正态分布性质,如果自相关系数落在上述区间外,那么在5%的显着性水平上,它就是显着异于零的。
给出了上证综指和深证综指日收益率数据的滞后1阶、2阶、4阶、8阶、16阶和32阶的自相关系数及其检验。其中,Q统计量为Ljung-BoxQ统计量,用来度量前k阶自相关系数整体是否为零,通常也可以用来检验一个序列是否是白噪声的,下面括号中的值为对应Q统计量的相伴概率。如果该概率值小于某一显着性水平,则表明在该显着性水平下,就可以拒绝前k阶自相关系数全部为零的原假设。如果大于某一显着性水平,则在该显着性水平之下,就不能拒绝前k阶自相关系数全部为零的原假设。从检验结果中可以看出,尽管前两阶的自相关系数不是非常显着的,但是,滞后4阶、8阶、16阶和32阶的自相关系数是显着异于零的。这表明在日收益率数据中存在着较强的自相关现象,且这种自相关现象随着滞后阶数的增加,并不会显着衰减。此外,从自相关系数的符号来看,正负号交错,并不存在明显的正反馈和负反馈现象。
给出了国际证券市场收益率自相关系数的研究结果。从我国证券市场股票价格指数自相关和国际证券市场收益率自相关的比较来看,我国上证综指收益率一阶自相关系数处于列表的中值水平,但和列表中存在显着自相关不同,上证综指收益率一阶自相关系数却不是显着的。深证综指收益率一阶自相关系数明显要高于列表中的一阶自相关系数,且是显着的。由于研究中没有给出更高阶的自相关系数,所以,尽管我们的研究中,两个股票市场的更高阶自相关系数是显着的,却没有办法和国际市场自相关情况进行比较。
给出了上证综指和深证综指周收益率和月收益率序列滞后1阶、2阶、4阶、8阶、16阶和32阶的自相关系数及其检验结果。周收益率序列和月收益率序列的自相关现象更弱,除了周收益率序列存在微弱的一阶和二阶自相关现象以外,其他收益率的各阶自相关系数都不是显着的。这表明和日收益率序列相比,周收益率序列和月收益率序列的随机性更强。这可能主要是因为在较长的时间段中,影响公司价值和股市波动的新闻信息出现的随机性更强一些。而在短期中,由于事件的发生不可避免存在一定的持续性和相关性,这就导致了新闻信息的持续性和相关性。此外,股市对上述新闻信息的吸收需要一定的时间,这样,日收益率序列的相关性就会更强一些。因此,一般来说,收益率的计量区间越短,表现出来的自相关模式就可能越强。