
股市网络的拓扑结构:美国股市实证研究

数学系本9班 张灵甫
指导教师:蒋介石
摘 要:本文首先介绍了复杂网络的概念、性质以及复杂网络研究的一些概率统计方法,接着以美国200个上市公司的股票收盘价为结点,将其股票价格变化的互相关性看成网络的边,互相关系数看成边上的权,构造加权复杂网络。相关系数的大小代表了股票影响力的强度。文章给出影响力强度直方图,验证了股市网络的拓扑结构。研究表明,在结点比较少的情况下,影响力强度服从正态分布。影响力强度揭示了各股票股价变化相关的内在实质,为股市研究和参与者提供了新的数学方法。
关键词:股票市场,互相关,复杂网络,拓扑结构。

TopologyofStock MarketNetwork:
AnEmpiricalResearch of the United States Stock Market
Zhang LinFu
Class 9, Mathematics Department
Tutor: Jia JieShi
Abstract:Thethesisintroduces the concepts and naturesof the complex network, and statistical methodsto study it. Then,the thesis constructsweightedcomplex network, whichconsidersclosing price of 200quoted companies in United Statestovertices,the cross-correlations in stock priceto edges,cross-correlationscoefficientto the weight of each edge.Cross-correlationscoefficient stands for influence-strength between twovertices. The thesis gives the bar graph of the influence-strength, and explorestopologyof stock market’s network. The conclusion shows that influence- strength distribution follows a normaldistribution.Influence-strengthrevealsthe internalnature ofstock price changes, providesa new mathematical methodfor researchers andparticipantstoobservestock market.

Key words:stockmarket,cross-correlation,complex network,topology.

1引言
目前,复杂网络研究正处于蓬勃发展的阶段,涉及经济、社会、生态、生物医学等等各个不同领域。虽然有些学者在上世纪末就对股票市场复杂性做过研究,但将复杂网络引入经济和金融领域研究却是本世纪才进行的。我国学者于世纪之交开始了复杂网络的研究,陈关荣、王小帆、刘曾荣、方锦清、王秉宏、李平等一批学者做了许多工作,但对金融领域特别是股票市场复杂网络的研究几乎空白。2006年1月,李平、王秉宏在《科学通报》发表了“基于网络拓扑统计的恒生证券指数处理”一文。此文开辟了国内研究股市网络的新篇章。此外,薛耀文、张朋柱、范静等人在金融网络方面也作了一定研究。
从网络结点度分布的角度看,复杂网络主要有两种不同的拓扑结构。一种是均匀网络,如Erdes和REnyi(ER)提出的随机网络[1]以及Watts和Strogatz提出的小世界网络[2]都属于这一类型。均匀网络是指网络中每个结点的度几乎都是相等的,通常它的度分布服从指数分布或正态分布。定义网络中结点的平均度为
,分布曲线在这一点达到峰值。当k<<
或者k>>
时,迅速地呈指数衰减。与之相对应的是非均匀网络,此类网络有着明显的非均匀特性。其中一个典型的例子就是Barabasi和Albert(BA)提出的无尺度(Scale-Free,SF)网络[3],它的度分布服从幂律(Power Law)分布:
。在非均匀的SF网络中,大多数结点的度都很小,但有少数结点的度很大。
时至今日,用复杂网络来研究股票市场还是一个全新的课题。本文就股市网络中度的分布,从数学方面作了一些有意义的工作,主要对上市公司的影响力强度分布作了一些分析。
2股市网络
图1由8个结点和10条边组成的网络
2.1网络的几个定义[4]
定义1 网络:一个典型的网络是由许多结点与连接两个结点之间的一些边组成的,其中结点用来代表真实系统中不同的个体,而边则用来表示个体间的关系。往往是两个结点之间具有某种特定的关系则连一条边,有边相连的两个结点可看作是相邻的。网络研究起源于图论,从数学上,网络可以看成是结点(P)和边(E)的集合G={P,E},这里P是结点的集合;E是边的集合.如图1所示的网络由8个结点和10条边组成。
定义2 复杂网络:指大量具有紧密联系和彼此相互作用单元组成的网络。
定义3 结点的度p是指该结点具有的连接数,即此结点所具有的边数和;它衡量了一个结点对其最邻近结点的重要程度。
定义4 度分布函数p(k):反应了网络中任意结点具有k条边(即有k个最近邻)的概率。
定义5 均匀网络:指网络中每个结点的度相差不大,通常它的度分布服从指数分布。
定义6 非均匀网络:此类网络有着明显的非均匀特性。其中一个典型的例子就是Barabasi和Albert(BA)提出的无尺度(Scale-Free,SF)网络[3],它的度分布服从(Power Law)分布:
。在非均匀的SF网络中,大多数结点的度都很小,但有少数结点的度很大。
定义7 网络的拓扑结构:网络不依赖于结点的具体位置和边的具体形态就能表现出来的性质叫做网络的拓扑性质,相应的结构叫做网络的拓扑结构。
2.2股市网络
目前,复杂系统诸如生物、经济、物理和社会系统已经作为一门综合学科受到了社会的广泛关注,这些系统又由各部分组成,诸如个体、公司,通过自身的相互影响展示出了良好的合作性和自适应性。近年来,在金融市场上,更多的注意力和研究集中在不同公司的股票价格变化及其互相关上。
在股票市场中,通过研究股票市场中各种不同股票之间的互相关,以真实股票市场的各个股票的价格数据时间序列计算不同股票之间的互相关矩阵。并以股票交叉矩阵的矩阵元作为相应股票之间的相互作用权重,构造股票之间的加权网络。我们将研究这一股票公司加权网络的影响力强度分布特征,从而揭示对于实际的股票市场股票价格的波动,不同股票公司究竟起多大的影响程度,以及他们彼此之间又是如何地相互影响。
以N个上市公司(股票)为结点,由各股之间的互相关系数(cross-correlations)为边的网络,称为股市网络。
2.3股市的实证研究
2.3.1股市网络的建立
在网络构建过程中,涉及到大量的企业数据。在国外,这些数据可以通过相关数据库获取。但在国内,这样的数据库较少,只能通过广泛地企业调研,以手工的方法获取。所以,这部份工作量非常大。
一般来说,股市网络数据量很大,因此,难以像图论研究一样,以直观的方式观察其中的规律,而必须借助计算机的运算,通过统计的方法进行分析研究。
在股市中,各个公司之间的股价变化是相互影响的,那么在研究股市相互影响行为中最重要的指标是不同公司(股票价格变化)的互相关系数(cross-coefficients),由于股价变化依赖于各种经济环境,研究股市的动态过程和预言股价变化是很难的。
下面通过随机矩阵理论来研究股价变化的互相关系数,它反映了股市的整体性行为。
本论文中,为了简化计算,忽略某些外部环境对股市的影响。定义如下:

表示第i公司在时刻t的股票价格,则
表示时间间隔
(看作一天)内的股价涨落:
(1)
则定义第i公司和第j公司之间的互相关系数为

(2)
其中“
”表示数学期望。
,当
时表示第i公司和第j公司的股价是正相关(负相关);当
时二者是不相关的。
……
从图上可以看出,权重数是介于(-0.2,0.7),在Matlab命令窗口中,由find函数可找出,max(W)=W(46,49)=0.6814,表明股市网络中,第46个公司和第49个公司的股价变化的相关系数(影响)最大,且相关性系数为0.6814, min(W(W>0))=W(69,184),表明这两个公司的正相关系数最小,且相关性系数为1.7762e-004;同理第24,69这两个公司的成负相关,负相关系数为-0.1610。
为了研究某一个公司对整个股市中其它公司的影响强度,给出如下定义:
结点i的影响力强度qi:与其相连的所有边(除本身)的权重之和:
(6)
2.3.2国外对股市网络的研究
在上面五个式子的基础上,韩国大学物理系李、金教授在《Scale-Free Network in Stock Markets》[5]一文中构建出股市网络,他们得出的是无标度网络,如图3所示:


图3 影响力强度分布
的双对数坐标图
需要说明的是,两位教授所选的结点(公司)的个数为6358。由图3可知,两位教授构建的股市网络服从定义6中的幂律分布,对影响力强度分布函数两边取双对数后,做出一条斜率大约为-1.8的直线。该图表明,股市中影响力强度值小的结点占的概率大,影响力强度值大的占得概率小。通俗地说,影响力强度值和所占的概率是成反比例的。
2.3.3本文的股市网络处理
将股市影响力强度值写成矩阵的形式q=(q1,q2,…q200).作出q的直方图:
……
……
2.4双对数坐标图
最后,为了定量地分析股市网络中的影响力强度(标度)值,先算频度。所谓频度,是指数据在特定区间出现的次数,因此计算频度首先要确定区间。由于q介于4.0807到51.6141之间,将各公司的影响力强度分为11组(由于影响力强度在12到16间的公司数为零)。如表1所示:
表1分组频数图
影响力强度区间(k组) |
4-8 |
8-12 |
16-20 |
20-24 |
24-28 |
28-32 |
32-36 |
36-40 |
40-44 |
44-48 |
48-52 |
对应度值的频数n |
2 |
4 |
9 |
17 |
32 |
37 |
39 |
32 |
16 |
8 |
4 |
那么在对应范围内影响力强度值对应的概率p(
)=n/200;然后求出这11组中对应的n个影响力强度的平均值。
……
3结论
在股市网络中,当结点数比较少时,影响力度值的分布属于正态分布,即影响力度值较大的和较小的所占的概率小一些;当结点数比较多时,影响力度值的分布属于幂律分布,即大多数结点的度都很小,但有少数结点的度很大。
网络研究的蓬勃兴起,为各类复杂系统(包括自然的和经济的)的研究提供了新的途径和支持。本文的工作正是基于这样的背景进行的,将一般网络的研究方法运用于股市的研究中去,提出了股市网络的构建方法及分析步骤。本文介绍了一般的数学方法,完成全部数据及网络构建后,更重要的是基于统计学和Matlab软件的应用。
由于采集的股市数据量较小,使得本文得出的统计数据必然有一定的误差。
时光如梭,短暂而有意义的四年大学生活即将结束,此时看着毕业设计摆在面前,我感慨万千。它不仅承载了我四年来的学习收获,更让我学会了如何求学、如何进行科学研究甚至如何做人。回想起四年的学习生活,有太多的人给我以帮助与鼓励,教导与交流。在此我将对我的恩师们,还有所有的同学们表示我的谢意!
首先,衷心感谢我的恩师***教授对我的悉心教诲和指导!在跟随*老师的这段时间里,我不仅跟*老师学到了许多专业知识,同时也学习到了他严谨求实、一丝不苟的治学态度和踏踏实实、孜孜不倦的工作精神,它将使我受益终生。在此我对*老师的教育和培养表示衷心的感谢!