. 正态分布是关于期望
值对称的。换句话说,绝对
值相同的正偏差与负偏差出
现的概率是相同的。对期望
值偏差越大,其事件发生的
可能性越小。事实上,正态
分布的关键之处就在于事件
的概率随着其偏差的增大而呈指数下降。
. 一个正态分布可以由两个参数完全决定,即其期望值和标准差。正态分布一个
有利于资产组合分析的特征是正态分布随机变量的加权和仍服从正态分布。这个性质
被称作稳定性,如果你对服从正态分布的随机变量加一个常数或乘以一个常数,它也
是稳定的,即变换后的随机变量仍服从正态分布。
设n是一个任意的随机变量(并不必服从正态分布),其期望为
,标准差为
。正
如我们前面所说的那样,如果你在n上加一个常数c,那么其标准差不变,均值变为
+c。如果你把n扩大b倍,它的均值与标准差也会相应变为b
和b
。如果n是正态分布
的,转换所得的随机变量也服从正态分布。
稳定性,再加上正态随机变量完全由其期望及标准差确定的性质,意味着一旦我
[1] 注意,看跌期权的预期收益率为-3 2 . 5%,因此,最坏的结果为-6 7 . 5%,最好的结果为8 2 . 5%。中间情
景也有一个7 . 5%的正的偏差(它出现的概率有0 . 5 0 )。这两个因素解释了看跌期权的偏度。
图A-1 正态分布下的概率图
面积=Pr(r≤a)
面积=Pr(a≤r≤b)
面积=Pr(r≥b)
=1-Pr(r≤b)
附录A 定量计算的复习
751
们知道了一个正态分布的期望及标准差,我们就知道其所有的信息了。
如果把随机变量减去期望值,然后除以标准差,我们就得到了标准正态分布。服
从标准正态分布的随机变量具有零期望,具其标准差与方差都等于1的特性。正式地,
服从标准正态分布的随机变量z与其概率f的关系。由下式给出:
f ( z) =
12p
expè
.. -
2
z2
÷
.
.
( A - 6 )
其中“e x p”是指自然对数e的幂函数。象p一样,e是一个很重要的数值,两者在
上述公式中都出现了。它们的重要性足以让你在你的金融计算器上特意留下它们的键
盘。因为它们经常在连续分布的计算中会被用到。
连续分布的概率函数通常被称为密度,记为f,以区别于情景分析中的P r;原因是
因为随机变量的可能取值有无穷多个,于是其取每个值的概率必为无穷小。密度是一
种函数,我们可以通过对它在一段区间上的积分来得到这一区间里取值的概率。换句
话说,如果我们要计算一个标准正态分布变量落在区间[a,b]上的概率,只要把随机
变量z从a到b的f(z)都加总起来就能得到。无论a与b多相近,在该区间内必有无数多
的随机变量z,积分正是解决这个问题的数学操作方法。
我们先来考虑一个服从标准正态分布的随机变量z小于等于a的概率,即z落在值域
[-∞,a]上的概率。我们应该对密度函数在区间[-∞,a]上进行积分,所得结果称为
累积(正态)分布,以N(a)表示。当a达到无穷大时,z就可以取任何值;因此这时
z取值的概率接近于1。任何一个密度函数都有这个性质,即当随机变量在整个取值范
围上进行积分时,累积分布就达到1 . 0。
同样,一个服从标准正态分布的随机变量z小于等于b的概率为N(b),于是,z在
区间[a,b]上取值的概率就是N(b)与N(a)之间的差。正式地,我们有:
P r(a≤z≤b)=N(b)-N(a)
图A - 1列示了这些概念。图中画出了正态分布的密度函数。在图中我们可以看出
正态分布关于期望值的对称性(标准正态分布的期望为零,同时众数与中位数也为零),
以及偏差越大概率可能性越小的特性。跟任何一个密度函数一样,在密度函数线下的
所有面积加总为1 . 0。a和b正好为正值,因此它们在期望值的右侧。最左边的区域是密
度函数中z≤a的部分,因此这部分面积就是a的累积分布,也就是z≤a的概率。中间的
区域是a与b之间的密度面积。如果我们把这部分面积加上a的累积分布,我们就得到
了到达b的总密度面积,也就是z落在b左边的概率。于是a、b之间的面积即为z落在a和
b之间的概率。
利用相同的逻辑,我们找到了z>b的概率。我们已经知道z≤b的概率为N(b)。由
于复合事件“小于等于b”和复合事件“大于b”是互斥的而且是完全的(指两个事件
包含了所有可能的结果),因此他们的概率之和为1 . 0;于是要计算z>b的概率,我们只
要简单地用1减去z≤b的概率即可。正式地,我们有:P r(z>b)=1-N(b)
让我们再来看图A - 1,密度函数下b到正无穷之间的区域面积就是密度函数整个面
积(等于1)与负无穷到b之间面积的差。
正态密度函数已经足够地复杂,以至于它的累积函数(即其积分)并没有一个很
精确的显式解。它必须求助于近似方法才能得到。就像本书中表2 1 - 2那样,我们已经
把任何z值所对应的N(z)值求了出来,并制成表供查询。
为了进一步说明问题,下面我们计算标准正态分布的概率:
P r (z≤-0 . 3 6 )=N(-0 . 3 6 )=z小于等于-0 . 3 6的概率
P r (z≤0 . 9 4 )=N( 0 . 9 4 )=z小于等于0 . 9 4的概率
P r (-0 . 3 6≤z≤0 . 9 4 )=N( 0 . 9 4 )-N(-0 . 3 6 )=z落在区间[-0 . 3 6,0 . 9 4 ]之间的概率
P r (z> 0 . 9 4 )=1-N( 0 . 9 4 ) =z大于0 . 9 4的概率
752 第八部分附录
利用表2 1 - 2的标准正态累积函数(有时也称为正态分布面积)和图A - 2,我们得
到:
N(-0 . 3 6)=0.359 4
N(0 . 9 4)=0.826 4
如图A - 2所示,-0 . 3 6和0 . 9 4之间的面积就是z落在[-0 . 3 6,0 . 9 4 ]之间的概率,因此
有:
P r (-0 . 3 6≤z≤0 . 9 4 )=N( 0 . 9 4 )-N(-0 . 3 6 )=0 . 8 2 6 4-0.359 4=0 . 4 6 7 0
z大于0 . 9 4的概率就是图A - 2中0 . 9 4与正无穷大之间的面积。它等于整个面积与负
无穷大到0 . 9 4之间面积的差。因此有:
P r(z> 0 . 9 4)= 1-N(0 . 9 4)=1-0.826 4=0.173 6
最后,还有一个问题,如果z小于等于a的概率为p,那么a的值为多少?
我们假定得到a的函数为Ф(P),于是就有:
如果Ф(P)=a,则P=N(a) ( A - 7 )
比如说,假设现在的问题是:累积密度为0 . 5的值为多少?只要看一下图A - 2,我
们就知道负无穷到零(即期望值)之间的面积为0 . 5,于是我们就有:
Ф(0 . 5)=0 因为N( 0 )=0 . 5
同样地
Ф(0.826 4)=0 . 9 4
因为
N( 0 . 9 4 )=0.826 4和Ф(0.359 4)=-0 . 3 6
我们可以验证一下。从表2 1 - 2中得出Ф(0.655 4)=0 . 4,这意味着具有累积分布
密度为0.655 4的值是z=0 . 4 0。
图A-2 概率与累积正态分布
非标准正态分布:假定某种股票的月收益大致服从均值为0 . 0 1 5 (每月1 . 5%)、标准
差为0 . 1 2 7 (每月1 2 . 7%)的正态分布。那么在某月中收益率小于零的概率为多大?注意
由于收益率为服从正态分布的随机变量,它的累积分布密度就可以用数字方法得到。
标准正态分布表可以应用于任何一个正态分布的变量。
任一个随机变量x,可以通过下式而替换成一个新的标准化的随机变量x*:
x - E( x)
x* = A-8
(x )
注意,我们对x所做的步骤是:(1)减掉期望;(2)乘以标准差的倒数1 / [ (x) ]。
根据我们前面的讨论,对随机变量来说,加上和乘以一个常数的替换效果就是使替换
后的随机变量具有零均值和单位方差。
E(x) - E(x)
(x)
E(x*) == 0;
(x*) == 1
( x)
(x )
附录A 定量计算的复习
753
从正态分布的固有性质我们知道,如果x服从正态分布,那么x*也服从正态分布。
一个正态分布的随机变量可以由两个参数完全确定:它的期望与标准差。对于x*来说,
它们分别为0与1 . 0。当我们对一个随机变量减去其期望然后再除以其标准差以后,我
们就把它标准化了。也就是说,我们把它转化成了一个服从标准正态分布的随机变量。
这个方法在对正态分布(近似正态分布)随机变量进行处理上应用得非常广泛。
回到我们先前考虑的股票。我们知道如果把月收益率减去0 . 0 1 5,然后再除以
0 . 1 2 7,所得的随机变量就是服从标准正态分布的。我们现在可以确定某月收益率小于
等于零的概率。我们知道,有
r - 0.015
z =
0.127
其中r为股票的收益率,z服从标准正态分布。所以,如果r=0,z就应该为:
0 - 0.015
z( r = 0) = =-0.1181
0.127
当r=0时,相应的标准化随机变量z=-11 . 8 1%,为一负数。“r小于等于零”的事
件应与“z小于等于-0 . 118 1 ”等价。计算后者的概率就能够解出我们要求的问题。它
的概率即为N(-0 . 118 1),利用标准正态表我们得到:
P r(r≤0)=N(-0 . 118 1)=0 . 5-0 . 0 4 7=0 . 4 5 3
结果很有意义。回忆起r的期望值为1 . 5%。所以,由于r小于等于1 . 5%的概率为0 . 5,
r小于等于0的概率应该接近于0 . 5,但可能会再低一些。
置信区间:由于我们的股票具有较大的标准差,因此我们有理由去怀疑月收益率
绝对数值的可靠性。对于这个问题,一种量化的回答方法可以解决:“如果某股票收
益率落在某区间的概率为9 5%,那么该区间是什么?”这个区间也被称作9 5%的置信
区间。
一种符合逻辑的区间是以期望值为其中心的,因为r本身就是关于期望值对称的
正态分布随机变量。把所求区间记为
[E(r)-a,E(r)+a]=[ 0 . 0 1 5-a,0 . 0 1 5+a]
它的区间长度为2a。r落在此区间内的概率可用下式表出:
P r ( 0 . 0 1 5-a≤r≤0 . 0 1 5+a)=0 . 9 5
要解决这个问题,我们首先从标准正态分布的随机变量入手。服从标准正态分布
的随机变量具有零期望与单位方差。
标准正态分布随机变量z的9 5%置信区间是什么?由于变量的分布关于零对称,因
此上面的计算式变为:
P r ( -a * ≤ z ≤ a 0 ) = N
(a*)-N(-a0)= 0 . 9 5
图A - 3有助于你对上式累
积分布差所代表的意义有更好
的了解。落于此区间外的概率
为1-0 . 9 5=0 . 0 5。由于正态分
布的对称性,z小于等于-a*的
概率为0 . 0 2 5,而且z≥a*的概
率亦为0 . 0 2 5。于是我们可以
用下式来解出a*:
-a*=Ф(0 . 0 2 5),其等价于N(-a*)=0 . 0 2 5
我们可以对这个解决思路作如下总结。如果我们要寻找一个置信水平为9 5%的置
信区间,我们可以定义为r落于置信区间之外的概率。由于具有对称性,
的一半就是
图A-3 置信区间与标准正态分布
第八部分附录
754
其落于置信区间右端的概率。同时其落于置信区间左端的概率亦为
/ 2。所以与P之间
的关系为:
=1-P=0.05
/ 2=( 1-P) / 2=0 . 0 2 5
我们这里使用
/ 2的原因就是考虑到分布的两个尾部把r以外的区域平分了。不含r
值的任一尾部都具有
/ 2的面积。值
=1-P表示的是不含r值所有区域的面积。
为了确定标准正态分布随机变量的置信区间下边界z=Ф(a/ 2)。我们通过标准正
态累积分布值0 . 0 2 5来确定z 值。查表得z =-1 . 9 6 ,于是我们推断出-a*=-1 . 9 6 ,
a*=1 . 9 6,z的置信区间为:
é .
.êE(z) -F è2
.
., E(z) +F è
.
2 .
.
.
ù
ú =[-F(0.025),f(0.025)]=[-1.96,1.96]
为了得到非标准正态分布随机变量r的区间边界,我们只要利用关系式r=z
(r)+
E(r)=Ф(
/ 2 ) (r)+E(r)来转化z的边界即可。注意,我们迄今为止都是设期望值为置
信区间的中心,然后以其一定数量的标准差向两边拓展。标准差的数量取决于我们允
许其落于置信区间之外的概率(
),或者就是其落于置信区间的概率(P)。通过加减
1 . 9 6 (即z=±Ф(0 . 0 2 5)),我们得到期望值两边的距离为±1 . 9 6×0 . 1 2 7=0 . 2 4 9,于是
我们得到了置信区间:
é
(r)Fè
.
.
. , E(r) + (r)F.
è .
.ù
ú =[E(r) -0.249, E(r ) +0.249] =[-0.234,0.264]
êE(r) -
.
22 .
é
以满足于P =1-= pr E(r) - ( r)Fè
.
2 .
.
≤r ≤E(r) + (r)Fè
.
2 .
.
.
ù
ú
.ê
对于我们的股票(期望值为0 . 0 1 5,标准差为0 . 1 2 7)来说,也就是:
P r [-0 . 2 3 4≤r≤0 . 2 6 4 ]=0 . 9 5
注意到由于股票收益率的标准差较大,9 5%的置信区间的宽度竟达到了4 9%。
利用该例的一个变体,我们再复习一下计算过程。假设我们要求一个资产组合年
收益9 0%的置信区间,其年收益率的期望值为1 . 2%。标准差为5 . 2%。
该例的解为:
Pr
é
êE(r) - (r)Fè
.1 -P
.
.
≤rp≤E( r) + (r)Fè
.1 - P
.
.ù
ú
.
22 .
=Pr[0.012-0.052 ′1.645≤rp≤0.012 +0.052 ′1.645]
= Pr[ -0.073 5 ≤rp≤0.0975]=0.90
因为该资产组合的风险较低,而且我们要求落于所求区间的概率为9 0%(而非
9 5%),所以该置信区间的宽度仅为2 . 4%
对数正态分布:采用正态分布来描述股价及收益率存在着两个不足。首先,尽管
正态分布允许随机变量取任何值(包括负值),但实际的股价不可能为负。其次,正
态分布不适于计算复利。而对数正态分布解决了这两个问题。
对数正态分布描述了一个不断增长的随机变量,它的增长率为一正态随机变量。
因此,一个对数正态分布随机变量的生成过程反映了连续计算复利的特征。
假定某股票以年连续复利(Annual Continuously Compounded,A C C)计算的收
益率服从正态分布,且其期望值为
=0 . 1 2,标准差为
=0 . 4 2,年初的股价为P0 =1 0
美元,利用连续复利(参见第5章附录),如果年复利rc =0 . 2 3,则年末的股价应为:
P1 =P0 ex p (rc)=1 0e0 . 2 3=1 2 . 5 8 6美元
其等价的有效年利率为
r =
P1 -
P0
P0 =e rc -1 =0.2586 (或2 5 . 8 6%)
附录A 定量计算的复习
755
这就是服从对数正态分布的年利率r的实际意义。注意,尽管年连续复利rc可能为
负,但期末股价P1不可能为负。
服从对数正态分布的金融资产具有两个重要的特性:它们的期望收益以及考察期
长度的可变性。
服从对数正态分布资产的期望收益:一个对数正态分布股票的期望年收益为:
E(r) = e x p (
+
2/ 2 )-1 = e x p ( 0 . 1 2 + 0 . 4 22/ 2 )-1 =e0 . 2 . 8 2-1 = 0 . 2 3 1 5 (或2 3 . 1 5%)
这只是关于分布统计值的一个数学特性。鉴于此,一个有用的统计量
*定义如下:
2
* =
+= 0.208 2
2
当分析家们提到对数正态分布资产年复利的期望时,他们一般是指
*。通常这份
资产的年复利就被认为服从期望是
*、标准差为的正态分布。
考察期间长度的可变性:对数正态分布允许资产持有期的变动。假定我们希望能
计算月收益,而非年收益。我们用t来表示我们要求的时间段,为方便起见,t用分数
(以年为单位1)来表示;那么在比例中我们就设t= 1 / 1 2。为了把年收益的分布转化成t
时段收益的分布,我们只需要把原分布的期望与方差乘以t即可(比例中t= 1 / 1 2)。
在我们这个例子中,股票月连续复利的期望和标准差为:
(月)=0 . 1 2 / 1 2=0 . 0 1 (或者说每月1%)
(月)=0 . 4 2/
12 =0.121 2(或每月1 2 . 1 2%)
*(月)=0.208 2/1 2=0.017 35(或每月1 . 7 3 5%)
注意我们在把年转化为月时,方差应除以1 2;因此标准差应除以
12 。
同样地,我们可以把一个非年利的分布转化为一个以年利计算的分布。例如,假
设股票周连续复利服从正态分布,且
*=0. 0 0 3,
=0 . 0 7,于是年连续复利分布的各
项指标为:
*=52×0 . 0 0 3=0 . 1 5 6 (或每年1 5 . 6%)
=
52 ×0 . 0 7=0 . 5 0 4 8 (或每年5 0 . 4 8%)
在实际应用中,为了得到标准正态分布的连续复利R,我们通常取原始收益率加
1 . 0后所得和的对数:
R= l o g(1 +r)
在短时期内,原始收益率很小,所以连续复利R也会与原始收益r非常相近。所以
对于一个月或短于一个月的期间来说,这个转换并不是必需的。也就是说,用正态分
布的股票收益率来近似已经足够精确了。但是对于一个较长的时期来说,这个转换还
是很有必要的。
A.2 分析分布特征的统计方法
迄今为止我们的分析都是“向前看”,或者如系统经济学家所说的“以过去推知
未来”。我们已经讨论了概率、期望值与惊奇。如果我们假设决策结果的分布遵循一
个相对简单的公式,而且我们对该分布与参数也了如指掌,那么我们就能较容易、较
准确地进行分析了。
投资管理者必须让他们自己确信这些假设都是合理的,而他们是通过长时期对相
关随机变量观测值的积累来达到这一点的。为了做出最优决策,股票收益率在以前的
分布是他们必须知道的一个要素。确实,收益率的分布随着事件在不断改变。但是,
一个不太“古老”的样本应该能够对下一期的收益率分布及参数提供相关的信息。在
这一节中,我们介绍一些描述分布的统计量,它们也被称为历史样本的组织分析。
A.2.1 柱状图、盒式描点与时间序列描点
表A - 3列出了两种主要资产:标准普尔5 0 0指数与长期政府债券资产组合在1 9 2 6年
到1 9 9 3年的年超额收益(超过国库券收益部分)。
756 第八部分附录
表A-3 股票及长期国债(到期溢价)的超额收益(风险溢价)
年份股权风险溢价债券到期溢价年份股权风险溢价债券到期溢价
1 9 2 6 8 . 3 5 4 . 5 0 1 9 6 3 1 9 . 6 8 -1 . 9 1
1 9 2 7 3 4 . 3 7 5 . 8 1 1 9 6 4 1 2 . 9 4 -0 . 0 3
1 9 2 8 4 0 . 3 7 -3 . 1 4 1 9 6 5 8 . 5 2 -3 . 2 2
1 9 2 9 -1 3 . 1 7 -1 . 3 3 1 9 6 6 -1 4 . 8 2 -1 . 11
1 9 3 0 -2 7 . 3 1 2 . 2 5 1 9 6 7 1 9 . 7 7 -1 3 . 4 0
1 9 3 1 -4 4 . 4 1 -6 . 3 8 1 9 6 8 8 . 5 8 -5 . 4 7
1 9 3 2 -9 . 1 5 1 5 . 8 8 1 9 6 9 -1 5 . 0 8 -11 . 6 6
1 9 3 3 5 3 . 6 9 -0 . 3 8 1 9 7 0 -2 . 5 2 5 . 5 7
1 9 3 4 -1 . 6 0 9 . 8 6 1 9 7 1 9 . 9 2 8 . 8 4
1 9 3 5 4 7 . 5 0 4 . 8 1 1 9 7 2 1 5 . 1 4 1 . 8 4
1 9 3 6 3 3 . 7 4 7 . 3 3 1 9 7 3 -2 1 . 5 9 -8 . 0 4
1 9 3 7 -3 5 . 3 4 0 . 0 8 1 9 7 4 -3 4 . 4 7 -3 . 6 5
1 9 3 8 3 1 . 1 4 5 . 5 5 1 9 7 5 3 1 . 4 0 3 . 3 9
1 9 3 9 -0 . 4 3 5 . 9 2 1 9 7 6 1 8 . 7 6 11 . 6 7
1 9 4 0 -9 . 7 8 6 . 0 9 1 9 7 7 -1 2 . 3 0 -5 . 7 9
1 9 4 1 -11 . 6 5 0 . 8 7 1 9 7 8 -0 . 6 2 -8 . 3 4
1 9 4 2 2 0 . 0 7 2 . 9 5 1 9 7 9 8 . 0 6 -11 . 6 0
1 9 4 3 2 5 . 5 5 1 . 7 3 1 9 8 0 2 1 . 1 8 -1 5 . 1 9
1 9 4 4 1 9 . 4 2 2 . 4 8 1 9 8 1 -1 9 . 6 2 -1 2 . 8 6
1 9 4 5 3 6 . 11 1 0 . 4 0 1 9 8 2 1 0 . 8 7 2 9 . 8 1
1 9 4 6 -8 . 4 2 -0 . 4 5 1 9 8 3 1 3 . 7 1 -8 . 1 2
1 9 4 7 5 . 2 1 -3 . 1 3 1 9 8 4 -3 . 5 8 5 . 5 8
1 9 4 8 4 . 6 9 2 . 5 9 1 9 8 5 2 4 . 4 4 2 3 . 2 5
1 9 4 9 1 7 . 6 9 5 . 3 5 1 9 8 6 1 2 . 3 1 1 8 . 2 8
1 9 5 0 3 0 . 5 1 -1 . 1 4 1 9 8 7 -0 . 2 4 -8 . 1 6
1 9 5 1 2 2 . 5 3 -5 . 4 3 1 9 8 8 1 0 . 4 6 3 . 3 2
1 9 5 2 1 6 . 7 1 -0 . 5 0 1 9 8 9 2 3 . 1 2 9 . 7 4
1 9 5 3 -2 . 8 1 1 . 8 1 1 9 9 0 -1 0 . 9 8 -1 . 6 3
1 9 5 4 5 1 . 7 6 6 . 3 3 1 9 9 1 2 4 . 9 5 1 3 . 7 0
1 9 5 5 2 9 . 9 9 -2 . 8 7 1 9 9 2 4 . 1 6 4 . 5 4
1 9 5 6 4 . 1 0 -8 . 0 5 1 9 9 3 7 . 0 9 1 5 . 3 4
1 9 5 7 -1 3 . 9 2 4 . 3 1
1 9 5 8 4 1 . 8 2 -7 . 6 4 样本均值8 . 5 7 1 . 6 2
1 9 5 9 9 . 0 1 -5 . 2 1 标准差2 0 . 9 0 8 . 5 0
1 9 6 0 -3 . 1 3 11 . 1 2 最小值-4 4 . 4 1 -1 5 . 1 9
1 9 6 1 2 4 . 7 6 -1 . 1 6 最大值5 3 . 6 9 2 9 . 8 1
1 9 6 2 -11 . 4 6 4 . 1 6
资料来源:芝加哥大学证券价格研究中心。
理解这些数据的一种方法是把它们画在图上,一般是作成柱状图或频率分布图。
表A - 3中6 8个观测值被作成了如图A - 4所示的频率分布图。这节我们要根据以下步骤及
原则来得到频率分布图:
. 随机变量取值的值域一般被平均分成几个相对较小的子值域。间隔的多少取决
于可得观测值的数量。表A - 3提供了6 8个数据,因此1 0分法(即1 0个间隔值域)看来
已经足够。
附录A 定量计算的复习
757
. 在第一个间隔值域中作出一个长方形,长方形的高度表示在该值域内观察值出
现次数的多少。
. 如果观测大多都集中在整个值域中的一小部分,那么该值域就可以被分成不相
等的间隔。在这种情况下,各间隔观测值的频率大小就由间隔中所作长方形的面积来
表示(但这并不是我们这里所要讨论的例子)。
. 如果样本是具有代表性的,那么该频率分布图的形状就可以揭示随机变量真实
的概率分布了。我们所有的6 8个观测值并不是一个大样本,但是频率分布图的大致形
状确实说明了收益率大致服从一个正态或对数正态的分布。
另外一个通过作图把样本信息体现出来的方法是盒式描点法。图A - 5就是盒式描
点的例子,它使用的同样是表A - 3的数据。盒式描点是一种能体现样本分布离散性质
的好方法。一个通常使用的散布性质指标是“内四分值域”。我们可以回忆一下值域
这种最原始的散布指标,它是观测值中最大值与最小值之间的差。由于它很可能会由
两个最极端的观测值所决定,因此这个指标并不可靠。
内四分值域是关于值域概念的一个较令人满意的简单变体,它由样本排序后最低
1 / 4与最高1 / 4两者之间的差来确定。对于最低1 / 4的观测值来说,样本中有2 5%的观测
值小于它;同样,在最高1 / 4的观测值上面,存在2 5%的大于它的观测值。于是内四分
值域就是样本中间5 0%观察值所组成样本的值域。样本散布度越高,这两个值之间的
差距就越大。
a)
b)
图A-4
a) 股权风险溢价的历史数据柱状图b) 债券到期溢价的历史数据柱状图
资料来源:The Wall Street Journal, October 15, 1997.
在盒式描点图中,水平的虚线表示中位数,中间的方盒表示内四分值域,垂直线则
表示从方盒延伸出去的幅度。垂直线所表示的延伸值域一般只限制于内四分值域的1 . 5倍。
这样许多极端的观测值(图中以分离的点表示)就只能被视为远离中心的非常规点。
作为一次概念检验,验证一下表A - 3的原始数据与图A - 5的方盒描点作图,并与下
列数字作比较。
第八部分附录
758
收益率(%)
股票债券
图A-5 年股权风险溢价与长期债券(到期)风险溢价的盒式描点图
股权风险溢价债券到期溢价
最低的极端点-4 4 . 4 1 -1 5 . 1 9
-3 5 . 3 4 -1 3 . 4 0
-3 4 . 4 7 -1 2 . 8 6
-2 7 . 3 1 -11 . 6 6
-2 1 . 5 9 -11 . 6 0
-1 9 . 6 2 -8 . 3 4
-1 5 . 0 8 -8 . 1 6
-1 4 . 8 2 -8 . 1 2
-1 3 . 9 2 -8 . 0 5
-1 3 . 1 7 -8 . 0 4
-1 2 . 3 0 -7 . 6 4
-6 . 3 8
-5 . 7 9
-5 . 4 7
-5 . 4 3
-5 . 2 1
最低1 / 4的分界点-4 . 7 9 -3 . 3 3
中位数8 . 7 7 1 . 7 7
最高1 / 4的分界点2 2 . 6 8 5 . 6 4
最高的极端点2 9 . 9 9 8 . 8 4
3 0 . 5 1 9 . 7 4
附录A 定量计算的复习
759
(续)
股权风险溢价债券到期溢价
3 1 . 1 4 9 . 8 6
3 1 . 4 0 1 0 . 4 0
3 3 . 7 4 11 . 1 2
3 4 . 3 7 11 . 6 7
3 6 . 11 1 3 . 7 0
4 0 . 3 7 1 5 . 3 4
4 1 . 8 2 1 5 . 8 8
4 7 . 5 0 1 8 . 2 8
5 1 . 7 6 2 3 . 2 5
5 3 . 6 9 2 9 . 8 1
内四分值域2 7 . 4 7 8 . 9 7
内四分值域的1 . 5倍4 1 . 2 0 1 3 . 4 5
从:-11 . 8 4 -4 . 9 5
到:2 9 . 3 7 8 . 4 9
最后就是第三种作图方法:时间序列描点法,它能够揭示经济变量随时间变化的运
动规律。图A - 6是根据表A - 3作的股票及债券超额收益时间序列点图。尽管我们的眼睛已
经习惯于看到由时间序列生成的随机形状,但考察一般长时期内时间序列的变化趋势却
能给我们提供一个有用的信息。有时通过一些正规的统计分析,这样的检验就会奏效。
a)
b)
图A-6
a) 股权风险溢价( 1 9 2 6 ~ 1 9 9 3年)b) 债券到期溢价( 1 9 2 6 ~ 1 9 9 3年)
760 第八部分附录
A.2.2 样本统计量
假设从1 9 2 6年至1 9 9 3年这6 8年中,股票收益的概率分布一直没有变化。现在我们
希望能从表A - 3这6 8个股票年超额收益的观测值中得到关于概率分布的某些信息。
表中的样本值是否为特定概率分布下的独立观测值,这是一个很关键的中心问题。
如果它们确实是,那么所得的统计分析结果就比较正确。我们的分析都建立在这个假
设之上。在许多情况下,金融市场上的实证研究能证实这个前提假设。
从样本均值来估计期望收益:期望收益的定义告诉我们,样本均值应该可以作为
样本期望值的一个较好的估计。事实上,在期望值的众多定义中,有一个定义就是当
观测值个数趋于无穷时的样本均值。
假定表A - 3中的收益样本为Rt,t= 1,.,T= 6 8,那么年超额收益期望值的估计即为
R =
1 .Rt = 8.57%