T
R上的横杠表示它是期望值的估计。从直觉上来看,样本容量越大,样本均值作
为期望估计值的可靠性也就越大;而随机变量的的标准差越大,均值作为期望估计期
的可靠性也越小。下面我们将更详细地讨论这个性质。
估计高阶矩:以样本均值来估计期望的原理同样也适用于对更高阶矩所进行的估
计。回忆一下,高阶矩的定义就是随机变量对期望偏差若干次方的期望。比如说,方
差(二阶矩)是偏差二次方的期望。于是,样本观测值对样本平均的偏差进行平方后,
平方的平均值S2即为方差的估计。
21 . 1 . 2
s = ( Rt - R )2 = ( Rt - 0.087 5)= 0.04368(s = 20.90%)
T -1 67
其中R 即为样本均值。偏差平方取平均值时分母采用了T-1=6 7,这纯粹是一个
技术上的原因。如果我们除以T,那么方差的估计就会偏小,偏小因子为(T-1 ) /T。同
时,对高阶矩来说,样本容量越大,真实标准差越小,估计值的可靠性也就越大。
A.3 多随机变量的统计分析
资产组合的构建需要将许多随机变量进行加总。资产组合的收益率就是各个体资
产收益率的加权平均。因此对于资产组合分析来说,理解和量化各随机变量之间的独
立性是相当重要的步骤。
在本节中,我们首先回到情景分析法,然后再考虑如何从样本中获取信息。
A.3.1 随机变量间关系的一个基本指标:协方差
在表A - 4中,我们把安休瑟-布希公司股票及其期权的收益率情况分析结果作了一
下总结。对于随机变量加一常数或乘以一个常数的情形,我们早已熟悉了。但当我们
把两个随机变量加在一起,结果会怎样呢?假如我们现在把股票收益加在看涨期权收
益之上,我们于是得到了一个新的随机变量,并把它记为r(s+c)=r(s)+r(c),
其中r(s)为股票收益,r(c)为看涨期权收益。
表A-4 安休瑟-布希公司股票及期权收益的概率分布
项目情景1 情景2 情景3
概率0 . 2 0 0 . 5 0 0 . 3 0
收益率(%)
股票2 0 3 0 5 0
看涨期权-1 0 0 -1 0 0 4 0 0
看跌期权5 0 -2 5 -1 0 0
E(r) 2
附录A 定量计算的复习
761
(续)
项目情景1 情景2 情景3
股票0 . 3 4 0 0 . 111 4 0.012 4
看涨期权0 . 5 0 0 2.291 3 5.250 0
看跌期权-0 . 3 2 5 0.525 0 0.275 6
由定义可知,该合成随机变量的期望值为:
E[r(s+c) ]=.P r (i)ri(s+c) ( A - 1 0 )
把r(s+c)的定义代入等式A - 1 0,我们有:
E[r(s+c) ]=.Pr(i) [ri(s)+ri(c) ]=.P r (i)ri(s)+.P r (i)ri(c)
=E[r(s) ]+E[r(c) ] ( A - 11 )
也就是说,两个随机变量和的期望值等于两个随机变量期望值的和。对于方差,
这句话还适用吗?回答是“不”,这也是资产组合理论中最重要的事实。其原因就归
根于随机变量之间具体的联合性质的基本指标。尽管下面的表述看上去很深奥,但它
们最多不过是平方和而已,也就是(a+b)2=a2+b2+2a b和(a-b)2=a2+b2-2a b这两个最
基本的公式。其中的a、b可能表示随机变量,也可以是它们的期望,或者它们对其期
望的偏差。由方差的定义,我们有:
s+c2= E[rs+c - E(rs+c )]2 (A - 1 2)
为了使式(A - 1 2)到式(A - 2 0)变得易于理解,我们以s、c脚标来表示随机变量,
然后以i来表示各种情景。在式(A - 1 2)中替换r(S+C)及其期望的定义式,有:
s+c2= E[rs + rc - E(rs ) - E(rc )]2
(A - 1 3)
在式(A - 1 3)中交换各变量的顺序,有:
2
= E[r- E(r) + r- E(r)]2
s+c ssc c
在平方的括弧里面,其实就是两个随机变量对其期望偏差的和,我们以d记之,即:
s+c2= E[( ds + dc )2] (A - 1 4)
式(A - 1 4)是一个完全平方和的期望。把平方展开,我们有:
s+c2= E(ds2+ dc2+ 2dsdc ) (A - 1 5)
式(A - 1 5 )括号由三个随机变量的和组成。由于和的期望就是期望的和,我们可
以把式( A - 1 5 )写成:
s+c2= E( ds2) + E (dc2) + 2 E(dsdc ) (A - 1 6)
在式( A - 1 6)中,右边的前两项就是股票收益的方差(即偏差平方的期望)加上
期权收益的方差。第三项就是协方差的两倍,该定义就在式( A - 1 7 )(注意期望要乘以2,
是因为随机变量两倍的期望等于随机变量期望的两倍)。
换句话来说,随机变量和的方差是方差的和再加上协方差的两倍。我们这里记协
方差为:
C o v (rs,rc)=E(dsdc)=E{ [rs -E(rs) ] [rc -E(rc)]} (A - 1 7)
协方差的值与表达式括号中两个随机变量的顺序无关。由于乘法计算与字母的顺
序无关。由式( A - 1 7 )协方差的定义可知字母顺序的改变不会影响协方差的值。
我们利用表A - 4中的数据作为原始输入数据来计算协方差。计算过程及结果如表
A - 5所示。
表A-5 安休瑟-布希公司股票及期权收益相对于各自期望的偏差、
偏差平方及偏差加权积
项目情景1 情景2 情景3 概率加权和
概率0 . 2 0 0 . 5 0 . 3 0
股票的偏差-0 . 1 4 -0 . 0 4 0 . 1 6 0 . 0 1 2 4
偏差平方0.019 6 0.001 6 0.025 6
看涨期权的偏差-1 . 5 0 -1 . 5 0 3 . 5 0 5 . 2 5
偏差平方2 . 2 5 2 . 2 5 1 2 . 2 5
看跌期权的偏差0 . 8 2 5 0 . 7 5 -0 . 6 7 5 0.275 628
偏差平方0.680 625 0.005 625 0.455 635 0 . 2 4
偏差乘积(dsdc) 0 . 2 1 0 . 0 6 0 . 5 6 -0 . 0 5 7
偏差乘积(dsdp) -0 . 115 5 -0 . 0 0 3 -0 . 1 0 8 -1.012 5
偏差乘积(dcdp) -1.237 5 -0 . 112 5 -2.362 5
首先,我们分析股票与看涨期权之间的协方差。在情景1或情景2中,两种资产都
表现出了对各自期望值的负偏差,这是正的同步性的一种反映。当两个负的偏差相乘
时,最终构成协方差的偏差积就会是正的。当随机变量变化方向一致,那么协方差就
趋于正,当随机变量的变化方向相反,那么协方差就趋于负。在情景3中,两种资产
都是正偏差,这更有力地表明了两者的同步性。偏差之积的大小程度,再乘以各个情
景的发生概率,然后加总,所得的结果就是协方差。它不仅能说明同步性的方向(通
过其符号),而且也能说明同步性的程度。
协方差是一个类似于方差的统计量。方差测度的是一个随机变量偏离其期望值的
程度,而协方差测度的是两个随机变量对其各自期望值偏离的同步性程度。对于资产
组合分析来说,有一个性质是很重要的,那就是一个随机变量与其自身的协方差等于
它的方差。如果你在式( A - 1 7 )中适当地替换某些偏差,你就会看到这一点。此时,协
方差的结果就是该随机变量偏差平方的期望。
在表A - 5最后一列的前三个值就是我们已经熟悉的三种资产的方差,它们分别是
股票、看涨期权与看跌期权。该列最后三个数值是协方差,其中的两个呈负值。比如
说,我们考察股票与看跌期权的协方差。在情景1中,股票实现了负的偏差值,而看
跌期权则实现了正的偏差值。当我们把它们相乘时,符号为负。在情景3下,同样的
情况也会发生,只是现在股票实现的是正偏差,而看跌期权为负偏差。同样,乘积仍
为负,因此更加强了两者之间负的同步性。
对其他的情景或者其他的资产来说,偏差乘积可以在某些情景下为负,在另一些
情景下为正。这些乘积的值,再乘以它们各自实现的概率,决定了两个随机变量同步
性的性质。但是,如果我们发现不管各种情景的乘积符号怎样变化,各自的结果会大
致正负相抵,并最终得到一个很小的接近于零的协方差,那么我们就会推断各资产的
收益间存在着小的同步性,甚至根本就不存在同步性。
由于协方差就是两随机变量对期望偏差乘积的期望,要分析变量替换对协方差的
影响,我们可以从变量替换对其偏差影响的分析来入手。
假设在其中一个随机变量上加了一个常数,我们早就知道此时其期望也会增加同
样的常数,所以其对期望的偏差应该保持不变。就像对一个随机变量加上一个常数不
会影响其方差一样,这样做也不会影响它与其他变量的协方差。
把随机变量乘以一个常数后,它的期望也扩大了常数倍,于是其对期望的偏差也
扩大了常数倍。因此,这样做会使它与其他随机变量的协方差扩大该常数倍。利用协
方差的定义式,读者可以验证下式是否成立(该式是对上文讨论的总结)。
Co v (a1+b1rs,a2+b2rc)=b1b2Co v (rs,rc) (A-18)
有了协方差,我们就可以计算随机变量和的方差,进而计算资产组合收益率的方差了。
A.3.2 一个纯粹的关于相关性的指标:相关系数
假如我们告诉你,现在股票收益率与看涨期权收益率之间的协方差为0 . 2 4(见表A - 5)。
你能得出什么结果?因为符号为正,你可能会得出两种收益大致为同向变动的结论。但
是,对于股票与看涨期权同步性的具体程度来说,0 . 2 4这个数字实在毫无用处。
要得到一个关于描述同步性程度的相关性指标,我们可以把协方差再除以这两个
变量的标准差。每个标准差即为其方差的平方根。于是两个标准差的乘积就与方差具
有同样的测度单位,而且也与协方差的单位相同。所以,我们据此定义有相关系数
: Cov(rs ,rc )
sc = (A - 1 9)
s
c
其中的下脚标标明了两个随机变量。由于在协方差的表达式中变量顺序的变换
与其数值结果无关,式( A - 1 9 )表明相关系数的数值也与字母顺序无关。
我们利用表A - 5,得到了三个随机变量的协方差矩阵。
名称股票看涨期权看跌期权
股票1 . 0 0 0 . 9 4 -0 . 9 7
看涨期权0 . 9 4 1 . 0 0 -0 . 8 4
看跌期权-0 . 9 7 -0 . 8 4 1 . 0 0
最高的(绝对值)相关系数是股票与看跌期权之间的相关系数
S P =-0 . 9 7,尽管它们之间协方差的绝对值为最小。原因很明显,它们两者的标准差乘积也很小。接下来
就是几条关于相关系数的重要性质:
. 如式( A - 1 9 )所示,相关系数完全由随机变量对其期望的偏差所决定。因此我们
推得相关系数并不会因为其中的随机变量加减某个常数而改变。但是,当随机变量乘
以一个常数后,相关系数仍保持不变。你可以通过把协方差与标准差各乘以一个常数
后的效果来验证这一性质。
. 就像协方差一样,相关系数只是关于两个变量相关性的指标,它并不能反映两
者之间的因果性。因果性必须要得到理论及特定实证结果的支持。
. 相关系数的取值范围为[-1 . 0 , 1 . 0 ],-1 . 0表示完全的负相关,1 . 0表示完全的正相
关。这可以从计算一个随机变量与其自身相关系数得到。其结果应为1 . 0,因为随机变
量与其自身的协方差即为其方差,你可以用式( A - 1 9 )来验证1 . 0的结果。你甚至还可以
验证一个随机变量与其负的自身之间的相关系数为-1 . 0。从式( A - 1 7 )你可以看到随机
变量与其负的自身之间的协方差等于负的方差。然后代入式( A - 1 9 ),即可得到这一结
果。
因为x与y之间的相关性和y与x之间的相关性没有区别,所以相关系数矩阵是对称
阵。对角线上的元素全为1 . 0,因为它们是各随机变量与其自身的相关系数。因此,习
惯上我们仅须写出相关系数矩阵的下三角部分。
再考察一下式( A - 1 9 )。你可以重新整理一下,得到式( A - 2 0 )。该式把协方差表示
成相关系数与标准乘积的形式:
C o v (rsrc) = ( A - 2 0 )s c
sc
这个公式很有用,因为许多人习惯用相关系数来考虑问题,而不是用协方差。
从收益样本中估计相关系数假设一个样本由互相独立的观测值构成,于是我们
对所有的观测值赋以相同的权重,并用它们的简单平均来估计其期望。当估计方差与
协方差时,我们把平方和除以总观测数减1,所得的平均值即为估计值。
假定我们现在希望对股票与长期无风险政府债券之间的相关系数进行估计,我们
仍以表A - 3为例。假定现有从1 9 2 6年到1 9 9 3年这6 8个年超额收益的样本观测值。利用式( A - 1 9 )中相关系数的定义式,你可以对下面的统计量进行估计(脚标s表示
股票,b表示债券,t表示时期):
Rs = 1 .(68) Rs ,t = 0.085 7;Rb = 1 .Rb, t = 0.162
68 t =1 68
=é 1 .(R- R )2 ù1/2
= 0.2090 ss,ts
=é 1 - Rb )2 ù1/2 = 0.085 0 b . 67 .(Rb, t .
Cov( Rs , Rb ) = 1 .[(Rs,t - Rs )(Rb,t - Rb )] = 0.00314
Cov( Rs , Rb )== 0.17916sb
s b
现在我们想说明一个有可能产生错误估计的例子。回忆一下,我们利用该样本进
行参数估计的前提假定是它们的概率分布在整个样本期内没有变化。为了考察这个假
定是否成立,我们现在对1 9 6 5~1 9 8 7年这段较近时期内股票、债券的相关系数进行重
新估计。这段时期正好是政府为越战与星球大战计划而大规模举债的时期。
如前面的计算过程,我们计算1 9 6 5年至1 9 8 7年的数据。我们得到:
Rs = 0.031 2; Rb =-0.003 17 =0.155 65
b= 0 . 112 17
C o v (Rs,Rb)=0.00 57s
s b=0.326 47
两组数据的差别说明随机变量的概率分布很有可能随着时期的改变而改变,虽然
这个论断并不十分肯定,收益率与样本容量的变化正是我们不能确信的原因。所以我
们应该把注意力放在短期样本统计量的研究上。
A.3.3 回归分析
我们以注册金融分析师( C FA )考试(水平I,1 9 8 6)中的一个题目为例来代表理解
回归分析所需的基础水平。但是,我们先需要了解一些背景知识。
对相关性进行了这么多的分析,我们其实忽略了因果性的问题。在因果性的分析
中,变量被分为被解释变量与解释变量。假定理论(以其最基本的结构式)告诉我们
所有资产的超额收益都由同一个经济力量所决定,而这个经济力量又由宽广的市场指
数运动所体现(比如说标准普尔5 0 0指数的超额收益)。
假定我们的理论预言,在任何资产与市场指数的收益率之间存在着一个简单的线
性关系。一个线性关系,即可以被一条直线所刻划,一般具有如下的形式:
Rj , t =aj+bjRM , t+ej , t ( A - 2 1 )
式中下标j表示任何资产,M表示市场指数(在下面的叙述中,我们将尽可能地省
略下标)。在式( A - 2 1 )的左边,资产j的超额收益是被解释变量;右边分为两部分,即
被解释变量中的可被解释部分与随机部分。
Rj可被解释部分为a+b RM。它被绘于图A - 7。数值a,有时也被称为截距,给出了
当解释变量为零时Rj的取值。在该关系中,我们假设其为常数。可被解释部分中的第
二项代表RM这种市场趋动力,当乘以敏感系数b后就把RM的运动传递给了Rj。同样,我
们也假设b为常数。图A - 7中b就是回归直线的斜率。
Rj 中不可被解释部分以扰动项ej表示。我们假定扰动项与解释变量RM无关,而且
具有零期望的特征。这样的变量也被称为“白噪声”变量,因为它仅仅能够加大被解
释变量Rj的波动性,而对其期望却没有任何影响。
我们把数据代入式( A - 2 1)所示的关系,然后对其系数进行估计,所得的方程即
为回归方程。仅含有一个解释变量的关系称为简单回归。参数a、b被称为回归系数。
因为每一个Rj的值都由回归方程所解释,Rj的期望值与方差也由该回归方程所决定。
利用式( A - 2 1 )中的期望表达式,我们有:E(Rj)=a+b E(RM) (A-22)
常数a不会对Rj的方差产生影响。因为变量RM和ej不相关,所以两随机变量和b Rm+e
的方差为两个随机变量各自方差的和。由于RM乘上了参数b,所以Rj的方差将为:
+ e2( A - 2 3 )
2j=b2M2式(A - 2 3)告诉我们,Rj波动性中RM部分取决于回归系数(即斜率)b。(b
M)2这一项被称为可被解释方差,扰动项的方差构成了不可被解释方差。
Rj与RM之间的协方差也可由回归方程得到。利用前文的定义式,我们有,
C o v (Rj, RM)=C o v (a+b RM+e, RM)
= C o v (b RM, RM)=bC o v (RM, RM)=b
2M( A - 2 4 )
截距a之所以没有出现在最后的表达式中,是因为在随机变量上加一个常数后,
它与其他随机变量的协方差将保持不变。另外,由于假设随机扰动项e与市场收益无
关,所以它也没有出现在最后的表达式中。
式( A - 2 4 )列出了回归参数b的另一个表达式:
Cov( Rj , RM )
b = 2 M
于是,斜率b就成为了一个比例的测度,这个比例就是j与M的同步变动在解释变
量M这一趋动力的运动中所占的比例。
对回归方程解释能力到底如何的一种测度方法是看Rj的总方差中可被方程解释的
方差所占的比例。这个比值称为确定系数
2: b22 b22 M M
2jM= 2
j = bM 2M2+ e2( A - 2 5 )
注意,确定系数与1 . 0之间的差由不可解释方差
e2组成。因此,表示确定系数的
另一种方法是:22 ejM 2 =1 - j
运用代数知识,我们可知确定系数即为相关系数的平方。这也就是说,被解释变量中由解释变量引起的方差所占的比例即为相关系数的平方(参见图A - 7)。
根据使观测值距回归估计值偏差的平方和最小的原则,我们能得到回归系数a、b的估计值。你的计算器,或者任何一个电子数据表程序,
都可以计算回归系数的估计图A-7 简单回归估计与残值,回归线上方差值。和最小的截距与斜率
实际价值(a+bRM+ej)
回归预计(a+bRM)
a=截距
b=斜率
残值=扰动的估计值
1 9 8 6年注册金融分析师( C FA )考试(水平I)的题目如下:
问题:
在对货币基金管理者进行业绩评估时,养老金计划的出资人一般很注重对各基金
进行排名的结果。事实上,各养老金的出资人都自然而然地认为,那些在同等的有代
表性的管理基金样本中,排在前1 / 4的经理在今后的业绩表现中将会优于那些排在后
1 / 4的管理基金。
通过对前一期基金业绩排名顺序进行本期的百分比排名回归,我们可以对这种评
判方法的正确性作出判断。
1. 假如出资人所认为的前提假定是正确的,即在各期内的百分比排名存在完全的
正相关,那么请给出回归直线的截距、斜率以及回归的R2值。
2. 假如基金的百分比排名在各期之间没有相互关系,那么请写出回归所得的截距、
斜率以及R2值。
3. 假定某一次回归分析所得的截距为0 . 5 1,斜率为-0 . 0 5,R2值为0 . 0 1。如果某基
金当期百分比率为0 . 1 5,那么根据这些回归数据,请给出该基金在下期内百分比排名
的最佳估计。
4. 某些养老金计划的出资人认为,在实际应用中他们应该放弃那些处于前1 / 4的
管理者,而转向那些处于后1 / 4的管理者。请说明在赞成这种实际方法的出资人的头脑
中,他们的前提假定是什么?或者说,在关于基金连续两期的百分比排名的关系中,
他们认为回归结果应该是什么样的?
答案:
1. 截距= 0,斜率= 1,R2= 1
2. 截距= 0 . 5,斜率= 0,R2= 0
3. 第5 0名,由下述计算得到:
y=a+b x=0 . 5 1-0 . 0 5 ( 0 . 1 5 )=0 . 5 1-0.007 5=0.502 5
因为R2值太小,可能很难对基金排名作出精确的预测。
4. 这些赞成放弃好业绩基金、支持差业绩基金的出资人认为,连续两期内百分比
排名回归分析中的斜率及相关系数皆显著地为负。
A.3.4 多因素回归分析
一些基本理论告诉我们,在许多情况下一个被解释变量往往要由好多个独立的解
释变量来决定。对这个概念的明释只需以两变量的情形为例。一个房地产分析家对一
个分散性房地产资产组合的收益给出了一个回归方程:
R Et =a+b1R Et-1+b2N V Rt+et ( A - 2 6 )
式中被解释变量是t期的房地产资产组合R Et,模型说明该收益的被解释部分由两
个独立的部分组成。第一个是前期收益R Et-1,表示房地产发展势头的持续性。第二部
分为当期国家的空房率N V Rt。与简单的回归分析一样,a是截距,即为当解释变量为
零时R E的取值。回归系数(斜率)b1、b2代表各解释变量对R Et的边际影响。
确定系数的定义与前文一样。干扰项e的方差与资产组合总方差的比值即为1 . 0减
去该方程的确定系数。这里回归系数的估计原则也是使观测值相对于预测值偏差的平
方和达到最小。
A.4 假设检验
投资学理论的一个中心假设就是不能被分散掉的系统风险将由一个较高的预期收
益率来补偿。但是这个理论是否得到实证数据的支持呢?考虑表A - 3中股票的超额收
益。超额收益预期的估计(即样本均值)为8 . 5 7%。看上去这已是一个比较大的风险
补偿,但风险本身也是如此—样本标准差的估计为2 0 . 9%。这个正相关的关系是否
只是一时的运气而已?假设检验正是要解决这个问题。
假设检验的第一步必须要确定被检验的命题。它被称为原假设,记为H0。相对于
原假设,我们有一个备择假设命题记为H1,假设检验的目标就是要通过计算判断出错
的概率而确定是否要拒绝原假设、接受备择假设。
当对一个变量赋予某值时,我们称其为“特定”假设。认为股票溢价为零就是
“特定”假设的一个例子,但通常情况下假设是“一般”意义上的。“股票风险溢价不
是零”这个命题是一个完全一般的假设,而且它就是风险溢价是零这个特定假设的备
择假设。它认为风险溢价可以是任何值,但是,不是零。如果备择假设认为风险溢价
为正,尽管它并不是完全一般的,但它们也不是特定的。虽然有时我们不得不对两个
非特定假设进行检验(比如说,原假设认为风险溢价为零或负,备择假设认为风险溢
价为正),但这种非特定假设确实使确定出错概率的工作复杂化了。
那么,到底什么是可能的错误呢?我们可以把它分为两类,记为第I类错误和第
Ⅱ类错误。第I类错误就是指当原假设为真时我们拒绝原假设的事件,第I类错误出
现的概率被称为显著性水平。第Ⅱ类错误是指当原假设为假时我们接受原假设的事件。
假定我们为接受H0确定了一个很宽松的标准,于是我们几乎可以确信我们肯定会
接受原假设。要达到这样,我们会使显著性水平趋于零(零是有利的)。如果我们肯
定不会拒绝原假设,那么当原假设为真时我们也肯定不会拒绝它。同时第Ⅱ类错误发
生的概率就会接近于1(1是不利的)。如果我们肯定会接受原假设,那么当原假设为
假时我们也会无条件地接受它。
如果我们为接受H0确定了一个很严格的条件,此时情况就完全相反了:因为我们
现在知道我们几乎肯定会拒绝它。这会使第Ⅱ类错误的发生概率变为零(有利情况):
因为从不接受原假设,所以当原假设为假时我们肯定会拒绝它。但现在显著水平却变
成了1(不利情况)。如果我们经常拒绝原假设,那么就算当原假设为真时,我们也会拒绝它。
两种错误的互相妥协决定了假设检验必须要有合适的显著水平。首先,它必须先
限制第I类错误的发生概率,然后根据已有的条件,理想的检验应该使第Ⅱ类错误发生
的概率减至最小。如果我们要避免第Ⅱ类错误(即当原假设为假时接受了它),那么当
你假设确定为假时,我们就必须拒绝它。避免的概率就是1减去第Ⅱ类错误的发生概率,
我们称其为检验强度。使第Ⅱ类错误发生概率最小化意味着检验强度的最大化。
为对“股票能获得风险补偿”这一命题作出检验,我们写出假设为:
H0:E(R)=0 即预期超额收益为零
H1:E(R)>0 即预期超额收益为正
H1是一个非特定的备择假设。当原假设和其相对的、完全一般的备择假设进行检
验时,我们称其为双尾检验,因为这时你可能会因为过大或过小的数值而拒绝原假设。
当两个假设都是非特定假设时,由于计算第I类错误的发生概率复杂化了,因此
检验也变难了。通常情况下,至少会有一个假设是简单的(即特定的),于是我们就
设其为原假设,这样我们计算检验显著水平时就相对简单了。而在非特定假设为真的
前提下,检验强度的计算仍然是很复杂的;一般情况下我们不能把它解出来。
我们接下来会说明,如果我们把希望拒绝的假设E(R)= 0设为原假设,那么要接
受我们所希望看到的备择假设就相对不易。
在对E(R)= 0这一假设进行检验时,我们设定显著性水平为5%,这就是说,当
原假设为真时,我们拒绝原假设(即认为存在一个正的风险溢价)的概率为5%或更小。
因此,我们必须找到一个记为z 的边界值(或称为双边检验的边界值),其中= 0 . 0 5。
该值将会产生两个区域:接受域与拒绝域。可以参看图A - 8。
图A-8 在原假设下样本的平均超额收益应在零周围分布
注:如果真实的平均超额收益为z ,我们的结论为原假设是错误的。
如果样本均值落在临界值的右边(即落在拒绝域),原假设即被拒绝;否则原假
设就被接受。在后一个情况下,正的样本均值就极有可能(也就是大于5%)是由样本
误差所致。如果样本均值大于临界值,我们就拒绝原假设,接受备择假设。由误差引
起该正的样本均值的概率会小于5%。
如果和该例一样备择假设是单边(单尾)的,那么接受区域就是负无穷到某区值,
而大于该正值的概率为5%。图A - 8中的临界值即为z 。当备择假设是双边的,5%的面
积就会平分于两个分布的极端,且各为2 . 5%。比较而言,双边检验要更严格一些(也
就是要拒绝原假设更难)。在单边检验中,我们可以根据原假设来预测样本均值偏差
的方向。这一事实将对备择假设更为有利。为了解决该问题,对于显著水平为5%的单
边检验,我们常用显著水平a/ 2=0 . 0 2 5的双边检验来代替。
假设检验需要对样本均值、样本方差等检验指标的概率分布作出必要的评价。为
此,我们需要对所分析随机变量的概率分布作出一定的假设。这样的前提假设是原假
设整体的一部分,而且常常是一个隐含的条件。
在本例中我们假设股票的超额收益服从正态分布。检验指标的分布是从指标的数
学定义和随机变量概率分布的假设中推出的,这里我们的检验指标是样本均值。
把所有观测值加总(T=6 8),然后乘以1 /T=1 / 6 8,所得的平均值即为样本均值。
每一个观测值都是一个随机变量,它们独立地服从同一个期望为
、标准差为的概率分布。所有观测值和的期望就是T个期望(都等于)的和,除以T后即为个体均值的
估计。计算结果为8 . 5 7%,其等于实际期望值加上样本误差。在原假设成立的条件下,
实际期望值为零,于是整个8 . 5 7%都是样本误差。
为了计算样本均值的方差,我们假定所有观测值相互之间是独立的,或者说是不
相关的。因此和的方差即为方差的和,也就是个体方差乘以T。但是,由于我们对和
一般要进行乘以1 /T的处理,因此我们需要对方差和T
除以T2。结果我们得到样本均
值的方差即为个体方差除以T。样本均值的标准差,一般称为标准误差,为:1/2 1/2 0.209 0
(样本均值) = .. è T12 . 2.÷ . = . è . T12 T 2.÷ == = 0.025 3 (A-2 7). T
我们的检验指标具有2 . 5 3%的标准偏差,而且,似乎观测值的数目越大,期望估
计的标准误差就越小。但是,注意“方差”下降的比例较大,为T=6 8;而“标准误差”
下降的比例仅为T = 8 . 2 5,该数值显然较小。
我们得到了样本均值8 . 5 7%和其标准差2 . 5 3%,而且知道在原假设成立的条件下其
服从正态分布,现在就可以进行检验了。我们想要做的是确定8 . 5 7%是否已经足够地
大于零。我们先使检验指标标准化,这个过程就是我们对指标减去原假设中的期望值,
然后再除以它的标准偏差。现在这个标准化的指标就可能同标准正态表中的正值进行
比较了。我们想问以下不等式是否成立:R - E(R) > z
还有一个问题需要解决。检验指标的正态性假设是完全成立的,因为它是许多正
态分布随机变量(根据收益的假设)的加权和;因此它也是服从正态分布的。但是,
以上的分析步骤要求我们知道其方差,而这里我们只是用样本方差来作为实际方差的估计。
该问题的解决是比较简单的,只需把标准正态分布替换成学生t分布(S t u d e n t - t)即
可。和正态分布一样,t分布是对称的。它依赖于自由度,数值上等于观测数目减1。
因此,我们只要把z 替换成t ,T-1即可。
现在的检验变成:R - E( R) > ta,T-1
当我们把样本数据代入上式后,左边就是一个标准化的检验指标,而右边是从t分
布表中得到的=0 . 0 5,T-1 = 6 8-1 = 6 7的t值。我们想知道的是该不等式是否成立。如果
成立,我们就以5%的显著水平拒绝原假设;如果不成立,我们就不能拒绝原假设(在
该例中,t0 . 0 5,6 7= 1 . 6 7)。我们发现:0.085 7 - 0 = 3.39 > 1.67 0.025 3
在该例中不等式成立,因此我们拒绝原假设,并认为备择假设正确,即存在正的
风险溢价。
如果以1 9 6 5年至1 9 8 7年的数据对假设再进行一次检验,你可能会产生一些疑问。
该期间的样本均值为3 . 1 2%,样本标准差为1 5 . 5 7%,自由度为2 3-1=2 2,这些数字是
否给了你第二种看法?
回归系数的t检验
假设我们以简单回归模型(等式A - 2 1)来描述政府长期债券资产组合与股市指数
之间的关系。利用表A - 3中的样本数据,我们回归的估计结果为(%每年):
a=0.991 3,b=0.072 9,R2=0.032 1
我们对这些数字的解释如下:对于当市场指数超额收益为零的时期,我们期望债
券能获得9 9 . 1 3个基本点的超额收益,这是截距的作用。对于斜率来说,只要每年股票
资产组合有1%的收益。债券资产组合就应该能多获得7 . 2 9个基本点的收益。在样本期
内,股权的平均风险溢价为8 . 5 7%。因此债券的样本平均为0.991 3+(0.072 9×8 . 5 7)