智库文档所有分类

（财务知识）北京大学经济学院极大似然估计.doc

下载

卓越管理

8页 | 493KB | 0次下载 |

0.0

(0人评价)

我要评价：

投诉举报

用手机看文档

扫一扫,手机看文档

下载

开通VIP

（财务知识）北京大学经济学院极大似然估计第二章极大似然估计（MLE）第 0节基础知识回顾：OLS 一．例子假设一个基金的投资组合(“基金XXX”)的超额回报和股市指数的超额回报，有如下的数据: Y ear, t Excess return = rX X X ,t – rft Excess return on m arket index = rm t - rft 1 2 3 4 5 直觉上，该基金的beta(beta测量股票对股市指数的反应)应该是一个正数，我们希望证实这种关系。画这2个变量的散点图：对于一条直线，可以用以下的方程,来拟合数据。 y=a+bx 不过这个方程(y=a+bx)是完全确定的，与实际情况不符合。要在这个方程里加入一个挠动项。 yt=+xt+ut 式中t=1,2,3,4,5 用直线来拟合数据最常用的方法是普通最小二乘法(ordinaryleastsquares，OLS)：取每个数据点到拟合直线的垂直距离，选择参数、，使得平方距离最小化(leastsquares)。挠动项能够反映数据的一些特征:我们经常会忽略一些影响yt的因素，不可能把影响yt的所有的的随机因素都在模型中考虑。求解两个参数：这就是OLS。整理得到：在上例中，把数据代入公式得：根据这个结果，如果预期下一年的市场回报将会比无风险回报高20%，那么你预期基金XXX的回报将会是多少? ˆ iy 二．概念：线性和非线性运用OLS,要求模型对参数(和)是线性的。“对参数线性”意味着参数之间不能乘、除、平方或n次方等。在实际中变量之间的关系很有可能不是线性的。某些非线性的模型可以通过变换转化为线性模型，例如指数回归模型：令yt=lnYt及xt=lnXt 但是，很多模型从本质上讲是非线性的，例如：三．OLS的优良性质在OLS回归模型中，对ut(不可观测的误差项作如下假设)作如下架设: 解释 (ut)=0误差项的均值为零 (ut)=2误差项的方差是常数 (ui,uj)=0误差项相互独立的 (ut,xt)=0误差项和解释变量不相关以上假设成立时，OLS有如下三个良好性质。一致性最小二乘估计是一致的。这意味着，当样本数趋向于无穷大时，估计值将收敛于它们的真实值（需要假设E(xtut)=0和Var(ut)=2<）无偏性最小二乘估计式是无偏的，意味着估计值的期望等于真实值. E()=andE()= 为了保持无偏性需要假设E(ut)=0和Cov(ui,uj)=0。无偏性比一致性更强。有效性在所有的线性无偏的估计式中，OLS估计式的方差是最小的，即OLS估计的参数与真实值 出现大的偏差的概率最小。四．统计推断用标准误差来度量参数估计值的可靠程度。在假设 1-4成立的条件下，估计值的标准误差可以写成其中 s是残差的标准误差。假设utN(0,2)，则OLS统计量服从正态分布： N(,Var()) N(,Var()) 如果挠动项不服从正态分布，最小二乘的估计式还是正态分布吗？样本数足够大时，答案是：是的。从估计式和构造标准正态分布：但是，由于不知道var()和var(),我们用下面的分布加以替代。 t分布和标准正态分布之很相似。这 2种分布都是对称的，并且均值都为零。t分布多了一个参数：自由度(样本总观测数-2)。当一个 t分布的自由度是无穷大时，它等于标准正态分布。用置信区间进行假设检验在显著性检验中，下面的情况下接受零假设 H0：=*，即统计量落在非拒绝域内， + % rejection % rejection region f(x) 如果我们能够以 5%(或者 10%)的置信水平拒绝某个检验的零假设，则称这个检验在统计上是显著的. 在这个过程中，我们可能会犯2种错误: 1.当H0是正确的时候，我们拒绝了它，第一类错误. 2.当H0是错误的时候，我们没有拒绝它，第二类错误. 犯第一类错误的概率是.回忆显著性水平的含义：当零假设是真的情况下，统计量落在拒绝域内的概率只有。但第二类错误的概率常常不能确定。一般而言，当我们降低第一类错误概率的同时也提高了第二类错误的概率。第一节引言考虑 ARMA模型：（1）其中。前面我们假定知道总体参数，此时利用过程（1）进行预测。本章我们要研究在仅能观测到序列的情况下，如何估计。估计方法为极大似然估计。令表示总体参数向量。假定我们观察到一个样本量为的样本。写出样本的联合概率密度函数：（2）这是观察到样本发生的概率。使得“概率”最大的值就是最优估计——这就是极大似然估计的思想。极大似然估计需要设定白噪声的分布。常常假定是高斯白噪声，则得到的函数为高斯似然函数。极大似然估计的步骤： 1）写出似然函数（2）。 2）利用求极大值方法求使得函数值最大的值。第2节高斯过程的似然函数一．计算高斯过程似然函数高斯过程的表达式为（3）其中。参数为。观察值的均值和方差分别为和。因为，因此也是高斯分布。其概率密度函数为（4）对于第二个观察值在观察到条件下的分布。根据（3），（5）此时，其概率密度函数为（6）观察值和的联合密度函数就是（4）和（6）的乘积：（7）同样（8）（9）一般地，（10）则前个观察值的联合密度为（11）全部样本似然函数为（12）进行对数变换，得到对数似然函数：（13）将（4）和（10）代入（13），得到（14）二．似然函数的矩阵表示观察值写成向量形式为：（15）可以看作是为高斯分布的单个实现。其均值为（16）这里。表示成向量形式为：其中表示（16）的右边的向量。的方差协方差矩阵为：（17）其中（18）该矩阵中的元素对应于的自协方差。将样本看作由分布的一个抽样，似然值可根据多元高斯密度公式直接写成：其对数似然值为：这本质上和（14）是相同的。理论上，对方程（14）求导并令导数为零，就可得到参数向量。而在实践当中，往往得到的是的非线性方程。此时求解需要格点（grid）搜索等数值优化方法。四．条件极大似然（）函数如果将的值看作确定性的，然后最大化以第一个值为条件的似然值，这种方法称为条件极大似然函数。此时最大化目标为：等价于最小化：这与回归的结果一样。已知参数估计值，下一步关于求导数得到这也是 OLS估计下的残差方差。条件极大似然估计的特点： 1．易于计算。 2．样本量足够大，则第一个观测值的影响可以忽略。第三节高斯 ARMA过程的条件似然函数一．条件似然函数其中。参数向量为。以前个观察值为条件的对数似然函数为：求使得最大化问题转变为最小化：非高斯时间序列的极大似然估计（拟极大似然估计） 1.如果残差过程非高斯的，使用高斯对数似然函数得到的估计为总体参数的一致估计。 2．拟极大似然估计得到的系数的标准差不正确。二．条件似然函数对于高斯过程其中。表示要估计的总体参数。如果已知，则其概率密度函数为：如果已知，则：给定观察值，则就是确定的：于是已知的话，可由下式求出：通过迭代法由求出整个序列：样本条件对数似然函数为三．高斯过程的条件似然函数对于过程假设前项的全为零：于是其中。令表示向量。条件对数似然函数为：其中。四．的条件似然函数对于高斯过程其中。参数向量为。自回归过程的似然函数的近似以的初始值为条件，移动平均过程似然函数的近似以的初始值为条件。过程以和的初始值为条件。假设初始值和给定，则利用实现，迭代得到：可得的序列。则条件似然函数为：五，选择模型的标准 1）AIC准则（Akaike信息标准） 2）BIC准则 3）HQ准则第四节极大似然估计的统计推断一．极大似然估计参数的标准差如果样本量足够大，则极大似然估计近似表示为：其中代表真实参数向量。矩阵称为信息矩阵，其估计值为：其中为对数似然函数。二．似然比（LR）检验假设原假设：参数向量中存在个限制（例如某些系数等于零）。分别求出无限制极大似然估计、限制情况下的极大似然估计。明显 L()>L()，检验统计量为： 2[L()-L()] 利用显著性检验法和置信区间法可以对原假设进行检验。标准差检验（Wald检验）需要计算无限制极大似然估计。似然比检验既要计算有限制极大似然估计量，又要计算无限制极大似然估计量。感谢阅读