当前位置:网站首页 > 技术博客 > 正文

mdp值迭代



本篇随笔主要参考Steven M. Kay的《Fundamentals of Statistical Signal Processing: Estimation Theory》第七章节最大似然估计,用作为平时的学习记录。在此我们主要来分析两种迭代算法,即Newton-Raphson迭代法和得分法。相对于K的论述,本文在此补充了一些详细的推理过程和计算步骤。       

        MLE的一个独特的优点在于对于一个给定的数据集,总能在数值上求出他。(因为当一个已知函数即似然函数取最大值时,MLE就可确定下来)。

        如果的θ可允许范围在区间[a,b]中(控制在有限区间内),那么只需在此区间上使得p(x;θ)最大即可,采用网络搜索法;(对于给定的数据集,只要θ 值的间隔足够小,我们就保证可求出其MLE;当然对于一个新的数据集,因为似然函数肯定会改变,所以将不得不重复使用网格搜寻法)

remark:有些情况下我们很难知道似然函数和参数θ之间函数是什么样的,参数的取值范围、似然函数关于参数θ的单调性、极值、最值等可能会很复杂难以把握。

        如果θ的范围没有控制在有限范围内,那么从数值计算角度来看,网络搜索法也许是不可行的,这种情况下可通过迭代法求最大值。此处的迭代法可以理解为一种数值最大化的技术。迭代法也存在一些问题:如果设定的初始值接近于真实最大值,那么这些方法可求出MLE,否则迭代就不会收敛,或者只会收敛到局部最大值,即事先不知道它们是否收敛,收敛的话所求的是否为MLE。        

先给出问题模型:WGN中的指数信号

        观测数据为  (其中w[n]是均值为0方差为的WGN)待估计量为参数r,即指数因子(r>0),r的MLE就是使似然函数最大的r值。

概率密度函数(PDF)为:

等效为使式子最小的r值。

对于J(r)求导,并令它等于零,

这是一个r的非线性方程,不能直接求解

接下来以Newton-Raphson法得分法两种迭代法入手解决该例题。(一般还会介绍EM数学期望最大算法,本文暂且不做介绍)

一、Newton-Raphson迭代法:

通过求导函数的零值而使对数似然函数最大,

    (7.26)

接着,使用迭代方法求解此方程,令

同时,假设我们有一个求解(7.26)式的初始猜测值,将该初始猜测值称为θ0。因此,如果g(θ)在θ0附近是近似线性的,我们就能将它近似表示为

remark:对于该式,我们要联想到高等数学中的微分思想来理解。

利用上式,求解零值所对应的θ1.(因此,令g(θ1)=0并解出θ1),具体计算步骤如下,

利用这个新的猜测值θ1作为线性化点,对函数g在此进行线性化,并重复前面的方法来求新的零值。这个猜测值序列将收敛到g(θ)的真零值

        总而言之,Newton-Raphson迭代法是根据前一个猜测值,利用下式求出新的一个猜测值。

我们可以参考下图以便有更为直观的理解。(tag:上述数学式子中的dg(θ)/dθ即为下图中两个theta之间的斜率,从图中我们可以发现随着不断迭代,斜率越来越小、函数曲线越来越趋向于水平,我们越来越能够逼近所谓的真零值

正如所期望的,迭代在处收敛,并且根据上式和,我们可计算得MLE,

 注意:关于Newton-Rapson迭代法我们还需注意两点。一是,迭代可能不收敛(修正项的起伏可能很大);二是,即使迭代收敛,求得的点也可能不是全局的最大值,而可能只是一个局部的最大值或者甚至是一个局部最小值(此情况可考虑采用多个起始点)。

在上述问题模型“WGN中的指数信号”中应用Newton-Rapson方法(具体计算步骤如下):

先计算处对数似然函数及其关于参数r的一阶、二阶导数,

 代入上述通过Newton-Rapson法求得MLE的公式中,求得带估计参数r的MLE,

 二、得分法

        事实上,对于独立同分布(IID)样本,根据大数定理(此处指的是辛钦大数定理),对数似然函数对参数的二阶求导可近似约等于负的Fisher信息矩阵。具体如下。

首先,我们说明辛钦大数定理

        设随机变量相互独立,服从同一分布且具有数学期望,则序列依概率收敛于,即.

        套用辛钦大数定理,相互独立,服从同一分布且具有数学期望,则有.

于是我们有如下替换,

 利用它的期望值代替其二阶导数,大概率会增加迭代的稳定性。

 在上述问题模型“WGN中的指数信号”中应用得分法(上述MLE式子)(具体计算步骤如下):

 3、两种算法扩展至矢量情况

        以上关于Newton-Rapson法和得分法都是在参数为标量情况下进行讨论的。下面将这两种算法扩展至矢量情况。

(1)Newton-Rapson迭代法

 其中对数似然函数的Hessian矩阵中各元素为,

 为了避免求逆矩阵,可重写上式为

 通过同时求解p个联立线性方程组,新的迭代能通过前一个迭代求出。

(2)得分法

利用负的Fisher信息矩阵代替Hessian矩阵,

同样,在矢量参数情况下,这两种方法也会遇到收敛问题。

参考文献

[1]StevenM.Kay. 统计信号处理基础:估计与检测理论[M]. 电子工业出版社, 2011.

版权声明


相关文章:

  • monkey软件测试教程2025-09-20 09:30:01
  • matlab高通滤波器2025-09-20 09:30:01
  • c++ exe反编译2025-09-20 09:30:01
  • 鸿蒙开发2025-09-20 09:30:01
  • 什么是空间索引?有哪些空间索引方法?2025-09-20 09:30:01
  • 操作系统题库及答案2025-09-20 09:30:01
  • java注解@autowired2025-09-20 09:30:01
  • 简述makefile的作用2025-09-20 09:30:01
  • vc++6.0断点调试2025-09-20 09:30:01
  • 异步fifo的verilog代码2025-09-20 09:30:01