最大期望演算法(英語:Expectation-maximization algorithm,又譯期望最大化算法)在统计中被用于寻找,依赖于不可观察的隐性变量的概率模型中,参数的最大似然估计。

统计计算中,最大期望(EM)算法是在概率模型中寻找参数最大似然估计或者最大后验估计算法,其中概率模型依赖于无法观测的隐变量。最大期望算法经常用在机器学习计算机视觉数据聚类(Data Clustering)领域。最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大化(M),最大化在E步上求得的最大似然值来计算参数的值。M步上找到的参数估计值被用于下一个E步计算中,这个过程不断交替进行。

历史

编辑

最大期望值算法由亞瑟·P·丹普斯特英语Arthur P. Dempster南·萊爾德英语Nan Laird唐納德·魯賓英语Donald Rubin在他们1977年发表的经典论文中提出。他们指出此方法之前其实已经被很多作者「在他们特定的研究领域中多次提出过」。

介绍

编辑

EM算法用于在方程不能直接求解的情况下寻找统计模型的(局部)最大似然参数。这些模型中较为典型的是含有潜变量,未知参数并且已知观测数据的模型。也就是说,要么数据中存在缺失的值,要么模型可以通过假设存在更多未观测到的数据点来更简单地表示。以混合模型(Mixture Model)为例,通过假设每个观察到的数据点都有一个对应的未观察到的数据点,也可以说是潜在变量,来指定每个数据点所属的混合部分,这样就可以更简单地描述混合模型。

EM简单教程

编辑

EM是一个在已知部分相关变量的情况下,估计未知变量的迭代技术。EM的算法流程如下:

  1. 初始化分布参数
  2. 重复直到收敛:
    1. E步骤:根据参数的假设值,给出未知变量的期望估计,应用于缺失值。
    2. M步骤:根据未知变量的估计值,给出当前的参数的极大似然估计。

最大期望过程说明

编辑

我们用 表示能够观察到的不完整的变量值,用 表示无法观察到的变量值,这样  一起组成了完整的数据。 可能是实际测量丢失的数据,也可能是能够简化问题的隐藏变量,如果它的值能够知道的话。例如,在混合模型中,如果“产生”样本的混合元素成分已知的话最大似然公式将变得更加便利(参见下面的例子)。

估计无法观测的数据

编辑

 代表矢量 :  定义的参数的全部数据的機率密度函數(连续情况下)或者機率質量函數(离散情况下),那么从这个函数就可以得到全部数据的最大似然值,另外,在给定的观察到的数据条件下未知数据的条件分布可以表示为:

 

参见

编辑

参考文献

编辑

📚 Artikel Terkait di Wikipedia

戴克斯特拉算法

戴克斯特拉算法(英語:Dijkstra's algorithm),又稱迪杰斯特拉算法、Dijkstra算法,是由荷兰计算机科学家艾茲赫尔·戴克斯特拉在1956年发现的算法,并于3年后在期刊上发表。戴克斯特拉算法使用类似廣度优先搜索的方法解决赋权图的单源最短路径问题。

数据增强

Laird, N.M.; Rubin, D.B. Maximum Likelihood from Incomplete Data Via the EM Algorithm. Journal of the Royal Statistical Society. Series B (Methodological)

吴建福

Statistics》(统计学年鉴)上发表了题为《On the Convergence Properties of the EM Algorithm》的开创性论文,修正并完善了EM算法的收敛性理论,并扩展其适用模型范围,是该领域广为引用的重要成果。此外,他撰寫的的书《Experiments: Planning

K-平均算法

算法。一般情况下,都使用效率比较高的启发式算法,它们能够快速收敛于一个局部最优解。这些算法通常类似于通过迭代优化方法处理高斯混合分布的最大期望算法(EM算法)。而且,它们都使用聚类中心来为数据建模;然而k-平均聚类倾向于在可比较的空间范围内寻找聚类,期望-最大化技术却允许聚类有不同的形状。

佩尔·马丁-洛夫

Laird, N.M.; Rubin, D.B. Maximum Likelihood from Incomplete Data via the EM Algorithm. Journal of the Royal Statistical Society, Series B. 1977, 39 (1): 1–38

聚类分析

clustering, and derivations including the E-M algorithm and the variational view of the E-M algorithm. Ng, R.T. and Han, J. 1994. Efficient and effective

曾志彬

variance-covariance matrix in mapping quantitative trait loci when using the EM algorithm. Biometrics, 653-665.(http://www.jstor.org/stable/10.2307/2533965) Zhi-Bin

Transformer架构

高斯过程 相关向量机(RVM) 支持向量机(SVM) 迁移学习 微调 聚类分析 BIRCH CURE算法(英语:CURE algorithm) 层次 k-平均 Fuzzy 期望最大化(EM) 谱聚类 DBSCAN OPTICS HDBSCAN(英语:HDBSCAN) 均值飘移(英语:Mean shift)