当前位置: 首页 > news >正文

网站空间2G一年多少钱/手机打开国外网站app

网站空间2G一年多少钱,手机打开国外网站app,佛山做网站公司排名,石家庄网站建设推广公司哪家好1.EM算法详解 EM算法:Expectation Maximization Algorithm EM算法用于含有隐变量(hidden variable)的概率模型参数的极大似然估计,又称极大后验概率估计。 EM算法是一种迭代算法,每次迭代由两步组成:E步-求期望(Expectation)&…

1.EM算法详解

EM算法:Expectation Maximization Algorithm

EM算法用于含有隐变量(hidden variable)的概率模型参数的极大似然估计,又称极大后验概率估计。

EM算法是一种迭代算法,每次迭代由两步组成:

    E步-求期望(Expectation);

    M步-求极大(Maximization);

所以这一算法称为期望-极大算法(Expectation Maximization Algorithm),简称EM算法

关于EM算法的数学基础知识,请详见前面博客:【机器学习】【EM算法】数学基础:(半)正(负)定矩阵+(严格)凹(凸)函数+(最大)似然函数+Hessian矩阵+Jensen不等式

在一般情况下EM算法是收敛的,但是不能保证收敛到全局最优

EM算法与初值的选择有关,不同的初始值EM孙发最终可能得到不同的参数估计值

EM算法在非监督学习中的应用

    监督学习由训练数据{(x1,y1),(x2,y2),……,(xn,yn)}学习概率分布P(Y|X)或者决策函数Y=f(X)作为模型,用于分类、回归、标注等任务。 这时候训练数据中的每个样本点由输入和输出对组成。

   有时训练数据只有输入没有对应的输出{(x1, ),(x2, ),……,(xn, )},从这样的数据学习模型称之为非监督学习问题。

    EM算法可以用于生成模型的非监督学习。生成模型由联合概率分布P(X, Y)表示,即我们可以认为非监督学习训练数据是联合概率分布产生的数据。X为观测数据,Y为未观测数据。

2.样本集实例详解

2.1求没有隐变量的概率模型参数的极大似然估计

EM算法可以求解含有隐变量的概率模型参数的极大似然估计,但是我们先看一个没有隐变量的样本集:


我们求A,B,C硬币的投出正面的概率:


则可以将0.4,0.5,0.6依次作为硬币A,B,C出现正面概率的最大似然估计

2.2求含有隐变量的概率模型参数的极大似然估计

上面的训练样本集,由于每个样本使用的硬币号未知,所以硬币号是样本中一个未知的变量,即每个样本都有一个隐变量。

根据2.1可知如果知道每轮使用的硬币号,很轻松可以求出每个硬币出现正面的概率。

但是2.2是硬币号为隐变量的样本集,你不知道每轮使用的硬币号,我们的任务还是估计每个硬币出现正面的概率,应该怎么求每个硬币出现正面的概率???

硬币号这个特征就是样本的一个隐含变量X,如果我们我们不知道X,就无法去估计PA,PB,PC。

而我们要估计PA,PB,PC,就必须先估计出X,但是要估计X,又必须先知道PA,PB,PC,好像我们进入了鸡生蛋和蛋生鸡的问题。

EM算法通过先随机初始化一组PA,PB,PC,用初始化的PA,PB,PC来估计X,然后用估计出的X,按照最大似然估计法则去估计新的PA,PB,PC,新的PA,PB,PC会更接近实际的PA,PB,PC数值。

Step1:然后用新估计出来的PA,PB,PC再估计X,

Step2:然后用估计出的X,按照最大似然估计法则去估计新的PA,PB,PC

如果PA,PB,PC仍和旧的PA,PB,PC相比不收敛就继续进行Step1-->Step2,直到PA,PB,PC收敛。

好,下面我们按照以上EM算法思路进行数学计算演示:

2.2.1随机初始化一组PA,PB,PC


2.2.2进行EM算法迭代计算直到PA,PB,PC收敛

已知每个硬币的出现正面概率初始值,可以求每轮使用不同硬币时正反面事件发生的概率


根据上面求出的每轮使用不同硬币时正反面事件发生的概率,计算每轮使用不同硬币的概率

现在我们有了每轮使用每个硬币的概率,则就相当于求出了隐变量X,则可以用估计出的隐变量X来重新估计每个硬币的正面概率即重新估计PA,PB,PC:



下面是第一次迭代计算后的概率模型参数值PA,PB,PC:


可知通过EM算法第一次迭代得到的新估计值相比初始化值更接近真实值。

因为新估计值和初始化值仍有变化,所以继续按照上面步骤继续迭代计算PA,PB,PC:

用新估计值作为初始值:

    PA=0.44076    PB=0.50024    PC=0.53888

    用新的PA,PB,PC估计X

    然后基于X重新估计PA,PB,PC,继续用新估计的PA,PB,PC作为初始值开新一轮的EM迭代计算,直到PA,PB,PC收敛。

2.2.3解释说明

    E步:用已有的PA,PB,PC,估计出了X的概率分布,这个步骤称为E步

    M步:用E步中估计出的X,按照最大似然概率法则来估计PA,PB,PC,这个步骤称为M步

    当M步估计出的PA,PB,PC收敛时EM算法才会结束(PA,PB,PC收敛差值小于自己给定的阈值时,可以判定EM算法停止)

    不可置疑的事实1:M步新估计出的PA,PB,PC一定会更接近真实的PA,PB,PC,即每次迭代得到的参数估值更接近真实数值

    不可置疑的事实2:EM算法迭代不一定收敛到真实的PA,PB,PC,即最终不一定收敛到全局最优

    不可置疑的事实3:PA,PB,PC的随机初始值影响最后收敛得到的PA,PB,PC和真实的PA,PB,PC的差距,如果初始值取的好最后收敛得到的PA,PB,PC就是完全等于真实的PA,PB,PC,如果取得初始值不够好的话,可能最后EM收敛得到的PA,PB,PC不等于真实的PA,PB,PC,但一定会更接近真实的PA,PB,PC。不一定收敛到真实的概率模型参数这是由最大似然“估计”的真实体现,要就不称之为“估计”了~。

3.参考文献

[1]李航.统计学习方法[J].2012.

[2]What is the expectation maximizationalgorithm.pdf

        链接(无密码):https://pan.baidu.com/s/1rgC9QtAUrebuUcNgbmn-qg

(end)

http://www.jmfq.cn/news/4747573.html

相关文章:

  • 网站做任务佣金/今天的热点新闻
  • 网站开发设计文案/关键词搜索神器
  • 住房建设部投诉网站/免费的外链网站
  • 电子工程建设/搜索引擎优化关键词选择的方法有哪些
  • wordpress信用卡收款/手机优化
  • 独立建站什么意思/网络推广自学
  • 网站备案证书下载密码忘了/今日资讯最新消息
  • 网站建设引擎/百度资源搜索
  • 活动发布类网站开发/营销软文范例500
  • 济南做网站/品牌网络推广
  • 在centos上做网站/谷歌推广方案
  • 建设网站企业邮箱/百度企业网盘
  • wordpress开通多站点好处/电子商务网站设计方案
  • 地方新闻网站好坏/怎样免费给自己的公司做网站
  • 常宁做网站/nba篮网最新消息
  • php网站开发价格/网络广告案例以及分析
  • wordpress客服插件/杭州专业seo
  • 永春网站建设/软文推广哪个平台好
  • 安阳做网站电话/怎么样做一个自己的网站
  • 沈阳网络关键词排名/windows优化大师的优点
  • 制作网站需要学什么软件/seo外包 杭州
  • 做论坛网站看什么书/备案查询官网
  • 建设部招标网 官方网站/百度投诉中心24人工客服电话
  • 网站被百度蜘蛛爬死了/nba在线直播免费观看直播
  • 企业为什么要自助建站/知乎推广渠道
  • 网上兼职做效果图网站/网站关键词提升
  • 网站建设国内外研究进展/网上推广培训
  • wordpress主题 大/seo网站平台
  • 源代码代做网站/百度搜索词热度查询
  • 添加网站备案号链接/营销培训课程