上海网站建设 建站猫/关键词优化哪家好

第二章一共是两个部分,共轭先验分布与充分统计量。今天就先复习共轭先验分布。
我们会介绍一下基本概念,然后说一说课本正文里出现的共轭先验分布以及我作业做错的共轭先验分布,问题主要出在定义域上。大家不要重蹈我的复辙o(╥﹏╥)o。
什么是共轭?
我第一接触“共轭”是在高一的第四节数学课。宝爷介绍了“对勾函数”
大一大二学数分我也没有去查共轭到底是什么意思。直到今天学贝叶斯,又碰到了“共轭”,才想起来自己不知道什么叫“共轭”。于是去问了度娘,度娘告诉我
共轭在数学、物理、化学、地理等学科中都有出现。 本意:两头牛背上的架子称为轭,轭使两头牛同步行走。共轭即为按一定的规律相配的一对。通俗点说就是孪生。
所以有点像《神树》和《降临》阴阳双生的感觉哈哈哈哈。
在介绍共轭先验分布之前,我们先引入一个概念,叫做后验分布的核。
什么是后验分布的核?
我们在知道样本分布与
而
这里,
事实上任何一个概率分布都有一个核,就像每一首种曲风的曲子都有自己最突出的特点一样。假设
上一章的结尾,我们有说二项分布与贝塔分布拥有共同形式的因子
假设
则
什么共轭先验分布?
我们刚刚介绍了后验分布的核,它暗示了某一个具体的分布。同时我们也看到,如果样本是二项
设样本来自于总体
,其中
是参数。我们也已知
是
的先验密度函数。另外,我们记
是样本联合密度函数,也就是似然函数。 如果后验密度函数
与先验密度函数
来自于同一个分布族,则称
共轭于似然函数
,同时,称
是参数
的共轭先验分布。
注:
- 共轭先验分布是参数
的一个先验密度函数。
- 定义里的“共轭”体现在参数的先验分布与样本的似然函数上。就是说,参数的先验分布与样本的似然函数是一对。参数的先验分布只有在经过特定的样本更新之后,才能得到一个与先验同分布族的后验。打个牵强的比方,参数的先验分布是《神树》,样本的似然函数是《降临》,参数的后验分布是《新世界》;《神树》中的万物毁只有经过《降临》的洗礼才能迎来向善向上的《新世界》。
- 共轭先验分布可以简化计算——具体体现在:由于任何一个概率分布都有一个核,我们经过先验与样本核的运算之后得到后验的核,可以直接判断后验属于什么分布。
- 共轭先验可以为先验特征量(如先验均值,先验方差)、样本特征量(如样本均值,样本方差)、后验特征量(如后验均值,后验方差)三者之间的关系提供一个合理的解释。【具体我们待会儿会举例说明】
- 贝叶斯推断中不是任何时候都需要寻找参数的共轭先验的。假设我们已经知道了样本来自于某一个特定的分布,这个分布含有参数
,同时我们也知道
的先验信息。如果共轭于似然函数的先验恰好与我们的先验信息一致,那是再好不过的了;若不一致,我们不能强行使用共轭先验,而是应该另辟蹊径。
有哪些常见的共轭先验呢?
- 样本来自
(
已知),参数先验为
- 单样本情况
注意到先验分布均值为
2.多样本情况
注意到先验分布均值为
注:
以上两个情况中,后验均值并不是先验均值与样本均值的加权平均(即两个均值前边的系数相加不等于1),原因在于:参数
- 样本来自
(
已知),参数
先验为
同样也有后验均值为先验均值与样本均值的加权平均,后验方差的倒数为先验方差倒数与样本均值方差倒数之和。所以,后验分布的精度比样本均值分布的精度以及先验分布的精度都更大,因此用后验分布做统计推断的结果就会更好。
- 样本来自
(
已知),参数
先验为
- 样本来自
,参数
先验为
先验均值为
- 样本来自均匀分布
,参数
先验为
这题就是我作业错的题,因为均匀分布的样本是有取值范围的,
- 样本来自
,参数
先验为
然后重新整理一下
今天就复习到这里啦~我们上边都是通过观察核来判断后验从属的分布,确实写起来也比较简单一些。明天会继续第二章的第二部分,充分统计量,它也可以用来计算后验分布。