其他
深度学习必须掌握的 13 种概率分布
转自:深度学习前沿
作为深度学习从业者,你需要知道概率分布相关的知识。这里有一份最常见的基本概率分布教程,大多数和使用 python 库进行深度学习有关。
一、概率分布概述
共轭意味着它有共轭分布的关系。 多分类表示随机方差大于 2。
n 次意味着我们也考虑了先验概率 p(x)。
为了进一步了解概率,我建议阅读 [pattern recognition and machine learning,Bishop 2006]。
先验概率 p(x)不考虑伯努利分布。因此,如果我们对最大似然进行优化,那么我们很容易被过度拟合。
利用二元交叉熵对二项分类进行分类。它的形式与伯努利分布的负对数相同。
参数为 n 和 p 的二项分布是一系列 n 个独立实验中成功次数的离散概率分布。 二项式分布是指通过指定要提前挑选的数量而考虑先验概率的分布。
多伯努利称为分类分布。 交叉熵和采取负对数的多伯努利分布具有相同的形式。
β分布与二项分布和伯努利分布共轭。 利用共轭,利用已知的先验分布可以更容易地得到后验分布。 当β分布满足特殊情况(α=1,β=1)时,均匀分布是相同的。
dirichlet 分布与多项式分布是共轭的。 如果 k=2,则为β分布。
如果 gamma(a,1)/gamma(a,1)+gamma(b,1)与beta(a,b)相同,则 gamma分布为β分布。 指数分布和卡方分布是伽马分布的特例。
k 自由度的卡方分布是 k 个独立标准正态随机变量的平方和的分布。
卡方分布是 β 分布的特例
代码:https://github.com/graykode/distribution-is-all-you-need/