介绍

多项式分布是二项分布的推广,也是一种离散概率分布。二项分布的典型例子是扔硬币,硬币正面朝上概率为 $p$, 重复扔 $n$ 次硬币,$k$ 次为正面的概率即为一个二项分布概率。而多项分布就像扔骰子,有 $6$ 个面对应 $6$ 个不同的点数。二项分布随机事件 $X$ 只有 $2$ 种取值,而多项分布的随机事件 $X$ 有多种取值,多项分布的概率公式为:

$P(X_1=x_1,X_2=x_2,\cdots,X_k=x_k) = \begin{cases} {n!\over x_1!\cdots x_k!} p_1^{x_1}\cdots p_k^{x_k} &when \sum_{i=1}^k x_i = n \\ 0 & otherwise.\end{cases}$

其中,$\sum_{i=1}^k p_i = 1$。

由来

二项分布的系数 $C_n^k$ 是在 $n$ 次试验中抽取 $k$ 个出现为正,而多项式的系数则是进行 $k$ 次抽取,每次抽取 $C_{n-x}^x$。其中 $k$ 为抽取次数,也是多项式的项数。而 $x$ 为出现某一项的次数,$n$ 试验总次数。

多项式定理

$(a_1+a_2+\cdots+a_k)^n = (a_1+x_2+\cdots+a_k)\cdots(a_1+a_2+\cdots+a_k), 从每个因式中抽取,a_1^{x_1} \cdot a_2^{x_2} \cdots a_k^{x_k}, 抽取 C_n^{x_1}\cdot C_{n-x_1}^{x_2} \cdots = {n! \over x_1!\cdot x_2!\cdots x_k!}$

多项式分布通式:${n!\over x_1!\cdot x_2!\cdots x_k!}a_1^{x_1}\cdot a_2^{x_2}\cdots a_k^{x_k}$, 其中 $x_1+x_2 + \cdots + x_k = n$,当 $k=2$ 时,就是二项分布。

期望

$E[X_i] = np_i$

方差

$D(X_i) = np_i(1-p_i)$

参考

  1. 多项式分布的理解概率公式的理解
  2. 深度学习必懂的13种概率分布
  3. 机器学习中常见的几种概率分布
  4. 多项式分布(The Multinomial Distributions)