定义

正态分布又名高斯分布(Gaussian distribution),是一种常见的连续概率分布.正态分布在统计学上非常重要,经常用来在自然和社会科学来代表一个不明的随机变量.正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线.

若随机变量 $X$ 服从一个位置参数为 $\mu$ ,尺度参数为 $\sigma$ 的正态分布,记为 $X ~ N(\mu, \sigma^2)$.

概率密度函数为:

$f(x) = {1\over \sqrt{2\pi}\sigma}e^{-{(x-\mu)^2}\over 2\sigma^2}$

图像为:

则累积分布函数为:

$F(x) = {1\over \sqrt{2\pi}\sigma}\int_{-\infty}^x e^{-{(t-\mu)^2}\over 2\sigma^2}dt$

图像为:

其中期望 $\mu$ 决定了分布的位置,标准差 $\sigma$ 或者方差 $\sigma^2$ 决定了分布的幅度.

标准状态分布

通常情况下,我们把期望 $\mu$ 为 0,方差 $\sigma^2$ 为 1 的正态分布,叫做标准正态分布.

性质

  • 密度函数 $f(x)$ 关于平均值线 $x=\mu$ 对称.
  • 平均值与它的众数以及中位数同一数值.
  • 函数曲线下 68.268949% 的面积在平均数左右的一个标准差 $\sigma$ 范围内.
  • 95.449974% 的面积在平均数左右的两个标准差 $\sigma$ 范围内.
  • 99.730020% 的面积在平均数左右的三个标准差 $\sigma$ 范围内.
  • 99.993666% 的面积在平均数左右的四个标准差 $\sigma$ 范围内.
  • 函数曲线的拐点位置在离平均数一个标准差 $\sigma$ 的位置.

举例

  • 某高校男生的身高.
  • 计算学生智力高低的概率.

参考

  1. 正态分布-wiki
  2. 正态分布(高斯分布)- CSDN
  3. 概率论:高斯/正态分布 - CSDN
  4. 透彻理解高斯分布 - 百度百科