似然函数和概率分布函数是统计推断的核心概念。概率分布描述随机变量的分布行为,似然函数则基于观测数据推断模型参数。

概率分布函数 (PDF)

概率分布函数描述随机变量在特定取值下的概率。

离散型随机变量

概率质量函数(PMF)定义:

满足:

连续型随机变量

概率密度函数(PDF) 定义:

满足:

示例: 标准正态分布的概率密度函数:

似然函数 (Likelihood Function)

似然函数基于观测数据估计参数,是参数估计的核心工具。

定义

给定数据样本 和概率密度函数 ,似然函数定义为:

最大似然估计 (MLE)

通过最大化似然函数估计参数:

实际应用中取对数似然:

示例: 正态分布 的似然函数:

区别与联系

概念概率分布函数 (PDF)似然函数 (LF)
输入参数 已知数据 已知
输出数据的概率分布参数的”可能性”
方向参数 → 数据数据 → 参数
用途描述随机现象估计未知参数

形象比喻: 掷硬币 10 次,7 次正面。

  • 概率分布函数:给定正面概率 ,计算 7 次正面的概率
  • 似然函数:给定 7 次正面,推断最可能的

总结

  • 概率分布函数:描述随机变量的分布,是正向建模过程
  • 似然函数:基于观测数据推断参数,是逆向推理过程

两者在统计推断中相辅相成:概率分布函数描述现象,似然函数估计参数。