似然函数和概率分布函数是统计推断的核心概念。概率分布描述随机变量的分布行为,似然函数则基于观测数据推断模型参数。
概率分布函数 (PDF)
概率分布函数描述随机变量在特定取值下的概率。
离散型随机变量
概率质量函数(PMF)定义:
满足: 且 。
连续型随机变量
概率密度函数(PDF) 定义:
满足: 且 。
示例: 标准正态分布的概率密度函数:
似然函数 (Likelihood Function)
似然函数基于观测数据估计参数,是参数估计的核心工具。
定义
给定数据样本 和概率密度函数 ,似然函数定义为:
最大似然估计 (MLE)
通过最大化似然函数估计参数:
实际应用中取对数似然:
示例: 正态分布 的似然函数:
区别与联系
| 概念 | 概率分布函数 (PDF) | 似然函数 (LF) |
|---|---|---|
| 输入 | 参数 已知 | 数据 已知 |
| 输出 | 数据的概率分布 | 参数的”可能性” |
| 方向 | 参数 → 数据 | 数据 → 参数 |
| 用途 | 描述随机现象 | 估计未知参数 |
形象比喻: 掷硬币 10 次,7 次正面。
- 概率分布函数:给定正面概率 ,计算 7 次正面的概率
- 似然函数:给定 7 次正面,推断最可能的 值
总结
- 概率分布函数:描述随机变量的分布,是正向建模过程
- 似然函数:基于观测数据推断参数,是逆向推理过程
两者在统计推断中相辅相成:概率分布函数描述现象,似然函数估计参数。