图像和视频质量评估指标分为全参考和无参考两类,LPIPS、SSIM、PSNR 是最常用的全参考指标。
全参考图像质量评估
基于像素差异
| 指标 | 公式 | 说明 |
|---|---|---|
| MSE | $\frac{1}{mn}\sum[I(i,j) - K(i,j)]^2$ | 值越小越好 |
| PSNR | $10 \cdot \log_{10}(\frac{MAX_I^2}{MSE})$ | 值越大越好 |
基于结构相似性
SSIM(Structural Similarity Index):比较亮度、对比度、结构三个方面。值越大越好,1 表示完全相同。
MS-SSIM:多尺度 SSIM,更好评估不同观看距离下的感知质量。
基于感知
LPIPS:利用预训练 CNN 提取特征计算相似度。值越小越好,与人类感知相关性极高。
全参考视频质量评估
| 指标 | 说明 |
|---|---|
| PSNR-AVG/SSIM-AVG | 逐帧计算平均值 |
| VMAF | Netflix 开源,融合多指标,视频感知质量黄金标准 |
无参考质量评估
| 指标 | 说明 |
|---|---|
| NIQE | 基于自然场景统计,无需原图 |
| 深度学习模型 | CNN/Transformer 直接预测质量分数 |
生成模型专用指标
| 指标 | 用途 |
|---|---|
| Inception Score (IS) | 生成图像多样性和清晰度 |
| Fréchet Inception Distance (FID) | 生成与真实图像分布距离 |
指标选择建议
| 指标 | 类型 | 优点 | 适用场景 |
|---|---|---|---|
| PSNR/SSIM | 全参考 | 计算快 | 初步验证 |
| LPIPS | 全参考 | 感知高度相关 | 超分辨率、图像修复 |
| VMAF | 全参考 | 视频黄金标准 | 视频编码评估 |
| NIQE | 无参考 | 无需原图 | 无原图时监控 |
最佳实践:同时报告 PSNR、SSIM 和 LPIPS,最终配合主观评价验证。
张芷铭的个人博客
Comments