张芷铭的个人博客

Hu不变矩

Hu 不变矩 是由 Hu 在 1962 年提出的一种基于图像矩的形状特征提取方法。它由七个不变矩组成,这些矩具有旋转、平移和尺度不变性,常用于图像的形状识别和分类。

Hu 不变矩的定义:

Hu 提出了 7 个不变矩,这些矩都是基于图像的中心矩(中央矩)。对于图像的中央矩 $M_{pq}$,它的计算公式为:

$$

M_{pq} = \sum_x \sum_y (x - \bar{x})^p (y - \bar{y})^q I(x, y)

$$

其中,$(x, y)$ 是像素位置,$I(x, y)$ 是像素值,$\bar{x}$ 和 $\bar{y}$ 是图像的质心(即图像的均值坐标)。

Hu 提出的七个不变矩如下:

  1. $\eta_1$:代表图像的归一化矩,包含图像的面积。

  2. $\eta_2$:图像的边缘的弯曲度或形状的复杂度。

  3. $\eta_3$:描述图像的对称性和形状的稳定性。

  4. $\eta_4$:图像边缘的另一个复杂度度量,和图像的大小、形状相关。

  5. $\eta_5$:主要描述图像中线性对称的特征。

  6. $\eta_6$:体现图像的扭曲程度。

  7. $\eta_7$:与图像的旋转、对称相关。

这些矩都对旋转、缩放、平移具有不变性,即不受这些变换的影响。

计算公式:

Hu 矩的计算涉及图像的低阶和高阶矩。公式较为复杂,需要首先计算图像的中央矩,然后进行一些归一化和转换操作,最终得到7个不变矩。

应用:

形状识别:Hu 不变矩可以用于图像中的物体、手写字符、面部识别等形状识别任务。

字符识别:在 OCR(光学字符识别)中,Hu 矩常用来提取字符的形状特征。

机器视觉:Hu 矩也广泛应用于工业检测和机器视觉系统中的目标识别和分类。

💬 评论