在计算机视觉技术生态中,图像分割技术扮演着至关重要的角色,它推动着世界向更好的未来发展。图像分割技术有着广泛的应用,是任何从事计算机视觉项目的人都应该理解的核心主题。本文将深入探讨图像分割,解释两种分割类型,并比较和对比实例分割和语义分割之间可能的区别。还将讨论语义分割和实例分割的应用场景。
图像分割是识别和分类图像中多个类别对象的任务。但如果深入研究分割,可能会感到困惑,因为不同类型的分割以及它们的工作原理之间存在相当大的差异。本文解释了分割的理论原理和抽象概念。为了准备图像数据进行分割任务,需要工具在像素级别标记数据。如果在这里创建一个分割项目,可以使用Roboflow Annotate应用智能多边形注释并创建训练数据集。然后,参考逐步指南,了解如何在自定义数据集上训练分割模型。
语义分割是一种技术,它使能够将数字图像中的每个像素与类别标签(如树木、标志牌、行人、道路、建筑物、汽车、天空等)关联起来。它也被认为是像素级别的图像分类任务,因为它涉及区分图像中的对象。重要的是要理解,语义分割对一个或多个类别的图像像素进行分类,而不是实际世界中的对象,这些对象在语义上是不可解释的。由于其复杂的工作机制,它是计算机视觉生态系统中的一个难题,因为对每个像素而不是对象进行分类,这与对象检测的情况不同。
语义分割的目标是在形成图像中不同类别之前提取特征。涉及的步骤如下:
注意:语义分割的步骤与图像分类有显著不同,后者只为整个图像分配一个类别。
医学诊断:用于检测X光、CT扫描、MRI扫描中的医学异常。
地理感知:用于从卫星图像中绘制土地使用图,并监测森林砍伐和城市化区域。
自动驾驶:用于准确检测车道、行人、交通标志、道路、天空和其他道路上的车辆。
实例分割是一种独特的图像分割形式,它涉及检测和描绘图像中出现的每个不同实例的对象。实例分割检测所有类别的实例,并具有划分任何段类的单独实例的额外功能。因此,它也被称为结合了目标检测和语义分割的功能。实例分割的输出格式更丰富,因为它为每个类别和该类别的每个实例创建了一个段图。简单地说,考虑有一张有狗和猫的图像。通过在该图像上运行实例分割模型,可以定位每只狗和猫的边界框,为每只狗和猫绘制分割图,并计算图像中有多少只狗和猫。
实例分割涉及在详细的像素级别识别对象的边界,这是一个复杂的任务。但正如之前看到的,实例分割包含两个重要部分:
注意:实例分割只区分每个类别中的所有实例;例如,它将每个人分成不同的类别。
医学领域:用于检测和分割大脑MRI扫描中的肿瘤和图像中的细胞核。
卫星图像:用于实现更好的对象分离,例如计算汽车数量、检测海上安全的船只和监测海洋污染。
自动驾驶汽车:与密集的距离到对象估计方法结合使用,从单目2D图像提供场景的高分辨率3D深度估计。
机器人技术:与自监督学习结合使用,通过与环境互动,将视觉观察分割成单独的对象。
自动化:用于检测汽车上的凹陷、分离城市中的建筑物等。
语义分割和实例分割在图像处理领域有着不同的应用和特点。以下是它们的主要区别:
现在已经了解了实例分割和语义分割之间的基本区别,它们各自的工作原理,可能的应用领域,以及何时使用它们。作为下一步,将知识付诸实践,通过在自定义数据集上训练SegFormer,这是一种新的最先进的语义分割算法!