HI,欢迎来到芯鱼书刊网!

基于小样本学习的语义分割算法的设计思路探讨

摘要:在如今与计算机视觉相关的领域之中,语义分割越来越引起人们的关注,语义分割在计算机视觉领域有着非常重要的地位,其分割的准确率对于后续的过程有着举足轻重的影响,由于语义分割强大的功能,目前被广泛应用于地理信息系统、无人车驾驶、医疗影像分析等领域。但是在传统的全监督模式下,学习深度卷积神经网络需要大量逐像素标注的训练数据,而在实际应用中,训练样本集尤其是训练集中的有标签样本非常稀少,并且获取这些训练数据因标注成本巨大受到诸多限制。因此,在小样本训练集的情况下,如何准确的对图像进行语义分割是实际亟需解决的问题。

本文首先对小样本学习以及现有的传统的语义分割方法进行研究,接着开始研究基于小样本学习的语义分割的方法。从多个角度出发,提出具体的可行性方法,为后续的工作展开提供有效的借鉴和参考。

关键词:小样本学习;语义分割;问题与措施

作者简介:兰馨怡,杨文;合肥工业大学计算机与信息学院

引言

在如今社会生活中的各个领域,图像与人们的生活息息相关,而对图像中的所有像素点进行分类的语义分割也逐渐成为计算机视觉领域的关键问题之一。最近几年小样本学习在图像领域的进展领先于在自然语言处理领域,所以本论文将小样本学习与语义分割结合,旨在基于小样本学习对问题进行语义分割。

一、小样本学习概述

小样本学习是近几年兴起的一个研究领域,小样本学习旨在解决在数据有限的机器学习任务。

小样本学习的先验知识来自三方面:数据、模型、算法,因此,小样本学习方法大致可分为基于数据增强的方法、基于模型改进的方法、基于算法优化的方法。一、基于数据增强的方法即增强数据,也就是扩充样本。但其存在的问题是大部分都不具备普适性,在迁移到别的数据集上有一定的难度。二、基于模型改进的方法即每个模型经过迭代都会得到近似解,而当样本有限时,在假设空间搜索解就变得困难。这类方法为了缩小假设空间,主要有四种方法:具有普适性和一般性的多任务学习、将样本映射到一个低维度空间的嵌入学习、基于外部记忆的学习以及生成模型。三、基于算法优化的方法主要是通过改进优化算法来更快地搜索到合适解。

二、传统语义分割方法

(一)传统的分割方法

在上个世纪的时候,语义分割的研究还停留在初级阶段,语义分割的手段也采用的是传统的方法,当时采用的也都是人工设计的特征向量机,很多初级的算法,由于不稳定的因素,以及人工的主观影响,导致在进行语义分割的时候出现非常多的错误,同时,很多区域的语义分割在当时来说都是很难进行处理结果的。之后的时间里,有研究人员也提出了一些新型的方法来解决这些问题,构建了很多新型的架构,但是并不能够准确的完成语义分割的任务。

(二)全监督的语义分割方法

在进入到新世纪之后,深度学习的技术得到了飞速的发展,其中深度学习与语义分割的结合发展也非常迅速,越来越多的基于深度学习的语义分割的方法被人提出,开始应用到比如图像检测中去,很多先进的模型也被提出来,比如RCNN,在RCNN的基础上,有人研究人员提出了fast RCNN来用于检测。随着深度学习与语义分割结合的不断深入,卷积神经网络的使用也开始变得流行了起来,卷积神经网络做到了标签的分配,对于特征的捕获可以很有效的实现,因为传统的卷积神经网络的很多局限性比如图片大小必须固定等原因,FCN就进一步的被研究人员的提出来了,其优点就在于能够接受任意尺寸的图像的输入,可以处理各种的图片,同时,对于低分辨率的图片,FCN也能够有效的解决,其实现了端到端的全卷积网络,大大提高了语义分割的效率和准确度,目前也正在被广泛的使用。

(三)边缘细化的语义分割方法

在当前阶段,现在使用的语义分割的方法目前都采用的是预先训练好的模型,这样做的好处是可以保证实时性以及能够将很多非常丰富的特征来加以识别,但是这样的算法也都有一个缺点,那就是使用这些算法的语义分割,最后输出的结果图片的预测边界会显得非常粗糙,因此就有很多研究人员在致力于解决这个问题,于是很多新型的网络架构就陆续被提出,所以边缘细化的语义分割的方法就自然而然的被提了出来,这种算法的最大的优点就在于能够将图像边界分割的精确度极大的提高,提高了一致性。

这些已经提及到的网络模型,对于语义分割的任务,并没有仔细的考虑基础的特征学习的问题。而且限定在特殊的环境下使用,非常的消耗人力物力,使用就导致这些模型不适合在很多不同的环境下来完成语义分割的任务。

三、基于小样本学习的语义分割算法

基于小样本学习的语义分割算法有不少,像Pa-NetAMP-2PGNet等,本文着重讲解一下Pa-NetFew-Shot Image Semantic Segmentation with Prototype Alignment)算法。

Pa-Net的创新点在于利用了prototypes上的度量学习,无参数。提出prototypes对齐正则化,充分利用support的知识,对于带有弱注释的少样本可以直接使用。

其用同一个backbone来提取support和query的深度特征,然后使用masked average pooling从support的特征将不同的前景物体和背景嵌入不同的prototypes中,每个prototype表示对应的类别,这样query图像的每个的像素通过参考离它的嵌入表达最近的特定类的prototype来标记,得到query的预测mask后;训练的时候,得到mask后,再将刚才提取的query feature和mask作为新的“support set”,将之前的support set作为新的“query set”,再用“support set”对“query set”做一波预测,然后再算一个lossprototype紧凑且鲁棒的对每个语义类别进行表达;mask标记那块就是无参度量学习,通过和嵌入空间的逐像素匹配来执行分割。执行一个prototype对齐正则化,用query和他的mask建立新的support,然后用这个来预测原始的support set的分割,实验证明能鼓励query的prototype对齐他们的support的prototype

结束语

综上所述,在实际应用中,基于小样本学习的语义分割算法有很广阔的前景,未来的研究道路还很长,要更加地制定更为科学、合理的方案策略,从而不断提高工作展开的效率和质量。

参考文献:

[1]黄鹏,郑淇,梁超.图像分割方法综述[J/OL].武汉大学学报(理学版),2020(06):519-531[2020-11-29].

[2]姜枫,顾庆,郝慧珍,李娜,郭延文,陈道蓄.基于内容的图像分割方法综述.软件学报.2017,28(01)

[3]Zhang C,Lin G,Liu F,et al.Pyramid graph networks with connection attentions for region-based one-shot semantic segmentation[C].IEEE International Conference on Computer Vision.2019:9587-9595.

顶部