基于卷积神经网络的海底火山烟雾图像分类

发布于:2022-12-10 ⋅ 阅读:(880) ⋅ 点赞:(0)

1. 摘要

为了解决海底火山场景中烟雾图像分类问题,该文作者采用深度卷积神经网络(Deep Convolutional Neural Networks,DCNN)对小尺度数据集下的烟雾海底图和无烟海底图进行分类和有限的计算。首先利用数据增强技术通过角度旋转、水平翻转、随机切割、加入高斯噪声等方式扩展数据集,然后构建深度卷积神经网络进行训练。最后根据分类器的预测图像标签进行识别和分类。实验结果表明,所提方法的分类准确率在91%以上。

2. 引言

       地球上70%以上的火山活动实际上发生在海洋中,海底火山是独特的生态系统基础,它告诉我们与地球的生态系统密切相关的海底地质活动如何在海洋甚至陆地上发挥作用。探测海底火山的存在对科学发展具有重要意义。然而,海底火山绝大多数位于深海区,与火山作用有关的海底地震通常很小,陆地上的仪器大多远离地震区,导致海底火山大部分活动未被发现。确定海底是否有火山的一个重要方法是探测海底的烟雾。目前,世界上作业最深的载人潜水器是蛟龙号,最大下潜深度为7000米。但海洋最大深度超过10000米,导致需要深海烟雾探测器自动检测蛟龙无法下潜的海底陨石坑的存在。

该文采用深度卷积神经网络训练模型对深海海底场景的有烟和无烟海底图像进行分类。实验结果表明,该模型对烟雾海底图像和无烟海底图像具有明显的识别效果。适用于深海海底场景的烟雾图像分类,可以大大提高深海探测器探测烟雾的效率和准确度,尽快探测海底火山和喷发的可能性。

3. 基于卷积神经网络的海底火山烟雾图像识别

卷积神经网络深度学习的代表性算法之一,在图像识别领域得到广泛应用。

3.1 网络结构

       该实验使用的卷积神经网络模型由4个卷积层、4个池化层、2个全连接层和1个输出层组成(见图1)。

图1  CNN结构

3.2 网络参数设置

实验设计并优化了卷积神经网络。网络模型包括卷积层、池化层和全连接层。为防止网络过拟合,全连接层采用dropout处理,概率设置为0.5的经验值。激活函数通过使用Softmax,输出节点分为两类。经过偏差修正后,参数比较稳定。

表1 四层卷积神经网络模型参数

3.3 激活函数优化

为了提高网络模型的性能,使用了修正的线性单元(Rectified linear unit,ReLU)激活函数(见图2)。

图2 激活函数表示

3.4 交叉熵损失函数

       交叉熵是实际输出概率与预期输出概率之间的距离。交叉熵的值越小,两个概率分布越接近,期望输出的准确度越高。经过回归处理后,Softmax 层可以将神经网络的实际输出转化为概率分布,然后利用交叉熵损失函数计算实际输出概率与期望输出概率之间的距离系数。假设神经网络的原始输出为a1、a2、ai,那么经过Softmax回归处理后的输出如下式。

设概率分布p为期望输出,概率分布q为实际输出,则交叉熵H(p,q)如下式所示

4 模型训练与验证

4.1 实验环境

实验所用电脑CPU为Intel(R)Core(TM)i7 5500U,主频2.40GHz,内存8G。它是在Windows7操作系统下用Python语言和OpenCV可视化处理库编写的。TensorFlow 深度学习框架用于构建 DCNN 模型以及训练和测试海底火山的烟雾图像。

4.2 图像数据处理

本次实验的数据集是从网上收集的海底火山烟雾图像,通过数据增强技术分批生成的。实验图片分为训练集和测试集,包括有烟和无烟,共6696个训练样本,600个测试样本,如表2所示。

表2 海底火山烟雾图像分类统计

图片类型

训练样本

测试样本

有烟

3348

300

无烟

3348

300

部分实验样本如下图所示。

 图3:部分实验样本,(a)为有烟图像样本 (b)为无烟图像样本

通过数据增强,增加训练数据量和噪声数据量,提高模型的泛化能力,提高模型的鲁棒性。图 4中,(a)为原始图像,(b)为角度旋转,(c)为水平翻转,(d)为随机裁剪,(e)为加入高斯噪声。

 图4 海底火山烟雾图像数据增强实例

使用上述四种数据集增强方法,通过Python程序从原始有限数据集批量生成训练数据,以达到目标迭代次数所需的数据量。增强后的数据可以有效减少网络过拟合,提高卷积神经网络识别深海海底烟雾图像的能力。

图像在数据增强后需要进行预处理。由于海底图像分辨率不等,为了完成网络输入的统一,所有图像都放大到208*208像素。由于图像通道不一致,部分图像需要转换为通道3。由于图像像素从0到225,输入计算比较复杂,为了简化网络的输入,对图片像素进行归一化处理,范围是 [0, 1]。

表3 卷积神经网络模型精度对比

模型

总数

正确识别

错误识别

准确率

三层卷积神经网络

600

514

86

85.37%

四层卷积神经网络

600

551

49

91.83%

4.3 分类结果与分析

海底火山烟卷积神经网络模型的训练包括网络训练和网络微调两个过程。数据增强后的数据集通过卷积神经网络进行训练。训练过程包括两个步骤:网络训练和网络微调。

在网络训练过程中,卷积神经网络的学习率初始设置为1e/4,迭代6000次,使用AdamOptimizer控制学习速度。在对比实验中,使用测试集来测试模型的正确率。网络微调时,在全连接层加入dropout,提高泛化能力、网络识别率和收敛速度,从而优化卷积网络的性能。实验中,两种不同模型的结构训练过程参数的变化趋势见图5和图 6。

 图5 模型交叉熵损失在迭代过程中的变化趋势

图6 迭代过程中模型精度的变化趋势

从图中可以看出,四层卷积层的卷积神经网络优于三层卷积层,其收敛速度更快,训练模型的识别准确率更高。

5. 结论

为了满足海底火山场景中烟雾识别的需求,以往的烟雾识别算法在特征提取上费时费力,尚未应用于深海海底场景。该文作者提出了一种基于卷积神经网络的海底火山烟雾分类模型,能够有效地自动获得有烟海底图像和无烟海底图像。

该文作者针对深海海床图像数量较少,采用数据增强的方法扩大图像数量。神经网络模型可以随机初始化参数,然后根据训练数据对参数进行微调,可以节省更多的时间,获得更高的测试精度。

在后期的工作中,我们可以增加样本的多样性(如黑烟、灰烟等,海底火山结合多种类型的烟雾,海底生物复杂场景的底图等)。海底火山烟雾探测精度进一步提高。

原文信息

[1]Liu X., Liu L., Chen Y. (2020) Image Classification of Submarine Volcanic Smog Map Based on Convolution Neural Network. In: Zhai G., Zhou J., Yang H., An P., Yang X. (eds) Digital TV and Wireless Multimedia Communication. IFTC 2019. Communications in Computer and Information Science, vol 1181. Springer, Singapore. https://doi.org/10.1007/978-981-15-3341-9_14

本文含有隐藏内容,请 开通VIP 后查看