基于改进算法的遥感建筑物检测研究(2) - 遥感学报杂志社投稿_期刊论文发表|版面费|电话|编辑部|论文发表- 遥感学报

来稿应自觉遵守国家有关著作权法律法规，不得侵犯他人版权或其他权利，如果出现问题作者文责自负，而且本刊将依法追究侵权行为给本刊造成的损失责任。本刊对录用稿有修改、删节权。经本刊通知进行修改的稿件或被采用的稿件，作者必须保证本刊的独立发表权。一、投稿方式： 1、请从我刊官网直接投稿。 2、请从我编辑部编辑的推广链接进入我刊投审稿系统进行投稿。二、稿件著作权： 1、投稿人保证其向我刊所投之作品是其本人或与他人合作创作之成果，或对所投作品拥有合法的著作权，无第三人对其作品提出可成立之权利主张。 2、投稿人保证向我刊所投之稿件，尚未在任何媒体上发表。 3、投稿人保证其作品不含有违反宪法、法律及损害社会公共利益之内容。 4、投稿人向我刊所投之作品不得同时向第三方投送，即不允许一稿多投。 5、投稿人授予我刊享有作品专有使用权的方式包括但不限于：通过网络向公众传播、复制、摘编、表演、播放、展览、发行、摄制电影、电视、录像制品、录制录音制品、制作数字化制品、改编、翻译、注释、编辑，以及出版、许可其他媒体、网站及单位转载、摘编、播放、录制、翻译、注释、编辑、改编、摄制。 6、第5条所述之网络是指通过我刊官网。 7、投稿人委托我刊声明，未经我方许可，任何网站、媒体、组织不得转载、摘编其作品。

基于改进算法的遥感建筑物检测研究(2)

作者:

关键词:

摘要：

在模型训练中，将边界框每个类别的置信度评分按高低排序，将置信度得分小于设定阈值的边界框的置信度设为0，然后再用非极大值抑制算法（NMS）去掉重复率较大的边界框，最后每一个边界框只保留置信度评分大于0且最高的类，从而检测出各类目标。

3.2 改进Yolo v3

Yolo v3算法的网络权重是基于COCO数据集训练测试所得，COCO数据集包括80种类别目标，且该数据集目标与本文检测的遥感建筑物尺度差异较大，故而原Yolo v3 算法不适用本文应用场景，尤其是对小型建筑物的检测表现不好。

目前随着Yolo v3 的广泛应用，已有相关文献针对具体场景做出了相应改进。文献[13]提出一种基于Yolo v2 的船舶检测算法Yolt，该算法网络结构与Yolo v2 相比，最大的修改是最后输出特征尺寸为26×26，加强了对小目标的检测，结果表明在稀疏的小目标场景下检测效果良好，但在目标密集的场景下表现不好[13]；文献[14]提出了一种基于Yolo v3改进的电气元件检测算法，通过对PASCAL VOC 和KITTI 数据集进行k-means 聚类分析，调整先验框维度，并在原来三种尺度的特征图上增加104×104 的特征图，达到加强小目标检测的能力，结果表明在文献提供的电气元件的数据集中表现良好，但该应用场景不具有泛用性[14]。

故本文在以下两方面进行改进：一是修改特征图分辨率，扩大感受野，减少语义特征丢失；二是使用k-means算法对本文的遥感建筑物数据集进行聚类分析，得到对应的先验框维度[15]。

3.2.1 修改特征图分辨率

Yolo v3 为加强对小目标的检测，借鉴了特征金字塔网络FPN（Feature Pyramid Network），将高层特征与浅层特征信息融合，采用多个尺度融合的方式，在多个尺度的特征图上进行位置和类别预测，但Yolo v3网络结构采取的三个尺度的特征融合方法对遥感图像中检测较小的目标有不利的影响，13×13的特征图语义丢失严重，易造成小目标丢失。考虑到特征的分辨率将直接影响小目标的检测和整体性能指标，所以在Darknet-53基础上对原特征图三个尺度的分辨率13×13、26×26 和52×52修改为两个较大尺度的分辨率26×26和52×52。

修改后的网络模型结构如图2所示，将原网络结构26×26的特征图分辨率作为第一尺度；将 L61（61层）结果进行五次卷积操作（Convolutional Set），首先为了提升计算效率进行1×1 卷积操作降维，然后上采样（Up Sample），再与 L36（36层）融合，最后融合之后采用3×3的卷积核对融合结果进行卷积，目的是消除上采样的混叠效应，如此就得到了一个新的特征图52×52，作为第二尺度特征。

图2 修改后的网络结构

经修改后，本文对Yolo v3 改进的网络结构能够在深层网络中保持较高分辨率和较大的特征图的感受野，以增强对小目标的检测能力。

聚类分析调整先验框维度

Yolo v3 借鉴先验框来预测边界框坐标，使用kmeans 算法预测得到9 个先验框，并将其均分到3 个尺度特征图，以此来获得更多的目标边缘信息。Yolo v3中计算得到的9 组先验框维度分别为（10，13），（16，30），（33，23），（30，61），（62，45），（59，119），（116，90），（156，198），（373，326），但是在本文应用场景中，Yolo v3算法中计算得到的先验框维度不适合建筑物的检测。因此，在遥感建筑物检测场景下，使用k-means 算法对自制的建筑物数据集进行聚类分析，得到先验框维度，从小到大分别为：（49，47），（92，50），（52，97），（175，51），（142，95），（74，200），分辨率较小的26×26 特征图有较大的感受野，故采用较大的先验框（175，51），（142，95），（74，200），分辨率较大的52×52的特征图有较小的感受野，故采用较小的先验框（49，47），（92，50），（52，97），如表1所示。

表1 数据集的先验框特征图先验框26×26（175，51）（142，95）（74，200）52×52（49，47）（92，50）（52，97）

4 实验结果及分析

4.1 数据集制作

本文使用的数据集来自我国北方某城市的卫星图像，使用谷歌地图下载，图像尺寸为25 km×25 km，对图像裁剪及筛选，使用标注工具labelImg 进行标注，制作本文的数据集。

labellmg 是专门为Yolo 系列算法的网络训练准备数据的工具，利用该标注工具，手动完成矩形框标注，最后得到xml文件，操作界面如图3所示。一共得到1 000张训练集和200张测试集。

图3 标注界面

4.2 实验过程及平台

本文采用计算机为笔记本电脑，配置为Intel i7-9750H，32 GB内存，64位Windows 10操作系统；开发环境为，，。

文章来源：《遥感学报》网址: http://www.ygxbzz.cn/qikandaodu/2021/0307/545.html