用深度学习理解遥感图像,识别效率提升90倍,PaddlePaddle&中科院遥感地球所

国内新闻 阅读(903)
?

高尔夫球场长期以来一直是高端社交场所,但其存在背后是资源和环境的入侵。

它不仅占用土地资源,消耗水资源,还在草坪养护中使用化肥和农药,造成严重污染。

有多严重?

前江苏省副省长徐明在接受《中国经济周刊》采访时做了对比:

“高尔夫球场比普通工厂污染更严重。”

自2004年以来,有关部门出台了一系列限制体育场馆建设的政策,并于2017年左右开展了专项清洁和整治。

但是如何检查修复的效果呢?

该课程相对分散,占地面积很大。通过遥感图像检测路线是一种更好的方案。高分辨率光学遥感图像的普及也为课程检测提供了强大的数据支持。

即使这些数据可用,也不容易检测到它们。

这是一个遥感图像。忽略绿箱,你能找到有多少高尔夫球场和它们在哪里?

img_pic_1555920854_0.jpg

熟练的翻译需要大约15分钟来从这种遥感图像中检测所有高尔夫球场。

现在,深入的学习技术已经改变了这项工作的面貌。

在这样的地图中自动检测高尔夫球场仅需10秒。

相反,效率提高了90倍。识别的准确率为84%。

这不是一个特例,而是整个应用方向的集体推广,发生在中国科学院遥感地球研究所。

这种转变是如何发生的以及它采取了什么样的过程?

人工智能多年来一直从事图像识别领域。为什么它现在如此强大?

要回答这些问题,您需要回答

为什么原始遥感图像非常慢?

使用遥感图像监测表面是一个持续的过程。

中国科学院遥感地球研究所面临的最大困难是,同一地区的环境和气候每年都在变化。

这将对理解遥感图像的算法产生很大影响。

最直接的表现是,最初为这些地方建造的算法,一年之后,必须针对性地进行调整以适应这些变化,否则它将“罢工”。

而且,这些算法与人类经验密切相关。如果设计算法的人离开,整个算法将难以维持。

应该注意,这些算法不是自动化的,仍然需要手动协作。

中国的960万平方公里,如果你想完成它,你需要至少一千人上班两到三个月。

该怎么办?你可以使用深度学习。现在,遥感做到了这一点:

为一个地方构建样本库,然后基于样本库中的图像训练深度学习模型。

在第二年,这个地方的环境和气候发生了变化。只需要将新图像添加到样本库,然后再次重新训练模型。

同时,这也可以减少对人的依赖。模型的调整不再受专家经验的限制,而是取决于数据的变化。

此外,越来越多的数据不再是负担,而是一种提高模型准确性的“营养素”。

虽然它现在看起来很好,但它非常有效且非常简单。

然而,在从传统的手动+算法模式切换到当前深度学习模式的模式中,它经历了很多困难。

AI有哪些难以理解的遥感图像?

图像识别可以说是当前AI领域中相对成熟的技术。各种用于图像理解的深度学习模型层出不穷,并在特定领域达到了相同的人性水平。

问题是这些深度模型主要用于自然图像,如果它们直接用于理解遥感图像,它们将大大减少。

因为这两种图像之间存在很大差异。

首先,有许多遥感图像带。除了三个RGB自然图像波段外,还应该有至少一个用于遥感图像的近红外波段。一些卫星获取的遥感图像有8个波段,高光谱图像甚至多达200个波段。多个乐队。

其次,图像的尺度差异也非常大。与自然图像中尺度金字塔的多尺度识别相比,遥感图像的尺度差异可以达到1:30以上,以便更好地识别每个目标对象。

第三,存在局部空间特征失真的问题。自然图像的失真主要是由于传感器边缘失真和镜头失真,整体可控。然而,遥感图像成像的失真是由于图像采集中的误差造成的并且相对不可控制。

这些问题的存在使得现有的深度学习算法难以直接应用于遥感图像理解任务。该模型不仅需要进一步优化,还需要框架的支持:

不仅需要为遥感图像读取提供多频带支持,而且还需要为遥感图像添加图像增强算法,同时考虑到多频带颜色增强和局部空间特征变形增强。

这些正是百度在其深度学习框架PaddlePaddle中所做的。有了这个框架,中国科学院遥感地球研究所也正在完成新一轮的技术迭代。

应用越来越广泛

针对我们在开始时提到的高尔夫球场识别问题,中国科学院遥感研究所的研究人员利用PaddlePaddle框架的支持,使用更快的R-CNN目标检测模型。

在专业的标准高尔夫球场遥感数据集中,只需10秒即可检测到遥感图像中的所有场。

使用手动+算法识别需要15分钟。

新的深度学习方法将工作效率提高了90倍,检测精度提高了84%。

img_pic_1555920854_1.jpg

此外,深度学习不仅用于自动化高尔夫球场的测试,还用于了解遥感图像中的机场,建在山区的风力和光伏电站。

借助深度学习技术,研究人员可以根据遥感图像快速确定一个地区的太阳能电池板数量,并且可以清楚地估算该地区可以产生多少电力,并为电网建设提供决策支持。避免“动力”。没有网络或“没有网络”。

根据国家能源局提供的数据,2018年,光伏发电浪费了44.9亿千瓦时,相当于超过200万户家庭的一年用电量(按每户每月200度计算)。

可以看出这背后的社会价值。

此外,了解遥感图像只是PaddlePaddle解决实际问题的一个例子。

在计算机视觉领域,该框架已经能够支持该模型完成图像分类,目标检测,图像语义分割,场景文本识别,图像生成,人体关键点检测,视频分类,度量学习等任务。

ITBear技术信息