新浪博客

高光谱数据的“非线性”浅谈

2017-03-21 17:57阅读:
​​
非洲埃塞俄比亚/肯尼亚交界处  SPARK光谱微纳02星 拍摄于2017年1月6日19:08:00

SPARK-01、SPARK-02两颗宽幅高光谱微纳卫星是由中科院微小卫星创新研究院(上海微小卫星工程中心)研制,由中科遥感科技集团有限公司参与,于2016年12月22日在酒泉卫星发射中心成功发射并由中科遥感科技集团有限公司运营。
SPARK两颗高光谱微纳卫星的主载荷为高光谱成像仪,是由中国科学院光电研究院研制的我国第一个面向商业化需求研制和运营的航天高光谱载荷,SPARK双星在多项指标参数上超过国内外同类卫星,达到了较高水平。
什么是“非线性”
在分析“非线性“、”这一概念之前,我们需要对“线性”这一概念作出明确的定义。从数学原理上来说,一个线性函数拥有以下两个性质(wikipedia):
高光谱数据的“非线性”浅谈

我们并不能从上述定义中直接得出什么有用的信息,从机器学习的角度来说,通常说某一数据集具有非线性特征的时候,往往指的是该数据集不能用线性回归很好的拟合,而需要引入高次项。
以二维空间举例,如下图左边的情况所示,我们用一条直线就可以拟合原始数据的分布特征,这样的数据被认为是线性的,即数据分布在原始数据的一个子空间上。而对于右边的情况,我们不能用一条直线很好的拟合原始数据的分布,必须引入高次项(曲线)。对于三维空间来说,非线性就是指不能用一个平面来拟合原始数据,对于超过三维的空间来说,非线性就是指不能用一个超平面(hyper-plane)来拟合原始数据的分布特征。
对于我们的SPARK卫星来说,光谱维度为128,即原始数据中的像素点是
分布在128维的空间中,由于其中的非线性因素,如主成分分析(PCA)等线性映射的方法将不能对原始高光谱数据的特征有最优的展示。
高光谱数据的“非线性”浅谈

高光谱图像的非线性来源
高光谱数据的非线性是由于其成像过程中的非线性因素引入的。来自太阳的电磁波经过大气的透射、折射、吸收、散射等作用,部分到达目标区域。到达目标区域的电磁波和地物进行交互作用。部分能量被反射后,再次穿过大气到达传感器。这些复杂高光谱成像过程引起了数据的非线性,即:
电磁波和大气的复杂作用会产生一定程度的非线性;
●目标区域会受到临近地物反射的电磁波的干扰;
●目标和电磁波之间的多次散射、太阳-目标-传感器位置的变化会引起非线性;
●受光谱仪的空间分辨率的限制,高光谱图像中的一个像素可能包含多种地物,也会带来非线性因素;
●对观测目标本身来说,目标的双向反射分布特征、二次散射特征、目标非均匀性也会引起非线性;
高光谱数据的“非线性”浅谈

非线性分类方法
非线性高光谱图像分类,是指将高光谱图像中的每一个像素点标记为一个类别标识。在众多的非线性分类算法中,最著名的为核函数支持向量机和基于深度学习的方法。
​支持向量机(SVM)的优化目标是最大化所有点到分类平面到最小距离,可以表示为:
高光谱数据的“非线性”浅谈

这是一个标准的二次规划问题,经过对偶变换、拉格朗日方法、KKT约束等过程,原问题变为:
高光谱数据的“非线性”浅谈

约束条件为:
高光谱数据的“非线性”浅谈

所谓的核函数其实就是指两个向量的内积,我们并不知道这两个向量本身是什么样子的,也不关心它们的维度具体是多少,甚至可能是无穷维的,但是我们可以在低维空间中简单的求出它们的内积,也就是说核函数提供了一种在低维空间中计算高维空间中的两个向量内积的方法,它把原本线性不可分的数据映射到更高维的空间中使得它们变得线性可分,而且提供了一种简便的计算两两内积的方法,上述问题引入核函数之后变为:
高光谱数据的“非线性”浅谈
最常见的核函数就是高斯核:
高光谱数据的“非线性”浅谈

对于深度学习中的网络结构,不管是全连接、卷积、递归都可以被概括为线性映射加非线性的激活函数的串联,其本质与傅立叶变换、小波变换类似,不同之处在于以一种数据驱动的方法逐渐逼近输入到输出的函数,深度学习的网络结构脱胎于概率图模型。人们发现这种每一层的神经元相互独立的结构比较有效,对于处理过拟合问题也有帮助,且往往是网络层数越深,效果越好,故美其名曰“深度学习”。
如今,深度学习技术已经应用到了图像、语音、文本等等各个领域,为计算机视觉和自然语言处理带来了颠覆性的改变,而分类问题更是它所擅长的领域之一。
下图直观的表示了深度神经网络针对非线性分类问题所做的变换:
高光谱数据的“非线性”浅谈

更多参考信息 http://colah.github.io/posts/2014-03-NN-Manifolds-Topology/
实时地球公众号
微信号 : shishidiqiu
QQ交流群:108211351
​​​​

我的更多文章

下载客户端阅读体验更佳

APP专享