语义分割--综述
https://zhuanlan.zhihu.com/p/37618829
https://baijiahao.baidu.com/s?id=1602428106371812559&wfr=spider&for=pc
1. 语义分割就是给图片在像素级别上做分类。
2. FCN-->DeepLab 发展史:用卷积代替全连接,用dropout下采样,up-conv上采样,用编码--解码的方法提取不同层次的图片特征,将不同层次的特征用相加或者concat融合到一起。整个分类的框架是以交叉熵为损失函数的,也就是计算图片中累计每个像素分类误差的和。所以会造成即使损失函数很小,图片像素分类依然效果不好,很模糊,于是有了条件随机场(CRF)以平滑的形式表现单个像素和周围像素之间的联系/相似度(同一颜色的像素),建立更接近真实值的CNN图像标签。也就有了,输入+分类器+后处理器+输出的特征结构。
典型的模型:U-net,Deeplab,Dilation10扩展的替代方法。
3. 其他研究模式:对抗网络,也就是”造假者“ 预测语义分割,竭力使之与真实分割相差很小,”鉴假者“鉴别语义分割是预测还是真实,竭力的增大两者差距。在不断的学习过程中,”造假者“预测语义分割的能力很强,使之很难分辨,”鉴假者“则不能区分预测和真实。
4. 时间尺度的语义分割,也就是用自相关的时间序列,用这一时刻的语义分割预测下一时刻的语义分割,用真实分割和预测分割的值作为分割的损失函数。
https://zhuanlan.zhihu.com/p/37618829
https://baijiahao.baidu.com/s?id=1602428106371812559&wfr=spider&for=pc
1. 语义分割就是给图片在像素级别上做分类。
2. FCN-->DeepLab 发展史:用卷积代替全连接,用dropout下采样,up-conv上采样,用编码--解码的方法提取不同层次的图片特征,将不同层次的特征用相加或者concat融合到一起。整个分类的框架是以交叉熵为损失函数的,也就是计算图片中累计每个像素分类误差的和。所以会造成即使损失函数很小,图片像素分类依然效果不好,很模糊,于是有了条件随机场(CRF)以平滑的形式表现单个像素和周围像素之间的联系/相似度(同一颜色的像素),建立更接近真实值的CNN图像标签。也就有了,输入+分类器+后处理器+输出的特征结构。
典型的模型:U-net,Deeplab,Dilation10扩展的替代方法。
3. 其他研究模式:对抗网络,也就是”造假者“ 预测语义分割,竭力使之与真实分割相差很小,”鉴假者“鉴别语义分割是预测还是真实,竭力的增大两者差距。在不断的学习过程中,”造假者“预测语义分割的能力很强,使之很难分辨,”鉴假者“则不能区分预测和真实。
4. 时间尺度的语义分割,也就是用自相关的时间序列,用这一时刻的语义分割预测下一时刻的语义分割,用真实分割和预测分割的值作为分割的损失函数。
