273FPS！图像分割，这一个就够了！！

本文来源：智车科技

车道线分割、自动驾驶感知、人像抠图、医疗影像分析等万亿级市场背后的核心技术是什么？那绝对要说到图像分割技术！相比目标检测、图像分类等技术，图像分割需要将每个像素点进行分类，在精细的图像识别任务中不可替代，也是AI算法工程师年薪百万的关键！

图1 图像分割应用

然而在实际产业落地过程中对算法的要求是苛刻的。在保障高识别精度的情况下，往往会牺牲算法运行速度；反之追求速度，则会带来精度的大幅度损失。

图2 各算法速度与精度平衡情况示意

因此，产业及学术界翘楚都竭力探索能同时实现速度和精度均衡、在当前云、边、端多场景实现高效协同的优秀算法。而 PP-LiteSeg 凭着 mIoU 72.0、273.6 FPS （Cityscapes数据集，1080ti）的超优秀性能，超越当前CVPR SOTA模型STDC，在众多优秀算法中脱颖而出，真正实现了精度和速度的最佳均衡！！！

图3 PP-LiteSeg精度/速度说明

行动力超强的小伙伴一定早已迫不及待了吧，识趣的小编赶紧送上传送门： https://github.com/PaddlePaddle/PaddleSeg

记得Star收藏支持！

更值得令人惊喜的是，PP-LiteSeg不仅在开源数据集评测效果优秀，在产业数据集也表现出了惊人的实力！例如在质检、遥感场景，PP-LiteSeg的精度与高精度、大体积的OCRNet持平，而速度却快了近7倍！！！

图4 PP-LiteSeg和OCRNet在某工业质检数据集识别情况对比

图5 PP-LiteSeg和OCRNet在deepglobe数据集识别情况对比

那PP-LiteSeg为何可以拥有这么优秀的效果呢？

PP-LiteSeg提出三个创新模块：灵活的解码模块（FLD）、注意力融合模块（UAFM）、简易金字塔池化模块（SPPM）。FLD灵活调整解码模块中通道数，平衡编码模块和解码模块的计算量，使得整个模型更加高效；UAFM模块效地加强特征表示，更好地提升了模型的精度；SPPM模块减小了中间特征图的通道数、移除了跳跃连接，使得模型性能进一步提升。

图6 PP-LiteSeg 模型结构和优化点

正是基于这些模块的设计与改进，最终PP-LiteSeg超越其他方法，在1080ti上精度为mIoU 72.0时，速度高达273.6 FPS , （mIoU 77.5 时，FPS为102.6），实现了精度和速度的SOTA平衡。更多关于PP-LiteSeg的内容，请参考：

https://github.com/PaddlePaddle/PaddleSeg/tree/release/2.5/configs/pp_liteseg

关键词：图像分割解码模块