Transformer 又立功了！又快(420 fps)又好的车道线检测算法

我爱计算机视觉

阅读 2 分钟

0

编译 | CV君
报道 | 我爱计算机视觉（微信id:aicvml）

分享一篇新出的论文 End-to-end Lane Shape Prediction with Transformers，该文为车道线检测问题建立参数模型，使用Transformer捕获道路中细长车道线特征和全局特征，所发明的车道线检测算法与以往相比，可端到端训练、参数量更少、速度更快（高达420 fps，单1080Ti）。

该文作者信息：

Facebook的DETR目标检测算法，说明了Transformer用于计算机视觉的巨大潜力。

该文的一大目标即是将Transformer用于车道线检测，将其用于特征提取部分。

另外，车道线检测以往的方法往往需要经过特征提取和后处理两个过程，这使得整个算法不能端到端训练，作者借助于对车道线曲线和相机内参的描述，采用多项式参数模型来描述车道线，并配以Bipartite Matching Loss函数，实现端到端训练，网络的目标成为预测几个参数，这无需后处理且降低了计算量。

整体网络结构：

车道线参数模型：

对应于网络结构中的 Curve Parameters 的参数组。

在TuSimple数据集测试集上的结果比较：

该文方法取得了速度最快（使用ResNet18作骨干网，420 FPS），精度不是最好，但已经是接近目前文献报告的最好结果，而且参数量极小。（使用1080TI GPU）

使用二次曲线还是三次曲线模型拟合车道线更好呢？作者做了个实验：

结果发现三次曲线略胜一筹。

与PolyLaneNet算法检测结果比较：

可见，该文算法拟合的车道线更加精确。

下图为在作者收集的FVL数据集上的效果：

尽管训练集中没有夜间行车数据，但该文算法仍能很好的检测车道线，表明其强大的泛化能力。

论文地址：

https://arxiv.org/pdf/2011.04...

代码地址：

https://github.com/liuruijin1...

（尚未开源）

Transformer最近频频在计算机视觉领域出镜，还可能有哪些突破？欢迎留言。

END

目标检测计算机视觉人工智能

阅读 3.1k发布于 2020-12-09

我爱计算机视觉

1 声望7 粉丝

« 上一篇

最新！图像去噪综合比较研究

下一篇 »

CenterFusion：融合雷达与摄像头数据的高精度3D目标检测

引用和评论

推荐阅读

Kaggle竞赛中使用YoloV5将物体检测的性能翻倍的心路历程

我爱计算机视觉赞 1阅读 3.8k

一文掌握 MCP 上下文协议：从理论到实践

陈明勇赞 6阅读 2k

AI Agent爆火后，MCP协议为什么如此重要！

程序员海军赞 5阅读 548

AdventureX 2025 正式启动：五天四夜，120小时极限创造！一起在杭州点燃青年创新之火！

思否编辑部赞 2阅读 5.4k

MCP 协议为何不如你想象的安全？从技术专家视角解读

Baihai_IDP赞 2阅读 575

🔥吐血整理 Bolt.diy 部署与应用攻略

北京宏哥阅读 6.1k

常见的 AI 模型格式

HuggingFace赞 1阅读 734

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。