前几天,马斯克在 We,Robot 的大会上给大家描绘了他眼中的无人驾驶,无人交通。<br/> 我们看到了机器人跳舞,倒酒,看到了没有方向盘的无人车。<br/>似乎,某种确定又模糊的未来正在被一点点拉近了。

马斯克关于无人交通的构想蓝图

Cybercab 无人驾驶出租车


这是一款彻底取消了方向盘和脚踏板的车辆,完全依赖特斯拉的 FSD(Full Self-Driving,完全自动驾驶能力)系统进行操作。<br/><br/> Cybercab 预计将在 2026 年开始生产,每英里运营成本约为 20 美分(约合人民币 1.4 元),远低于美国公共交通每英里 1 美元的成本。马斯克预计,Cybercab 的售价将控制在 30000 美元以下(约合人民币 21.2 万元),并引入感应充电技术,无需传统的充电口
。此外,Cybercab 的自动驾驶能力将提升驾驶安全性至人类水平的 10 倍以上,且外观采用未来派的金属色泽和蝶翼式车门设计

Robovan 无人驾驶多功能车

Robovan 的设计灵感源自 20 世纪 30 年代的装饰艺术火车,具有流线型且极具未来感的造型。<br/> 这款车没有传统意义上的挡风玻璃和驾驶舱,取而代之的是一个大面积的乘客空间,可以一次搭载 20 人,适用于商用出行或私人出行,也可以作为校车或货物运输工具。<br/>Robovan 的预期运输成本仅为每英里 5 至 10 美分(约合人民币 0.35 至 0.71 元),将极大降低交通成本
。Robovan 同样将使用特斯拉的 FSD 系统,并配备了自动负载水平调节悬架系统,以提升乘客的乘坐体验

马斯克眼中的出行和交通形态

  • 首先,高效的共享经济模式将得到前所未有的发展。 <br/>特斯拉计划推出的 Robotaxi 服务将允许车主将自己的车辆加入共享车队,这种类似 Airbnb 的模式将大幅提升车辆使用率,为车主创造额外收入。想象一下,你的爱车不再只是停在车库,而是 24 小时为你赚钱,这将彻底改变人们对于车辆所有权的认知。
  • 其次,低成本的交通解决方案将成为现实。 <br/>Cybercab 和 Robovan 等无人驾驶车辆的运营成本远低于传统交通工具,这将为物流和客运行业带来革命性变革。随着成本的降低,我们可能会看到更加便捷和普及的公共交通系统。

  • 更令人兴奋的是,城市空间将得到更优化的利用。 <br/>随着自动驾驶车辆的普及,大量停车场将变得多余。这些空间可以被改造成公园、广场等公共设施,让我们的城市变得更加宜居。
  • 特斯拉还有一个雄心勃勃的计划:将全球车队转化为分布式计算资源。 <br/>每一辆特斯拉车辆都将成为一个计算节点,共同组成一个庞大的算力网络。<br/> 这不仅可以用于车辆自身的运行,还可以为 AI 推理、智能化应用等领域提供强大的计算支持。

马斯克的愿景是通过技术创新带来全方位的社会变革。<br/>从降低出行成本到提升安全性,再到释放车内时间,特斯拉正在逐步构建一个智能化、低成本、高效率的未来出行网络。 <br/> 这场交通革命不仅仅关乎出行,更将深刻影响我们的生活方式、城市规划,乃至整个社会结构。

特斯拉无人驾驶出租车 Cybercab 的技术核心

  • 特斯拉构建了从底层芯片到上层应用的全栈自研体系,包括车端的 FSD 算力芯片和板卡域控制器,云端的训练所需算力芯片 D1 芯片和超级计算机 Dojo,以及全栈自动驾驶算法(感知算法、规控算法和各类神经网络)。这种全栈自研体系使得特斯拉能够实现高效的联合优化,并且能够应用在汽车和机器人上,实现规模化降本。
  • Dojo 超级计算机是特斯拉自动驾驶系统的重要组成部分,它基于 D1 Dojo 芯片,晶圆上(System on Wafer)系统级方案,用于对海量视频数据进行无监督学习,加速特斯拉的 Autopilot 和完全自动驾驶(FSD)系统的迭代。<br/> Dojo 超级计算机具有极高的算力,单个 ExaPOD 拥有超过 10^6 万个训练节点,BF16/CFP8 算力高达 1.1 EFLOPs,能够在相同成本下提供更高的性能和更低的能耗。
  • 特斯拉采用端到端智驾方案,即BEV+Transformer+Occupancy Network,该方案的核心是将车辆采集到的信息直接送入统一的深度学习网络进行处理并输出驾驶命令。这种设计简化了硬件成本,提高了泛化性,但高度依赖大算力芯片硬件和足够的源数据来保证算法的持续训练和快速迭代。
  • 特斯拉的纯视觉感知框架包括 HydraNet 多头网络叠加数据校准、空间理解和时空序列特征空间。该框架能够从视频数据中提取时空序列特征,并通过端到端的训练模型实现物体深度识别和短时记忆。此外,特斯拉还引入了 BEV(Bird’s Eye View)技术,用于增强驾驶员对周围环境的感知。
  • 特斯拉使用多任务网络提高了自动驾驶感知模型效率,在 BEV 空间下进行后融合,节约计算资源。特斯拉 Autopilot 引擎包含 48 个神经网络,专门针对特定任务进行学习,以减少误报。
  • 特斯拉建立了复杂的自动打标网络,收集不同数据进行 3D 精确重建,并以此训练神经网络。这种数据闭环体系确保了算法的持续优化和迭代。

特斯拉 Cybercab 的技术核心在于其全栈自研的自动驾驶体系、强大的 Dojo 超级计算机、端到端智驾方案、纯视觉感知框架、多任务网络和神经网络模型以及数据闭环体系。<br/>这些技术共同构成了 Cybercab 的先进 AI 系统,确保其安全性是人类驾驶车辆的十倍,<br/>并大幅提高车辆的利用率。

Dojo 的具体应用案例

具体应用

  • Dojo 超级计算机是特斯拉用于云端训练 AI 模型的核心设备,其核心是特斯拉自主设计和制造的神经网络训练芯片 D1。Dojo 通过处理海量的视频数据进行无监督学习,加速特斯拉的 Autopilot 和完全自动驾驶(FSD)系统的迭代。
  • Dojo 超级计算机采用独特的架构,优化了单一目标视觉识别与处理,大幅提升了对视觉数据的处理能力。例如,Dojo 能够通过 3D 图像和时间戳(4D Autopilot 系统)来训练自动驾驶系统,这使得系统能够更准确地预测和标记道路物体的三维运动轨迹,从而增强自动驾驶功能的可靠性。

  • Dojo 是一种通过网络结构连接的分布式计算架构,具有大型计算平面、极高带宽、低延迟和极强的可扩展性。这种架构使得 Dojo 能够高效地处理来自全球超过 100 万辆特斯拉车辆的行驶数据,帮助特斯拉 FSD 自动驾驶系统不断优化。
  • Dojo 超级计算机不仅提高了特斯拉自动驾驶系统的性能,还帮助特斯拉节省了高达 65 亿美元的成本,并为公司市值增加了 5000 亿美元。Dojo 的应用使特斯拉在潜在价值 10 万亿美元的自动驾驶市场中获得了不对称优势。

效果评估

  • 相比传统 GPU,Dojo 的性能提高了 4 倍,性能/瓦提高了 1.3 倍,空间面积减少了 5 倍。这些改进显著提升了 Dojo 在处理复杂视觉数据时的效率和能效。
  • Dojo 超级计算机的推出标志着特斯拉在自动驾驶技术上的重大突破,特别是在 AI 芯片和超级计算平台方面。Dojo 不仅支持特斯拉的自动驾驶系统,还为其人形机器人 Optimus 提供算力支持。
  • Dojo 超级计算机的应用不仅提升了特斯拉自动驾驶系统的性能,还为传统汽车行业打开了增量空间。通过更快地采用机器人出租车和网络服务,特斯拉市值有望增加 5000 亿美元。

特斯拉 BEV+Transformer+Occupancy Network 的具体实现方式和优势在哪里?

这两年我们频繁听到端到端智能,而特斯拉是端到端智能到目前为止最成功的实践者。<br/>特斯拉的端到端智驾方案中,BEV(Bird's Eye View,鸟瞰图)、Transformer 和 Occupancy Network 的结合实现了显著的技术突破和优势。

  1. BEV+Transformer 的具体实现方式

    • 特斯拉首先通过 BEV 视角将车辆周围的 2D 图像数据转化为鸟瞰图视角,这样可以有效避免图像视角下的尺度和遮挡问题。
    • 然后,利用 Transformer 模型将多视角图像信息重建至向量空间下。Transformer 模型基于人类大脑的注意力机制,能够灵活高效地处理和融合来自不同摄像机的图像特征,从而提升环境感知精度。
    • 特斯拉在其 FSD Beta 软件视觉感知模块中应用了这种方法,并展示了 BEVFormer 的相关技术理念。

  1. Occupancy Network 的具体实现方式

  • Occupancy Network 的核心思想是将三维空间划分为无数个微小立方体,面对障碍物时不再考虑物体的具体形状,而是判断对应区域的微小立方体是否被占用。这种方法有效解决了对异形障碍物识别的问题。
  • 在不使用雷达的情况下,Occupancy Network 通过 BEV 坐标系和 Transformer 神经网络,将地面坡度、曲率等几何形状的变化情况内化进神经网络的训练参数中,实现对物体深度信息的准确感知和预测。
  1. 具体优势:

    • 信息处理效率提升:BEV+Transformer 组合提升了信息处理效率,时空序列特征层的引入赋予了自动驾驶短时记忆能力,从而推演当前场景下可能性最大的结果。
    • 减少对高精度地图的依赖:BEV 视角解决了此前落地城市 NOA 功能过程中对高精度地图强依赖的问题,通过大模型加持下的向量空间重建,拥有更高的环境感知精度。
    • 多传感器信号统一输入与融合:端到端智驾方案实现了多传感器信号的统一输入并融合,共享图像特征,提升了算法开发效率。
    • 消除遮挡和重叠:BEV 视角能够实现局部端到端优化,感知和预测都在同一个空间进行,输出并行结果,从而提高了检测精度。

HydraNet 多头网络和 BEV 技术是如何工作的,以及它们对自动驾驶性能的具体贡献?

  • 特斯拉的纯视觉感知框架通过 HydraNet 多头网络和 BEV 技术显著提升了自动驾驶性能。<br/>HydraNet 是一种多任务神经网络架构,由主干网络、颈部和多个分支头部组成,能够支持超过 1000 个不同的任务。<br/>其核心特点是多个子任务分支共享同一个特征空间,从而减少重复的卷积计算,提高效率。HydraNet 通过残差神经网络和多层特征融合结构完成端到端训练,提取出多尺度视觉特征空间,然后根据不同任务类型完成子网络训练并输出感知结果。


  • BEV(Bird's Eye View,鸟瞰图)技术是特斯拉用于描述感知到的现实世界的视角或坐标的一种方法。特斯拉在 2021 年基于 Transformer 架构推出了 BEV+Transformer 大模型算法,构建俯视角全景图,解决了 2D-3D 空间转换和感知性能问题。BEV 技术通过将摄像头采集的 2D 数据转换为 3D 向量空间,实现了高精度的空间转换,从而提高了自动驾驶系统的感知能力。
  • HydraNet 和 BEV 技术的结合为特斯拉的纯视觉感知方案提供了先进的支持。HydraNet 通过特征共享和任务解耦,提高了感知系统的效率和灵活性。而 BEV 技术则通过构建鸟瞰图,解决了 2D-3D 空间转换的问题,提高了感知精度。

特斯拉数据自动打标网络和 3D 精确重建技术?

特斯拉的数据闭环体系在自动驾驶技术中扮演着至关重要的角色,其中自动打标网络和 3D 精确重建技术是其核心组成部分。以下是对这两项技术的详细介绍及其在自动驾驶算法优化中的作用。

自动打标网络

自动打标网络是特斯拉数据闭环体系中的一个关键环节,主要负责对采集到的原始数据进行标注,以便用于神经网络的训练。特斯拉通过建立复杂的自动打标网络,收集不同类型的驾驶数据,并利用这些数据进行 3D 精确重建。这一过程不仅提高了数据标注的效率,还大幅提升了标注数据的质量。

特斯拉的自动打标系统采用了先进的算法,如基于 Transformer 机制的自动标注算法(如 SAM),这些算法能够快速处理大量数据并生成高质量的标注结果。例如,特斯拉已经实现了最低人力需求的自动标注流程,原先需要两周完成的复杂路口标注现在仅需 5 分钟,效率提升了 1000 倍。这种高效的自动标注流程不仅减少了人工成本,还加快了模型训练的速度。

此外,特斯拉还通过影子模式高效地收集了大量真实有效的驾驶数据,形成了完整的数据闭环。这些数据经过自动打标后,被用于神经网络的训练,从而不断优化自动驾驶算法。

3D 精确重建技术

  • 3D 精确重建技术是特斯拉自动打标网络的重要组成部分,它通过对采集到的数据进行三维空间重建,生成高质量的三维场景模型。这一技术使得特斯拉能够在重建的基础上进行各种模型测试,包括对极端情况的测试。

  • 3D 重建技术的应用极大地提升了自动驾驶系统的鲁棒性和适应性。<br/>
    通过精确重建三维场景,特斯拉能够更准确地识别和预测道路上的各种障碍物和动态变化,从而提高自动驾驶系统的安全性和可靠性。此外,3D 重建技术还为仿真模拟提供了高质量的数据支持,使得仿真平台能够生成无限多个模拟道路场景,进一步优化神经网络的训练效果。

自动打标网络和 3D 精确重建技术在自动驾驶中的作用

自动打标网络和 3D 精确重建技术在特斯拉自动驾驶算法优化中起到了至关重要的作用。

  • 首先,自动打标网络通过高效、高质量的数据标注,为神经网络提供了充足的训练数据,从而不断优化算法性能。
  • 其次,3D 精确重建技术通过生成高质量的三维场景模型,提高了自动驾驶系统对复杂路况的识别和预测能力,进一步提升了算法的鲁棒性和安全性。

  • 此外,特斯拉通过结合自动打标和 3D 重建技术,实现了对极端仿真场景的持续训练,这不仅减少了对真实数据的依赖,还加速了算法能力的迭代。<br/> 这种高效的数据闭环体系使得特斯拉能够在短时间内完成大量数据的标注和处理,从而快速迭代和优化自动驾驶算法。

<br/><br/><br/>
还有一个事,特斯拉是第一个车企参考 transformer 架构的时候,相当早,早到《attention is all you need》发表 2 年后的 2019 年。
<br/> 还有啥?对了,前一年马斯克还没有离开 OpenAI。

综上所述,对消费者来说就俩字 “买吧!”

ps:如果明年 FSD 能引进国内,那就相当热闹了

本文由mdnice多平台发布


一支烟一朵花
5 声望0 粉丝

一支烟花社区发起人