• 最新
  • 热门
  • 所有
  • 期货市场
  • 外汇动态
  • 股票行情
智能眼镜「烧」内容生态,一场无谓的豪赌

自动驾驶的流派纷争史

2025 年 9 月 29 日
美国就业增长预期近腰斩,高通胀与疲软增长持续施压

美国就业增长预期近腰斩,高通胀与疲软增长持续施压

2025 年 9 月 29 日
AI Agent 暗战,大厂电商如何排兵布阵?

大多老板都会撒的三个谎

2025 年 9 月 29 日
今日中国黄金基础金价(2025年9月4日)

20cm 速递|创新高! 创业板新能源 ETF 华夏 (159368) 规模突破 10 亿元,同类规模第一

2025 年 9 月 29 日
王健林被限消,这次的麻烦可不小

王健林被限消,这次的麻烦可不小

2025 年 9 月 29 日
iPhone 17发布在即,华尔街预计新机难逃提价命运

China's Gas-Fired Power Faces Uncertain Future Amid "Dual Carbon" Push and Energy Transition

2025 年 9 月 29 日
谷歌大涨超9%,创纪录新高

辽宁省工业互联网布局显成效 赋能 「新」「旧」 产业多领域开花

2025 年 9 月 29 日
上市银行上半年整体营收及利润增速双双转正,银行尾盘走强

上海官宣新规!高品质住宅标准明确,阳台面积计算方式重大调整

2025 年 9 月 29 日
现货黄金冲破3800!特朗普对决国会,谈崩就关门

现货黄金冲破 3800!特朗普对决国会,谈崩就关门

2025 年 9 月 29 日
固态电池生产设备企业上半年订单激增

现货黄金高位震荡紧盯 3760 压力

2025 年 9 月 29 日
被特斯拉Model 3生产线机器人打成重伤工人已发起诉讼 要求赔偿3.6亿

被特斯拉 Model 3 生产线机器人打成重伤工人已发起诉讼 要求赔偿 3.6 亿

2025 年 9 月 29 日
今日pd900钯金回收价格查询(2025年09月01日)

期现深度融合构建共赢生态 驱动贵金属产业可持续发展

2025 年 9 月 29 日
终端价普涨!茅台9月动销同比增20% 机构称白酒行业底部愈发清晰

终端价普涨!茅台 9 月动销同比增 20% 机构称白酒行业底部愈发清晰

2025 年 9 月 29 日
禾湖财经
  • 登录
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
2025 年 9 月 29 日 星期一
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
没有结果
查看所有结果
禾湖财经
没有结果
查看所有结果
首页 期货市场

自动驾驶的流派纷争史

3 小时 之前
在 期货市场
阅读时间: 1 mins read
0 0
A A
智能眼镜「烧」内容生态,一场无谓的豪赌


文 | 脑洞汽车

自动驾驶的商业化落地正在全球范围内加速推进。

猜您喜欢

深市宽基指数上涨,深证50ETF易方达(159150)、深证100ETF(159901)等产品受关注

大商所:关于纯苯期货交割业务有关事项的通知

3 月 之前
0
尿素基本面支撑偏弱 玻璃盘面延续阶段性底部盘整趋势

期货锁仓作用都有哪些

4 周 之前
0

截至 2025 年 5 月,Waymo 在美国旧金山、洛杉矶、凤凰城和奥斯汀运营的自动驾驶出租车达到 1500 辆,每周完成超过 25 万次付费出行服务;百度 Apollo 已在全球部署超 1000 辆无人驾驶汽车,累计提供超 1100 万次出行服务,安全行驶里程超过 1.7 亿公里。

大规模落地仿佛意味着技术已经成熟,其实不然,关于自动驾驶,还有很多尚未达成共识的流派分歧。

比如,传感器方案,纯视觉和多传感器融合方案该如何抉择?系统架构上,采用模块化设计,还是拥抱新兴的端到端架构?更进一步,关于如何理解世界,VLA 和 VLM 孰优孰劣?

这些悬而未决的争议,正引领着自动驾驶驶向尚未完全确定的未来。而理解这些不尽相同的技术路线,就是理解自动驾驶从哪里来、到哪里去,如何实现技术的自我进化。

眼睛之争:纯视觉 vs 多传感器融合

一切始于“ 看见”。汽车如何感知世界,是自动驾驶的基石。在这个问题上存在着对峙已久的两大阵营,且双方至今未休。

故事最早可以追溯到 2004 年美国莫哈韦沙漠的一场挑战赛。

那时,美国国防高级研究计划局设立了 200 万美元的奖金,吸引数十支顶尖高校和科研机构参与,试图解答“ 如何让车辆感知周围环境?” 的问题。

卡内基梅隆大学和斯坦福大学等团队选择的激光雷达胜出。这项能生成精确 3D 点云图的技术奠定了早期自动驾驶发展路线,被谷歌旗下的 Waymo 继承和发展。

然而,这一派有个致命软肋:成本。一套激光雷达系统造价高达 7.5 万美元,比车还贵,注定只能走小规模精英路线,难以大规模商业化。

十年后,特斯拉代表的视觉派走出了另一条路。

他们主张大道至简:“ 人类靠一双眼睛和一个大脑就能开车,机器为何不能?”

2014 年,特斯拉推出 Autopilot 系统,采用 Mobileye 的视觉方案,选择了以摄像头为主的视觉方案。2016 年,埃隆· 马斯克公开表示“ 激光雷达是徒劳的”,正式确立了纯视觉技术路线。

团队通过 8 个环绕摄像头模拟人类视野,依靠深度学习算法从二维图像中重建三维环境。纯视觉方案成本极低,能够大规模商业化。而通过卖出更多车,收集更多海量真实世界数据,形成一个“ 数据飞轮”,反哺算法迭代,越用越强。

但摄像头是“ 被动” 传感器,严重依赖环境光。在逆光、眩光、黑夜、大雨、大雾等情况下,性能会显著下降,远远比不上激光雷达。

以激光雷达为主的多传感器融合方案认为,机器的智能在可见的未来都无法完全媲美人类基于经验的常识和直觉,恶劣天气下必须通过激光雷达等硬件冗余来弥补软件的不足。

可以说,纯视觉将所有压力都集中在算法上,赌的是智能化的未来;多传感器融合更注重工程落地,选的是经过验证的现实方案。

目前,主流车企 (Waymo、小鹏、蔚来等) 都站在多传感器融合的阵营。他们认为安全是自动驾驶不可逾越的红线,而冗余是保障安全的唯一途径。

值得注意的是,两条路线并非完全泾渭分明,而是在相互学习和融合:纯视觉方案也在引入更多的传感器;多传感器融合方案中,视觉算法的地位也越来越高,成为理解场景语义的关键。

触觉之争:激光雷达 vs 4D 毫米波雷达

即使在多传感器融合派内部,也藏着一个选择题:

毫米波雷达成本仅数百元,激光雷达早期要数万美元,为什么还要花大价钱装激光雷达?

激光雷达 (LiDAR) 通过发射激光束并测量其返回时间,可以构建出周围环境极其精细的 3D 点云图像,解决了当时其他传感器无法解决的、致命的“Corner Case”(极端案例)。

它的角分辨率极高,能够清晰分辨行人的姿态、车辆的轮廓,甚至路面上的微小障碍物。L4/L5 级别的商业自动驾驶领域,没有其他传感器能同时满足“ 高精度” 和“ 测静态物体” 这两个要求,为了实现最基本的自动驾驶功能和安全冗余,激光雷达的成本是车企必须付出的门票。

那么激光雷达既然已经这么强了,为什么还要研发其他传感器呢?

激光雷达性能极高,但也有其局限。激光属于红外光,波长很短。雨滴、雾滴、雪花、烟尘等颗粒的大小与激光波长接近,会导致激光发生散射和吸收,产生大量“ 噪声” 点云。

而 4D 毫米波雷达能全天候工作,在恶劣天气下能利用其强大的穿透能力,率先发现前方障碍物并提供距离和速度数据。不过,毫米波雷达回波点非常稀疏,只能形成少量点云,无法像激光雷达那样勾勒出物体的轮廓和形状,还可能因为电子干扰产生“ 幽灵识别”。低分辨率让它注定无法成为主传感器,只能作为辅助上车。

所以,激光雷达和毫米波雷达各有优劣。二者不是替代关系,而是“ 常规场景靠毫米波控成本,复杂场景靠激光雷达保安全” 的互补逻辑,不同的车型有不同配置。

L4 Robotaxi、豪华车通常采用“ 激光雷达为主,毫米波雷达为辅” 的策略。不计成本地堆砌传感器,追求极致的安全和性能上限;L2+、L3 量产经济车主要依赖“ 摄像头+毫米波雷达”,在车顶关键位置使用 1~2 颗激光雷达,形成高性价比的方案。

车企围绕传感器的选择争议,本质是一场关于“ 如何用最低成本实现最高安全” 的技术探索和商业博弈。未来,各种传感器还将进一步融合,形成多样化的搭配方案。

大脑之争:端到端 vs 模块化

如果说传感器是眼睛,那么算法就是大脑。

很长一段时间里,自动驾驶系统都采用模块化设计,整个驾驶任务被拆解为感知、预测、规划、控制等独立的子任务。每个模块各司其职,有独立的算法和优化目标,像一条分工明确的流水线。

模块化的优点是可解释强、开发并行、易于调试。但局部最优不等于全局最优,分而治之的模式也存在致命缺陷。每个模块在处理和传递信息时,都会进行一定程度的简化和抽象,导致原始的丰富信息在层层传递中丢失,整体表现难以达到最优。

2022—2023 年,以特斯拉 FSD V12 为代表的“ 端到端” 模型横空出世,颠覆了传统范式。这种方案的灵感来自人类的学习方式:新手司机不是先学习光学原理再研究交通规则,而是通过观察教练的操作直接学习驾驶。

端到端模型不再进行人为的模块划分,而是通过学习海量的人类驾驶数据,构建一个庞大的神经网络,直接将传感器输入的原始数据映射到方向盘转角、油门刹车等终端驾驶控制指令。

与模块化算法不同,端到端模型全过程没有信息损失、性能上限高,开发流程能进一步简化,但也存在着难以溯源问题点的黑箱难题。一旦发生事故,系统是难以判断哪个步骤出了错、后续应该怎样优化?

端到端的出现让自动驾驶从规则驱动迈向了数据驱动。然而,它的“ 黑箱” 特质让许多更重视安全的车企望而却步,海量训练数据也只有拥有大规模车队的公司才能支撑。

因此,行业内出现了折中的“ 显式端到端” 方案,即在端到端模型中保留可行驶区域、目标轨迹等中间输出,试图在性能与可解释性之间找到平衡。

“ 灵魂” 之争:VLM vs VLA

随着 AI 发展,新的战场在大模型内部开辟。这关乎自动驾驶的灵魂,它应该是辅助驾驶的思考者 (VLM),还是执行者 (VLA)?

VLM 视觉语言模型信奉协同,更追求过程可控,也被称为增强派。该路线认为 AI 大模型虽然强大,但幻觉在安全领域是致命的,应该让它做自己最擅长的事 (理解、解释、推理),而把最终决策权交给经过数十年验证的、可预测、可调试的传统自动驾驶模块。

VLA 视觉语言动作模型信奉涌现,追求结果最优,被称为端到端的终极形态。该流派主张只要模型足够大、数据足够多,AI 就能自己从零开始学会驾驶的一切细节和规则,最终其驾驶能力会超越人类和基于规则的系统。

围绕 VLM 与 VLA 的争议就像模块化和端到端方案辩论的延续。

VLA 存在着难以溯源的黑箱困境。如果一辆 VLA 车发生了一次急刹车,工程师几乎无法追溯原因。是因为它把阴影误判为坑洞?还是它学到了某个人类司机的不良习惯?无法调试、无法验证,这与汽车行业严格的功能安全标准是根本性冲突的。

而 VLM 系统整个过程可分解、可分析、可优化。如果遇到问题,工程师可以清晰地看到:传统感知模块看到了一个物体、VLM 将其识别为“ 一个被风吹走的塑料袋”、规划模块因此决定“ 无需紧急刹车,轻微减速即可”。出了事故,责任清晰界定。

除了可解释性上的两极分化,训练成本也是车企犹疑不决的原因之一。

VLA 需要海量的“ 视频-控制信号” 配对数据,即输入一段 8 摄像头视频,输出同步的方向盘、油门、刹车信号。这种数据极其稀缺且制作成本高昂。

VLM 本质是多模态大模型,可以利用互联网规模的、丰富的“ 图像-文本” 配对数据进行预训练,再用驾驶相关的数据微调。数据来源更广,成本相对更低。

目前来看,VLM 技术相对成熟,更容易落地,大部分主流车企和自动驾驶公司 (包括 Waymo、Cruise、华为、小鹏等) 都走在 VLM 路线上。而 VLA 路线的探索者则以特斯拉、吉利和理想为代表。据悉,吉利千里科技的千里浩瀚 H9 方案就采用了 VLA 大模型,具备更强的推理与决策能力,支持 L3 级智能驾驶解决方案。

回顾自动驾驶的流派之争,我们发现这些技术争论从未以一方完全胜出告终,而是在碰撞中相互融合,走向更高层次的统一。激光雷达与视觉正在融合为多模态感知系统;模块化架构开始吸收端到端的优势;大模型正在为所有系统注入认知智能。

而那些曾让行业困惑的谜题,看起来似乎没有标准答案,但最终都会成为技术迭代的注脚,推动自动驾驶继续向前发展。

更多精彩内容,关注钛媒体微信号 (ID:taimeiti),或者下载钛媒体 App

相关 文章

美国就业增长预期近腰斩,高通胀与疲软增长持续施压
禾湖观察

美国就业增长预期近腰斩,高通胀与疲软增长持续施压

55 秒 之前

【文章来源:金十数据】

AI Agent 暗战,大厂电商如何排兵布阵?
期货市场

大多老板都会撒的三个谎

15 分 之前

文 | 穆胜接触企业多了,对于大多中国企业老板有了一些粗浅的认知。俗话说,听话要听音,有时,他们表达的观点,并不代表他们真实的意思。如果沿着他们表达的观点往下走...

  • 热门
  • 评论
  • 最新
老凤祥回收黄金多少钱一克(2025年6月27日)

国海证券策略首席分析师胡国鹏:下半年 A 股牛途在望,配置核心在科技成长

2025 年 8 月 1 日
铑多少钱一克(2025年06月27日)

人工智能+行动重磅发布!资金借道软件 ETF(515230) 布局,连续两日吸金近 2 亿元

2025 年 8 月 1 日
郑州宝泉钱币周五(6月27日)银条价格8.79元/克

老凤祥黄金价格今天多少一克 (2025 年 07 月 30 日)

2025 年 8 月 1 日
Lesson 1: Basics Of Photography With Natural Lighting

The Single Most Important Thing You Need To Know About Success

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

5 Ways Animals Will Help You Get More Business

美国就业增长预期近腰斩,高通胀与疲软增长持续施压

美国就业增长预期近腰斩,高通胀与疲软增长持续施压

2025 年 9 月 29 日
AI Agent 暗战,大厂电商如何排兵布阵?

大多老板都会撒的三个谎

2025 年 9 月 29 日
今日中国黄金基础金价(2025年9月4日)

20cm 速递|创新高! 创业板新能源 ETF 华夏 (159368) 规模突破 10 亿元,同类规模第一

2025 年 9 月 29 日
  • 隐私政策
  • 联系我们
  • 关于禾湖
联系我们:+86 15388934451

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

没有结果
查看所有结果
  • Home
  • Tech

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

欢迎回来!

在下面登录您的帐户

忘记密码?

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录