为什么所有车企，都说要成为AI公司？-那点事

「一家成功的智能电动汽车公司，一定是一家成功的 AI 公司。」

这是汽车领域近两年最时髦的一种表达，最近一次出自蔚来 CEO 李斌之口。李斌如今常常把企业家、投资人等一系列头衔藏起来，以自媒体人自居，核心目的是要让更多人了解一个真实的蔚来，不能因为过往被打上了「服务好」的标签，就认为蔚来技术不好。

他说：「创新才是蔚来的底色。」

有过类似的表达的不只有蔚来一家。过往每家汽车公司都会有自己的标签，例如操控感、豪华感、动力感、经济性……但现在，大家有了一个新的共识：给自己贴上 AI 的标签。

李斌和秦力洪分享蔚来在科技创新领域的最新思考 | 图片来源：极客公园

让汽车变得更聪明，是第一个关键问题，也是车企们现阶段需要尽快向用户展示的重要能力。

但「变聪明」这三个字，本身又是一个很难量化的描述。怎样才是一个聪明的机器呢？OpenAI 的首席技术官 Mira Murati 曾经试过在一档播客节目中，用人类的智力水平类比过 AI 模型的能力：GPT-4 相当于聪明的高中生，而 GPT-5 有望达到博士的水平。

这种说法虽然通俗易懂，但其实很难直接套用在汽车上。因为比起大模型本身，智能汽车作为一个巨大的智能硬件载体，不仅要有「智力」理解问题，还要通过具体的「能力」解决问题。

如果把智能汽车比作机器人，那么这个「人」变聪明的过程中，需要一个「聪明的大脑」——不仅要拥有模型本身的智力；还要负责为「身体」制定一套合理的任务管理和分配体系，以确定不同「器官」需要在不同时候按怎样的优先级处理一系列不同的任务。

举个例子：主动悬架是这两年很火的新功能，其核心就是根据记忆和计算，让车辆在行驶过程中对悬架参数进行调节，以应对不同路面的颠簸程度，带来更好的驾乘体验。这涉及到了底盘、智驾等不同领域之间的配合。如果没有一个统一的大脑协调，由于带宽、延时等技术问题，配合就容易不协调，达不到想要的体验。

7 月 27 日，在 2024 NIO IN 蔚来创新科技日上，蔚来发布了「整车大脑」——整车全域操作系统 SkyOS。这代表着蔚来对于 AI 时代的思考：据介绍，基于这一系统，可以在跨域任务执行、算力分配等方面提供更好的体验。

而这些努力都是为了同一个目标：让智能汽车变得更聪明。

世界模型，让智驾「会推理」

智能驾驶是 AI 上车关注度最高的场景，也是近年来技术路线变化最快速的一个领域。

过去几年，智驾经历过几次技术路线的迭代，既有从高精地图方案切换到无图模式，也有以特斯拉为代表的部分公司尝试纯视觉（去激光雷达）路线。

但这些路线的切换，本质上只是为了降本，并没有改变智驾「规则驱动」的本质。这个系统依然需要大量的程序员花心思写代码，改 BUG。换言之，这只是人类通过编程语言，把自己对于驾驶的认知翻译给机器的一个过程，智驾系统本身并没有产生智能。

端到端技术的出现，改变了这一套规则。规则驱动正在向数据驱动演进，人类试图复制在大语言模型领域里已被验证成功的 Scalling Law，通过投喂大量视频数据，把智驾系统训练成一个可以涌现出智能的神经网络大模型。

这种模式的最理想结果，是马斯克曾经描述过的人类驾驶思考模式，即：输入视频（看到的路面信息），输出控制（踏板及方向控制）。

端到端的智能驾驶架构图 | 图片来源：蔚来

套用「AI 三大基石」的理论，要达到这一目标，需要解决算力、算法、数据三大关键问题。

蔚来在数据上采取了「群体智能」的方式，即：基于大量预装高算力、高配感知硬件的量产车获得大量真实数据。据介绍，

算力则更是一个外部问题，并不由车企自身决定。

所以，下一阶段的重点，是从算法本身出发，提高模型自身的训练效率和推理能力。蔚来给出的下一个答案是：世界模型（Nio World Model，以下简称 NWM）。

你可以把 NWM 看成是 Sora 的一种变体，某种程度上也是一个视频生成的产品。略有不同的是，Sora 主要依然基于「文生视频」，而蔚来的世界模型则是一种「视频生视频」：根据官方介绍，NWM 可以将 3 秒钟的真实驾驶视频作为提示词，生成最多长达 120 秒的视频。

蔚来将 NWM 的职责描述为「推演万千平行世界」 | 图片来源：蔚来

但视频生成显然不是蔚来的目的，蔚来也不是要用 NWM 生成的视频来做训练数据。

仍然用人类的思维模式做比喻：在一个人类司机选择超车前，TA 会根据实时路况判断左右不同的变道路线以及选择不同的超车时机。这一决策和推理的过程，NWM 通过一段生成的视频，具象地表达了出来。

根据官方介绍，NWM 能在 100 毫秒内推演出 216 种可能发生的场景，并找到最优解。

所以，NWM 的出现，实际是通过生成式 AI 这条技术路线，找到了智驾系统在新工作方式（端到端）下变得更聪明的新路径。

发掘座舱里的「人味」

AI在汽车上的另一个深度应用场景，就是智能座舱。

如果你曾经分别体验过一台“传统车”和一台“优秀的智能汽车”，你应该不会认为智能座舱里的种种功能只是花拳绣腿。笔者一直认为，在驾驶过程中，最安全的人车交互方式应该是通过语音——它可以保证你的视线和双手继续保持在对驾驶的关注当中。

可以说，在座舱智能化这件事上，具有互联网基因的造车新势力们显然已经走在了很多传统车企前面。

现在，当AI浪潮到来的时候，它们已经开始面对下一个选择，就像前阿里董事会主席张勇说的那样：

用AI的方法，把所有产品都重新做一次。

蔚来希望用AI重新定义人车交互的范式 | 图片来源：蔚来

就目前来说，蔚来基本把目前市面上主流的 AI 软硬件玩法，都搬到了车上。

例如 AI+音乐，通过 AI 加持的音质算法加成，为缺乏全景声的音源进行优化，再用车机自带的硬件进行播放。

停车守卫功能在 AI 加持下，则变成了一个类似视频会议纪要的产品。AI 会筛选生成值得关注的重点瞬间，如果不幸在停车时遭遇剐蹭等，这个产品就可以变成一个提效工具。

还有即将上车的旅行回忆功能。发布会现场显示了一段自驾游之后，根据车载摄像头捕捉的沿途风景自动剪辑生成的 vlog，其中还有一些标志性山峰进行了地点标注。类似的 AI 剪辑功能，过往在运动相机等场景有过应用，如今蔚来也把它搬上了车里。

除此之外，蔚来此次还展示了 NOMI 在多模态能力加持下的进化：可以看到「嘘」的手势，自动调低音量；也可以基于不同环境下，表达恰如其分的情感关心。

蔚来用「情感智能」描述了 AI 在座舱领域的进化。但在笔者看来，这些单一功能在 AI 本身的能力上并没有非常巨大的突破，反而是想到这些实际应用场景，并且落地上车的决策值得关注。在座舱领域里，也许目前应用场景的挖掘是先于模型能力进化的。

7 月 27 日晚上，结束了媒体采访的李斌几乎是马不停蹄地进入了又一场线上直播。和过往无数次在网上发声一样，他又遇到了一些或尴尬或尖锐的问题，他选择直接念了出来：

「别天天整抖音了，用心管理公司吧。」

李斌笑着解释这只是他第 5 次直播。但就像那些被藏进智能座舱里，也许现在使用率还不高的小巧思一样，他觉得蔚来在创新上的思考和努力是需要介绍给大家的，「不然大家每天都说蔚来服务好，就好像我们技术不好一样。」

索性，这样的表达收到了很多正面的反馈。李斌在媒体沟通会上自嘲道，以前大家说因为一个人（指李斌自己）不买一台车，现在也有很多人说要为了一个人买一台车，他很高兴自己能做到这一点。

一旁的秦力洪补充了一句：以前大家最期待的是年底的 NIO DAY（蔚来日，蔚来车主最大的活动），我们希望以后蔚来 NIO IN 可以成为媒体和车主最喜欢的活动。

期待这一天可以尽早到来。

为什么所有车企，都说要成为AI公司？

世界模型，让智驾「会推理」

发掘座舱里的「人味」

相关推荐

评论抢沙发

视频

关注我们

热门标签

热门文章

随机阅读

最新评论

网站统计

切换注册登录

切换登录注册

世界模型，让智驾「会推理」

发掘座舱里的「人味」

相关推荐

评论 抢沙发

视频

关注我们

热门标签

热门文章

随机阅读

最新评论

网站统计

切换注册登录

切换登录注册

评论抢沙发