华体会,华体会体育官网,华体会体育APP下载/华体会体育[永久网址:363050.com]平台是一家专注于体育娱乐的领先平台。华体会专注体育竞技,华体会app提供实时体育赛事、华体会棋牌、华体会彩票、华体会百家乐、华体会APP,华体会官网,华体会官方网站,华体会网址,华体会登陆链接,华体会平台,华体会官方平台,华体会app下载,华体会体育靠谱吗,华体会2025最新,华体会世界杯,华体会体育打造安全便捷的互动娱乐平台,体验最好的赛事服务。
如果说大模型的上半场是以互联网大数据预训练为代表的数字AI;而下半场,是以机器人、世界模型等为代表的物理AI。汽车可能正好处于两者之间...
如果说大模型的上半场是以互联网大数据预训练为代表的数字AI;而下半场,是以机器人、世界模型等为代表的物理AI。汽车可能正好处于两者之间的分水岭上。
在杭州云栖小镇的会场,今年云栖大会,无论是会场外的天气热度,和会场内的人群热度,都达到了一个相当高的程度。
每一个我遇见的新老朋友都会说,今年大家对AI的关注度明显提高了,讨论的问题也都非常的实际。
而我这次对大会的关注点,是汽车。因为这个产业,是观察AI未来发展脉络一个非常好的切入点。
年,卡尔本茨发明了第一辆汽车。人类突破了肌肉的限制。139年后的今天,我们正在突破认知(智能)的边界。汽车成为了移动的计算平台,驾驶成为了人机协作的艺术,速度由数据的流转效率重新定义物理,实现拥抱数字智能,数字智能融入实体产业,汽车恰好站在这个交汇点上,成为虚实融合的最佳载体。我的理解是:如果说大模型的上半场是以互联网大数据预训练为代表的数字AI;而下半场,是以机器人、世界模型等为代表的物理AI。
另一方面,消费者虽然喜欢中国车企所创造的智能体验,但要真金白银买单,或许还不到火候。汽车的“卷”字,大概也就从中而来。这是一个投入和收益的剪刀差时刻。
这个观察切中要害。30年前,当美国汽车工程师学会(SAE)制定智能驾驶分级标准时,人工智能还处于专家系统时代。那时的工程师们想象的智能驾驶,是一台遵循预设规则的精密机器如果看到红灯就停车,如果前方有障碍物就绕行,如果车道线向左弯就转动方向盘。
的出现,改变了游戏规则。VLA(Vision-Language-Action)是一种新一代AI架构,它不仅能“看懂”图像、“读懂”语言,还能基于理解直接驱动决策与动作,被视为大模型从“会说”走向“会做”的关键拐点。
理想汽车自动驾驶研发高级副总裁郎咸朋在圆桌上分享了一个生动的案例:有用户发了个十连绕场景的视频经过施工路段,隔一段就有井盖或路障,车辆绕来绕去都成功通过。用户第一天绕了不信,但第二天又试,还是能绕过去。
他特别强调:我们并没有定义连续绕十次井盖这个场景。这就是能力涌现,我们做的是能力而不是功能。
广汽集团自动驾驶首席科学家周寅在圆桌讨论中,也从技术层面解释了VLA为什么如此特别:VLA利用了VLM(Vision-Language Model)的预训练,利用互联网海量知识让模型具有常识(common sense)。然后通过自动驾驶数据唤醒激活,能够处理长尾案例,实现零样本迁移(zero-shot transfer)。
郎咸朋进一步解释了VLA中L(Language)的深层含义:它并不是大家想象的对话或文字。它背后是人类长时序的思考、逻辑推理能力的体现。有人问我,不会说话的人就没有思维能力吗?不是的,他们也会看书、看文字,这些都是人类知识高度浓缩和压缩的过程,表达了长时间思维能力。
这个解释让我想起了维特根斯坦的名言:语言的界限就是世界的界限。当我们给机器赋予语言能力,我们实际上是在扩展它理解世界的边界。
到了大模型时代,两个数字最终可能变成一半一半。比例的变化,首先是财务报表上的庞大数字。其次,它意味着整个产业的底层逻辑在改变。过去,汽车公司的核心资产是工程师、设计师、产品经理;未来,可能是GPU集群、训练数据、模型参数。
郎咸朋在圆桌上提供了更具体的数据:在云上要做两件事:一是生成仿真环境(世界模型),需要大量云端推理算力;二是训练本身需要算力。世界模型和VLA模型是一主一辅VLA是要训练的主模型,世界模型辅助训练VLA。现在理想用世界模型生成的数据已经占到VLA训练的10%以上。
虽然对阿里云来说,AI算力需求增加是好事,但阿里云的方法论是,AI算力的增加,一定要用在模型训练的每一分钟,每一秒,而不是空耗。
在这方面,阿里云做了大量工作。我们以小鹏汽车为例。根据之前的一个消息,这个异常抢眼的新势力车企依托阿里云灵骏智算,打造了国内汽车行业首个万卡规模AI算力集群,AI算力储备达到10EFLOPS,集群利用率最高可达98%。同时,该集群还具备秒级故障发现与处置能力,建立了高可用的容灾体系。在此基础上,小鹏汽车“云端模型工厂”的迭代周期平均缩短至5天,大模型迭代效率显著提升。
分布式计算框架。MaxFrame可以直接调用第三方模型,对多模态数据进行万级别的高并发处理,相比开源框架性能提升40%以上。客户案例显示,从每天7000个数据包处理提升到20万个,资源消耗下降40%,综合处理效能提升50多倍。PAI Turbo X
加速包的极致优化。这个专门为智能辅助驾驶定制的加速包,带来了惊人的性能提升:在BEVFusion训练中,训练时间缩短58%;在MapTR训练中,缩短53%;在UniAD训练中,缩短50%。这些技术细节可能显得枯燥,但就像上世纪初的铁路建设。当所有人都在争论该运什么货、去哪里时,总要有人先把铁轨铺好。
60%,这意味着中国智能辅助驾驶的登月计划,有一半以上的台阶是阿里云搭建的。
如果说智能驾驶是关于如何抵达目的地的技术革命,那么智能座舱就是关于如何度过旅程的思考。
他详细解释了每个阶段的含义:相识让AI认识你。现在我可以唤醒小魏同学,但小魏同学不知道我是谁、副驾是谁、后排是谁。相知学习你的操作习惯、用车习惯。相爱产生感情,有温度。相伴长期陪伴。
在和理想汽车空间AI团队负责人江会星博士的交流中,我也记录了一些他的心得。
江博透露了一个让人意外的时间线月份,就快速的去立项的做自己的大模型。从预训练、后训练、强化学习这些全部做了。到了2023年的12月份完全上线用户。这段时间我们就把所有的该趟的所有的坑都趟了一遍。
江博说,大家都说理想的座舱体验好:“这个体验的背后,坦率讲是慢工出细活。每一个体验一点点抠,一点点做出来。”
阿里云智能集团公共云事业部AI汽车行业解决方案总经理霍健详细解释了智能座舱的技术架构:我们认为智能座舱的技术趋势之一是大模型的端云协同架构。端侧大模型与云端大模型的分工是核心关键。
还以乘客有点冷来说明这种分工:处理这个操作,车端MindGPT首先要完成环境感知和理解:谁在说话,车内温度,空气质量,以及当前的车速等情况。然后结合前面的说话内容,以及全信息记忆里对用户的记忆,推理出用户的真实意图。
为了支撑这种体验,阿里云推出了专门为汽车场景定制的通义Omni模型。李强在峰会开场致辞中详细介绍:这是一个三进两出的架构设计三种输入:语音、视觉、文本;两种输出:语音、文本。延时低至0.5秒,到11月份将支持超过20种语言的语音交互。
李强在汽车峰会的开场致辞中透露了一个惊人的数据:“95%的中国车企在出海时选择了阿里云。”
在云栖大会期间,我与阿里云智能集团公共云事业部AI汽车行业解决方案架构师黄华杰做了交流,专门谈出海这个议题。
客户一般会认为在海外用阿里云不那么容易合规,用海外云会更加合规。他说,但事实不是这样。
这种反常识背后,是对合规的深度理解和长期投入。更重要的是服务经验的积累。像阿里巴巴电商、菜鸟物流、蚂蚁支付,和众多消费电子企业,这些内外部客户比汽车更早出海。我们在这些案例中沉淀的经验,可以反复跟车企的业务部门、IT部门、法务部门、采购部门去讲。
我问他,贴身服务是不是成本很高,商业模式如何成立?黄华杰却讲:我们产品在帮客户做定制优化,但会提炼出通用的东西,反哺产品演进。,阿里云的多模态数据库Lindorm,云原生中间件、日志服务SLS等产品,很多都是在跟客户场景共创中不断迭代演进的。
电影里,吴彦祖饰演的香港音乐人Michael因故滞留北京,遇到了耿乐饰演的摇滚乐队主唱平路。一个来自商业音乐体系成熟的香港,习惯了唱片公司的运作规则;一个扎根于北京地下音乐场景,在破旧的排练室里寻找真正的摇滚精神。电影的英文名Beijing Rocks一语双关,既是摇滚的新姿态,也暗示着城市的新脉动。
云栖大会汽车峰会上,阿里云智能集团公共云事业部AI汽车行业总经理李强分享了三个深刻的观察,恰好回应了这种追问。
这是技术演进的必然每一次革命都建立在前一次的基础上,但当质变发生时,能量是指数级释放的。
这种选择背后,是中国车企的成熟既不盲目依赖,也不闭门造车,而是在开放与自主之间找到平衡。
这三个观察勾勒出一幅图景:汽车产业正在经历一场从基础设施到研发模式,再到生态合作的全面重构。
被需要这三个字道出了阿里云在这场变革中的价值。他们不造车,但60%中国智能辅助驾驶的AI算力来自阿里云。
在这个历史进程中,每个参与者都在寻找自己的节奏。车企在寻找智能化的突破口,技术公司在寻找落地的场景,而阿里云找到的,是成为这场变革的基础设施不张扬,但不可或缺。
这或许就是光的深处的答案不是某个具体的技术突破,也不是某个单一的商业成功,而是整个产业生态的共同进化。