小鹏集团受邀参加CVPR 首次对外分享世界模型技术图谱
近日,全球计算机视觉顶级会议——IEEE国际计算机视觉与模式识别会议(The IEEE Conference on Computer Vision and Pattern Recognition 2026,简称CVPR 2026)在美国丹佛开幕,小鹏集团第三次受邀发表演讲,并首次对外展示了世界模型技术图谱。
作为AI领域具有影响力的专业会议之一,CVPR历来都是AI研究的风向标,而“具身智能”毫无疑问是今年的最热议题。今年大会首次开设“具身智能基座模型部署研讨会”,邀请特斯拉 AI 软件副总裁Ashok Elluswamy、小鹏集团通用智能中心负责人刘先明等分享各自团队的研究成果。

小鹏通用智能中心负责人刘先明分享小鹏世界模型
去年,刘先明作为中国车企受邀演讲者,介绍了小鹏的物理AI基座模型;今年3月,小鹏基于基座模型——第二代VLA的辅助驾驶软件正式量产,完成了从研发创新到商业应用的重要跨越。刘先明的分享进一步打开小鹏的物理AI卷轴,展示了小鹏世界模型的技术图谱。
刘先明介绍,小鹏集团正在研发具备主动思考、可控生成和长时序推演能力的世界模型。世界模型与第二代VLA共同构成小鹏物理AI基模底座,二者通过不同训练信号共同提升模型对物理世界的理解能力和在物理世界的行动能力。具体到自动驾驶场景,第二代VLA主要从人类驾驶行为中学习,将视频流、指令与动作输出进行统一建模,掌握在复杂交通环境中合理行动的能力;世界模型则通过对未来状态和场景演化的预测,学习物理世界的运行规律,并支持可控生成、长时序推演和因果推理。前者让模型学习“如何行动”,后者让模型理解“行动之后世界会如何变化”。二者结合,最终目标是构建能够深度理解真实世界并在其中安全行动的物理AI基座模型。

有了世界模型所赋予的世界知识,基座模型才能朝着L4级的自动驾驶能力进化。L4自动驾驶需要解决的海量长尾问题,不可能靠人类手写规则穷尽,必须由模型内生的智能来处理。第二代VLA现已同时搭载到小鹏的L2和L4车型,近期,以小鹏GX为原型车打造的小鹏Robotaxi量产下线,即将在年内开展示范运营,实现L4自动驾驶。
在小鹏的规划中,自动驾驶是基座模型落地的第一步,未来,基模还将应用到机器人、飞行汽车等更多具身载体。
编辑: 王自然

微信
QQ
朋友圈