6月1日,英伟达在GTC台北大会正式发布面向L4级自动驾驶出租车研发的开源视觉-语言-动作(VLA)推理模型Alpamayo 2 Super。该模型参数规模达320亿,较前代100亿参数版本提升3倍,基于Cosmos世界基础模型构建,具备感知、推理与行动能力,其推理代码将于今年夏季在GitHub开放,模型权重同步发布于Hugging Face平台。

Alpamayo 2 Super针对长尾场景逻辑推理、三维空间感知及轨迹预测能力进行增强,支持全车环视360度环境感知,覆盖前后及侧方视野。模型新增元动作输出能力,可预判礼让、变道、停车等高层级驾驶行为,并提供可解释决策依据以满足安全验证和合规监管要求。作为教师模型,Alpamayo 2 Super可通过知识蒸馏压缩为轻量化模型,部署于DRIVE AGX Thor车载芯片及DRIVE Hyperion系统,解决传统模仿学习难以应对罕见复杂场景的问题。
配套工具链方面,英伟达同步推出开源闭环强化学习框架AlpaGym,支持在仿真环境中实现决策与感知的持续循环训练。OmniDreams角色模型基于Cosmos构建,可大规模生成逼真且多样化的长尾驾驶场景数据。Omniverse NuRec神经重建函数库能在单块GPU上以25ms以内的速度完成真实世界重建与渲染,帮助开发者实时评估模型感知效果。CoC因果链自动标注管道已在GitHub开源,可将数据标注周期从数月缩短至数日。
目前比亚迪、吉利、极氪、小米及小马智行等企业已采用或正在基于NVIDIA DRIVE Hyperion平台开发智能驾驶系统。富士康计划于2028年在高雄落地相关项目,VinFast在东南亚、优步在慕尼黑及沙特HUMAIN也正基于该平台推进L4级自动驾驶出租车规模化部署。英伟达创始人兼CEO黄仁勋表示,这是汽车安全推理的转折点,Alpamayo系列模型自发布以来下载量已接近40万次。
此次发布的模型与工具构建了从数据采集、训练到部署的全流程支持体系,通过开源策略降低了L4级自动驾驶系统的研发门槛,为车载算力平台提供了标准化的软件栈参考。