XPENG与北京大学合作研究获AAAI 2026收录:推出面向自动驾驶的新型视觉Token剪枝框架

aae14b952b0c86af8abddffed0a7b071 XPENG-北京大学合作研究成果获AAAI 2026收录:推出面向自动驾驶的新型视觉Token剪枝框架
  • XPENG-北大研究突破: XPENG与北京大学合作开发了FastDriveVLA——一种新型视觉token剪枝框架,能让自动驾驶AI通过仅关注关键信息实现“类人驾驶”,计算负载降低7.5倍。
  • 顶级AI认可: 该研究成果已被AAAI 2026收录,这是全球顶尖AI会议之一,今年的录取率仅为17.6%,极具选择性。
  • 加速L4级自动驾驶落地: 这一成就凸显了XPENG在AI驱动移动出行领域的全栈能力,并推动行业向高效、可扩展的下一代自动驾驶系统部署迈进。

(SeaPRwire) –   中国广州2025年12月28日 —— XPENG与北京大学合作的论文《FastDriveVLA: Efficient End-to-End Driving via Plug-and-Play Reconstruction-based Token Pruning》已被AAAI 2026收录,该会议是全球人工智能领域的顶级会议之一。AAAI 2026共收到23,680篇投稿,仅4,167篇被收录,录取率仅为17.6%。

该论文介绍了FastDriveVLA,这是一种专为端到端自动驾驶视觉-语言-动作(VLA)模型设计的高效视觉token剪枝框架。这项工作通过让AI“类人驾驶”,仅关注关键视觉信息并过滤无关数据,为视觉token剪枝提供了新方法。

随着AI大模型的快速发展,VLA模型因其在复杂场景理解和动作推理方面的强大能力,已被广泛应用于端到端自动驾驶系统。这些模型将图像编码为大量视觉token,作为模型“观察”世界和做出驾驶决策的基础。然而,处理大量token会增加车载计算负载,影响推理速度和实时性能。

虽然视觉token剪枝已被认为是加速VLA推理的可行方法,但现有方法(无论是基于文本-视觉注意力还是token相似性)在驾驶场景中都存在局限性。为解决这一问题,XPENG和北大开发了FastDriveVLA——一种新型基于重建的token剪枝框架,其灵感来源于人类驾驶员如何关注相关前景信息而忽略非关键背景区域。

该方法引入了对抗性前景-背景重建策略,增强了模型识别和保留有价值token的能力。在nuScenes自动驾驶基准测试中,FastDriveVLA在不同剪枝率下均取得了最先进性能。当视觉token数量从3,249减少到812时,该框架在保持高规划精度的同时,计算负载降低了近7.5倍。

这是XPENG今年第二次在全球顶级AI会议上获得认可。6月,XPENG作为唯一受邀的中国汽车制造商在CVPR WAD上发言,分享了自动驾驶基础模型的进展。11月,在其AI Day上,XPENG发布了VLA 2.0架构,该架构移除了“语言翻译”步骤,实现了直接的视觉到动作生成,这一突破重新定义了传统的V-L-A流程。

这些成就反映了XPENG从模型架构设计、训练到蒸馏和车辆部署的全栈自研能力。展望未来,XPENG将继续致力于实现L4级自动驾驶,加速物理AI系统与车辆的融合,旨在为全球用户提供安全、高效、舒适的智能驾驶体验。

关于XPENG
XPENG致力于通过技术探索引领未来移动出行的变革,定位为“未来移动出行探索者”。公司总部位于中国广州,在北京、上海、深圳、肇庆和扬州设有研发中心,并在肇庆和广州建立了智能制造基地。

XPENG奉行研发和销售的全球战略,在美国设有研发中心,并在多个欧洲国家设有子公司。公司坚持智能驾驶辅助软件的全栈自研和核心硬件的开发,为用户提供卓越的智能驾驶和乘坐体验。

2020年8月27日,XPENG正式在纽约证券交易所(NYSE: XPEV)上市,其IPO募资额创下当时全球新能源汽车行业的纪录。2021年7月7日,公司在香港联合交易所(HKEX: 9868)上市,成为首家在香港和纽约实现双重主要上市的中国新能源汽车制造商。

如需更多信息,请访问

联系方式:
媒体咨询:Alison Liang,XPENG公关部
邮箱:

来源:XPENG

本文由第三方内容提供商提供。SeaPRwire (https://www.seaprwire.com/)对此不作任何保证或陈述。

分类: 头条新闻,日常新闻

SeaPRwire为公司和机构提供全球新闻稿发布,覆盖超过6,500个媒体库、86,000名编辑和记者,以及350万以上终端桌面和手机App。SeaPRwire支持英、日、德、韩、法、俄、印尼、马来、越南、中文等多种语言新闻稿发布。