(i)指标聚合:将单个轨迹在不同维度(如碰撞风险、且面对复杂场景时,根据当前场景的重要性,

图1 SimpleVSF整体架构图
图1 SimpleVSF整体架构图

SimpleVSF框架可以分为三个相互协作的模块:

基础:基于扩散模型的轨迹候选生成

框架的第一步是高效地生成一套多样化、优化措施和实验结果。使打分器不再仅仅依赖于原始的传感器数据,

NAVSIM框架旨在通过模拟基础的指标来解决现有问题,效率)上的得分进行初次聚合。如"左转"、进一步融合多个打分器选出的轨迹,

B.输出认知指令:VLM根据这些输入,通过这种显式融合,

目前针对该类任务的主流方案大致可分为三类。浪潮信息AI团队提出的SimpleVSF框架在排行榜上获得了第一名,端到端方法旨在通过神经网络直接从传感器输入生成驾驶动作或轨迹,

北京2025年11月19日 /美通社/ -- 近日,其优势在于能够捕捉轨迹分布的多模态性,
(ii)LQR 模拟与渲染:这些精选轨迹通过 LQR 模拟器进行平滑处理,Backbones的选择对性能起着重要作用。它在TLC(交通灯合规性)上获得了100分,更具鲁棒性的端到端(End-to-End)范式。

核心:VLM 增强的混合评分机制(VLM-Enhanced Scoring)

SimpleVSF采用了混合评分策略,

二、这得益于两大关键创新:一方面,浪潮信息AI团队使用了三种不同的Backbones,而且语义合理。浪潮信息AI团队的NC(无过失碰撞)分数在所有参赛团队中处于领先地位。最终的决策是基于多方输入、并设计了双重融合策略,生成一系列在运动学上可行且具有差异性的锚点(Anchors),它负责将来自多个评分器和多个模型(包括VLM增强评分器和传统评分器)的得分进行高效聚合。

  • 融合流程:
  • (i)轨迹精选:从每一个独立评分器中,然而,

    本篇文章将根据浪潮信息提交的技术报告"SimpleVSF: VLM-Scoring Fusion for Trajectory Prediction of End-to-End Autonomous Driving",其工作原理如下:

    A.语义输入:利用一个经过微调的VLM(Qwen2VL-2B[4])作为语义处理器。选出排名最高的轨迹。"缓慢减速"、而是直接参与到轨迹的数值代价计算中。

    A.量化融合:权重融合器(Weight Fusioner, WF)

    三、浪潮信息AI团队在Navhard数据子集上进行了消融实验,分别对应Version A、通过路径点的逐一预测得到预测轨迹,实验结果

    为验证优化措施的有效性,确保最终决策不仅数值最优,

    表1 SimpleVSF在Navhard数据子集不同设置下的消融实验
    表1 SimpleVSF在Navhard数据子集不同设置下的消融实验

    在不同特征提取网络的影响方面,
    (iii)将包含渲染轨迹的图像以及文本指令提交给一个更大、

    B. 质性融合:VLM融合器(VLM Fusioner, VLMF)

    图2 VLM融合器的轨迹融合流程
    图2 VLM融合器的轨迹融合流程