尽管目前各大车企都已“调转车头”,投入端到端自动驾驶技术的研发中,
但是端到端自动驾驶方案都高度依赖于BEV,严重限制了其Scale Up潜力。 ICLR2025
最新收录的一篇论文设计了一套不同于以往Scale Up Vision Backbone算法的,以Decoder为核心的无需BEV的大一统架构。
DriveTransformer在一定程度上标志着端到端技术从“依赖特定视角”向“动态自适应”的范式转变。
3月20日
晚
( 周四)
杨导师带你学习
《端到端架构黑魔法:大一统架构的DriveTransformer》 从 论文入手,详细拆解架构,找创新点,算法框架选择,实验评估里的方法比较!并探索多模态融合与任务并行化新路径。
扫码免费预约直播课!凡预约还可领取20+篇自动驾驶多模态感知相关论文➕24个Occ工作代码+数据集+论文➕还有102篇VLM论文➕34篇端到端论文。更有额外福利9.9购原价299自动驾驶直播课!
直播课内容概览
01 论文引言
- DriveTransformer的核心根据
02 相关工作
- E2E-AD的历史
- DETR风格的解码策略
- 统一的BEV分割框架
03 DriveTransformer设计 (重点)
- 初始化 & Tokenization
- Token之间的共同交互
- DETR风格的任务头设计
- 损失函数及其优化
04 实验要点 (重点)
- 数据集 & benchmark
- 主实验分析
- 消融实验分析
- 鲁棒性分析
👇🏻 扫描二维码找助教 0元 预约 直播课!
05 总结与展望
- 任务并行:所有智能体、地图与规划查询直接交互,打破串行模式限制
导师介绍
杨导师
【简介】毕业于知名计算机名校。博士期间研究方向聚焦为计算机视觉,自然语言处理,高效的深度学习训练和推理方法,大语言模型轻量化与高效微调技术。曾在多家公司担任算法研究员,并进行计算机视觉,高效模型压缩算法,多模态大语言模型的研究,包括模型量化,剪枝,蒸馏,编译以及高效稀疏化训练与推理。
【科研成果】在国际顶级会议CVPR,ICCV, EMNLP等发表13篇论文,并担任CVPR,ICCV,ECCV,ICML,ICLR, NeurIPS等重要会议和期刊的审稿人。多项发明专利,指导学生有耐心,教学严谨,思维逻辑缜密,已经指导数十篇论文。对于成果好的学生,帮助学生写推荐信和指导申请硕/博申请。
【招收学生方向】计算机视觉,自然语言处理,高效模型压缩算法,多模态大语言模型,包括模型量化,剪枝,蒸馏,编译以及高效稀疏化训练与推理
研梦非凡科研论文指导
unset
unset
如果你的研究方向/方法/idea是属于 CV全方向/NLP全方向/机器学习/深度学习及AI+金融、医疗、交通等方向, 如果你需要发 CCF A-C、SCI一区-四区、EI会议/EI期刊、毕业大论文、毕业设计等, 都可以来研梦非凡,匹配合适的科研指导。
研梦非凡可指导的研究方向
主流方向科研论文常用方法
研梦非凡现有idea
👇🏻全程1v1论文辅导扫码咨询助教
研梦非凡导师团队
研梦非凡的导师来自 海外QStop50、国内华五、C9、985高校的教授/博士导师/博士后,世界500强公司算法工程师 ,以及国内外知名人工智能实验室研究员。
这是一支实力强大的高学历导师团队,在计算机科学、机器学习、深度学习等领域,积累了丰富的科研经历,研究成果也发表在国际各大顶级会议和期刊上,在指导学员的过程中,全程秉持初心,坚持手把手个性化带教。包括但不限于以下导师~~
<<< 左右滑动见更多 >>>
研梦非凡隶属于苏州研途教育,深耕考研辅导行业13年,累计服务1w+付费学员(60%高校学生/教师,40%职场精英);科研为本,质量为先!我们有:500+ 国内外顶尖高校博士/教授,互联网大厂/独角兽公司的高级算法科学家组成的教师团队;深度定制的科研服务,根据每位学员的实际情况,提供个性化的科研辅导方案,确保交付结果;一站式、全方位科研支持,从选题到方案设计,从实验实施到论文撰写、成果发表,4V1全流程保姆式服务!