|

车评报
2000活跃值=1葫芦

首页 > 汽车笔记 > 汽车笔记 > 免训练加速61倍！陈怡然团队新作DPad：仅关注「彩票token」

免训练加速61倍！陈怡然团队新作DPad：仅关注「彩票token」

发布时间：2025-09-27 14:35:10来源： 18811119908

杜克大学团队发现，扩散大语言模型只需关注少量「中奖」token，就能在推理时把速度提升61-97倍，还能让模型更懂格式、更听话。新策略DPad不训练也能零成本挑出关键信息，实现「少算多准」的双赢。

在大型语言模型的优化中，业界通常认为计算量与模型性能正相关。

然而，杜克大学陈怡然教授团队的一项最新研究DPad，却揭示了一个反直觉的现象：对于扩散大语言模型（dLLMs），通过一种「先验丢弃」策略，主动减少其计算量，不仅能带来高达61倍的推理加速，还能意外地增强模型语境学习的能力。

这一发现源于对dLLM内部一种「中奖彩票」（Lottery Ticket）现象的洞察。模型在生成文本时，其庞大的注意力网络中似乎隐藏着一个极度稀疏但高效的「中奖组合」。

DPad的核心贡献就在于，它无需训练，便能在推理时动态地、近乎零成本地找出这个组合，从而实现速度与精度的双重飞跃。

免训练加速61倍！陈怡然团队新作DPad：仅关注「彩票token」

论文作者团队来自杜克大学CEI中心，由实习生陈欣骅、黄思韬及郭聪博士共同完成，指导教师为李海教授、陈怡然教授，其他作者还包括魏迟越、何银涛、张健一。

独特的注意力机制

dLLM的草稿纸

团队发现，dLLM的独特之处在于双向注意力，这使得它在生成文本时，会关注所有待生成的后文词元（Suffix Token），并将它们用作规划全文的「草稿纸」。

「草稿纸」机制使得模型能在Transformer的第n层往后文写入信息，然后在第n+1层读取后文信息，用于辅助前文的解码。

免训练加速61倍！陈怡然团队新作DPad：仅关注「彩票token」

【返回列表】

特别声明：以上内容(如有图片或视频亦包括在内)为“车评报用户上传并发布"，本平台仅提供信息存储服务。

下一篇:透视阿里云产品生态团队：AI 落地的「关键通道」

上一篇:京东零售首次对外公布电商创新AI架构体系Oxygen 实现\"千人百面\"AI电商购物体验

汽车笔记更多>>

6999起三星S26系列发布丨硬件防窥屏安卓机皇？三星研发部门负责人解释Galaxy S26系列手机未原生集成磁吸功能魅族科技宣布战略转型，将暂停国内手机新产品自研硬件项目魅族第一个停更！内存涨价潮下手机厂商承压华为清华联手，研发28nm存内计算芯片又一国产全模态视频大模型杀入Artificial Analysis榜单Top 2 苹果警告旧版Home家庭架构今起停用 OPPO K14x 5G手机海外发布，配置与售价全曝光华为nova16系列再次确认：三芯分层+方形前摄革新，定价诚意拉满 OPPO Find X10系列配置曝光：2nm芯、双2亿主摄，堆料不讲武德 ColorOS再次发力：二月体验升级大揭秘，覆盖众多机型！小米17 Max再次被确认：取消副屏和加大电池，两亿像素也没跑了 iQOO Z11系列突然入网：90W+9000mAh，还有LCD屏幕！三星Galaxy S26系列完整规格曝光，预计2月25日正式发布京东高端手机Top10，华为Mate 80六连冠，iQOO 15 Ultra大亮 CounterPoint报告2025全球手机存量：8大品牌破2亿分析师：苹果iPhone 18 Pro系列起售价将与前代持平苹果即将移除iTunes愿望清单功能，提醒用户迁移内容苹果预计本月推出搭载M5 Pro/Max芯片的新款MacBook Pro笔记本电脑联想拯救者Y700 2026款小平板配置曝光：骁龙8E5处理器配8.8英寸3K LCD屏 SK海力士、闪迪：2025Q4 NAND闪存平均单价上涨30%以上 PGYTech蒲公英RetroVa摄影套件亮相，适配苹果iPhone多机型 Mate 80卖爆！华为拿到1月中国手机市场份额第一名：份额提升至18.6% 人民日报头版力挺，OPPO折叠屏技术引苹果学习！《后厂村AI派》正式启动：Pitch Your Next Move！中途退学的艺术生，开发Web 3D项目，周下载量破400万印奇挂帅后，阶跃星辰最强开源模型登场！六大国产AI芯片已适配 Moltbook漏洞大到可以冒充Karpathy发帖，黑客都急了苹果妙控键盘固件更新，覆盖M4/M5款iPad Pro与M3 Air机型昔日HDD巨头Conner重生回归！进军外置存储与手机周边

Copyright 2006-2025 车评报版权所有京ICP备2025121051号-11