猫眼电影
猫眼电影记者 焦立坤 报道Q8X2R7L1T4J5M9B6W3
大语言模型(LLM)的「炼丹师」们,或许都曾面临一个共同的困扰:为不同任务、不同模型手动调整解码超参数(如 temperature 和 top-p)。这个过程不仅耗时耗力,而且一旦模型或任务发生变化,历史经验便瞬间失效,一切又得从头再来。
这种繁琐的试错过程,在许多研发团队的日常沟通中屡见不鲜,正如下图所展示的那样:
图 1:研发人员手动调整解码参数的日常。
一个灵魂拷问随之而来:为何不能让模型自己学会如何解码,从而实现真正的「端到端」?
事实上,各大模型厂商的 API 文档也印证了这一难题。以 DeepSeek 为例,其官方文档明确建议针对不同场景设置截然不同的 temperature 值,这使得单一的静态参数设置显得捉襟见肘。
图 2:不同任务需要不同的解码参数,这使得静态设置难以应对复杂多变的现实需求。
近日,由腾讯 AI Lab 的王琰研究员及其团队领衔,联合香港中文大学(深圳)唐晓莹教授及其博士生王志超给出了一个优雅的答案。他们推出了名为 AutoDeco 的全新架构,旨在彻底终结手动解码的「手工作坊」时代。这项研究《The End of Manual Decoding: Towards Truly End-to-End Language Models》,通过让模型动态预测并控制自身的解码参数,向着真正端到端的语言生成迈出了关键一步。
论文链接: https://huggingface.co/papers/2510.26697代码链接: https://github.com/Zacks917/AutoDeco模型链接: https://huggingface.co/collections/Jadeislaw/autodeco
图 3:AutoDeco 位居 Hugging Face Daily Papers 榜首
当前,尽管 LLM 本身已高度集成,但其生成过程的「最后一公里」—— 解码,仍然是一个独立于模型之外的、不可微的僵硬环节。研究团队形象地将其比作「手动挡变速箱」:无论引擎(LLM)多么强大,换挡(调参)依然依赖人工操作。
AutoDeco 的核心思想,就是为 LLM 装上「自动挡」。它通过在标准 Transformer 架构中引入两个超轻量的预测头,让模型在生成每一个 token 时,都能根据当前的上下文信息,动态地预测出最适合下一步生成的 temperature 和 top-p 值。其架构如下图所示:
图 4:AutoDeco(上)与传统手动解码(下)的对比。AutoDeco 将解码参数的预测无缝集成到模型的前向传播中,实现了动态自调节。
核心挑战与技术突破:如何训练一个没有「标准答案」的任务?
设想很美好,然而,一个关键的挑战摆在研究团队面前:如何训练这些预测头?在训练数据中,并不存在每一时刻「正确」的温度和 top-p 标签,这使得监督学习无从谈起。
为此,团队提出了一种创新的、完全端到端的训练策略。他们设计了一种新颖的可微分「软性 top-p」(soft top-p)机制,巧妙地替代了传统 top-p 采样中不可微的「硬截断」操作。该方法分为三步:
图 5:可微分的 soft top-p(橙色线)与传统的 hard top-p (绿色线)对比。Soft top-p 的平滑特性打通了从最终损失到解码参数预测头的梯度路径。
这一设计的巧妙之处在于,它使得从最终的「下一个词预测」损失到解码参数预测头的梯度能够顺畅回传。如此一来,模型便可以在标准的 Next Token Prediction 任务中,通过优化最终生成结果来「倒逼」自己学会如何动态调整解码策略,整个过程无需任何额外的标注数据。
AutoDeco 的惊人表现:三大亮点
通过在 Llama、Qwen、Deepseek 等多个主流模型家族上的广泛实验,AutoDeco 展现了其强大的能力:
卓越的性能与泛化能力
实验结果表明,AutoDeco 不仅稳定超越了传统的 Greedy Search 和 Default Sampling 等基线方法,其性能甚至能媲美、乃至超越了利用测试集进行精细调优的「神谕」基线(oracle-tuned baseline)。
图 6:AutoDeco 在多个数学和通用任务 benchmark 上均取得了 SOTA 性能,展现了其强大的泛化能力。
极致的效率与易用性
AutoDeco 的预测头设计极为轻量,其带来的额外推理延迟通常仅为 1.7%,内存开销也几乎可以忽略不计。对于开发者而言,接入 AutoDeco 模型仅需修改几行代码,即可享受「免费」的性能提升。
「言出法随」:开创性的自然语言控制能力
研究中最令人兴奋的发现之一,是 AutoDeco 涌现出的一种「通过自然语言控制解码」的能力。用户可以直接在 prompt 中通过自然语言下达指令,如「我希望答案更有创意」,模型便能「听懂」并自主地调高其预测的 temperature 和 top-p 值,整个过程清晰可见。
图 7:在不同指令下,AutoDeco 预测的 T/P 值变化。从左至右分别为:基线、高创造力指令(T/P 值自发升高)、高确定性指令(T/P 值自发降低)。
当然,作者坦言这种能力还不够完善,还做不到非常精准的控制。他们猜测实现细粒度、高精度的自然语言控制解码无法仅仅能通过微调 AutoDeco 模块做到,而是需要全参微调模型,这也被他们列为了 Future work 的重点。因此,作者没有放出带有自然语言控制能力的 AutoDeco heads 权重。
AutoDeco 在发布后迅速吸引全球 AI 社区的关注,在 Twitter 等社交平台上引发了顶尖学者、开发者和企业家的广泛热议和高度评价。
图 8:大模型社区对 AutoDeco 的广泛热议和高度评价。
目前,该团队已将论文、代码以及在多个主流模型上训练好的 AutoDeco heads 全面开源,包含适配于 Deepseek V3.1、Qwen3-235B、GPT-OSS-120B 等生产级大模型的版本。正如研究人员在分享中所说,这项工作旨在将研究者和开发者从繁琐的调参工作中解放出来,共同迈向一个更智能、更自动化的 AGI 新时代。
??时事1:国外胖老太
??11月01日,美军宣布:打死一名与“基地”关联武装高级头目,
现在,他双臂处金色符文闪烁,呼呼生风,宛若一头小金鹏般,划过长空,姿势优美而又有些许凌厉。
,久久六视频网。??11月01日,活力喷涌!辽宁夏日消费季暨“国潮臻品馆”项目启动,
一、充分认识当前形式,切实增强工作的紧迫感和责任感。
,免费 成人 结,猎奇破解版免费版安装,亚洲另类综合欧美。??时事2:国内精品久久久久久
??11月01日,香港不止“居大不易”,还有郊野的山水之乐,
(一)坚持高起点规划,提高城市规划设计档次。一是要放开规划设计市场。要不断整顿和规范规划设计市场秩序,完善市场机制,一切规划设计项目都要向国内外公开招标,公开定标。重点规划设计项目,要聘请国内外著名专家参与设计,确保城市规划的高起点、高水平、高质量。二是要加大规划设计深度。城市的规划设计要充分体现当地历史文化底蕴,自然风貌特色,新世纪现代化气息。要加快控制性详细规划的编制步伐,使城市所有土地的开发和建设置于城市规划的严格控制之下。对城镇区域内各片区的土地利用性质、开发强度、容积率、绿地率等都要做出控制性详细规划,条件成熟时上升为法定图则,在三至五年内,控制性详细规划要全面覆盖城镇建成区。在城市详细规划中,要确定规划红线、生态绿线、自然水体保护蓝线、历史文化街区保护紫线,并向社会公布。三是要理顺规划管理体制。要高度集中规划管理权,按照规划管理权上移的要求,一个城市只准设立一个城市规划主管部门,实行政府对城市规划实施权的集中统一。建立科学民主的规划决策机制。按照省委、省政府的统一要求,市和各县都要建立由、专家和社会各界代表组成的城市规划委员会,作为政府城市规划设计的决策咨询机构,所有城市规划设计项目都必须经过规划委员会的咨询论证,今后,未经规划委员会论证的规划设计项目,政府一律不予审批。加快建立规划、土地、房产统一的管理体制,使土地和房产管理成为规划实施的有效保障。四是要依法加强规划管理。城市规划一经确定,就要严格依法实施,任何单位和个人都无权干预,更不能随意变更,确需变更的,必须严格按法定程序进行。要进一步加强建设项目的规划管理,不符合城市规划的项目不得批准立项,未编制控制性详细规划的地块不得出让、转让和开发建设。任何建设项目都不得突破红线、绿线、蓝线和紫线。要加大规划管理的深度,严格实行城市规划错案行政责任追究制度,对违法用地和违法建设要严肃进行查处,依法追究有关责任人的责任。五是要强化对城市规划工作的社会监督。全面推行"阳光规划",在规划编制、审批和实施的全过程实行公示制度,对建设工程项目规划许可的审批,实行批前和批后15天的公示制度,扩大公众参与,广泛接受社会监督,确保城市规划的科学合理。
,另类视频一区二区,国产精品亚洲专区无码app,美女18岁免费网站。??11月01日,美国防部将多家中企列入“中国军方企业名单” 中方坚决反对,
三枚蛋被摆在大柳树下的祭坛旁,有专门的人负责看护,静等幼鸟破壳而出,毕竟这可是强大的凶禽卵啊,非常珍贵。
,日本韩国特级黄色视频,男女交配视频网站,在线看国产日韩。??时事3:亚州人体性交一区二区
??11月01日,【奥运画刊】奥运在这一刻很温暖,
金翅大鹏、真犼,这些天阶太古凶兽,想都不用想,它们的宝术绝对称得上盖世,不可比拟!
,fuqqer100% 2023,怎么样扣币更爽,亚洲黄色视频视频在线观看。??11月01日,加拿大东西部港口停工 加政府要求对劳资双方实施强制仲裁,
小不点被白色瀑布淹没,在峭壁上只留下一个凸起的白点,但是灵觉极强,感觉到了危机,不过这一次他没有躲避,而是凭借肉身硬抗。
,sm跪下来张口嘴喝尿的视频,情欲超时,动漫美女足交。??时事4:瓜老师笔记网页版入口
??11月01日,消费贷打响新年“价格战” 多家银行利率低至3%,
一群孩子皆翻白眼,嘘声道:“族长要是相信就见鬼了,朱雀在太古时代也只是传说而已,现在怎么可能真有,而且还被你追逐!”
,XXXX张柏芝性生交XXXXX,欧美操逼aaaaaa极,亚洲性爱网站二十。??11月01日,“五一”返程高峰日 哈铁预计发送旅客48万人次,
二秃子直接吓傻了,喃喃道:“这不光是吓坏上古大能的节奏,估计太古的大家伙也要被吓一跳啊。”
?第二百二十三章 成交,小 伸进 喷水国产,一级黄片一级黄片一级黄片一级黄片一级黄片,挤奶做运动好爽。责编:泰克尼克
审核:宋俊峰
责编:沙东沙












