猫眼电影
猫眼电影记者 严朝君 报道Q8X2R7L1T4J5M9B6W3
大语言模型(LLM)的「炼丹师」们,或许都曾面临一个共同的困扰:为不同任务、不同模型手动调整解码超参数(如 temperature 和 top-p)。这个过程不仅耗时耗力,而且一旦模型或任务发生变化,历史经验便瞬间失效,一切又得从头再来。
这种繁琐的试错过程,在许多研发团队的日常沟通中屡见不鲜,正如下图所展示的那样:
图 1:研发人员手动调整解码参数的日常。
一个灵魂拷问随之而来:为何不能让模型自己学会如何解码,从而实现真正的「端到端」?
事实上,各大模型厂商的 API 文档也印证了这一难题。以 DeepSeek 为例,其官方文档明确建议针对不同场景设置截然不同的 temperature 值,这使得单一的静态参数设置显得捉襟见肘。
图 2:不同任务需要不同的解码参数,这使得静态设置难以应对复杂多变的现实需求。
近日,由腾讯 AI Lab 的王琰研究员及其团队领衔,联合香港中文大学(深圳)唐晓莹教授及其博士生王志超给出了一个优雅的答案。他们推出了名为 AutoDeco 的全新架构,旨在彻底终结手动解码的「手工作坊」时代。这项研究《The End of Manual Decoding: Towards Truly End-to-End Language Models》,通过让模型动态预测并控制自身的解码参数,向着真正端到端的语言生成迈出了关键一步。
论文链接: https://huggingface.co/papers/2510.26697代码链接: https://github.com/Zacks917/AutoDeco模型链接: https://huggingface.co/collections/Jadeislaw/autodeco
图 3:AutoDeco 位居 Hugging Face Daily Papers 榜首
当前,尽管 LLM 本身已高度集成,但其生成过程的「最后一公里」—— 解码,仍然是一个独立于模型之外的、不可微的僵硬环节。研究团队形象地将其比作「手动挡变速箱」:无论引擎(LLM)多么强大,换挡(调参)依然依赖人工操作。
AutoDeco 的核心思想,就是为 LLM 装上「自动挡」。它通过在标准 Transformer 架构中引入两个超轻量的预测头,让模型在生成每一个 token 时,都能根据当前的上下文信息,动态地预测出最适合下一步生成的 temperature 和 top-p 值。其架构如下图所示:
图 4:AutoDeco(上)与传统手动解码(下)的对比。AutoDeco 将解码参数的预测无缝集成到模型的前向传播中,实现了动态自调节。
核心挑战与技术突破:如何训练一个没有「标准答案」的任务?
设想很美好,然而,一个关键的挑战摆在研究团队面前:如何训练这些预测头?在训练数据中,并不存在每一时刻「正确」的温度和 top-p 标签,这使得监督学习无从谈起。
为此,团队提出了一种创新的、完全端到端的训练策略。他们设计了一种新颖的可微分「软性 top-p」(soft top-p)机制,巧妙地替代了传统 top-p 采样中不可微的「硬截断」操作。该方法分为三步:
图 5:可微分的 soft top-p(橙色线)与传统的 hard top-p (绿色线)对比。Soft top-p 的平滑特性打通了从最终损失到解码参数预测头的梯度路径。
这一设计的巧妙之处在于,它使得从最终的「下一个词预测」损失到解码参数预测头的梯度能够顺畅回传。如此一来,模型便可以在标准的 Next Token Prediction 任务中,通过优化最终生成结果来「倒逼」自己学会如何动态调整解码策略,整个过程无需任何额外的标注数据。
AutoDeco 的惊人表现:三大亮点
通过在 Llama、Qwen、Deepseek 等多个主流模型家族上的广泛实验,AutoDeco 展现了其强大的能力:
卓越的性能与泛化能力
实验结果表明,AutoDeco 不仅稳定超越了传统的 Greedy Search 和 Default Sampling 等基线方法,其性能甚至能媲美、乃至超越了利用测试集进行精细调优的「神谕」基线(oracle-tuned baseline)。
图 6:AutoDeco 在多个数学和通用任务 benchmark 上均取得了 SOTA 性能,展现了其强大的泛化能力。
极致的效率与易用性
AutoDeco 的预测头设计极为轻量,其带来的额外推理延迟通常仅为 1.7%,内存开销也几乎可以忽略不计。对于开发者而言,接入 AutoDeco 模型仅需修改几行代码,即可享受「免费」的性能提升。
「言出法随」:开创性的自然语言控制能力
研究中最令人兴奋的发现之一,是 AutoDeco 涌现出的一种「通过自然语言控制解码」的能力。用户可以直接在 prompt 中通过自然语言下达指令,如「我希望答案更有创意」,模型便能「听懂」并自主地调高其预测的 temperature 和 top-p 值,整个过程清晰可见。
图 7:在不同指令下,AutoDeco 预测的 T/P 值变化。从左至右分别为:基线、高创造力指令(T/P 值自发升高)、高确定性指令(T/P 值自发降低)。
当然,作者坦言这种能力还不够完善,还做不到非常精准的控制。他们猜测实现细粒度、高精度的自然语言控制解码无法仅仅能通过微调 AutoDeco 模块做到,而是需要全参微调模型,这也被他们列为了 Future work 的重点。因此,作者没有放出带有自然语言控制能力的 AutoDeco heads 权重。
AutoDeco 在发布后迅速吸引全球 AI 社区的关注,在 Twitter 等社交平台上引发了顶尖学者、开发者和企业家的广泛热议和高度评价。
图 8:大模型社区对 AutoDeco 的广泛热议和高度评价。
目前,该团队已将论文、代码以及在多个主流模型上训练好的 AutoDeco heads 全面开源,包含适配于 Deepseek V3.1、Qwen3-235B、GPT-OSS-120B 等生产级大模型的版本。正如研究人员在分享中所说,这项工作旨在将研究者和开发者从繁琐的调参工作中解放出来,共同迈向一个更智能、更自动化的 AGI 新时代。
??时事1:BOB线路检测
??11月02日,(乡村行·看振兴)福建寿宁:党建引领猕猴桃产业 协同发展助力乡村振兴,
一年来,*集团积极推进品牌建设,开展企业形象和品牌传播,启动体育营销,正式成为国家篮球队唯一指定,并陆续在全国20多个重点城市举办篮球争霸赛、篮球宝贝选拔赛等相关活动。籍珠江诞生10周年的机会,我们与中国酿酒工业协会共同举办了“中国行业自主创新国际高峰论坛暨中国十周年庆典”,中央和地方媒体进行了全面深入的报道,进一步确立了珠江在中国行业“第一”的地位,提升了知名度和美誉度。
,天博体育下载。??11月02日,对韩免签落地不到1个月 “周五下班去中国”登上韩网热搜,
仿若回到了上古年间,聆听到了诸神的吟唱。
,亚洲彩票下载平台,世界杯足球直播网站,太阳成网址。??时事2:万博手机版官网登录不了
??11月02日,中新健康丨蓝皮书:“十四五”以来,各地健康指标得到有效提升,
“怎么样?”一群族人眼巴巴的望着。
,易胜博的正规网址,ag真人游戏正规,乐博苹果版。??11月02日,江西全省高等级航道通航总里程达960.6公里,
他还年幼,就有了一种很非常可怕的气势,仿佛注定要凌驾芸芸众生上、俯视万灵般,像是一尊神明降世。
?第五十六章 天生至尊,世界杯买球的网站,国际ag旗舰厅,尊龙z6。??时事3:ag线上下载
??11月02日,如何享受减半征收“六税两费”政策?收好这张图,
它很愤怒,明明感觉到小不点就在前方,祭出宝剪,准备一击必杀,可是每次都落空。
,AG真人官方平台,马经龙头报(荐),欧宝平台下载安卓版。??11月02日,从“网红”变“长红”小帐篷撑起身边的“诗与远方”,
“唉,越来越死气沉沉了,几个老怪物都先后死了,剩下那个小可怜怎么办?造孽啊。”一个老人赶着兽车,离开了破败的庄子,他是送来果子、猎物等吃食来的。
,斗球APP下载网址,马经玄机图(荐),永利国际彩票网站。??时事4:云顶娱乐登陆地址
??11月02日,东西问·镇馆之宝|李清丽:虢国玉柄铁剑为何可视为“中华第一剑”?,
“不好,有凶兽出没,快进行防御!”
,MT电子,明升体育电竞,BOB页面登录。??11月02日,斯诺克冠中冠:丁俊晖不敌特鲁姆普止步首轮,
穷人的孩子早当家,暑假了,有些懂事的孩子为了锻炼自己,也为了给父母减轻些负担,便趁暑假出去打工挣点学费和零花钱,这些学生有的是刚考完中考,有的刚参加完高考,很多是未成年人,孩子们初次出门打工,需要全社会的关爱和支持。

可就是有些老板黑了心,只顾自己赚钱,不管别人死活。他们招学生打工,明明知道学生打工只有一两个月,但他们却设置一个月甚至两个月的试工期,也不签合同,开的工资也很低,他们不给买社保但却会从微薄的工资中扣缴一两百块社保费用,而且往往把发工资的日期定到下月中旬,如此种种不一而足。更有甚者,好不容易等到该发工资了,黑心人又找种种理由克扣工资,甚至拖着不发工资。
碰到这些事,你该怎么维权呢?劳动仲裁当然可以,但时间长程序复杂,也等不及呀。去求老板发发慈悲,也不一定管用,有些人践就是记打不记吃,三句好话当不得一马棒棒,求也没用。那难道就没招了?有!
最好最快的办法,就是与小伙伴们一起(人多点易受重视,但没有小伙伴的话也没关系,胆大点一个人也中),带上你的身份证(没有身份证拿能证明身份的证件比如学生证也行)到打工地所在的区(县)找人力资源和社会保障局去,那里有一个劳动监察大队,找他们投诉举报,通常效果较好。投诉最好写个书面的《举报信》,举报人是你自己,姓名年龄性别民族住址****,被举报人是公司或工厂或营业部或个体老板,也有名称**负责人****(负责人及****不知道可不写),举报事由,则要写明你何时入厂打工及合同签订及拖欠工资情形,通常是没签合同没买社保乱扣工钱不给加班费或拖欠工资,总有一款适合你,再写你的要求,简单粗暴,快点把工资付了!请监察大队尽快进行监察处理。当然,你得提供一些确实在工厂打工的证据,比如工牌,工号,合同,聊天记录,照片,工资条等,大致就这些。也有些监察大队会让你填表,内容与《举报信》差不多,劳动监察大队一般会受理。
有时会碰到无良的监察人员,对你不理不睬或忽攸你,让你找劳动仲裁,你可千万别听,就请他依法受理,《劳动保障监察条例》有明文规定,拖欠工资应当受理报案,且应当监察处理。但他就是不受理怎么办?你别和他当场斗,记住他工牌或姓名备用。你还可以在社保网站或政务网站上举报,如何找到网站,自己百度,还可以打**投诉,拨打当地固定**区号+12333即可投诉。
如果还没用怎么办?用大招,打市长热线12345,投诉被扣工资还投诉无门劳动监察还不管,劳监大队谁谁谁不受理你投诉,市长大人的**,一定会有人处理并反馈给你的。
这些都做完了,还没有结果怎么办?重复重复再重复,一定会有用,成本又低,要敢搞事,要不怕麻烦,要有决心!依法维权,合法维权,勇于维权,不但可以挽回经济损失,还可以锻造人格,好处真是太大了!
小伙伴们永远记住,人弱被人欺,马弱被人骑,有人就喜欢欺压老实人,权利是靠自己争取来的,一定要勇于讨说法,忍气吞声只会受欺侮,诚可悲也。
?学校及周边安全教育国旗下讲话稿(通用24篇),炸金花app靠谱,190足球比分,188体育登录首页注册。责编:克劳斯
审核:崔灿
责编:宫来宾












