RAG准确率提升10.6%,多项基准拿下新SOTA!
ACL 2025最新研究提出Lexical Diversity-aware RAG(DRAG)框架,首次系统性地将词汇多样性引入RAG的检索与生成过程,提供了一个轻量、通用且易扩展的解决方案。
在多项基准任务中,该方法带来了显著性能提升,尤其在HotpotQA上刷新了当前最优结果。
在大语言模型的浪潮下,Retrieval-Augmented Generation(RAG)已经成为提升模型事实性和时效性的重要手段。然而,现有方法普遍忽视了一个看似细微却极为关键的问题——词汇多样性(lexical diversity)。
同一个问题,不同的表达方式,往往让检索模型“晕头转向”,最终导致错误答案。
由此,来自北航、北大、中关村实验室的研究团队提出了这项最新工作,他们首次将“词汇多样性”引入检索增强生成的相关性评估过程,并通过新颖的风险稀疏校准机制解决了生成阶段被无关信息干扰的问题。
团队认为,该方法对信息检索、问答系统、专业领域大模型应用都具有重要价值。未来,他们计划进一步拓展该方法到新万博体育:专业场景,让大模型不仅能“读懂”,更能“理解”复杂的人类语言表达。
词汇多样性:RAG的隐形痛点
研究团队指出,现有RAG方法大多通过“单一标准”判断检索文档是否相关,但现实情况要复杂得多。如图所示,以问题“What is Hattie McDaniel’s occupation?”为例,其中的语义成分表现出不同程度“词汇多样性”:
不变词(Invariant):人名“Hattie McDaniel”一般不会变形;可变词(Variant):词语“occupation”可以对应“profession”“actress”甚至“Academy Award”;补充信息(Supplementary):答案可能依赖“American celebrity”等扩展语境。
这种词汇多样性往往导致模型错误地将部分相似但无关的文档判为相关,或者忽略了真正有用的信息。
两大关键创新
为解决“词汇多样性”带来的挑战,研究团队提出了该框架,核心在于两个互补模块:
1、Diversity-sensitive Relevance Analyzer(DRA)
传统检索相关性评估往往“一刀切”,把整体查询和检索文档进行比较。该方法则进一步拆解查询语义,针对不同成分采用差异化策略:
不变成分:如人名、地名等必须精确匹配的关键词,该方法强调其检索文档应与该成分严格匹配;可变成分:如“occupation”—“profession”,DRA借助LLM的语义扩展和分析能力,在检索时允许一定语义灵活性;补充成分:如“American celebrity”,该方法通过检索需求的明确程度来判断是否需要真正提供有用的补充证据。
在此基础上,该方法通过该模块对相似度检索结果进行重排序,输出一个更细粒度、多维度的相关性评分,避免检索时存在的“假阳性”和“假阴性”的常见问题。
2. Risk-guided Sparse Calibration
即使有了更精准的检索,生成阶段仍然可能“被干扰”。Risk-guided Sparse Calibration的设计灵感来自“风险控制”:它会实时监控每个生成token的“被误导风险”,并在必要时进行解码校准。
词汇风险(Lexical Risk):检测生成内容是否过度依赖低相关的词汇;注意力风险(Attention Risk):评估模型注意力是否集中在无关段落;预测风险(Prediction Risk):衡量当前预测是否与检索证据存在冲突。
RSC的独特之处在于它的稀疏性(sparse calibration):只对高风险token动态干预,而不会对全局输出强行重写,从而保证了生成质量与效率的平衡。
最终,DRA负责“挑选更靠谱的材料”,RSC负责“防止模型走偏”,形成了检索与生成环节的双保险,让RAG更稳健、更准确。
实验结果:显著超越现有方法
团队在多个开放域问答基准上验证了该方法:
其中,该方法在PopQA/TriviaQA(短文本问答):准确率分别提升4.9%和4.4%;HotpotQA/2WikiMultiHopQA(多跳问答):准确率均提升10.6%,展现出强泛化性;在ASQA(长答案生成):在str-em、QA-F1等指标上刷新SOTA。
不仅如此,该方法在不同类型、大小的模型上均表现出显著增益,如Llama2-7B, Llama2-13B, Qwen2-7B, Alpaca-7B和Mistral-7B等。
论文链接:
https://aclanthology.org/2025.acl-long.1346/代码(即将开源):
https://github.com/Zhange21/DRAG
《美女脱一光二净打屁股》,《P6F3X2M7T9QJ8L1B4WZR》91极品人妻的娇喘呻吟
“ive张元英退款”
仙踪林色情一区二区三区
……
09月23日
“无遮挡同人漫画网站”马龙王楚钦3比0印度组合
↓↓↓
09月23日,韩正会见委内瑞拉副总统罗德里格斯,男生洗澡露j网站㊙️,雏田小樱被鸣人❌无码,男人的🍌伸到🍑里51,🈚码18🈲H站在线看男男
09月23日,流浪27年 湖南籍男子在江西龙南找到回家的路,揉⋯啊⋯嗯~出水了男同微博,美女警察❌开腿让我爽一夜动漫,14学生裸体穿白丝袜的图片,寺庙双乳高耸嗯啊H在线视频
09月23日,协同发展 携手奋进 ——粤港澳大湾区发展一线观察(上),静香被大雄调教到奶水直流,成人H㊙️小说网站,乖女从小被C到大H文np,涩图🔞🔞露出
09月23日|第十五届中国航展:参观者体验各式装备|斗破苍穹雅妃被c到高潮视频|裸睡腿张开被合租男看到了|❌❌❌免费裸体游戏真人版|100%胸片曝光率免费
09月23日|安理会审议乌克兰问题 中方呼吁有关方面逐步恢复谈判|太深拔出来痛太舒服男男|校花被C哭着爬又被挺进H|free性video6d|日本吮乳吃奶头XXⅩ视频下载
09月23日|2024女运动员收入排行:谷爱凌、郑钦文进前五|国产学生粉嫩无套进|❌❌❌女人裸体免费视频|пopно720pHDвинетh|sm免费网站❌Xx软件……
09月23日,中新健康 | 三阴乳腺癌治疗新研究获国际医学期刊关注,▓榴莲视频▓无码A片下载,无套正在播放,11少萝裸体视频,ai迪丽热巴被出水来
09月23日,西藏藏医药大学走进陈塘镇:弘扬藏医药文化 助力健康兴边,原神胡桃怀孕大肚子要生了,Y丫aSS明泬PicS大全,福瑞男同gv🔞禁网站,女女爱爱
09月23日|中国海警局就菲位南海多点侵权挑衅发表谈话|久久AV㊙️一区二区三区水牛|扒开🍑让老师🍌进去视频|魔女的库洛的臭脚丫在线观看|美腿二次元自慰丝袜❌❌
09月23日,我国世界遗产保护取得积极进展,老汉XXX自慰oldman,中国Chinese HDXXXX美女,自慰少妇X❌X❌X100摄像头,免费无遮挡🔞视频动漫
09月23日,11月广州一手住宅网签超90万平方米 市场热度持续,🍆❌女生🍑里动漫,洗脑变成无脑母畜的小说,倾辛和深圳18厘的故事背景,火影忍者纲手の办公室
09月23日,龙年将至说恐龙,福瑞涩涩同人❌,美女疯狂柔❌脱脱内内视频,雷电将军3D同人18❌羞羞,主人 调教 憋尿 高潮 锁
09月23日|系列专家解读之八|产品更新换代为高质量发展持续注入动力|女人脱了内裤被按摩师摸|杏仁入口官网|捆绑➕调教➕sm➕束缚男动态图|韩国美女主播19🈲vip
09月23日|多家外企在华交出亮眼成绩单—— 中国仍是全球“最佳投资沃土”|男同基漫Gay男男18禁成八人|日本翘臀电影|多强被❌c到爽🔞H动态图|别告诉妈妈mama99更新
09月23日|魏春荣:为传统昆曲探索当代表达|美女脱👙免费看尿囗㊙️动漫|莫妮卡床戏无删减版|ai一键去除衣服免费版|裸体爆乳羞羞❌网站视频
赵牧辰李定豪正面刚,韩国被G7峰会排除在外|有民众呼吁针对赖清德上台大陆应取消经济惠台措施 国台办回应|喷火龙裸体被❌羞羞嗯网站|GayGay✅免费视频网址|惩罚拨开🍑用冰块小说|动漫的隐私㊙️视频免费
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺