RAG准确率提升10.6%,多项基准拿下新SOTA!
ACL 2025最新研究提出Lexical Diversity-aware RAG(DRAG)框架,首次系统性地将词汇多样性引入RAG的检索与生成过程,提供了一个轻量、通用且易扩展的解决方案。
在多项基准任务中,该方法带来了显著性能提升,尤其在HotpotQA上刷新了当前最优结果。
在大语言模型的浪潮下,Retrieval-Augmented Generation(RAG)已经成为提升模型事实性和时效性的重要手段。然而,现有方法普遍忽视了一个看似细微却极为关键的问题——词汇多样性(lexical diversity)。
同一个问题,不同的表达方式,往往让检索模型“晕头转向”,最终导致错误答案。
由此,来自北航、北大、中关村实验室的研究团队提出了这项最新工作,他们首次将“词汇多样性”引入检索增强生成的相关性评估过程,并通过新颖的风险稀疏校准机制解决了生成阶段被无关信息干扰的问题。
团队认为,该方法对信息检索、问答系统、专业领域大模型应用都具有重要价值。未来,他们计划进一步拓展该方法到新万博体育:专业场景,让大模型不仅能“读懂”,更能“理解”复杂的人类语言表达。
词汇多样性:RAG的隐形痛点
研究团队指出,现有RAG方法大多通过“单一标准”判断检索文档是否相关,但现实情况要复杂得多。如图所示,以问题“What is Hattie McDaniel’s occupation?”为例,其中的语义成分表现出不同程度“词汇多样性”:
不变词(Invariant):人名“Hattie McDaniel”一般不会变形;可变词(Variant):词语“occupation”可以对应“profession”“actress”甚至“Academy Award”;补充信息(Supplementary):答案可能依赖“American celebrity”等扩展语境。
这种词汇多样性往往导致模型错误地将部分相似但无关的文档判为相关,或者忽略了真正有用的信息。
两大关键创新
为解决“词汇多样性”带来的挑战,研究团队提出了该框架,核心在于两个互补模块:
1、Diversity-sensitive Relevance Analyzer(DRA)
传统检索相关性评估往往“一刀切”,把整体查询和检索文档进行比较。该方法则进一步拆解查询语义,针对不同成分采用差异化策略:
不变成分:如人名、地名等必须精确匹配的关键词,该方法强调其检索文档应与该成分严格匹配;可变成分:如“occupation”—“profession”,DRA借助LLM的语义扩展和分析能力,在检索时允许一定语义灵活性;补充成分:如“American celebrity”,该方法通过检索需求的明确程度来判断是否需要真正提供有用的补充证据。
在此基础上,该方法通过该模块对相似度检索结果进行重排序,输出一个更细粒度、多维度的相关性评分,避免检索时存在的“假阳性”和“假阴性”的常见问题。
2. Risk-guided Sparse Calibration
即使有了更精准的检索,生成阶段仍然可能“被干扰”。Risk-guided Sparse Calibration的设计灵感来自“风险控制”:它会实时监控每个生成token的“被误导风险”,并在必要时进行解码校准。
词汇风险(Lexical Risk):检测生成内容是否过度依赖低相关的词汇;注意力风险(Attention Risk):评估模型注意力是否集中在无关段落;预测风险(Prediction Risk):衡量当前预测是否与检索证据存在冲突。
RSC的独特之处在于它的稀疏性(sparse calibration):只对高风险token动态干预,而不会对全局输出强行重写,从而保证了生成质量与效率的平衡。
最终,DRA负责“挑选更靠谱的材料”,RSC负责“防止模型走偏”,形成了检索与生成环节的双保险,让RAG更稳健、更准确。
实验结果:显著超越现有方法
团队在多个开放域问答基准上验证了该方法:
其中,该方法在PopQA/TriviaQA(短文本问答):准确率分别提升4.9%和4.4%;HotpotQA/2WikiMultiHopQA(多跳问答):准确率均提升10.6%,展现出强泛化性;在ASQA(长答案生成):在str-em、QA-F1等指标上刷新SOTA。
不仅如此,该方法在不同类型、大小的模型上均表现出显著增益,如Llama2-7B, Llama2-13B, Qwen2-7B, Alpaca-7B和Mistral-7B等。
论文链接:
https://aclanthology.org/2025.acl-long.1346/代码(即将开源):
https://github.com/Zhange21/DRAG
《男男全肉黄湿玩具play文》,《P6F3X2M7T9QJ8L1B4WZR》疯狂❌自慰爽www看片免费动漫
“疯狂自慰爽网站”
男男做爰无遮挡
……
09月23日
“刘涛牲交A片”何运晨做牛马的一天
↓↓↓
09月23日,创新动能十足 康弘药业2024年上半年营收同比增长19.46%,同性男A片18🈲在线观看,茄子视频成人♥免费观看,雷电将军被❌到深处喷水,芭芭拉穿白丝自慰流白浆
09月23日,江苏连云港扩大东西双向开放 全力建设“一带一路”强支点,亚洲AV㊙️无码一区莲水凛,frisk被强行扒开双腿玩弄漫画,jk天堂入口,蛇人和少爷双男主
09月23日,千余精品菊花汇聚南京争奇斗艳,美女隐私㊙️黄网站,捷克街头无删减在线观看,我的魅魔仆人第四集,九幺成人🔞在线观看喷潮
09月23日|中国正能量|马拉维留学生眼中“多样的中国”|美女的隐私㊙️拉屎视频|在线观看🔞禁无码精品动漫|美女🍑裸体|91娇喘❌❌⭕⭕白丝少林寺
09月23日|一习话丨“坚定不移推进高质量共建‘一带一路’”|日本午夜无码18🈲啪啪|荷兰巜性猛交做愛|羞羞漫画免费网站|女女百合高H喷汁黄文
09月23日|“香”遇智利 五粮液再启“和美之约”|日本一级特黄大片做受的背景故事|欧美ZC0O人与善交|总裁的妖精小秘H顾|毛利兰全身赤裸无遮挡……
09月23日,前三季度新疆经济运行稳步向好,小欣奈糖心作品,美女脱个精光18🈲,14岁男生手冲素材免费看,白皑草校霸爸爸免费阅读
09月23日,【光明论坛】坚持守正创新 不断取得改革新突破,XXXX69馃崋馃崋HT,🍆❌女生🍑里动漫,佐鸣把鸣人c哭了,小🐤🐤戳进🍑漫画
09月23日|2024年一季度贵州新能源汽车产量同比增长178.2%|民工把我奶头掏出来在线视频|v7tcc什么网站|美女露出🐻让男生揉的亲嘴|王馨瑶海滩比基尼秀引热议
09月23日,4月15日-21日国家铁路累计运输货物7440.4万吨,刺客伍六七❌18同人禁网站,芙宁娜爆乳被❌🔞🔞㊙️游戏,宋居寒何故木马椅,向日葵视频❤色版网站下载
09月23日,台商在江西:深耕大陆市场 冀江西工厂实现全球覆铜板产能第一不管你信不信,我们在福建找到了“齐天大圣”!,芙宁娜被❌吸乳脱内内H文,另类Z0Z❌❌❌000,少年骇客小玫泳装图片,灰原哀的奖励免费观看动漫
09月23日,澳大利亚维州华人社团联合会青年会正式成立,雏田被鸣人❌❌黄 3d,甘露寺蜜璃被c❌黄漫,火影佐良娜爆乳裸体自慰,闺蜜扒开我的腿用黄鳝
09月23日|中央气象台:西北地区东部黄淮及以南地区有雨雪|打女人屁股视频|被爆❌自慰流水3D|美女又爽❌又黄❌在线|女人成人扒开🍑游戏软件
09月23日|浙江丽水:津巴布韦“洋弟子”寻访中国传统文化|绫华被扒开腿灌满白浆|碧蓝航线裸体❌禁图漫画|开档露小内裤奶头白丝jk美女|男人自慰✅️免费观看欧美
09月23日|海南大熊猫兄弟过11岁生日 粉丝:肉眼可见变壮了|浴室里强摁做开腿呻吟动态图|扒开美女❌狂揉❌下部:|主人罚我把内裤夹在屁股里|母亲儿子乱伦~下面好多水~啊啊啊~ 视频
孙杨提前伸脖子等待金牌,男孩遭多人围殴并被砍伤 当地回应|开年后多家房企债务重整取得进展,业内预计行业风险出清将加速|克洛琳德无内奖励旅行者|崩坏3爱莉希雅女仆装|午夜男女爽爽影院A片免费失禁|美女又爽❌又黄❌在线观看
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺