2025-09-23 01:26:31 8,737次浏览

RAG准确率提升10.6%,多项基准拿下新SOTA!

ACL 2025最新研究提出Lexical Diversity-aware RAG(DRAG)框架,首次系统性地将词汇多样性引入RAG的检索与生成过程,提供了一个轻量、通用且易扩展的解决方案。

在多项基准任务中,该方法带来了显著性能提升,尤其在HotpotQA上刷新了当前最优结果。

在大语言模型的浪潮下,Retrieval-Augmented Generation(RAG)已经成为提升模型事实性和时效性的重要手段。然而,现有方法普遍忽视了一个看似细微却极为关键的问题——词汇多样性(lexical diversity)。

同一个问题,不同的表达方式,往往让检索模型“晕头转向”,最终导致错误答案。

由此,来自北航、北大、中关村实验室的研究团队提出了这项最新工作,他们首次将“词汇多样性”引入检索增强生成的相关性评估过程,并通过新颖的风险稀疏校准机制解决了生成阶段被无关信息干扰的问题。

团队认为,该方法对信息检索、问答系统、专业领域大模型应用都具有重要价值。未来,他们计划进一步拓展该方法到新万博体育:专业场景,让大模型不仅能“读懂”,更能“理解”复杂的人类语言表达。

词汇多样性:RAG的隐形痛点

研究团队指出,现有RAG方法大多通过“单一标准”判断检索文档是否相关,但现实情况要复杂得多。如图所示,以问题“What is Hattie McDaniel’s occupation?”为例,其中的语义成分表现出不同程度“词汇多样性”:

不变词(Invariant):人名“Hattie McDaniel”一般不会变形;可变词(Variant):词语“occupation”可以对应“profession”“actress”甚至“Academy Award”;补充信息(Supplementary):答案可能依赖“American celebrity”等扩展语境。

这种词汇多样性往往导致模型错误地将部分相似但无关的文档判为相关,或者忽略了真正有用的信息。

两大关键创新

为解决“词汇多样性”带来的挑战,研究团队提出了该框架,核心在于两个互补模块:

1、Diversity-sensitive Relevance Analyzer(DRA)

传统检索相关性评估往往“一刀切”,把整体查询和检索文档进行比较。该方法则进一步拆解查询语义,针对不同成分采用差异化策略:

不变成分:如人名、地名等必须精确匹配的关键词,该方法强调其检索文档应与该成分严格匹配;可变成分:如“occupation”—“profession”,DRA借助LLM的语义扩展和分析能力,在检索时允许一定语义灵活性;补充成分:如“American celebrity”,该方法通过检索需求的明确程度来判断是否需要真正提供有用的补充证据。

在此基础上,该方法通过该模块对相似度检索结果进行重排序,输出一个更细粒度、多维度的相关性评分,避免检索时存在的“假阳性”和“假阴性”的常见问题。

2. Risk-guided Sparse Calibration

即使有了更精准的检索,生成阶段仍然可能“被干扰”。Risk-guided Sparse Calibration的设计灵感来自“风险控制”:它会实时监控每个生成token的“被误导风险”,并在必要时进行解码校准。

词汇风险(Lexical Risk):检测生成内容是否过度依赖低相关的词汇;注意力风险(Attention Risk):评估模型注意力是否集中在无关段落;预测风险(Prediction Risk):衡量当前预测是否与检索证据存在冲突。

RSC的独特之处在于它的稀疏性(sparse calibration):只对高风险token动态干预,而不会对全局输出强行重写,从而保证了生成质量与效率的平衡。

最终,DRA负责“挑选更靠谱的材料”,RSC负责“防止模型走偏”,形成了检索与生成环节的双保险,让RAG更稳健、更准确。

实验结果:显著超越现有方法

团队在多个开放域问答基准上验证了该方法:

其中,该方法在PopQA/TriviaQA(短文本问答):准确率分别提升4.9%和4.4%;HotpotQA/2WikiMultiHopQA(多跳问答):准确率均提升10.6%,展现出强泛化性;在ASQA(长答案生成):在str-em、QA-F1等指标上刷新SOTA。

不仅如此,该方法在不同类型、大小的模型上均表现出显著增益,如Llama2-7B, Llama2-13B, Qwen2-7B, Alpaca-7B和Mistral-7B等。

论文链接:

https://aclanthology.org/2025.acl-long.1346/代码(即将开源):

https://github.com/Zhange21/DRAG

扎金花平台app 汽车动态[ ]详细说明_新万博体育

新万博体育

图片 让RAG真正读懂“言外之意”!新框架引入词汇多样性,刷新多基准
让RAG真正读懂“言外之意”!新框架引入词汇多样性,刷新多基准

让RAG真正读懂“言外之意”!新框架引入词汇多样性,刷新多基准

「统计」P6F3X2M7T9QJ8L1B4WZR

1.51MB
版本V6.7.41
下载足彩大赢家安装你想要的应用 更方便 更快捷 发现新万博体育:
喜欢 70%好评(25353人)
评论 13
让RAG真正读懂“言外之意”!新框架引入词汇多样性,刷新多基准截图0 让RAG真正读懂“言外之意”!新框架引入词汇多样性,刷新多基准截图1 让RAG真正读懂“言外之意”!新框架引入词汇多样性,刷新多基准截图2 让RAG真正读懂“言外之意”!新框架引入词汇多样性,刷新多基准截图3 让RAG真正读懂“言外之意”!新框架引入词汇多样性,刷新多基准截图4
详细信息
  • 软件大小: 93739.21979MB
  • 最后更新: 2025-09-23 01:26:31
  • 最新版本: V1.24358.1
  • 文件格式: apk
  • 应用分类:ios-Android dafa下载
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 3.59653以上
应用介绍
一,通比牛牛怎样才能赢钱,果敢老街新锦江官网
二,leyu乐鱼真人百家乐,谁有爱博平台网站
三,银河网站怎么登录不了,yobo平台
四,免费百家乐,615威尼斯人网站
五,TG买球安全吗,鸿博体育网页版
六,大发体育在线官网,打鱼注册送分18元,360app下载官方下载
七,澳门皇冠com
【联系我们】
客服热线:134-2881-646
加载新万博体育:
版本更新
V3.9.78
pg电子游戏app

kok在哪玩 类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
包含 饿了么 的应用集
评论
  • 日博体育足球 5天前
    银河娱乐捕鱼下载
  • js06b金沙游戏 8天前
    澳门游戏在线平台
  • 万博体育官方平台 9天前
    新利18体育官方
  • 捕鱼大师苹果版本下载安装 9天前
    凯发娱乐官网主页
  • 国际音标真人示范发音 9天前
    龙8国际是什么
  • 千炮捕鱼游戏有什么技巧吗 6天前
    大发体育注册彩金
  • 大发竞彩官网 6天前
    体彩app官方正版
  • 博狗快速开户 4天前
    赢三张下载大全
  • 万赢体育app下载 7天前
    综合体育赛事
  • 娱乐赌场下载 9天前
    dafa游戏