当前位置:首页 → 电脑软件 → 博主质疑吉林文旅用张起灵宣传不妥 → 乐鱼体育注册登录 v6.420 安卓免費版
v9.772.4365.967730 安卓最新版
v4.694 IOS版
v5.100.3448 最新版
v7.227.7968.41858 PC版
v1.320.7699 安卓最新版
v5.408.7985.956894 最新版
v9.52.7425.42578 安卓最新版
v1.510 安卓漢化版
v5.38 最新版
v7.700.5254.24887 PC版
v4.97.6906.134307 PC版
v4.234.1520.429284 最新版
v8.246.5283.681879 最新版
v1.202 安卓免費版
v5.528.1540.269390 安卓漢化版
v5.84.1275.595943 安卓最新版
v8.889 安卓最新版
v8.190.8869.146162 安卓最新版
v9.742.6212.55812 安卓漢化版
v9.590.4930.363927 安卓最新版
v4.729.6692 安卓免費版
v1.288.1917 安卓版
v8.719.9811.975412 最新版
v9.2.4788 安卓漢化版
v3.953 PC版
v6.15.5289 最新版
v1.426 安卓漢化版
v5.897.6917.766312 安卓漢化版
v5.488.2837.694608 安卓版
v9.713.4709 安卓免費版
v8.549.9848.305169 安卓最新版
v1.748.5913.968689 安卓漢化版
v9.342 安卓最新版
v4.561.5732 安卓漢化版
v1.553 安卓版
v9.820.9144 安卓最新版
v6.237.7954 安卓漢化版
v6.920.1163 安卓版
v1.374.4259.298436 安卓免費版
v7.123.4583 最新版
v4.53.4602.951027 PC版
v3.36.8386.597954 PC版
v7.349.2518 安卓版
v6.444.4458.151139 安卓最新版
v6.473.9618.964444 安卓免費版
v5.177.3137 PC版
v4.611.954.361908 安卓免費版
v5.762.2514.97670 安卓版
v4.919.1587.269513 安卓漢化版
v5.906.4066.432366 安卓免費版
v3.990.8564.112080 安卓版
v4.90.4439 安卓漢化版
v4.10.5462 安卓最新版
v2.470.6108.839220 PC版
v5.602.610.857401 安卓漢化版
v9.117.4988.723535 安卓版
v8.36.9816.7558 IOS版
v9.287.211 安卓免費版
v3.915.9084.169903 PC版
v3.992.6638.411831 安卓最新版
v6.809 PC版
v7.383 安卓免費版
v9.461.9845.63788 安卓免費版
v7.256.3006.971612 安卓版
v8.979 安卓版
v8.601.3421.719265 安卓漢化版
v2.260.2645 安卓免費版
v5.25 PC版
v8.443 安卓漢化版
v1.556.6262.540836 安卓免費版
v8.152 安卓最新版
v6.570.4881 安卓免費版
v3.204 安卓免費版
v8.727 IOS版
v6.875.5447.356077 安卓最新版
v6.524.6847.960540 安卓最新版
v6.579.8175.755086 安卓最新版
v8.489 安卓免費版
v3.715 PC版
v6.595 安卓最新版
乐鱼体育注册登录
RAG准确率提升10.6%,多项基准拿下新SOTA!
ACL 2025最新研究提出Lexical Diversity-aware RAG(DRAG)框架,首次系统性地将词汇多样性引入RAG的检索与生成过程,提供了一个轻量、通用且易扩展的解决方案。
在多项基准任务中,该方法带来了显著性能提升,尤其在HotpotQA上刷新了当前最优结果。
在大语言模型的浪潮下,Retrieval-Augmented Generation(RAG)已经成为提升模型事实性和时效性的重要手段。然而,现有方法普遍忽视了一个看似细微却极为关键的问题——词汇多样性(lexical diversity)。
同一个问题,不同的表达方式,往往让检索模型“晕头转向”,最终导致错误答案。
由此,来自北航、北大、中关村实验室的研究团队提出了这项最新工作,他们首次将“词汇多样性”引入检索增强生成的相关性评估过程,并通过新颖的风险稀疏校准机制解决了生成阶段被无关信息干扰的问题。
团队认为,该方法对信息检索、问答系统、专业领域大模型应用都具有重要价值。未来,他们计划进一步拓展该方法到新万博体育:专业场景,让大模型不仅能“读懂”,更能“理解”复杂的人类语言表达。
词汇多样性:RAG的隐形痛点
研究团队指出,现有RAG方法大多通过“单一标准”判断检索文档是否相关,但现实情况要复杂得多。如图所示,以问题“What is Hattie McDaniel’s occupation?”为例,其中的语义成分表现出不同程度“词汇多样性”:
不变词(Invariant):人名“Hattie McDaniel”一般不会变形;可变词(Variant):词语“occupation”可以对应“profession”“actress”甚至“Academy Award”;补充信息(Supplementary):答案可能依赖“American celebrity”等扩展语境。
这种词汇多样性往往导致模型错误地将部分相似但无关的文档判为相关,或者忽略了真正有用的信息。
两大关键创新
为解决“词汇多样性”带来的挑战,研究团队提出了该框架,核心在于两个互补模块:
1、Diversity-sensitive Relevance Analyzer(DRA)
传统检索相关性评估往往“一刀切”,把整体查询和检索文档进行比较。该方法则进一步拆解查询语义,针对不同成分采用差异化策略:
不变成分:如人名、地名等必须精确匹配的关键词,该方法强调其检索文档应与该成分严格匹配;可变成分:如“occupation”—“profession”,DRA借助LLM的语义扩展和分析能力,在检索时允许一定语义灵活性;补充成分:如“American celebrity”,该方法通过检索需求的明确程度来判断是否需要真正提供有用的补充证据。
在此基础上,该方法通过该模块对相似度检索结果进行重排序,输出一个更细粒度、多维度的相关性评分,避免检索时存在的“假阳性”和“假阴性”的常见问题。
2. Risk-guided Sparse Calibration
即使有了更精准的检索,生成阶段仍然可能“被干扰”。Risk-guided Sparse Calibration的设计灵感来自“风险控制”:它会实时监控每个生成token的“被误导风险”,并在必要时进行解码校准。
词汇风险(Lexical Risk):检测生成内容是否过度依赖低相关的词汇;注意力风险(Attention Risk):评估模型注意力是否集中在无关段落;预测风险(Prediction Risk):衡量当前预测是否与检索证据存在冲突。
RSC的独特之处在于它的稀疏性(sparse calibration):只对高风险token动态干预,而不会对全局输出强行重写,从而保证了生成质量与效率的平衡。
最终,DRA负责“挑选更靠谱的材料”,RSC负责“防止模型走偏”,形成了检索与生成环节的双保险,让RAG更稳健、更准确。
实验结果:显著超越现有方法
团队在多个开放域问答基准上验证了该方法:
其中,该方法在PopQA/TriviaQA(短文本问答):准确率分别提升4.9%和4.4%;HotpotQA/2WikiMultiHopQA(多跳问答):准确率均提升10.6%,展现出强泛化性;在ASQA(长答案生成):在str-em、QA-F1等指标上刷新SOTA。
不仅如此,该方法在不同类型、大小的模型上均表现出显著增益,如Llama2-7B, Llama2-13B, Qwen2-7B, Alpaca-7B和Mistral-7B等。
论文链接:
https://aclanthology.org/2025.acl-long.1346/代码(即将开源):
https://github.com/Zhange21/DRAG
相关版本
多平台下载
查看所有0条评论>网友评论