为大语言模型（LLM）配备浏览工具，能够显著提升其作为深度搜索智能体（Agent）解决复杂现实世界任务的潜力。

然而，由于使用浏览工具进行长程推理的能力有限，且缺乏足够难度的监督数据，开源 LLM 在此类场景下的表现依旧不佳。

为推动深度搜索 Agent 发展，来自清华大学、东北大学的研究团队提出了DeepDive，该方法通过结合知识图谱（KG）的自动化数据合成与端到端的多轮 RL，来创建具备复杂长程推理和网页浏览能力的 Agent。

实验表明，基于该方法训练的 DeepDive-32B 在 BrowseComp 测试中取得了 14.8% 的准确率。这证明了在深度搜索中，工具调用和并行采样的测试时间扩展是有效的。

图｜左：DeepDive-32B 在 BrowseComp 上的表现优于开源深度搜索模型和专有模型；中：DeepDive 通过最大化工具调用来驱动模型的深度搜索能力，从而提高其在 BrowseComp 上的性能；右：多轮 RL 持续增强 DeepDive-32B 在 4 个深度搜索基准上的表现。

此外，除了上述方法和数据，研究团队还开源了一项新万博体育：半自动独立同分布（i.i.d.）深度搜索问答合成的附加研究。仅使用这项研究中的数据，DeepDive-32B 在 BrowseComp 上的准确率可以进一步提升至 22.2%。

值得一提的是，这些自动生成的知识图谱数据和半自动 i.i.d. 数据，帮助 GLM-4.5 系列开源模型在 BrowseComp 测试中取得了出色的表现。

最后，所有 DeepDive 数据集、模型和代码均已在 GitHub 上开源。

深度搜索 Agent 需要通过分析数百个在线资源进行推理和检索，以定位复杂且难以获取的信息。然而，开放模型在深度搜索 Agent 方面与 OpenAI DeepResearch 等专有 LLM 存在显著差距。

研究团队认为，这一差距源于难以获取的数据资源匮乏，以及缺乏多轮 RL 训练机制。数据层面，现有大多数问答数据集通常包含相对简单的提问，难以真实反映“疑难案例”；在训练方法上，如何有效结合长程推理与深度搜索工具的使用仍是一个未解难题；此外，现有的集成浏览工具的搜索或浏览 Agent 主要针对直接搜索任务进行设计。

DeepDive旨在提升深度搜索 Agent 的长期信息检索能力，通过数据构建与 RL 两大技术模块实现突破。他们开发了一种策略，能够自动从开放知识图谱中生成难以发现的查询问题，并运用端到端多轮 RL 技术，通过深度搜索增强语言模型的长程推理能力。

在数据层面，要构建深度搜索 Agent，其训练数据必须突破传统多跳问答的局限。

知识图谱天然具备结构化且语义丰富的环境，为多跳推理提供支持，这使其特别适合生成训练深度搜索 Agent 所需的监督数据。他们通过从知识图谱中自动生成深度搜索问答数据集，来解决问答数据集缺乏难度的问题。

由于知识图谱天然支持多跳连接，且每个实体都具有不同属性，他们在构建问题时刻意模糊了每个实体的部分属性，从而创造出一种“模糊实体”的形式。

随后在知识图谱上进行随机游走，提取长距离多跳路径，并利用 LLM 进一步混淆关键线索，使问答对更具挑战性。这种数据合成过程生成的数据能够有效激发 LLM 的长程推理能力和深度搜索能力。

图｜用于 DeepDive 的知识图谱自动化问答数据合成。通过在知识图谱上执行随机游走，自动构建深度搜索问答对，然后使用 LLM 对其进行混淆。

在训练方法方面，他们采用端到端多轮 RL，来整合推理与搜索工具的使用。运用多轮 GRPO 算法进行端到端 RL，其中 LLM 与网络环境交互，并根据构建的问答数据集中的最终答案获取奖励。

实验表明，经过 RL 训练的模型在推理阶段比基线方法更有效地提升工具使用效率，这证明了工具调用在测试时的扩展性，从而有效提升长程推理能力和深度搜索能力。

图｜多轮 RL 概述，用于训练 DeepDive 的推理和深度搜索能力。

为进一步提升部署效率并确保正样本的有效性，他们还引入了提前退出机制：当模型在任何步骤中出现格式错误时，轨迹生成将立即终止并赋予 0 分奖励。这种机制确保所有获得正向奖励的轨迹既无错误又完全可靠，从而显著增强了多轮次工具使用的鲁棒性。

研究团队通过 Bro-wseComp、BrowseComp-ZH 等 4 个公开且具有挑战性的深度搜索基准，对 DeepDive 进行评估，并将 DeepDive 与多类模型进行对比。结果如下：

表｜深度搜索问答基准评测结果。准确率（%）为报告数据。*表示现有研究的报告性能。? 表示通过函数调用实现浏览功能。

图｜训练奖励（a）和在 BrowseComp-266 上的评估准确率（b），以及在训练和评估过程中的平均工具调用次数（c），展示了强化学习（RL）如何逐步培养出更深层次的搜索策略。

图｜DeepDive 在简单搜索基准上的泛化效果。? 表示通过函数调用来实现浏览功能。

以上结果表明，复杂的监督和多轮强化学习共同为工具使用奠定了基础，模型的性能会随着工具调用预算和并行采样的增加而提升，并且在解决复杂问题时习得的技能可以迁移到更简单的场景中。

例如，由两种具有挑战性的深度搜索问答数据合成方法生成的数据，在难度上依然低于 BrowseComp 等数据集。这间接导致了 DeepDive-32B 在 BrowseComp 上的性能，比具备浏览能力的 o3 等先进模型要低得多。

此外，研究团队主要针对高难度数据进行训练的方法，导致了 DeepDive-32B 出现了“过度搜索”（over-search）的现象。因此，确定最优的训练步骤，并为 RL 阶段设计更合适的奖励机制，将是未来一个重要的探索方向。

新万博体育

清华团队提出DeepDive：深度搜索Agent再迎新突破

「统计」P6F3X2M7T9QJ8L1B4WZR

530.23MB

版本V9.9.76

下载APK 高速下载

下载云顶娱乐注册页面在哪安装你想要的应用更方便更快捷发现新万博体育：

75%好评(52866人)

详细信息

软件大小: 67808.51259MB
最后更新: 2025-09-22 01:09:55
最新版本: V1.47947.7
文件格式: apk
应用分类:ios-Android 6UP扑克之星注册18
使用语言: 中文
: 需要联网
系统要求: 8.99795以上

应用介绍

一，凯发娱乐官方登录入口，华夏彩票官网下载4595
二，365彩票平台，至尊平台网址是多少
三，斗牛平台，ag凯发官网
四，外围足球哪个网站靠谱，优博体育APP
五，新匍京下载，奥博体育是黑台子吗
六，天天澳门,千亿体育网，bet365休育投注备用平台
七，欧宝娱乐贴吧官网
【联系我们】
客服热线：134-2881-646

加载新万博体育：

版本更新

V9.1.18

kok在哪里玩

bsports最新登录地址

云顶娱乐网站官网入口

39088.33MB

104好评

在线斗地主真钱
天天游棋牌

彩票快3下载网址

37988.34MB

768387好评

宝马娱乐官方
皇冠轮盘

竞技宝注册

13.81MB

314好评

乐鱼官网登录地址
伟德体育在哪玩

ky体育官方平台中国

53.86MB

273好评

视讯真人游戏注册彩金
亚赢体育官网首页入口

贝博app体育官方下载尤文

71.23MB

701好评

国际象棋真人版视频教程
永利大全

97娱乐棋牌

83.69MB

339好评

升博平台网址
湖南国际频道真人秀

188betapp下载

23.54MB

101好评

财神爷娱乐
365官方平台开户

手机赢钱游戏

50.80MB

927好评

手机赌场官网
亚洲best365

bet8九州体育官网

83.50MB

564好评

必维官网
新皇冠官方app2020

365bet体育下载APP

83.85MB

758好评

千赢娱乐首页
大发开户网址

杏悦注册官网

69.84MB

3790好评

哪里网上二八杠玩
彩民之家

365bet官网客户端下载

58.71MB

393好评

撲克王下载
哪个平台有九线拉王

365bet体育直播开户

65.93MB

742好评

k1体育棋牌链接网址
开户信息

伟德体育网站是什么

54.14MB

754好评

bbin在线官网
真人炸金花棋牌

宝赢体育

57.78MB

684好评

贝博平台网站
皇冠多少钱

凯时首页入口

24.45MB

352好评

888真人国际娱乐赌场
金沙澳门游戏

金沙开户网址

13.56MB

313好评

kaiyun登录入口登录2024
手机网投投注

澳门新永利网址多少

84.75MB

218好评

德州赢钱
至尊千炮捕鱼官方

开元棋牌投注登录

45.64MB

731好评

leyu乐鱼app链接
威尼斯游戏手机版

OD体育官方登录

10.97MB

183好评

历届欧洲杯比赛用球
金宝博搏彩官网

bet36体育在线平台

44.96MB

361好评

365体育在投注网站
银河手机版注册

永利导航大全

91.98MB

206好评

体育网站投注
mg游戏在线网站

AG真人集团官网

30.76MB

904好评

必赢压洲
环球手机版登陆

银河贵宾厅网址

30.48MB

542好评

ag旗下有哪些平台
太阳城电子游戏在线玩

澳娱集团

29.68MB

125好评

凯时在线平台官网
各大赌场网址

买球赛app有哪些

70.79MB

453好评

利博官网网站
永利皇官 title="必博快速登陆" class="0v5366j9r7414 app-list-img" src="https://t11.baidu.com/it/u=1040017057,165456434&fm=30&app=106&f=JPEG?w=312&h=208&s=15B07D95426079116A1494FD03009032"">

21点

188bet金宝搏入口

详情
金新国际真人赌场 title="dafa网站" class="0v5366j9r7414 app-list-img" src="https://t10.baidu.com/it/u=3070224572,165461829&fm=30&app=106&f=JPEG?w=312&h=208&s=C6000AAC4838BAC8463F54AC0300A00B"">

澳门葡亰国际

BV伟德体育下载

详情
云顶娱乐官方 title="炸金花app下载" class="0v5366j9r7414 app-list-img" src="https://t12.baidu.com/it/u=1041590673,165100299&fm=30&app=106&f=JPEG?w=312&h=208&s=D7383EC642E1D8EA0A87937F0300C078"">

免费德州游戏

271娱乐

详情