v3.30.8826.918924 安卓免費版
v7.601.3159.342428 安卓免費版
v6.850.2703.879242 最新版
v8.881 最新版
v5.454.819.863252 安卓版
v9.705.7555 最新版
v7.51.9026.739899 IOS版
v3.526.8461.421394 最新版
v5.990.5456.593123 安卓最新版
v7.568.4779.119662 PC版
v9.408.7294.976235 安卓版
v3.392 安卓免費版
v1.386 安卓版
v2.390.8636 安卓最新版
v1.570.6864.916622 IOS版
v8.786.7888 安卓最新版
v2.791.4946 最新版
v2.253.4903.750138 安卓最新版
v6.709.1382.315812 安卓版
v1.828.8148.56050 安卓漢化版
v6.534.7030.605358 PC版
v7.57.8372.765676 最新版
v4.821 IOS版
v8.476 安卓最新版
v6.428.5645 PC版
v9.566.5984 安卓版
v6.974.3095.426966 安卓免費版
v7.761.3787 PC版
v7.281 安卓漢化版
v7.771.4037.998704 IOS版
v2.138 安卓漢化版
v9.482.1805.618683 安卓免費版
v5.82 安卓最新版
v9.442.3791.516674 安卓最新版
v4.453.1706.989227 安卓最新版
v4.888.3810.806411 最新版
v9.777.3153 最新版
v4.662.4014 安卓漢化版
v2.852.6745.873428 安卓最新版
v9.112 最新版
v5.399.4902.980499 IOS版
v5.674.7390.833671 安卓最新版
v6.43.8817.217915 最新版
v7.666.8792 PC版
v3.826.4257.47776 IOS版
v6.275.5077.977947 安卓免費版
v7.81.7477.163891 IOS版
v3.365.5161 安卓版
v6.480.8242.885892 IOS版
v7.51 安卓版
v4.520 PC版
v1.594.8869 最新版
v3.710.4007.568842 安卓免費版
v1.72 安卓最新版
v6.40.7768 安卓版
v5.895.5152.589768 安卓免費版
v1.13.1005 安卓漢化版
v9.472 IOS版
v4.445 IOS版
v2.321.8939 安卓版
v2.33.7421.836112 安卓漢化版
v8.270 安卓版
v7.880 安卓漢化版
v4.470.820.281269 PC版
v1.121.3592 安卓最新版
v9.292.5134.811232 最新版
v4.80.5343 PC版
v3.288.2524 安卓版
v2.987.4235.684716 最新版
v9.926.8061.876074 IOS版
v4.994.4797.553288 安卓版
v1.291.8007 安卓最新版
v7.256.1260 安卓版
v8.34.842 安卓最新版
v3.98.5048.441711 IOS版
v4.73.168.947656 安卓版
v9.79.1978.143379 IOS版
v4.486.3290.517413 PC版
v6.806.2380.98624 安卓最新版
v3.675.603 安卓免費版
娱乐国际娱乐真人av
9月26日,据全球权威评测基准BIRD-Bech官网,蚂蚁数科的数据分析智能体Agentar-SQL超越AT&T(美国电话电报公司)、谷歌云、腾讯云、阿里云等诸多国内外厂商,位居全球第一。这也是中国公司在该榜单上取得的最高成绩。
BIRD-Bench是公认的全球最具权威性的自然语言转SQL评测基准,要求AI大模型将自然语言查询转换为结构化查询语言(SQL),并且在真实复杂的大规模生产级数据库中稳定执行。BIRD--Bench数据集覆盖金融、电力、医疗等37个行业场景,总量33GB,包含超过1万条高复杂度查询任务,是全球顶级AI团队展示技术实力的权威平台。
值得一提的是,蚂蚁数科Agentar-SQL在BIRD榜单的执行准确率排行榜(81.67分)以及执行效率榜上(77分)上均取得第一的成绩。这意味着蚂蚁数科在智能问数领域的技术创新实现全球领先。
据介绍,Agentar-SQL智能体基于蚂蚁数科的SQL大模型Agentar-Scale-SQL构建,旨在让用户可以通过自然语言轻松完成复杂的数据查询任务。它通过GSPO(组序列策略优化)强化学习训练方法,能够增强SQL内在推理,让大模型在推理阶段,深度思考SQL框架,避免潜在的逻辑错误,提升SQL逻辑准确性;此外,Agentar-SQL具备多轮反思修正的能力,让模型对生成的SQL进行多轮次的审视和修正,提升SQL语言的精准性;Agentar-SQL还通过独创的两阶段生成法,让大模型生成多个SQL候选,再对SQL进行两两PK的“锦标赛”,筛选出最优的SQL。
蚂蚁数科持续深耕AI大模型技术与应用,此前其自研的金融推理大模型Agentar-Fin-R1,在多项主流金融基准测试实现领先。专为新能源行业定制的能源电力垂类时序大模型在行业评测集上的发电量预测准确率超越谷歌(TimesFM-V2.0)、亚马逊(Chronos-Large)等行业主流的通用时序模型。
相关版本
多平台下载
查看所有0条评论>网友评论