菠菜大平台导航 (医学简讯 2.3)3MB_新万博体育
菠菜大平台导航 最近更新|更新列表|字母检索|下载排行|苹果专区|分类导航

当前位置:首页专题合集 → P6F3X2M7T9QJ8L1B4WZR

蚂蚁首个万亿参数推理大模型,开源!

蚂蚁首个万亿参数推理大模型,开源!

智东西作者 王涵编辑 漠影

智东西9月30日消息,今天,蚂蚁百灵大模型宣布开源其思考模型Ring-1T的预览版——Ring-1T-preview,参数量达1000B(1万亿)!

开源链接:

Hugging Face:https://huggingface.co/inclusionAI/Ring-1T-preview

魔搭社区:https://modelscope.cn/models?page=1&tabKey=task

该模型延续Ling 2.0的MoE架构,在20T高质量语料上完成预训练,结合此前公开的棒冰(icepop)方法,在自研开源高效强化学习系统ASystem上进行了针对推理能力的RLVR训练。

在AIME 2025(美国数学邀请赛),Ring-1T通过纯自然语言推理即可取得92.6的高分,进一步逼近GPT-5 with thinking(no tools)的94.6水平。

此外,在哈佛-麻省理工数学竞赛HMMT 2025,竞赛级代码生成任务LiveCodeBench v6、CodeForces上,以及抽象推理基准ARC-AGI-1等任务中,Ring-1T均超越Gemini-2.5-pro和DeepSeek-V3.1-Terminus-Thinking。

为了进一步探索Ring-1T早期版本的推理上限,研究团队将其接入多智能体框架AWorld,并在IMO 2025(国际数学奥林匹克竞赛)上进行了纯自然语言推理测试。

此前,Ring-flash-2.0在允许三次推理尝试的设定下,直到第三次才勉强解出第3题。相比之下,Ring-1T在本次测试中仅用一次推理就解出了第3题,并且在第1、2、4、5题上也能一次性给出部分正确答案。

百灵团队称Ring-1T仍在持续训练中,此次发布的预览版仍存在语种混杂、推理重复、身份认知错误等问题,希望通过开源社区的反馈,进一步完善Ring-1T的功能。

从今年3月到现在,蚂蚁一直在对百灵大模型进行迭代优化。3月,蚂蚁开源了两款MoE(混合专家)大语言模型Ling-Lite和Ling-Plus,并在4月发布了Ling-Lite的更新版本Ling-lite-0415。4月初,轻量级推理模型Ring-lite-distill-preview和混合线性长推理模型Ring-lite-linear-preview开源。

5月,蚂蚁发布了MoE架构的全模态大模型Ming-lite-omni-preview和Ming-lite-uni,并开源了统一多模态大模型Ming-lite-omni和Ling-lite-1.5。

6月,在Ling-lite-1.5的基础上,蚂蚁发布了轻量级推理模型Ring-lite。7月,其发布了Ming-lite-omni v1.5、Ring-lite-2507和Ling-lite-1.5-2507。

9月,蚂蚁开源语言模型Ling-mini-2.0,在此基础上推出了推理模型Ring-mini-2.0和轻量版Ling-flash-2.0以及思考模型Ring-flash-2.0。

上周五,蚂蚁也才刚刚开源两款思考模型——Ring-flash-linear-2.0 与 Ring-mini-linear-2.0,还同步发布两大自研融合算子,即FP8融合算子和线性Attention推理融合算子。

结语:百灵大模型在复杂逻辑推理能力上下“狠功夫”

百灵大模型团队此次开源,是想要通过开放早期成果,汇聚社区智慧,对于Ring-1T进行“查漏补缺”。

从AIME到IMO国际顶级数学竞赛的初步测试表现来看,Ring-1T在复杂逻辑推理能力上进一步提升,正式版本的性能值得期待。

相关推荐:万博manbetx注册 TG买球安全吗 立博官网

分享: 2025-09-24 16:21:10 共81款

电脑

安卓

苹果

相关合集

网友评论 查看所有评论>>

发表评论

(您的评论需要经过审核才能显示) 网友粉丝QQ群号:766969941

查看所有0条评论>>