v5.749 IOS版
v2.474.1812 最新版
v3.622.3904.867627 安卓最新版
v3.297.7811.506687 安卓版
v2.136.4016.357543 安卓漢化版
v6.376 安卓漢化版
v1.835.5862.636350 安卓版
v7.522.167.22332 最新版
v8.684.2929.747517 安卓漢化版
v9.990.9947.330054 安卓最新版
v1.776 最新版
v4.474 安卓版
v3.473.2444.668125 安卓最新版
v6.123.6144 安卓漢化版
v8.542.7871 安卓免費版
v1.635 安卓版
v6.560 安卓免費版
v7.628.7980 安卓版
v6.805.5640 安卓版
v1.567.5180 安卓版
v2.133.7485 安卓免費版
v8.307.4503.438091 PC版
v2.614.1552 安卓免費版
v4.422.6414 IOS版
v3.451 IOS版
v2.898.2948 安卓漢化版
v8.212.4807.147108 安卓免費版
v7.375.6152 IOS版
v6.4 安卓版
v5.883.3836.957514 PC版
v4.207.544.975946 安卓漢化版
v5.35.5772.753817 安卓漢化版
v4.107 安卓最新版
v3.197 最新版
v6.51.4099.430806 安卓免費版
v2.920.9666 安卓版
v6.36.9367 安卓版
v6.573.1988.426427 PC版
v9.680 IOS版
v8.361.9728.664240 安卓免費版
v5.380 安卓最新版
v3.792.6260.324778 安卓版
v9.280.2757.433121 PC版
v3.179.1028.659089 最新版
v1.652.1941.910839 IOS版
v7.179.852.51803 安卓免費版
v7.246.5427 安卓最新版
v6.507.9011.951922 PC版
v7.832 最新版
v4.165.420.250769 安卓版
v6.466 安卓漢化版
v8.215.6937.847031 安卓免費版
v1.830 安卓漢化版
v1.354.4932 IOS版
v3.164 最新版
v8.76.698.546711 安卓版
v8.476.9423.282782 安卓最新版
v9.913.8156.233758 安卓版
v9.122 安卓版
v7.876 最新版
v3.188.9701 安卓免費版
v1.409.2931.372493 安卓版
v1.454.5095 PC版
v7.750 PC版
v7.532.5842.141369 安卓版
v8.68.8279 IOS版
v2.874.2215.90423 PC版
v9.2.3224 IOS版
v7.276.9534.541611 最新版
v2.43.2606 PC版
v2.87.276.720011 安卓免費版
v1.6 IOS版
v9.98.250.25126 安卓最新版
v7.303.2429.975224 安卓漢化版
v7.228.7853.128419 安卓最新版
v5.955.4976.263143 最新版
v9.80.3610.718119 IOS版
v1.297.2799.277352 PC版
v9.406.7269.87039 PC版
v1.528.6210 安卓最新版
鸣人
11月20日,蚂蚁开源官微发文,蚂蚁集团宣布开源万亿参数强化学习高性能权重交换框架Awex。
据介绍,Awex 是为极致性能打造的训练推理引擎权重同步框架,解决强化学习(Reinforcement Learning,简称 RL)流程中训练权重参数同步到推理模型的核心难题,可在秒级完成 TB 级大规模参数交换,显著降低 RL 模型训练延迟。
Awex 是蚂蚁 ASystem 强化学习系统的核心组件之一,而 ASystem 是百灵万亿模型训练的坚实基础。蚂蚁表示,将在未来陆续开源 ASystem 的其他核心 RL 组件,进一步完善开源强化学习训练生态。
强化学习(Reinforcement Learning,简称 RL)已经成为大模型后训练的核心技术。从 ChatGPT 的 RLHF,到 DeepSeek/Claude/Llama 的后训练体系,都依赖强化学习让模型更符合人类偏好、具备更强的推理能力,进一步扩大模型智能边界。
今年10月,蚂蚁集团开源了两款业界领先的万亿参数旗舰模型,包括非思考的 Ling-1T 和思考模型 Ring-1T。其中 Ring-1T 基于我们自研的高性能权重交换框架 Awex(Asystem Weight Exchange Framework),实现了在数千卡 GPU 集群上5~10秒内完成万亿参数级别的权重同步。
相关版本
多平台下载
查看所有0条评论>网友评论