热点分享-LeCun团队开源首个代码世界模型:能生成代码还能自“测自修作者:孔小”溪_新万博体育
bbin体育是哪个 最近更新|更新列表|字母检索|下载排行|苹果专区|分类导航

当前位置:首页电脑软件第75届艾美奖获奖名单公布 → bbin体育是哪个 v2.443 最新版

bbin体育是哪个

bbin体育是哪个

  • 电脑版下载
猜你喜欢
标签: bbin体育是哪个 杏鑫平台官方网站
详情
介绍
猜你喜欢
相关版本

内容详情

bbin体育是哪个

衡宇 发自 凹非寺量子位 | 公众号 QbitAI

刚刚,Meta FAIR推出了代码世界模型!

CWM(Code World Model),一个参数量为32B、上下文大小达131k token的密集语言模型,专为代码生成和推理打造的研究模型

这是全球首个将世界模型系统性引入代码生成的语言模型。

与现有代码大模型相比,CWM最与众不同的一点在于,它不仅能生成代码、理解语义。

更关键的是,它“懂得”代码如何执行,能模拟代码运行过程中变量的状态变化与环境反馈,从而推动代码理解、调试乃至规划的整体能力提升。

也就是说,它具备接近人类程序员的思考能力。

在多个代码与推理任务上,CWM均有出色表现,譬如其在SWE-bench Verified得分65.8%,领先所有开源同规模模型,已接近GPT-4级别。

更重要的是,Meta FAIR这次开源了模型代码、训练细节以及多个阶段的权重检查点,诚意十足。

有人给LeCun留言问:

“你不是一直认为语言模型只是AI道路上的一个支线(LLMs are an off ramp),怎么又推出了以语言模型为基础的世界模型?”

LeCun轻松回复称:

是的,不过咱现在讲的是编程,不是ASI哟~让大模型“懂动态执行”

CWM的诞生,直击当前大模型在代码生成中的一大痛点:

尽管现有大模型已经具备写代码的能力,但代码执行效果并不稳定,生成内容难以调试、不可执行,甚至存在隐藏逻辑错误。

FAIR团队认为,其根源在于大模型只是把代码当作文本来预测。

它不理解代码会如何运行,对变量状态的变化、函数调用的副作用一知半解(甚至一无所知)。

在FAIR团队看来:

如果希望模型像程序员一样思考,就必须教会它代码执行的“世界状态”变化。

因此,CWM首次在训练过程中引入代码世界建模(code world modeling)的概念,明确让模型学习“代码运行过程中,程序状态如何一步步演变”。

这意味着,CWM的理解维度,从静态文本跃迁到了动态执行。

Meta FAIR专攻AI与代码生成的资深研究科学家,也是CWM的资深核心贡献者Gabriel Synnaeve在上分享了CWM追踪执行计算”strawberry”中”r”个数的代码的例子:

你可以把它想象成一个可以设置为任何初始帧状态的神经‘pdb’,推理可以作为工具在标记空间中查询。

相较于传统代码大模型生成token接token的静态预测,CWM在三大能力有所升级——

第一,代码执行模拟。

CWM可以逐行模拟代码执行过程,预测每一行代码如何影响变量状态,甚至提前判断出执行中的潜在错误。

这种能力为构建“神经调试器”提供了可能。

在CWM的推理过程中,变量状态可以随代码运行不断更新。

它甚至可以模拟终止条件、循环展开、边界情况,从而更精准地理解程序逻辑。

第二,自我调试与修复。

不止会写代码,CWM还能自测、修错。

它能够在生成代码后自动构造测试用例,并在发现代码失败后用多种修改路径来尝试自我修复。

整个流程模拟了人类程序员常见的开发闭环:写→测试→改→再测。

第三,推理与规划能力。

面对复杂问题时,CWM还能进行推理与规划。

例如,在编程竞赛或数学任务中,它可以根据问题描述分析步骤、规划函数结构,再结合执行预测逐步生成并验证代码,展现出多轮逻辑推理能力。

CWM模型信息:参数、架构、性能一次看全

CWM的模型架构采用了64层的decoder-only Transformer,参数规模为32B。

它支持131k tokens的长上下文输入——这大幅拓展了复杂项目、多文件代码、文档上下文的处理能力。

相对应的,Attention结构采用了局部+全局交替机制,兼顾效率与上下文覆盖。

FAIR提供了以下3个checkpoints,供研究人员使用:

CWM预训练模型:例如用于新的后训练方法。CWM SFT:例如用于强化学习研究。CWM:例如用于推理时间扩展。

在与多个一线模型的评测对比上,CWM成绩如下:

SWE-bench Verified得分65.8%,领先所有开源同规模模型,接近GPT-4级别;LiveCodeBench v5得分68.6%,展示高复杂度编程任务上的准确性;Math-500得分96.6%,AIME 2024模拟题达76.0%;Terminal-Bench得分26.3%,高于Gemini 2.5 Pro;Aider Polyglot(多语言代码生成)得分35.1%,与Qwen3-32B相近。

综合来看,CWM在理解、生成、验证、修复等多个环节上,都有不俗表现。

FAIR团队称CWM验证了“代码世界建模”对提升推理与代码生成的价值。

Gabriel Synnaeve表示:

我对我的CodeGen团队所做的工作感到无比自豪!这个团队由博士生和经验丰富的资深员工组成。我们所有人都齐心协力,全力以赴,绝不将任何问题归咎于他人。整个Meta AI社区都为此共同努力。非常感谢整个领导层始终如一的支持。

三阶段训练流程,与数据集构建

CWM分三阶段进行训练——

第一阶段,预训练阶段(Pretrain)。

在这个阶段,CWM使用了8T tokens的数据进行通用语言与代码建模训练。

其中代码占比约30%,上下文长度为8k token。

第二阶段,中期训练阶段(Mid-train),这也是CWM最具特色的一步。

在这个阶段,模型引入了5T tokens的世界建模数据,用于训练模型识别“代码运行过程中,程序状态如何变化”。

这部分核心数据类型包括:

Python执行轨迹数据来自数千万函数调用与代码提交,记录每一行代码执行时变量的值如何变化;ForagerAgent数据模型驱动的智能体在真实Docker环境中运行代码,修复Bug,执行任务,生成真实交互轨迹(共300万条);自然语言描述版本将执行过程转化为自然语言,便于泛化迁移。

也是在这一阶段,CWM的上下文能力扩展到了131k token,支撑对大型项目和代码流程的完整建模。

第三阶段,后训练阶段(SFT+多任务RL)。

最后,CWM进行了100B tokens的监督微调训练(SFT)和172B tokens的多任务强化学习(RL)训练。

训练任务覆盖了真实软件工程任务(如SWE-bench)、编程竞赛问题(CodeContests等)、数学推理题目(如AIME模拟题、MathQA)。

在这一阶段,FAIR团队使用异步RL机制、分布式环境以及自举方法,提升了模型在多环境、多任务间的泛化能力。

基础设施方面,CWM训练使用了FlashAttention-3、FSDP+TP并行策略,并采用fp8低精度加速。

Meta FAIR强调其训练过程遵循了Frontier AI Framework中的前沿AI安全框架。

结果表明,CWM不会对网络安全、化学、生物等高敏感领域构成滥用风险。

此外需要注意的一点是,当前CWM的世界建模数据仅支持Python语言,尚未覆盖C++、Java等主流语言或符号执行任务。

不过,研究团队表示未来将探索多语言扩展,有望形成自动化编程助手的通用框架。

Two More Things

BTW,如果你想使用使用CWM,有两点需要特别注意:

第一点,CWM主要面向代码理解与复杂推理研究,没有做RLHF。

因此,它并不适合对话任务或作为Chatbot使用。

第二点,CWM明确定位是“研究用”,即仅供非商业研究使用。

Anyway,总之,CWM团队选择了模型开源、数据透明、训练复现全开放。借此也向研究社区抛出一个重要问题:

如果大模型能理解世界,它能成为更好的程序员吗?

相关版本

    多平台下载

    查看所有0条评论>网友评论

    发表评论

    (您的评论需要经过审核才能显示) 网友粉丝QQ群号:766969941

    查看所有0条评论>>

    相关软件
    九州体育登陆 开元国际53ky最新版下载 澳门金利游戏 华体会平台网址 伟德体育官网地址是什么 j9363九游会 bwin官网 和记登录 mgm体育外围 百老汇免费试玩 包牛牛网址 日博体育快速注册 维多利亚vic67中国线路 皇冠娱乐从搜博网开始 天马澳门金砂网址 赚钱斗地主 十大赌场名字 火狐体育官网iOS下载 千赢国际官网欢迎您 凯发娱乐首页登陆 ky开元棋牌链接 一分钟彩票网 lol赌外围 365登录入口官方网站 星速app下载苹果版安装 高清跑狗图 云开体育app OD入口 国际音标发音的动画及真人演示 牛牛游戏现金网 乐途官网 金沙快速充值无需 天博体育App2.2.6 明升体育注册送18 欢乐牛牛下载 大嘴棋牌最新官方app下载 2022最新澳门菠菜 188金宝傅体育 棋牌斗牛牛 美高梅在线app 篮球竞彩结果 云顶国际游戏官方网站 亚博app链接 黄金岛注册 彩神争霸登录网址 银河网站大全 九游会ag亚洲 澳门凤凰版网站 凤凰娱乐登录地址十 九游会j9官网入口 万家乐吧 赌的网站有哪些 太阳城体育外围 aoa体育网页版 BOB官网 足彩app外围 网上bbin真人 ag在线下载 新浪棋牌 澳门黄金城中心 火狐手机版登录 奥门新萄京威尼斯 Beplayapp体育下载 必威官网亚洲 南通棋牌中心 日博备用 必威官网手机版网页 凤凰彩票官方下载 六合简报 365体育下注全网独家介绍 im体育网页版 火狐体育网页 万博max手机版 伟德BETVlCTOR软件 天博体育平台app下载 乐博在线注册 宝马线上电子娱乐网站 凯时赌场网站 365有没有app bb贝博app下载 全民彩娱乐平台 视讯真人游戏体育 手机AG捕鱼 金宝博官网备用网址 金虎国际是正规平台吗 澳门十三弟官网网址 爱博官网APP 葡京体育在线试玩 易博yb 华体汇app官方下载安装 立博app官方网站 b体育官网登录 K8凯发入口 第一娱乐平台 beplay网址 永利彩票网址 玄机二句诗加送 leyu乐鱼注册App 澳门正规网站626969 永乐国际app手机下载 电子游戏门户 永利皇宫会员注册登录 韦德官网网址 必威手机app登录 创世大发 球球大作战攻略 M6赌场网站 完美国际真人版赌场 云顶国际可靠吗 365bet充值 尊龙凯时ag旗舰厅 澳门真人手机版app下载 网络版电玩城 必博平台网址 威尼斯游戏在线平台 188bet金宝搏网址是多少 凯时官方平台 hth华体会真人百家乐 欧宝电竞首页下载 开奖号码
    热门网络工具