智东西编译 王欣逸编辑 程茜
智东西12月10日消息,昨晚,法国大模型独角兽Mistral AI发布并开源编程系列模型Devstral 2,该系列分为两个不同规格的模型Devstral 2 132B和Devstral Small 2 24B。此外,Mistral还同时推出了原生CLI工具Mistral Vibe,能实现端到端的代码自动化。此次发布距Mistral 3系列模型才过去一周。
Devstral 2参数为123B,支持256K上下文窗口,可以探索代码库,并能在保持架构层面上下文理解的同时,进行跨文件协调更改;Devstral Small 2参数为24B,同样具备256K上下文窗口,支持快速推理和反馈,可以定制和本地部署,同时还支持图像输入,可应用于多模态Agents。
在SWE-bench Verified编程基准测试中,Devstral 2取得了72.2%的成绩,优于Qwen 3 coder plus、Kimi K2 Thinking等开源模型,仅次于DeepSeek V3.2;Devstral Small 2取得了68.8%的成绩,超过GPT-OOS-120B,和GLM 4.6持平;在针对实际编程任务进行的人工测试中,Devstral 2表现优于DeepSeek V3.2。基准测试结果如下:
此外,在部署上,Devstral 2至少需要四块H100级GPU,更轻量化的Devstral Small 2可以在消费级硬件上本地运行。
Mistral Vibe是一个由Devstral驱动的开源命令行编程助手,集成了文件操作、代码搜索、版本控制及命令执行等工具。
Mistral AI是一家法国创企,成立于2023年,由前DeepMind和Meta研究人员成立,专注于开源模型开发。今年9月,该公司宣布获得17亿欧元(约合人民币139.9亿元)C轮融资,估值达到117亿欧元(约合人民币962.6亿元),英伟达曾三次投资这家公司。
一、基准测试位列开源第二,和顶尖闭源还有性能差距
据Mistral官网,Devstral 2 123B支持探索代码库,能跨多个文件协调修改,还能保持上下文理解。它可以跟踪框架依赖、检测故障,并能通过修正后重试,从而解决如修复错误、改造遗留系统等复杂挑战。
该模型支持微调,可针对特定编程语言进行优化,适配大型企业代码库的需求。
不过,Devstral 2以修改版的MIT协议发布,这一协议对大企业进行了限制:月收入超过2000万美元(约合人民币1.41亿元)的公司,在未获得Mistral单独商业许可的情况下,无法使用该模型。
更轻量化的模型Devstral Small 2 24B支持快速推理、迭代反馈和定制,可本地部署,同时还支持图像输入,可应用于多模态Agents。
从基准测试来看,Devstral 2模型位列开源模型的第二名,并正赶超顶尖闭源模型。
Devstral 2在SWE-bench Verified编程基准测试中取得了72.2%的得分,Devstral Small 2取得了68%的得分,在开源模型中已经达到了领先水平,Devstral 2的得分仅次于DeepSeek V3.2。
Devstral 2系列模型的亮点在于小参数设计,其模型在关键基准测试中展现出和顶尖开源模型齐平的性能,却仅需后者几分之一的参数量。
得分只比Devstral 2高0.9%的DeepSeek V3.2,其参数大小是Devstral 2的5倍,是Devstral Small 2的28倍,而表现次于Devstral 2的Kimi K2 Thinking,其参数大小是Devstral 2的8倍,是Devstral Small 2的41倍。
不过,Devstral 2系列模型与顶尖闭源模型之间还存在差距。
人工评测结果显示,在Cline构建的任务场景中,Devstral 2相对DeepSeek V3.2优势明显,胜率为42.8%,败率为28.6%。然而,Devstral 2相对顶尖闭源模型Claude Sonnet 4.5败下阵来,胜率仅为21.4%,败率为53.1%。
二、端到端代码自动化,能进行架构级推理
Mistral Vibe是基于Devstral模型构建的开源命令行编程助手,能通过自然语言交互,接入IDE,实现对代码库的探索、修改与变更执行。
Mistral Vibe提供了一个交互式对话界面,集成了文件操作、代码搜索、版本控制及命令执行等工具。
它能自动扫描用户文件结构及Git状态,提供相关上下文信息,能理解整个代码库的架构,并进行架构级推理,此外,它还拥有智能引用、持久化历史、自动补全和可自定义主题等功能。
开发者可以通过脚本编程方式运行Mistral Vibe,启用工具执行的自动批准功能,通过简洁的config.toml配置文件管理本地模型与供应商设置,灵活控制工具权限。
结语:平衡高性能与小参数,为企业提供了低门槛解决方案
从Mistral 3到Devstral 2系列、Mistral Vibe,Mistral AI正以相当快的进击速度参与AI竞争,并在模型的高性能与轻量化间实现了平衡,从测试结果看,Devstral Small 2模型在参数仅为24B的情况下,依然优于不少开源模型,和GLM 4.6打平。
Mistral AI在公告中提到,Devstral 2系列模型专为生产级工作流打造,并被定位为下一代SOTA编程模型。尽管和顶尖闭源编程模型还有很大差距,不过,对大多数企业而言,Devstral 2和Devstral Small 2可以作为一个低门槛的初步解决方案,尤其是在和Mistral Vibe的搭配使用上,Devstral 2系列模型或将在特定的生产环节发挥作用。
来源:Mistral AI
《凤凰彩票快速注册》,《Q8X2R7L1T4J5M9B6W3》皇冠体育足球打法
“亚新在线登陆”
百亿国际官网
……
12月04日
“AG8亚洲国际游戏集团”驻韩美军战斗机在韩国坠落
↓↓↓
12月04日,世界民众如何看中国?经济强国认可度最广,手机必赢亚洲登录官网,万博手机版本登录体育网,德赢体育官网登录,德扑圈网址
12月04日,水往高处流!宁夏扬黄河水逆势向上让戈壁沙漠变良田绿洲,hth华体会在线注册,世界杯彩票外围网站,最有实力赌博app,新萄京娱乐下载
12月04日,“纪念陈嘉庚诞辰150周年特别读书会”在厦大举行,澳门新葡亰官方APP,澳门捕鱼入口,最新菠菜,168平台网址
12月04日|闽籍港澳乡贤“深珠座谈会”建言资政|完美体育平台注册|云顶集团平台网址|网上赌场|真钱赌大小
12月04日|冬季气象防灾减灾应该关注些什么?|牛派牛头报|千赢国际注册送18|9877游戏|爱游戏登陆平台
12月04日|150余家厂商亮相巴西圣保罗国际纺织服装采购展|赌博app排行榜|金沙官网网址|世界杯买球app不能用了|ManBetX万博开户……
12月04日,香港研究指重症流感患者患急性肾损伤风险为新冠患者两倍,乐动体育苹果版,网上开户,365bet体育注册开户首页,SW天风电子百搭猫咪
12月04日,山西古县万亩小麦迎来收割季,亿博注册彩金,黄大仙射箭,bbin在哪玩,国外看世界杯免费网站
12月04日|微信转账or红包?速看,不懂吃大亏|澳门在线开户|伟德vb|火狐体育官方下载|365篮球比分
12月04日,受新疆乌什县地震影响列车正在逐步恢复运行,新濠天地手机版注册平台,必威手机登陆,澳门体育网站是多少,网赌十大排行榜
12月04日,六小龄童:人生需苦练“七十二变”才能笑对“八十一难”,永利在线官网,官网炸金花下载,优德体育值得信赖网站,火狐体育页面
12月04日,多彩活动点亮福建武警“五一”假期生活,188体育足球上盘,澳博体育最新地址,新濠的网址是多少,银河电子游戏下载app
12月04日|黑龙江省2024年旅游增量领跑全国|mg注册送10|宝马娱乐app|M6在线注册|18BET的网站
12月04日|新能源车企开启新春大促“第一响”|188篮球比分平台|万博投注|AG娱乐8|中国体育直播
12月04日|时隔两年半 南京海底世界“10后”北极熊西安“相亲”归来|博狗世界杯功率|188betAPP安卓|有赌博的网址吗|万博官网manbetx
相亲对象是分手两年的前男友,武警部队中将副司令员郑家概逝世|台舆论关注大陆高校师生访台行:掀“马龙旋风”,彼此善意交融|亚投彩票|大富翁官网手机版|亚星在线官网|bbin平台合作
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺