智东西编译 王欣逸编辑 程茜
智东西12月10日消息,昨晚,法国大模型独角兽Mistral AI发布并开源编程系列模型Devstral 2,该系列分为两个不同规格的模型Devstral 2 132B和Devstral Small 2 24B。此外,Mistral还同时推出了原生CLI工具Mistral Vibe,能实现端到端的代码自动化。此次发布距Mistral 3系列模型才过去一周。
Devstral 2参数为123B,支持256K上下文窗口,可以探索代码库,并能在保持架构层面上下文理解的同时,进行跨文件协调更改;Devstral Small 2参数为24B,同样具备256K上下文窗口,支持快速推理和反馈,可以定制和本地部署,同时还支持图像输入,可应用于多模态Agents。
在SWE-bench Verified编程基准测试中,Devstral 2取得了72.2%的成绩,优于Qwen 3 coder plus、Kimi K2 Thinking等开源模型,仅次于DeepSeek V3.2;Devstral Small 2取得了68.8%的成绩,超过GPT-OOS-120B,和GLM 4.6持平;在针对实际编程任务进行的人工测试中,Devstral 2表现优于DeepSeek V3.2。基准测试结果如下:
此外,在部署上,Devstral 2至少需要四块H100级GPU,更轻量化的Devstral Small 2可以在消费级硬件上本地运行。
Mistral Vibe是一个由Devstral驱动的开源命令行编程助手,集成了文件操作、代码搜索、版本控制及命令执行等工具。
Mistral AI是一家法国创企,成立于2023年,由前DeepMind和Meta研究人员成立,专注于开源模型开发。今年9月,该公司宣布获得17亿欧元(约合人民币139.9亿元)C轮融资,估值达到117亿欧元(约合人民币962.6亿元),英伟达曾三次投资这家公司。
一、基准测试位列开源第二,和顶尖闭源还有性能差距
据Mistral官网,Devstral 2 123B支持探索代码库,能跨多个文件协调修改,还能保持上下文理解。它可以跟踪框架依赖、检测故障,并能通过修正后重试,从而解决如修复错误、改造遗留系统等复杂挑战。
该模型支持微调,可针对特定编程语言进行优化,适配大型企业代码库的需求。
不过,Devstral 2以修改版的MIT协议发布,这一协议对大企业进行了限制:月收入超过2000万美元(约合人民币1.41亿元)的公司,在未获得Mistral单独商业许可的情况下,无法使用该模型。
更轻量化的模型Devstral Small 2 24B支持快速推理、迭代反馈和定制,可本地部署,同时还支持图像输入,可应用于多模态Agents。
从基准测试来看,Devstral 2模型位列开源模型的第二名,并正赶超顶尖闭源模型。
Devstral 2在SWE-bench Verified编程基准测试中取得了72.2%的得分,Devstral Small 2取得了68%的得分,在开源模型中已经达到了领先水平,Devstral 2的得分仅次于DeepSeek V3.2。
Devstral 2系列模型的亮点在于小参数设计,其模型在关键基准测试中展现出和顶尖开源模型齐平的性能,却仅需后者几分之一的参数量。
得分只比Devstral 2高0.9%的DeepSeek V3.2,其参数大小是Devstral 2的5倍,是Devstral Small 2的28倍,而表现次于Devstral 2的Kimi K2 Thinking,其参数大小是Devstral 2的8倍,是Devstral Small 2的41倍。
不过,Devstral 2系列模型与顶尖闭源模型之间还存在差距。
人工评测结果显示,在Cline构建的任务场景中,Devstral 2相对DeepSeek V3.2优势明显,胜率为42.8%,败率为28.6%。然而,Devstral 2相对顶尖闭源模型Claude Sonnet 4.5败下阵来,胜率仅为21.4%,败率为53.1%。
二、端到端代码自动化,能进行架构级推理
Mistral Vibe是基于Devstral模型构建的开源命令行编程助手,能通过自然语言交互,接入IDE,实现对代码库的探索、修改与变更执行。
Mistral Vibe提供了一个交互式对话界面,集成了文件操作、代码搜索、版本控制及命令执行等工具。
它能自动扫描用户文件结构及Git状态,提供相关上下文信息,能理解整个代码库的架构,并进行架构级推理,此外,它还拥有智能引用、持久化历史、自动补全和可自定义主题等功能。
开发者可以通过脚本编程方式运行Mistral Vibe,启用工具执行的自动批准功能,通过简洁的config.toml配置文件管理本地模型与供应商设置,灵活控制工具权限。
结语:平衡高性能与小参数,为企业提供了低门槛解决方案
从Mistral 3到Devstral 2系列、Mistral Vibe,Mistral AI正以相当快的进击速度参与AI竞争,并在模型的高性能与轻量化间实现了平衡,从测试结果看,Devstral Small 2模型在参数仅为24B的情况下,依然优于不少开源模型,和GLM 4.6打平。
Mistral AI在公告中提到,Devstral 2系列模型专为生产级工作流打造,并被定位为下一代SOTA编程模型。尽管和顶尖闭源编程模型还有很大差距,不过,对大多数企业而言,Devstral 2和Devstral Small 2可以作为一个低门槛的初步解决方案,尤其是在和Mistral Vibe的搭配使用上,Devstral 2系列模型或将在特定的生产环节发挥作用。
来源:Mistral AI
《九区毛片视频》,《Q8X2R7L1T4J5M9B6W3》www.99re这里只有精品
“男同女同精品久久AV”
黄色视频日本a级久久
……
12月04日
“欧美激情com”双轨导演
↓↓↓
12月04日,以数字技术赋能“两个文明”协调发展,波多野结衣性交片,胡秀的丰满奶沟大屁股,印度一区二区三区精品视频,白丝 玉足 精液 巨乳
12月04日,“运河边的光影故事”电影公益放映系列活动开启,色色干天天干,久久99久久99,久久99久久免费观看视频,在线播放日本黄色视频,老外肏中国女人屄HD
12月04日,妈祖为何“定居”深山?探访闽南侨乡梅林“大山深处的妈祖庙”,甘雨裸体 开腿涩涩的视频,特一级黄色片免费在线手机播放视频,玛薇卡被操,久操免费视频
12月04日|宁夏彭阳:黄土高原上层层梯田如大地“指纹”|jizz网站|一级视频特级视频|一区色色色|娜娜姐姐vlog视频
12月04日|创新生态治理,内蒙古防沙治沙与新能源建设如何擦出火花?|4s 4s 4s 久久影院|一级黄一|藤浦惠在线播放|国产视频自拍
12月04日|春节前医美直播打响价格战 警惕“破价”医美|好爽好紧好大好痛A视频|91精品国产色综合久久不8|freepron韩国|特级一级片……
12月04日,陕西黄河壶口瀑布山水交响演出《黄河大合唱》开演,一级婬片高清视频一,含羞草视频一二区,美女脱裤子光插pp,不卡的日本在线视频
12月04日,中国财政部将连续发行多笔国债,暴躁老妈色bbb穴操,免费无码又爽又刺激羞羞视频,国内自拍中文字幕在线,密圆·cc图片
12月04日|外交部发言人就瑙鲁政府宣布同台湾“断交”、愿同中国复交答记者问|黄久久免费网址|毛片在线网址|国产黄短视频在线观看视频|亚色视频污
12月04日,安徽祁门:丝光椋鸟正成长,困熊一v三,欧洲欧洲免费观看网站黄,欧美A一级黄色网站,麻豆国产福利91在线
12月04日,吉林市力推“吉菜”香飘海外,亚洲福利福利网站在线观看,mjmjzs.com,亚洲欧美一二三区天天拍夜夜添,手机在线看精品激情毛片
12月04日,场地自行车女团竞速赛:中国队无缘奖牌,亚洲欧美日韩图片,中文字幕亚洲综合久久202,亚洲vs欧美vsm日韩三级动作,小 伸进 www.17cm
12月04日|疼起来万箭穿心 专家介绍“带状疱疹是什么”|欧美黄片A片|18岁操逼网站|欧美性爱1 区|污色网站视频
12月04日|香港警方打击诈骗和洗黑钱拘219人 涉逾5亿港元骗款|真实偷拍网站|仙踪林网站直接入口首页欢迎您|无码东京热尹人久久|五月间天堂2五月间天堂2中字免费在线观看
12月04日|世界一流大学博士教育改革有哪些新趋势|触手 进沙奈朵尿孔里|亚洲国产日韩欧美一区|欧美黄色影院在线免费观看|欧美大网站
司机疑误踩油门 su7穿墙撞上商务车,继承之战 第四季|巴厘岛举行“Ogoh-Ogoh”游行:怪兽狂欢|农民工野外一级毛片|色一片网站|人人肏屄网|原神甘雨自慰
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺