闻乐 发自 凹非寺量子位 | 公众号 QbitAI
编程模型最新卷王来了。
就在今天,火山引擎推出了面向Agentic编程任务深度优化的全新代码模型Doubao-Seed-Code
三个不同的维度,卷出了新高度。
第一,性能SOTA,与TRAE开发环境深度结合后,能更快、更准地解决问题,登顶了SWE-Bench Verified榜单。
第二,价格,调用价格国内最低,火山引擎还配套推出9块9套餐,一杯咖啡钱,就能搞定各种摸鱼小游戏——比如办公室躲老板(doge)。
最后,迁移成本——Doubao-Seed-Code原生兼容Anthropic API,在Claude Code环境中进行迁移,都不用做复杂的配置,几乎就是零成本切换。
不过说归说闹归闹,最后还得看实测效果。
咱实测一波看看……
实测Doubao-Seed-Code
老样子,Coding测试,咱先设置几个进阶任务,看看能力究竟几斤几两。
首先是基础功能,然后交互优化,接着工程化重构,最后完整网站设计
逻辑上层层递进,难度上从单一视觉实现到复杂问题解决,逐步考验Doubao-Seed-Code的综合能力。
第一阶段聚焦简单任务,看看它的基础视觉效果实现能力。
请帮我创建一个银河系粒子效果动画。要求:1)使用Canvas绘制粒子系统;2)粒子随机分布在画布上,模拟星空效果;3)粒子有不同的大小和亮度,模拟远近不同的星星;4)添加鼠标交互,鼠标移动时粒子会有轻微的响应;5)背景使用深色渐变,营造宇宙深邃感。请使用HTML5 Canvas和JavaScript实现。
这个任务的核心需求单一,没有复杂的交互,模型耗时1分多钟输出完整的HTML5 Canvas+JS代码,运行后粒子随机分布,大小与亮度差异也确实能体现远近感,和鼠标交互的轻微响应也能get。
结果很不错,能快速完成简单视觉任务,技术栈使用准确且基础功能无偏差。
紧接着,验证一下模型对“视觉风格+复杂交互逻辑”的理解与优化能力。
这次在Claude Code里进行API调用,不得不夸一句,“无缝衔接”真丝滑,就这个API原生兼容爽!
实际上也不止Claude Code,Doubao-Seed-Code在Cursor、Cline、Codex CLI等主流智能编程环境里,都能与开发者们日常使用的工具无缝衔接。
完整html,Minecraft风格,展示拉链形状,当我上下移动鼠标时,拉链会像真实的拉链一样打开和关闭。拉链闭合拉开的速度慢点。要求:禁止使用任何改变应用结构或组件化范式的JavaScript 框架/库(例如:React,Vue,Angular)。可以cdn引用第三方库以满足题目要求,如Three.js,p5js。最终产物必须是纯粹的HTML、CSS和JS文件。如果需要创建多个文件(HTML/CSS/JS),请确保所有文件引用均使用相对路径。
任务是开发Minecraft风格拉链交互效果,相比第一阶段增加了“鼠标上下移动控制拉链开合(速度慢)” 的交互要求。
模型第一次做完项目倒是非常贴心地帮忙检查了运行效果,也给了一些速度修改建议。
Minecraft风格是有了、拉链形状也有了,但这个交互方式,怎么看也不像拉链啊……
是不是提示的问题,那咱再进一步改造一下:
这个交互模式不像现实生活中的拉链
很快就找到了问题所在,定位到交互逻辑与现实场景脱节的核心问题。
一次改造后的效果如下:
虽然第一次没完成,但调整起来效率尚可,在多轮交互时响应也还算丝滑。
下面,咱来看看Doubao-Seed-Code解决工程化问题的能力,给它给一份旧代码,让它找bug并且进行项目重构。
测试素材是一份有多个问题的记事本项目。
(提供文件)定位这份代码的bug,并进行结构化重构
Doubao-Seed-Code拿到任务后先是明确了旧代码的问题,将Bug定位到了具体的代码行。
随后输出重构代码,还列出了优化清单。
对比两份代码,从菜单创建模块可以看出,左边旧代码结构混乱,并且没有分离设计,重构后的代码拆分了菜单与文件操作模块,并且绑定了快捷键。
具体到某个函数,比如打开文件夹模块,左边旧代码中文内容乱码,没有进行文件不存在的异常处理,新代码都进行了改善。
可以看出模型面对“多Bug+结构混乱”的复杂工程问题时,具备系统性诊断与专业重构的能力。
最后进行完整项目开发,测试模型对多需求整合与落地的能力。
帮我开发一个故宫博物院的导览网站。需要包含几个主要宫殿的介绍,配上高清的馆藏文物图片。最重要的是,每个宫殿的介绍页面,都要有一个语音导览按钮,点击后能播放由AI生成的专业语音解说。
由于没有提前提供素材,模型在交付的代码中主动补充了图片替换教程,详细说明如何按需搜索素材并替换占位图,解决了素材缺失的问题。
从最终效果来看,网站结构完整,涵盖了核心功能模块,语音导览按钮的逻辑也已预留,并且实现了完整功能。
同时还考虑到了实际使用中的素材问题,不得不说,全面~
等一下,好像还有更有意思的事情,Doubao-Seed-Code居然能看图写代码
现阶段,只有Claude系列、GPT-4V等一些国外模型能够参考UI设计稿或截图生成代码。
Doubao-Seed-Code要是能做到,那真是国产编程模型独一份了。
马上来试试!先提供一个“移动端咖啡点单页面”的UI设计稿:
(提供UI设计稿)请参考给出的UI设计稿图片,生成一个“移动端咖啡点单页面”,生成满足所有要求的前端代码,确保页面主题明确。
点餐页面就这么水灵灵的做出来了,相似度99%!
那另外的1%去哪了?
原来是为了避免素材依赖,Doubao-Seed-Code给画了个和原图不太一样的咖啡杯(hhh
这只能说,「图片在手,UI我有」了。
整体测完后,Doubao-Seed-Code的实测效果,确实符合官方强调的优势特点——
国内首个支持视觉理解能力的编程模型,能够参照UI设计稿、界面截图或手绘草图直接生成对应代码;同时,还能对已生成的页面进行视觉比对,主动识别样式偏差与功能Bug,并自主完成修复优化,显著提升了前端开发效率;原生兼容Anthropic API。对于广大使用Claude Code的开发者,几乎零成本即可将API切换到Doubao-Seed-Code。多平台适配,还对Claude Code、Trae等主流IDE进行了特别优化;原生256K长上下文,在处理长代码文件、多模块依赖等复杂场景能力提升,实现端到端自主编程,全栈开发友好,前端能力突出;
当然,性能上的优势之外,火山引擎在AI大模型浪潮中给人的最大印象,还得是稳定又便宜。
模型够强,保障够硬,价格够低
AI Coding愈发竞争激烈,各厂商纷纷发力卷性能卷价格卷使用保障,火山引擎也不遑多让。
最最最受关切的成本问题,也被火山引擎打到了“一杯咖啡价”。
综合使用成本在业界平均水平上砍了62.7%,在调用价格上,不仅比国际主流模型低得多,还卷到了国内最低价:
0-32k输入区间:输入1.20元/百万Token,输出8.00元/百万Token32-128k输入区间:输入1.40元/百万Token,输出12.00元/百万Token128-256k输入区间:输入2.80元/百万Token,输出16.00元/百万Token
打个比方,要创建一个美观的交互式英语学习网站,在0-32k区间的相同tokens量下,Claude Sonnet 4.5的成本约4.05元,GLM-4.6约0.77元,而Doubao-Seed-Code仅约0.34元
这不刚好双11,火山引擎还给个人开发者安排了省钱大礼包,推出了支持最新模型的Coding Plan,最低套餐首月仅需9.9元。
火山引擎自投身编程模型研发以来,从早期版本的逐步迭代,到推出如豆包大模型系列,在编程能力上可以说是持续进化。
开源了命令行AI Agent——veCLI,通过自然语言交互,实现从指令到代码的自动化构建与运行。
还基于编程相关模型打造了IDE产品TRAE 。如今,在字节内部,超过80%的工程师都在使用TRAE辅助开发,其整体月活用户已超100万。
现下,Doubao-Seed-Code和TRAE的组合拳更是有亮眼表现,在SWE-Bench-Verified基准上“卷”到了SOTA。
Doubao-Seed-Code在Terminal Bench、SWE-Bench-Verified-Openhands、Multi-SWE-Bench-Flash-Openhands等主流测评也表现出色,在国内同赛道模型中表现突出。
表现如此,离不开背后的技术支撑优化。
这次,火山引擎为Doubao-Seed-Code构建了覆盖10万容器镜像的庞大训练库,支持端到端沙盒环境评测;依托千卡GPU集群,实现了万级并发沙盒session能力。
采用端到端强化学习,直接从任务沙盒反馈中学习,不用依赖复杂的蒸馏过程,优化路径也更高效。
另外,火山引擎还在算力和安全保障上,做了进一步加码。
背靠火山引擎的超大资源池,即便遇到多用户并行调用、复杂项目开发等高频场景,也能保持稳定响应。
同时,模型由火山方舟提供推理接口服务,代码数据传输和调用过程全程加密,不用担心核心开发信息泄露。
可以说把企业级AI开发,痛点都琢磨得透透的了。
不愧是宇宙厂自己先用先检验的产品和技术。
AI coding正进入了“一杯咖啡”时代,而且还是一杯国产咖啡价格的时代。
想要薅这个羊毛,复制下方链接即可传送~
Coding Plan订阅:https://www.volcengine.com/activity/codingplan?utm_campaign=202511&utm_content=codingplan&utm_medium=waibumeiti_jigou&utm_source=VolcanoArk&utm_term=liangziwei
— 完 —
《yabo22vip网站是多少》,《Q8X2R7L1T4J5M9B6W3》三星发财报(新图推荐)
“快3正规app”
188体育篮球比分直播
……
11月09日
“球世界杯投注网站”日车企造假影响汽车零件材料出货量
↓↓↓
11月09日,收到陌生快递还能扫码领钱?别信!已有多人被骗,美高梅手机版登陆,美高梅注册,沙巴体育游戏登录,世界杯买球平台app
11月09日,宇宙年龄究竟有多大?最新研究发现比当前宇宙学模型预测的年轻,bob综合体育官网网址,世界杯买球方法,真人代替国际象棋视频,在线威尼斯游戏
11月09日,民进党胜选后大陆方面将加速统一进程?国台办回应,易博yb,三元棋牌官网最新版,炸金花规则大小王,沙巴体育体育外围
11月09日|报告:全球企业员工对AI技能的学习诉求增长迅速|jdb财神捕鱼的放水规律|沙巴体育游戏下载官网|爱博体育在哪里下载|亚盈体育app官网
11月09日|中国出口吉尔吉斯斯坦新能源客车订单完成全批次交付|明博体育网|抓码王|澳门金沙平台娱乐场|云顶官方
11月09日|第三届广东青少年粤剧夏令营开营|宝博体育登录平台|体育注册送本金|新澳门游戏网站导航|必赢下载……
11月09日,“我的公交我的城”活动珠海收官,泛雅平台下载,tvt体育注册网址入口,白姐解密,ag真人线上国际娱乐平台
11月09日,春运期间东航加大在湖北市场运力投放,AG真人游戏,俄罗斯世界杯投注官网,澳门星际xj1277app,在哪里可以投注世界杯
11月09日|中印尼机构携手打造产学研校企国际合作基地|世界杯买球在哪浮fc3_tv|365篮球比分|世界杯无脑买球分析|真钱官网注册
11月09日,中国大使为柬埔寨华校学生才华魅力点赞,kok网页登录,js6666娱乐,天博app官网地址下载,体育平台送体验金网站
11月09日,2024年医保目录现场谈判竞价正式开始 162个药品有望纳入医保,澳门威尼斯人网址,英亚国际综合,彩神彩票登录入口,365bet免费投注
11月09日,天津港2024年接待邮轮达100艘次、进出境旅客超34万人次,下载斗地主免费版斗地主不花钱的,大富豪下载送27,彩票世界杯投注app,米乐官方下载
11月09日|青海完善社会救助体系:分层分类多元参与|新mg网站|梦幻国际棋牌有真人|OD世界杯比分|ky开元棋
11月09日|中国新闻一周纵览(10月19日至25日)|银河网上开户|永利体育真人百家乐|英亚手机app|买球的app哪个靠谱
11月09日|成都警方破获一起制售假冒品牌火锅调和油案 涉案金额1400余万元|M6米乐小罗|必博注册|千赢国际体育下载|天齐网3d藏机图
壶鱼辣椒,村民焚烧秸秆被罚款?镇政府回应|科摩罗现任总统阿扎利赢得新一届总统选举|开元app官方网站|乐鱼竞技在线登录|网投网站平台|九游会线上平台
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺