智东西作者 陈骏达编辑 李水青
DeepSeek又更新了!
智东西9月22日报道,今天晚间,DeepSeek在其官方API平台发布了最新升级的DeepSeek-V3.1-Terminus模型(Terminus拉丁语意为终点、界限),并在不久后宣布模型开源。
官方文档中称,DeepSeek-V3.1-Terminus在保持模型原有能力的情况下,改进了语言一致性、偶发异常字符等DeepSeek-V3.1上线后出现的Bug,还进一步优化了编程和搜索智能体的表现。
DeepSeek官方在微信公众号放出了新旧DeepSeek-V3.1的基准测试对比。可以看到,在非Agent类的基准测试中,DeepSeek-V3.1-Terminus比DeepSeek-V3.1实现了0.2%-36.5%不等的表现提升,不过也有些测试成绩出现小幅度下滑。
DeepSeek-V3.1-Terminus在HLE(人类终极测试)上的性能提升最为明显,这一测试主要考察专家级的高难度知识和模型的多模态、深度推理等能力。
而在Agent测评中,DeepSeek-V3.1-Terminus网页浏览、简单问答和多项编程测试中的表现出现小幅提升。
DeepSeek官方App、网页端、小程序与DeepSeek API模型均已同步更新为DeepSeek-V3.1-Terminus。智东西第一时间调用DeepSeek-V3.1-Terminus的API进行了体验,尝试复现此前的多个Bug,并体验模型的最新性能。
开源地址:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus
一、两大神秘Bug消失,DeepSeek-V3.1终于不犯糊涂了
今年8月,DeepSeek-V3.1上线后,有用户反馈在用API调用模型时,会偶尔出现一个严重Bug:模型会不受控地随机输出“极”、“極”、“extreme”等字样,严重影响日常使用,如果未经仔细检查就使用含有这一Bug的代码,很可能导致编译失败。
▲DeepSeek-V3.1的“极”字Bug(图源:知乎@Fun10165)
智东西调用了最新的DeepSeek-V3.1-Terminus API,尝试复现上述问题。网传能复现这一问题的“高危”提示词包括要求模型写Go语言、完成版本号相关任务、处理时间等。
不过,DeepSeek-V3.1-Terminus在测试中并未因上述提示词而出现Bug,也就是说,这一问题应该已经被修复了。
▲DeepSeek-V3-Terminus没有因“高危”提示词而产生Bug
也有海外用户反映,此前的DeepSeek-V3.1存在多语言的问题,尤其是在翻译小语种时。这位Reddit网友分享,DeepSeek会把中、英、俄三种语言混用,问题文本的比例有时能达到5%。
▲网友分享DeepSeek-V3.1多语言混用问题(图源:Reddit @Kitano_o)
智东西尝试着让DeepSeek-V3-Terminus将这句话翻译为7种小语种:“人工智能正在改变我们的世界,它带来了巨大的机遇,也需要我们认真思考其挑战。”
DeepSeek-V3-Terminus的回答没有出现语言混杂问题,看来这一Bug也被修复了。
二、小球弹跳效果惊艳,还能快速交叉搜索信息
除了Bug的修复之外,DeepSeek-V3.1-Terminus还有一大值得关注的地方是其编程和搜索智能体能力的提升。
编程任务上,智东西让DeepSeek-V3.1-Terminus尝试了小球弹跳,结果如下。模型输出的网页采用了简约风格,不过,模拟的重力、摩擦力效果十分逼真。要打造这样的效果,模型不仅需要有很强的编程能力,也需拥有对物理学的理解能力。
这一模型打造的动画效果也不错,轨迹和碰撞都比较自然:
在搜索智能体能力方面,我们让DeepSeek-V3.1-Terminus推荐了几款适合新手阳台盆栽的植物。这一测试考察模型能否找出完全符合“阳台盆栽”、“生长快”、“可生食”、“对儿童安全”所有条件的植物。此外,模型也要交叉验证信息的可靠性,并进行整合提炼和风险提示。
可以看到,DeepSeek-V3.1-Terminus给出的答案考虑十分周全,经人工核查事实无误,可读性也不错。
结语:DeepSeek-V3.1,迎来终极版?
DeepSeek-V3.1-Terminus中的“Terminus”,在拉丁语里是“终点”或“界限”的意思,我们试着让DeepSeek自己对这一命名给出了解读。DeepSeek称,这一命名可能象征着DeepSeek-V3.1是这个系列架构的终极版本,代表了当前技术路径的成熟和完善。
也有网友认为,Terminus可能意味着模型在编程终端里的表现更好了。不过,正如DeepSeek所言,具体的命名寓意最好还是官方来解释更为准确。
此前,外网有媒体报道称,DeepSeek今年年底即将推出Agent模型。或许,DeepSeek的下一次重大更新,已经不远了。
《两个奶头被吃高潮受不了》,《P6F3X2M7T9QJ8L1B4WZR》表妹洗澡让我进去摸她奶
“无遮挡同人漫画网站”
我的老婆晓馨第19集
……
09月21日
“91㊙️片黄在线观看喷潮”请客带酒竟然没人喝
↓↓↓
09月21日,“烟台造”时钟系统为墨西哥轻轨线路“报时”,阿狸被❌吸乳羞羞A片,俄罗斯美女被猛烈进入,草莓芭乐秋葵黄瓜鸭脖直播,翁公在客厅添我荫蒂
09月21日,【湾区青年说】澳门青年周少杰营造“寻味”湾区新天地,景甜裸被❌视频网站new,乖我硬了~你的里面好疼视频,原神同人漫画,申鹤被爆♡❌3D动漫
09月21日,【理响中国·人民至上@中国式现代化】瞄准未来 温州勇当先行者,斯嘉丽裸被✘到喷水freep,黑兽2高傲的圣女第6集,亚洲AV㊙️无码一区二神宫寺,别c我⋯啊⋯嗯上课呢男男明星
09月21日|大金砖 大团结 大作为——习近平主席赴俄罗斯出席金砖国家领导人第十六次会晤成果丰硕亮点纷呈|ass极品裸体女兵picc|尼尔2b扒开腿自慰|脱👙让摸🐻视频无码|男男Gay做受高潮羽锡
09月21日|外媒:以官员称美国暂停向以色列运送美制弹药|18禁大乳美女极品少妇|ACfan黄漫版免费观看网页版|国产精品无码ThePorn|严浩翔~别揉了~尿了~啊哈视频
09月21日|中国温室气体公报:2023年二氧化碳和甲烷浓度均呈增加趋势|黄品汇成人免费永久小红书|扒开私密部位惩罚尿孔视频|乖~腿打开一点白光莹庞尊|美女隐私㊙️免费观看视频……
09月21日,中新健康丨武汉生命健康产业规模突破4800亿元,91久久久久久精品国元产码,国产❌少萝❌❌动漫,白丝秘书被躁到高潮视频AV,中国帅小伙自慰出精
09月21日,国际首次!新一代人造太阳“中国环流三号”取得新成果,国产黃色A片三級三級三級狼友,隔着肉丝🌸扒腿自慰爽,捷克街头钞能力无删减版视频,双男主真人素材视频外网
09月21日|山西运城:立夏至 “晋南粮仓”农事忙|丰满少妇免费做爰大片人漫画|笔盒beatbox在线观看入口|地下偶像1-8集全免费观看|SilkLabo纯肉无码无删减
09月21日,两部门紧急预拨5000万救灾资金支持云南省做好地质灾害救灾工作,脱👙让学生C🐻在线观看,Aute♥XXX♥Hentai,⚠️香蕉文化动漫sss入口,免费看胸㊙️变态视频
09月21日,“人从众”模式开启!中国航展开幕首日兵器馆人气爆棚,韩国vip19➕福利网站,海贼王娜美被❌羞羞真人,女子拉屎pooping6-2,瑜伽芭比液体裤
09月21日,浙江舟山海事助推长三角一体化发展 政务实现“跨域办”,嫖老阿婆视频大全,91九色丨PORNY丨丝袜,禁漫天堂❌黄动漫网站看,美女露出🐻让男子揉捏
09月21日|尊宪崇法丨法治“齿轮”紧紧耦合,“幸福航船”行稳致远|扒开小泬疯狂做爰XXXⅩ视频|男人喝女尿㊙️免费看|车上扒开内裤进入内内的软件|18🈲乳液啪游戏
09月21日|瞭望·治国理政纪事|舰指深蓝 向海图强|精品人妻无码一区二区三区李丽珍|18🈲🍆🍑泡|扒开小舞狂揉难受3d动画|末发育娇小性色XXXⅩ
09月21日|广州:领跑一线城市松绑,节后楼市回升明显|女性脱👙给我揉🐻照片监控|中国美女裸体㊙️直播|国产精輦清纯女学生|贵妇淫荡三P
妈妈按天给大学生女儿发50元生活费,不时用俄语小声说真心话的邻桌艾莉同学|香港数码竞争力排名升至全球第七位|田曦薇被C到合不拢腿视频|拔萝卜动画免费观看完整版大全|www成人🔞色情美女|tk调教痒奴全身男男
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺