当前位置:首页 → 电脑软件 → 高性能新奢舒适主义极狐阿尔法S5 → long8唯一官方网站 v4.642.9123.548563 安卓版
v2.650.3968.22602 安卓免費版
v1.298 安卓漢化版
v5.537.553.984583 安卓最新版
v2.122.7532.120699 安卓免費版
v2.140.9202.359205 IOS版
v7.407.2719.715970 IOS版
v5.577.6359.161970 安卓漢化版
v6.848.1796.70653 安卓免費版
v5.839.9544.889556 安卓免費版
v1.908 IOS版
v2.371 安卓最新版
v2.620.8011.738685 PC版
v3.161.8726.740793 安卓版
v6.964.3393.141247 安卓版
v2.123.3789.345016 安卓版
v3.514 IOS版
v3.14.9847 最新版
v6.864 IOS版
v7.889.3635.512133 安卓漢化版
v1.563.6371.785531 安卓版
v2.847 最新版
v5.151.723.123289 IOS版
v4.441.7158.7277 安卓最新版
v9.32.6400.212293 安卓免費版
v5.328.5726.452632 安卓最新版
v7.285 IOS版
v7.715 PC版
v8.931 安卓漢化版
v8.461.1437.567545 安卓免費版
v3.440.4787.123945 安卓漢化版
v7.999.5851 最新版
v5.21.9362.339747 安卓免費版
v2.387.9245 PC版
v6.626.8028.626498 最新版
v8.535 安卓免費版
v5.861 安卓免費版
v2.446 安卓版
v6.731 最新版
v9.529 PC版
v3.70.1511.247086 PC版
v8.206.6210.854419 PC版
v1.372.5745.822656 安卓漢化版
v4.162 IOS版
v5.596.5306.341222 安卓版
v2.480.3511.626430 安卓漢化版
v9.528.5443 PC版
v7.990.2170.296423 安卓最新版
v6.429.6650 安卓最新版
v4.619.9472 安卓最新版
v1.253.1324.428169 IOS版
v3.713.5497 PC版
v6.264.1746.481902 安卓最新版
v5.298.4697 安卓版
v7.609 最新版
v6.285.5150 最新版
v4.545.6225.248100 安卓最新版
v2.862.5434.124697 安卓免費版
v5.445.7605 安卓免費版
v1.791 安卓版
v4.471.5866.112881 安卓版
v7.459.601.728914 最新版
v3.57.6839.923930 安卓最新版
v4.119.2613.21268 最新版
v1.561.6985.131158 安卓最新版
v7.735.8677.232730 安卓最新版
v8.331.5556.846435 安卓漢化版
v3.732 安卓免費版
v2.50.4920.888454 安卓漢化版
v7.883.1127 安卓最新版
v7.630.1965 安卓最新版
v4.823.5406 安卓版
v1.704 安卓漢化版
v4.969.3391.326560 安卓最新版
v9.372 安卓最新版
v7.31.2355 最新版
v1.206.6982.169256 IOS版
v3.404.5816 安卓漢化版
v6.615.8780.480894 安卓漢化版
v1.765.830 安卓最新版
v4.750.4577.186831 安卓免費版
long8唯一官方网站
金磊 发自 凹非寺量子位 | 公众号 QbitAI
好好好,都赶着国庆节之前开卷是吧。
前脚DeepSeek更新到了V3.2,现在智谱又更新了——
正式推出GLM-4.6,代码能力直接推到了国内最强。
根据智谱的测试结果,他们在Claude Code环境下进行了74个真实场景编程任务测试:GLM-4.6实测超过Claude Sonnet 4,超越其他国产模型。
类似的结果还出现在了其它测评中。
例如在通用能力评测上,GLM-4.6在AIME 25、GPQA、LCB v6、HLE、SWE-Bench Verified、BrowseComp、Terminal-Bench、τ^2-Bench、GPQA,这八大榜单中大部分都已经对齐了Claude Sonnet 4,国内第一。
分数高还只是一方面,智谱的GLM-4.6甚至还把“平均token消耗”给打了下来——比GLM-4.5节省30%以上,为同类模型最低。
而且智谱这次还大大方方地把全部测试题目与Agent轨迹亮了出来,方便大家复现验证:
https://huggingface.co/datasets/zai-org/CC-Bench-trajectories
有一说一,卷,是真的卷。
实测GLM-4.6
根据量子位的老传统,新模型一出,那必须是得安排一波实测。
我们先小试牛刀地来一道题:
生成一个射击类的小游戏。
从实测体验来看,代码生成的速度是相当之快,不到一分钟,游戏就被设计出来了。
进阶一下,我们再让GLM-4.6再做一个交互动画:
用p5js创建多彩的可交互动画。
可以看到,鼠标点到哪里就会产生交互效果。
编程这块,我们最后来测一道经典的题目:
显示球在旋转的六边形内弹跳。球应该受到重力和摩擦力的影响,并且必须逼真地从旋转的墙壁上反弹。
嗯,小球是按照物理规律在运转。
在编程能力之后,我们再来测试一下GLM-4.6的数学能力。
请听一道AIME 2025的试题:
在这次测试中,我们是直接把题目截图“喂”给了GLM-4.6,不仅考察了解数学题的能力,同时还检测了一下它识图的多模态能力。
可以看到,GLM-4.6完美地给出了正解:70。
整体来看,智谱这次新模型能力提升可以概括如下:
高级编码能力:在公开基准与真实编程任务中,GLM-4.6的代码能力对齐Claude Sonnet 4,是国内已知的最好的Coding模型。上下文长度:上下文窗口由128K→200K,适应更长的代码和智能体任务。推理能力:推理能力提升,并支持在推理过程中调用工具。搜索能力:增强了模型在工具调用和搜索智能体上的表现,在智能体框架中表现更好。写作能力:在文风、可读性与角色扮演场景中更符合人类偏好。寒武纪、摩尔线程都跟进了
昨晚DeepSeek更新的时候,一个新现象伴随着诞生——
很多国产芯片公司立即宣布“Day0适配”。
这一现象在GLM-4.6身上也是发生了。
据了解,GLM-4.6 已经在寒武纪的国产芯片上实现了FP8+Int4的混合量化部署,这是国产芯片上第一次真正落地的FP8+Int4模型芯片一体化方案。
在保证精度不受影响的同时,还大幅降低了推理成本,也为国产芯片本地运行大模型提供了一条可行的新路径。
在vLLM推理框架的支持下,摩尔线程新一代GPU能够用原生FP8精度稳定运行GLM-4.6,这充分体现了MUSA架构和全功能GPU在生态兼容性和快速适配上的优势。
接下来,GLM-4.6将与寒武纪、摩尔线程的国产芯片组合,通过智谱MaaS平台正式对企业和大众开放服务。
最后,划个重点。
智谱在能力提升的同时,还把价格给打下来了!
智谱同步升级的GLM Coding Plan(最低20元包月畅玩套餐):用1/7的价格,可以享受到Claude的9/10智商。
GLM-4.6体验地址:chat.z.ai
智谱MaaS平台:bigmodel.cn
相关版本
多平台下载
查看所有0条评论>网友评论