智谱发布GLM-4.6,寒武纪,摩尔线程完成适配
9月30日,国产大模型“六小龙”之一的智谱发布GLM-4.6新模型。
作为GLM系列最新版本,GLM-4.6在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面能力有所提升。
官方信息显示,此次升级表现在公开基准与真实编程任务中,GLM-4.6代码能力对齐Claude Sonnet 4;上下文窗口由128K提升至200K,适应更长的代码和智能体任务;新模型提升推理能力,并支持在推理过程中调用工具;搜索方面增强模型的工具调用和搜索智能体。
另外,“模芯联动”是此次新模型发布的重点,GLM-4.6已在寒武纪国产芯片上实现FP8+Int4混合量化部署,这也是行业首次在国产芯片上投产的FP8+Int4模型芯片一体解决方案,在保持精度不变的前提下,降低推理成本,为国产芯片在大模型本地化运行上探索可行路径。
FP8是8位浮点数(Floating-Point 8)数据类型,动态范围广、精度损失小;Int4是4 位整数(Integer 4)数据类型,压缩比极高,内存占用最少,适配低算力硬件但精度损失相对明显。此次尝试的“FP8+Int4 混合” 模式,并非简单将两种格式叠加,而是根据大模型的“模块功能差异”,针对性分配量化格式,让该省内存的地方用Int4压到极致,该保精度的地方用FP8守住底线,实现合理资源分配。
具体到模型适配过程中,占总内存的60%-80%的大模型核心参数通过Int4量化后,可将权重体积直接压缩为FP16的1/4,大幅降低芯片显存的占用压力;推理环节积累的临时对话数据可以通过Int4压缩内存的同时,将精度损失控制在 “轻微”范围。而FP8可重点针对模型中“数值敏感、影响推理准确性”的模块,降低精度损失、保留精细语义信息。
除了寒武纪,摩尔线程已基于vLLM推理框架完成对GLM-4.6 的适配,新一代GPU可在原生FP8精度下稳定运行模型,验证MUSA架构及全功能GPU在生态兼容性和快速适配能力方面的优势。
寒武纪与摩尔线程此番完成对GLM-4.6的适配,标志着国产GPU已具备与前沿大模型协同迭代的能力,加速构建自主可控的 AI 技术生态。接下来,GLM-4.6搭配国产芯片的组合将率先通过智谱MaaS平台面向企业与公众提供服务。
本文系观察者网独家稿件,未经授权,不得转载。
地下偶像1-8集全免费
哎呦绅士提醒您为了身体健康请适度
furry老虎猛交大肉自慰
鈭↖DXXOO鉂屸潓HD
YOUJIZZJIZZJIZZ18
美女被❌吸乳脱内内游戏网战韩国
原神夜兰的身材有多爆炸
国产成人精品❌❌❌视频
隐私㊙️黄www网站在线看
裸体裸乳被扒蜜桃小说
精产国品51麻豆cm传媒
中国❌❌❌free少妇公交车
动漫美女自愿扒开㊙️视频
免费裸体奶头视频
纳西妲裸乳被爆❌白浆软件
免费jk❌❌❌白丝乳应用
梅花十三被❌18禁视频
禁天堂国产🍆🍑🔞❌❌
🔞无遮挡裸光打屁股视频
free❌❌❌性3口动漫
老师两腿间乳液自慰羞羞
龟仙人❌18号禁漫画
台湾成人片巜裸体舞
舞蹈生开腿让我爽了一夜
小尿奴张开腿灌水憋尿失禁文章
js深入浅出jsp软件特色
美女❌❌❌免费视频网店动漫
动漫女被❌❌❌喷水
小学生自愈扣出桨的三个基本原则
大胸婬妇❌❌❌❌❌
动漫h18禁免费观看
巜生殖按摩2未删减版
美女露隐私秘免费视频扣扣传媒
性瘾军官男泄欲猛男h
英国妓女丰满多毛
足控社交
18无套直蓝莓视频
男男免费观看完整版大结局
uoco福利库❤网盘资源
男军人自愿脱裤子露蛋网站
成人18㊙️免费网站AI
美女脱内衣给男生揉揉
罗峰干巴塔免费网站
xzjzjzjzjzj欧美大片
91丨九色丨国产女❤️黑色jk
申鹤被❌到爽🔞高潮动漫
爽⋯好大⋯快⋯深点头短视频
流萤裸体无打码
高清🈚码🔞❌♋免费直播动漫
舌头伸入妈妈两腿之间
BB痒想让你添添
视频丨9l丨大学生
被狂男吃奶乳尖60分钟
sone-312
金艺贞ck大尺度自慰
黄漫自慰出精🔞🈲
成人高潮片无爱不欢
一级做a爱片久久A片
山村乳妇奶汁
Japanese胖熊Gay片bear
男人把ji大巴放进女人的图片
朱竹清斗罗大陆抱枕
蹭蹭好爽⋯好紧⋯宝贝别视频日本
涩涩同人❌18禁
高清🈚码🔞❌♋蘑菇视频
宫交+灌尿+跪趴+调教视频
禁慢♥天堂原神p站p站xman
玖辛奈女被c黄扒衣服
爆❌喷水❌洗澡❌麻豆
脱裤子打美女屁屁㊙️
浣肠ちょうきょう调教日本
豪门女佣嗯啊H
中东波斯女人A片作爱
中国老头logoDADDy
千鹤的养成日记1~6集
消防员张开腿被猛躁调教男男
俄罗斯美女与动交zoz0z
动漫做❌打扑克视频网站
國產老女人Z0OZ0zXxXx
嗯~啊别揉我奶头秘视频景甜
散兵被空扒开腿做❌本子
网友评论 查看所有评论>>