11 月 3 日,阿里巴巴推出 Qwen3-Max-Thinking 早期预览版。Qwen3-Max-Thinking 是 Qwen3-Max 的推理增强版本,它通过集成代码解释器和运用并行测试时计算技术,展现出较强的推理能力。据了解,Qwen3-Max 是阿里巴巴于今年 9 月下旬推出的该公司迄今为止规模最大、能力最强的语言模型,参数量在 1 万亿以上,预训练数据达到 36T tokens。
图 | Qwen3-Max-Thinking 早期预览版的相关 X 推文(来源:X)
目前,Qwen3-Max 推理模型仍在持续训练中,即便使用当前的 Checkpoint,当借助工具调用和规模化的测试时计算时,阿里巴巴表示该模型可在 AIME 25 和 HMMT25 等挑战性较高的数学推理基准测试中达到 100% 的准确率。
Qwen3-Max-Thinking 早期预览版融合了思考模式与非思考模式。当开启思考模式的时候,模型可以很好地执行常识推理和智能体编程等能力,也在数学、科学和其他通用领域具有较好的推理能力。
(来源:实测图)
在实测中,当笔者让 Qwen3-Max-Thinking 完成一个名为“数学推理与可视化智能体”的智能体编程任务时,它花了较长时间思考,消耗的 tokens 也不算低。
(来源:实测截图)
(来源:实测图)
经过几分钟的思考以及长达 527 行的代码,它给出了一个示例输出报告,附上了完整的 HTML 报告示例,并指出这一智能体通过多路径验证可以确保数学严谨性,通过结果的专业可视化能够提供直观的洞察,在架构设计上支持扩展至微积分和组合优化等其他数学问题类型,能够为复杂数学推理任务提供完整解决方案。
(来源:实测图)
当给到 Qwen3-Max-Thinking 一个名为“社区生活情境推理”的常识推理任务时,它给出了两千多字的回答,在这一回答中它根据线索开展了常识分析,给出了逐步重建的核心常识,并进行了超越表面问题的深度风险分析。
图 | “社区生活情境推理”的常识推理任务的描述(来源:实测图)
(来源:实测图)
一位名为“MZift”的 X 网友在 Qwen 的 X 推文下表示:“在 AIME 测试中斩获满分着实惊人,即使是阶段性测试也堪称突破。当众人沉迷于 OpenAI 的纷争时,Qwen 正在悄然蓄力。中国 AI 实验室的崛起之路,果然别具一格。”另一位名为“Kenshii”的 X 网友也评论称:“竟能在AlME 2025 这一中期基准测试中拿到满分?这实力着实骇人。”
图 | X 网友评论(来源:X)
但也有网友根据试用体验表达了自己遇到的问题,一位名为“Goutham Rajesh”的 X 网友表示:“我在试用带有‘思考过程’的 Qwen3-Max 时,页面竟然陷入了无限滚动模式,每当生成响应内容,页面便持续地进行递归式自行滚动,直到完全生成内容才会停止。这一现象仅限于 Qwen3-Max 思考模式。”写完这段话,这位网友还艾特了 Qwen 的 X 账号来反馈该问题。
图 | X 网友评论(来源:X)
事实上,这并非阿里的突然发布。11 月 2 日,通义千问负责人林俊旸已经在 X 上预告称:“它来了,你们可以试试。”新万博体育: Qwen3-Max-Thinking 早期预览版,尚未在 Hugging Face 和魔搭等平台开源。目前,用户可以在 Qwen Chat 中免费试体验,也可以在阿里云百炼平台上调用 API。需要说明的是,文本到文本——是 Qwen3-Max-Thinking 早期预览版目前支持的唯一模态。在对外提供 API 服务上,它采用输出限时免费的方式。未来随着训练的进一步开展,阿里也将推出新万博体育:版本。
名为“ρ:ɡeσn”的 X 网友已经根据 Qwen 的模型时间给出了推测:“Qwen3-Max 预览版于 9 月 5 日发布,正式指令版于 9 月 23 日亮相,其间相隔 18 天。假如思考模型也遵循这一时间线,那么 Qwen3-Max-Thinking 正式版有望于 11 月 20 日到 11 月 21 日之间亮相。”是否真的如此,或许不久之后即将揭晓。
参考资料:
https://chat.qwen.ai/
阅读 1666
《少妇激情一区二区三区视频》,《Q8X2R7L1T4J5M9B6W3》操B无码一级毛片
“就去吻狠狠的干”
簧片一区二区
……
10月30日
“www.17cn.cn免费起草”学姐 可以爱我吗
↓↓↓
10月30日,“中国之船”,故事在延续……(观象台),色哟哟视频在线观看永久日本图片,久久精品国产99久久不卡,鸥美大片,一区二区黄色视频
10月30日,2023年中国互联网企业完成互联网业务收入逾1.7万亿元,综合网色天使,国产农村精品盗摄一区二区三区,午夜影院三级,人妻自拍超碰
10月30日,凤凰卫视香港台4月22日起正式在香港TVB免费电视85频道开播,亚洲欧美黄色小说,性爱网页在线免费看,大黄网址网站免费网站,免费看美女操蛋蛋
10月30日|黄河流凌簇拥碰撞 奏响“大合唱”|欧美性大乱交xxxxx|神乐桃果最惊艳的一部剧|日日舔天天舔|亚洲欧美a
10月30日|“尔滨”火出国:全球搜索热度上升 入境游订单量增加|精品视频在视|国产 美女 在线|黄片免费高清视频|黄 色 软 件
10月30日|浙江省政协十三届二次会议开幕|国产又大又粗又猛视频网站|免费黄色网站大全在线黄|巨胸爆乳美女露双奶头挤奶软件|免费 成 人 黄 色……
10月30日,11月中国大宗商品价格指数环比回落0.8%,高清码 免费下载,日韩精品无码视频人妻四本道,欧美一极黄免费,热热伊人
10月30日,中央气象台继续发布暴雨蓝色预警 12省份局地有大到暴雨,国产A级黄色,超碰1000,日本亚洲一区二区三区,毛利兰的堕落同人漫画在哪里看
10月30日|法国童声合唱团:“如果我去中国”梦成真|公交车上性ⅩXXX视频|97.riav|u蓝正太主打仙气小奶狗维码|一个好妈妈蘑菇电视剧
10月30日,伊朗外交部:将“果断而有效地”回应以色列的袭击,美女又黄 又爽,插插插黄色片,A级毛片免费,天天久久久久久精品影院
10月30日,中国驻德使馆举办2024“国际中文日”活动,国产精品视频一视频二视频三,国产进出又黄又大又粗视频,一,一级黄片,男女一级a爱做片观看免费
10月30日,佛山再推九项新政促进楼市平稳发展,性欧美性巨大69,精品 国产 精品 自拍 高跟,亚洲人精品午夜在线观看,性交小视频
10月30日|大湾区出行更便捷 微信扫码可付香港的士费|2018久久国产免费αv|ai人工智能换脸吴谨言在线愤水|黄色网页,视频|粉嫩av浪潮av浪潮av蜜臀aⅴ
10月30日|开泰研究中心:泰国能源类产品价格上涨致通胀回升|欧美性爱操逼大片|P0RNHD高|八叉八叉|新黄色视频
10月30日|面对AI,巴菲特为何“投资理念不会有任何改变”|人人摸人人操学生妹|又爽又湿有免费的视频|蘑菇tv官方网页版永久版|国产精品第三页在线观看
我心里危险的东西 第二季,降世神通:最后的气宗 第一季|广州“消费帮扶工惠行”助力乡村美味“进城上桌”|亚洲天堂A综合|特种养殖|绝望的校花赵诗宁|A片视频在线网站
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺