当前位置:首页 → 电脑软件 → 为什么朋友圈这条线有长有短 → 世界杯如何买球 v2.363.4801.188282 安卓版
v9.399.9775 最新版
v2.183.9637.474664 安卓漢化版
v7.791.3746.945136 最新版
v5.403.3151 IOS版
v3.415 安卓最新版
v2.510.3152 PC版
v9.395.3658.222723 最新版
v9.615.3867.688450 安卓漢化版
v5.426 安卓免費版
v6.680.2083.587520 安卓漢化版
v2.113.2933 PC版
v7.340.723.333621 安卓最新版
v9.415 最新版
v1.817.747 最新版
v8.555.7001.233291 最新版
v4.309.6753 安卓版
v1.692.2007.899133 最新版
v2.37.7801.639343 安卓免費版
v4.552.3581.31863 安卓免費版
v2.515.6424 PC版
v9.552.3832.897807 最新版
v5.681 PC版
v2.47.2032.743353 PC版
v5.338.3853.265081 安卓漢化版
v7.183 安卓免費版
v6.974.7493.118516 安卓最新版
v6.507.747 安卓漢化版
v2.815.1208.171665 安卓版
v2.488.3957.480316 安卓漢化版
v9.214.1026.403025 安卓免費版
v2.575.4880.793816 安卓免費版
v1.78.7813.959478 安卓版
v2.558.3853.359609 安卓免費版
v1.832 IOS版
v7.929.1296.994989 安卓最新版
v4.58.5687.859452 安卓免費版
v5.509.5613.340853 安卓版
v7.776.7245.698576 IOS版
v8.599.7135 安卓漢化版
v5.331 IOS版
v8.865 安卓最新版
v3.53.4245 PC版
v8.302 PC版
v6.236 安卓版
v2.133.3086.901977 安卓最新版
v5.842.318 安卓最新版
v6.691 安卓免費版
v1.712.2855 安卓漢化版
v1.798.2622 安卓漢化版
v8.906.9874.205223 安卓最新版
v4.466.2321.260014 安卓版
v4.136.4952 IOS版
v8.72.6221.947625 安卓漢化版
v9.974.6571.925478 最新版
v5.857.2074.345354 安卓免費版
v2.990.1748.452666 PC版
v8.699.4394.308324 安卓最新版
v7.787.3987 安卓最新版
v7.327 安卓最新版
v1.366 安卓免費版
v3.546.6407 安卓漢化版
v7.84.955.479768 安卓版
v5.931.2808.74882 PC版
v9.980.1027.2279 安卓最新版
v4.234 安卓最新版
v7.411.3560.90803 安卓版
v1.877.8395.631160 安卓免費版
v2.395.7844.430577 最新版
v5.992.8188.784074 PC版
v7.883.8636 IOS版
v8.633.9644.178066 IOS版
v8.745.3087.256835 IOS版
v2.554.1281 IOS版
v8.679.1141 安卓最新版
v9.313.3179.197314 安卓最新版
v6.582.9676.37476 安卓免費版
v1.967.8216 IOS版
v5.235.4231.60473 安卓最新版
v5.761.4971 安卓版
v1.712.2443.985816 安卓版
世界杯如何买球
11 月 3 日,阿里巴巴推出 Qwen3-Max-Thinking 早期预览版。Qwen3-Max-Thinking 是 Qwen3-Max 的推理增强版本,它通过集成代码解释器和运用并行测试时计算技术,展现出较强的推理能力。据了解,Qwen3-Max 是阿里巴巴于今年 9 月下旬推出的该公司迄今为止规模最大、能力最强的语言模型,参数量在 1 万亿以上,预训练数据达到 36T tokens。
图 | Qwen3-Max-Thinking 早期预览版的相关 X 推文(来源:X)
目前,Qwen3-Max 推理模型仍在持续训练中,即便使用当前的 Checkpoint,当借助工具调用和规模化的测试时计算时,阿里巴巴表示该模型可在 AIME 25 和 HMMT25 等挑战性较高的数学推理基准测试中达到 100% 的准确率。
Qwen3-Max-Thinking 早期预览版融合了思考模式与非思考模式。当开启思考模式的时候,模型可以很好地执行常识推理和智能体编程等能力,也在数学、科学和其他通用领域具有较好的推理能力。
(来源:实测图)
在实测中,当笔者让 Qwen3-Max-Thinking 完成一个名为“数学推理与可视化智能体”的智能体编程任务时,它花了较长时间思考,消耗的 tokens 也不算低。
(来源:实测截图)
(来源:实测图)
经过几分钟的思考以及长达 527 行的代码,它给出了一个示例输出报告,附上了完整的 HTML 报告示例,并指出这一智能体通过多路径验证可以确保数学严谨性,通过结果的专业可视化能够提供直观的洞察,在架构设计上支持扩展至微积分和组合优化等其他数学问题类型,能够为复杂数学推理任务提供完整解决方案。
(来源:实测图)
当给到 Qwen3-Max-Thinking 一个名为“社区生活情境推理”的常识推理任务时,它给出了两千多字的回答,在这一回答中它根据线索开展了常识分析,给出了逐步重建的核心常识,并进行了超越表面问题的深度风险分析。
图 | “社区生活情境推理”的常识推理任务的描述(来源:实测图)
(来源:实测图)
一位名为“MZift”的 X 网友在 Qwen 的 X 推文下表示:“在 AIME 测试中斩获满分着实惊人,即使是阶段性测试也堪称突破。当众人沉迷于 OpenAI 的纷争时,Qwen 正在悄然蓄力。中国 AI 实验室的崛起之路,果然别具一格。”另一位名为“Kenshii”的 X 网友也评论称:“竟能在AlME 2025 这一中期基准测试中拿到满分?这实力着实骇人。”
图 | X 网友评论(来源:X)
但也有网友根据试用体验表达了自己遇到的问题,一位名为“Goutham Rajesh”的 X 网友表示:“我在试用带有‘思考过程’的 Qwen3-Max 时,页面竟然陷入了无限滚动模式,每当生成响应内容,页面便持续地进行递归式自行滚动,直到完全生成内容才会停止。这一现象仅限于 Qwen3-Max 思考模式。”写完这段话,这位网友还艾特了 Qwen 的 X 账号来反馈该问题。
图 | X 网友评论(来源:X)
事实上,这并非阿里的突然发布。11 月 2 日,通义千问负责人林俊旸已经在 X 上预告称:“它来了,你们可以试试。”新万博体育: Qwen3-Max-Thinking 早期预览版,尚未在 Hugging Face 和魔搭等平台开源。目前,用户可以在 Qwen Chat 中免费试体验,也可以在阿里云百炼平台上调用 API。需要说明的是,文本到文本——是 Qwen3-Max-Thinking 早期预览版目前支持的唯一模态。在对外提供 API 服务上,它采用输出限时免费的方式。未来随着训练的进一步开展,阿里也将推出新万博体育:版本。
名为“ρ:ɡeσn”的 X 网友已经根据 Qwen 的模型时间给出了推测:“Qwen3-Max 预览版于 9 月 5 日发布,正式指令版于 9 月 23 日亮相,其间相隔 18 天。假如思考模型也遵循这一时间线,那么 Qwen3-Max-Thinking 正式版有望于 11 月 20 日到 11 月 21 日之间亮相。”是否真的如此,或许不久之后即将揭晓。
参考资料:
https://chat.qwen.ai/
阅读 1666
相关版本
多平台下载
查看所有0条评论>网友评论