猫眼电影
猫眼电影记者 官博捧 报道Q8X2R7L1T4J5M9B6W3
智东西作者 陈骏达编辑 李水青
阿里的“超大杯”思考模型,终于现身了!
智东西11月4日报道,刚刚,阿里发布了Qwen 3系列中最强推理模型Qwen3-Max-Thinking的早期预览版。尽管这一模型只是一个训练的中间检查点,但它已借助工具使用和测试时计算,在AIME 2025和HMMT(哈佛-MIT数学锦标赛)等具有挑战性的推理基准测试中,达到100%的准确率。
不过,这一模型其实已经在通义千问负责人林俊旸的个人社交媒体账号上获得了“超前点映”:在11月2日的23点54分,林俊旸便发文“它来了,你们可以试试”,配图是开启思考模式的Qwen3-Max。
Qwen团队并未透露Qwen3-Max-Thinking早期预览版的新万博体育:信息,模型也并未在Hugging Face、魔搭等平台开源。Qwen团队称,随着训练的继续,新万博体育:版本将会推出。
用户可在Qwen Chat和阿里云API中试用Qwen3-Max-Thinking早期预览版。API调用界面介绍,Qwen3-Max-Thinking早期预览版实现了思考模式与非思考模式的有效融合,在思考模式下,模型在智能体编程、常识推理,以及数学、科学和通用领域的推理能力等方面都有显著提升。
体验链接:
chat.qwen.ai/?thinking=true
API调用:
https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3-max-preview
值得注意的是,Qwen3-Max-Thinking早期预览版仅支持文本到文本这一模态,并选择以输出“限时免费”的模式对外提供API服务。
我们在体验中发现,Qwen3-Max-Thinking早期预览版的确挺费token的,如果不是限时免费输出的话,使用成本或许会较为高昂。
不过,该问题是可以用自带的思考预算控件解决的,用户可以在1024-81920个token的思考预算区间内随意切换,直接控制模型的推理长度。
智东西在Qwen Chat中体验了Qwen3-Max-Thinking早期预览版的能力。要使用这一模型,用户需要在左上方选择Qwen3-Max,并开启输入框中的Thinking模式。
既然Qwen3-Max-Thinking早期预览版在AIME 2025上拿下了满分,我们便拿这场竞赛难度最高的压轴题,来考察该模型的数学推理能力。
可以看到,Qwen3-Max-Thinking早期预览版在其思考过程反复输出了正确答案,不断验算,不断以新的方式解题目,甚至调用了代码解释器,从多种角度证明了其结果。
这一过程耗时大概4-5分钟,不过确实保证了答案的完全正确。将这一结果放到token计数器后,大致计算出其对应的token用量在1.2万-1.5万之间。
在智能体编程任务上,我们尝试让DeepSeek-V3.2和Qwen3-Max-Thinking早期预览版完成相同的任务——开发一个开源项目分享网站的HTML原型。
Qwen3-Max-Thinking早期预览版能准确分析用户需求,输出所需的网页。网页设计简洁清晰,也符合开源项目分享网站的基本使用需求,就是在样式和字体选择上略显粗糙。
对于其输出的网站结果而言,Qwen3-Max-Thinking早期预览版消耗的token数量明显偏多。反映到代码数量上,这一模型使用了整整1417行代码完成了任务。
开启深度推理的DeepSeek-V3.2生成了如下网页预览,代码源文件中包含787行代码。
在常识推理类任务上,Qwen3-Max-Thinking早期预览版能很容易地绕开逻辑陷阱。
不过,平心而论,此类题目Qwen-3-Max也能轻松解决,只需要几十个字。
已经有不少网友用上了Qwen3-Max-Thinking早期预览版。有网友反馈,这一模型的回复更为直接、切中要点,也更为“商务”,几乎避开了所有“人性化”的情感。
也有网友在自己打造的“randombench”基准测试上,考察了Qwen3-Max-Thinking早期预览版的表现。Qwen3-Max-Thinking早期预览版能解答高难度的推理问题,在这一基准测试上,此前只有GPT-5(思考模式)和Grok 4达到了相同的水准。
不过,广大网友们最关心的问题,或许还是:到底啥时候上Hugging Face?
结语:Qwen3-Max系列模型,期待拉满
阿里的Qwen3-Max系列模型已经成为当前AI业内最广受期待的模型之一,在社交媒体的评论区中,已有不少网友开启催更模式。
今年9月5日,阿里上线Qwen3系列最强模型Qwen3-Max的预览版本,这也是阿里迄今为止最大的模型,参数量超1万亿。
此番发布的Qwen3-Max-Thinking早期预览版在推理方面展现出强大的能力,其在数学竞赛上的满分表现就是例证之一。在定位上,这或许就是一款专为高难度推理而生的模型,并不一定适用于所有使用场景。目前阿里尚未放出完整的基准测试结果,其整体表现仍有待观察。
??时事1:千亿竞彩官网
??10月31日,翟立新任天津市副市长,
老子曾说:上善若水,厚德载物。今天我说:只要是真实利益众生的好事,我们就应当抓住时机尽力去做!这便是:随缘、尽力、修善,也正是这几年来公司上下为之不懈努力的目标。瑞特公司是从最根本处解决百姓的生活质量和健康问题,并可由此提高全民的身体素质。因此,我们现在所做的,不但是蕴藏着无限商机的大事,同时也是一件送人以健康的好事!所以应该说,无论是昨天、今天还是明天,凡是支持和帮助瑞特公司的朋友们以及加入瑞特公司的员工,均是有智慧、有福德之人!若说有机缘饮用瑞特牛奶是“独善其身”的话,那么,像所有的朋友这样,能够尽力地帮助我们把瑞特公司管理好建设好,并让它随着我们坚实的脚步走进千家万户,利益普天下所有的众生,则是“兼善天下”的义举。
,线上网投娱乐。??10月31日,贵州玉屏:自行车选手山地竞速,
1、开拓市场,创造一流营销业绩。20年订货形势比较严峻,因此我们要更加努力,抓住机遇,乘势而上,为耐力发展源源不断地提供市场资源支持和产业支撑。一是要巩固已有的合作关系;二是要做好回访和售后服务工作,建立长久合作机制,为经销的长远战略实施奠定坚实的基础;三是要适时调整营销策略和主攻方向,坚持走差异化的发展战略之路,主动出击,抢占先机,努力开拓新市场,不断向生产制造高端方向发展和延伸,为公司不断取得一流的经营业绩创造有利的物质基础和外部条件。
,腾龙娱乐公司网址app,二八杠做庄,十年信举亚洲首选主页。??时事2:韦德娱乐网址
??10月31日,新疆巴音布鲁克草原牲畜陆续转入冬季牧场,
像石村那样得到狻猊遗体,并且发现其原始符文,这种事情实在太罕见了,只有个别罕见的例子而已。
,威尼斯人官方网站链接,半岛bob·体育官方网站,AG真人平台。??10月31日,端午假期消费持续火热 文旅融合跑出“加速度”,
“看到了吧,我们失去了一个至尊,难道还要再眼睁睁的看着另一个重瞳的孩子死掉?在上古,这可是圣人、神人!先放开她,慢慢计较。”如血凰般的老人说道。
,澳门海立方下载,玩老虎机网站,永利登录电玩。??时事3:菲彩官网
??10月31日,穆利诺赢得巴拿马总统选举,
在这一瞬间青鳞鹰又中了十几箭,伤口处都快被射烂了。小不点落泪,他守不住,大叫着:“我与你们拼了!”
,鸭博体育网址,银河体育平台开户,天博网站多少。??10月31日,新疆托布秀尔制作匠人:精雕细琢才有灵魂,
数十年来,石云峰多次持骨叩拜柳树,进行祭祀,但是却始终没有得到柳树的回应,甚至不知它可以进行神念沟通。
,世界杯买球段子,2026世界杯投注抚fc3_tv,幸运六合彩。??时事4:迪士尼彩乐园2
??10月31日,王毅同柬埔寨副首相兼外交大臣宋金达举行会谈,
石昊安抚三只幼鸟,同时叮嘱他们,一定要再次劝说青鳞鹰,到时候去帮忙。因为去寻狻猊的尸体可能会很危险,若是有一头强大的凶禽相助,一定会顺利很多。
,澳门拉斯维加斯线上网站,pg电子寻龙探宝,搜米足球直播。??10月31日,通络药物科研成果荣获中国中西医结合学会科学技术一等奖,
刚才教科室主任朗其生老师就这一届毕业班的情况及上学期的成绩进行了客观、详细的分析,并根据现状以如何提高教育教学质量做了详细的指导安排,为这一届小学毕业学生提高教育教学质量奠定了基础。借此机会,我也讲以下几点想法:
,蛊真人英文版起点国际,威廉希尔体育在线登陆,bbin官网联系方式。责编:江学昌
审核:景德旺
责编:海特












