(2分钟核心解读)下载官方澳门皇冠鸿蒙版v89.1.60.25.28.94.6.58-2265安卓网

首页 >新闻 >社会新闻

Google 首席 AI 架构师：Gemini 逆风翻盘的18个关键

2025-11-25 02:06:41

来源：

猫眼电影

作者：

吴泰然

手机查看

　　猫眼电影记者成俊报道Q8X2R7L1T4J5M9B6W3

如果不是亲耳听到，很难想象一家科技巨头会在镜头前承认：“两年半前，我们远远落后了。”在这次访谈里，DeepMind CTO、Google 首席 AI 架构师 Koray Kavukcuoglu 罕见地拆开了过去两年 Google 的真实处境——不是领先、不是规模，而是被时代加速甩在身后、再一点点追上来的过程。

他没有炫耀参数，也没有谈模型的“神迹”，而是把重点放在更底层、更残酷的问题上：一家全球最强的 AI 实验室，如何在巨大的惯性中重新学会创新、学会工程化、学会组织协作、学会把技术真正变成产品？

Gemini 的故事只是表层。真正发生变化的，是 Google 这家公司的骨架与节奏。

原文访谈链接：https://www.youtube.com/watch?v=fXtna7UrL44以下是根据访谈实录整理的关键议题，希望也能帮你更清晰地读懂 Google 的这次“重构”。

一、真正的起点不是突破，而是承认自己落后了

访谈中最刺耳也最重要的一句话，出现在结尾：

“当 Gemini 项目开始时，我们离最先进水平还很远，那是一个追赶。”

这句话标志着一个巨大的认知转折：Google 承认自己在 LLM 起跑线上是真正的落后者。不是“状态不好”这种轻描淡写，而是“远远落后”。这意味着 DeepMind 必须抛弃此前十年建立的自信，从最基础的用户使用场景重新学习。

而这种承认，是一切变化的源头。Koray 在访谈里反复强调：真正的转折不是某个新技术，而是 Google 接受自己必须重新建立训练方式、产品方式、工程方式以及组织方式。

二、为什么中国用户最先明显感觉到 Gemini 变好了？

访谈一开始，主持人提到一个特别中国的反馈：Gemini 3 在中国用户中被形容为“像 Windows XP 一样稳定好使”。Koray 很有兴致地解释，这不是模型本身突然“智商暴涨”，而是 Google 终于把“模型 × UI × 任务链路”统一到了一起。

以前的大模型“聪明”，但不“好使”。而 Gemini 3 的转折来自：

用户界面更直觉

任务拆解更稳定

模型更能理解人类意图

产品团队从训练阶段就介入模型设计

真实用户使用数据可以直接反哺训练

换句话说，Google 终于开始像一家做产品的公司在做大模型。这是 Gemini 3 变化最直观的原因，也是中国用户最先体会到的原因。

三、Benchmark 正在失效，但真实世界永远不会

外界批评 Google 的 benchmark 成绩起伏不定，但 Koray 的解释很罕见地触及本质：主流 benchmark 正在靠近它们的自然上限。GPQA、ARC-AGI 等“智商题”已经被模型顶住，HLE 这种曾经难得离谱的测评如今也能“持续提升”。

Benchmark 会枯竭，但真实世界不会。学生写作、科学研究、专业翻译、复杂跨语境对话、跨语言表达……这些场景永远无法被一个固定测试集穷尽。Google 把模型的最终价值从“得分”转向“能不能帮人完成任务”。这是 Gemini 的第一性原理转变。

四、Gemini 3 的核心不是智力提升，而是让模型“能干活”

从 Gemini 3 开始，Google 清晰确立了三个优先级最高的能力方向。

第一是指令遵从。模型要能“无二义性地理解和执行用户的真实意图”。这对用户体验影响巨大，比提升推理指标更重要。

第二是国际化能力。Google 的用户覆盖超过 200 个国家，“理解全球不同文化语境”成为模型能力的底层指标，而不是翻译能力的延伸。

第三是工具调用与代码执行。这是未来智能体的基础，模型必须不仅能理解问题，还能执行任务、运行工具链、处理工程环境中的真实任务。

三者加在一起，构成了 Google 的 “Gemini 设计哲学”：智能不是来自“更聪明的对话”，而来自“更可靠的执行”。

五、为什么多模态强的 Google，起初 Agent 却不好用？

这是主持人问得最尖锐的问题，也是外界最想知道的矛盾。Koray 的答案意外朴素：研究员可以在实验室推动视觉理解，但 Agent 的任务不是研究员能想出来的，是用户逼出来的。

真正的 Agent 场景来自：

创作者的任务链路

学生的写作流程

工程师的工具调用模式

商业用户的复杂需求

也就是说，Google 走了一条与 OpenAI 不同的路径：不是“demo 优先”，而是“真实用户需求优先”。Agent 的能力不是靠酷炫演示驱动的，而是靠“让百万用户每天用”驱动的。

六、Google 真正的反超武器：模型、产品、工程第一次被统一

Koray 多次强调一个过去被低估的事实：Gemini 3 不是“模型团队”的胜利，而是“工程、产品、模型、安全”第一次从第一天就被捏在一起推进。

以往是：

模型训练完了，产品团队接盘

安全团队在最后做审核

工程团队负责部署

而今天是：

产品团队从训练最初就参与

安全成为训练目标，而不是后置规则

真实用户数据（AI Studio、AI Overviews、Anti-Gravity）直接反哺模型

使用成本、延迟、推理路径都在训练阶段就被优化

Google 终于构建出了一个“模型 × 产品 × 工程”的统一体系。这是它在 2024–2025 年真正反超的结构性基础。

七、Nano Banana Pro 的突破不是“画图变好看”，而是“理解世界结构”

外界关注图像模型总是看“清晰度”、“风格”，但 Koray 在访谈中反复强调，真正的突破来自：

理解 PDF、表格、图表等复杂文档结构

具备结构化的视觉推理

第一次能生成“概念一致的信息图”

一句值得记下的话是：

“当一个模型能把复杂概念准确地用一张信息图表达出来，你就能感受到真正的理解。”

这是多模态模型的真正价值，也直接指向 Agent 的未来能力。

八、多模态不是功能加法，而是真正的“世界模型”入口

Koray 给出了一个简洁但极具说服力的框架：

文本是线性的，视觉是空间的，音频是时序的。真实世界不是只靠线性序列能描述的。因此一个真正智能的模型必须同时具备三种感知维度。

这也是为什么 Google 在推进统一多模态模型上比任何公司都更加坚持——不是因为多模态“更炫酷”，而是因为它是理解世界的基础。

九、统一模型并不是“把视觉塞进语言模型”，而是一场架构革命

外界经常把“统一模型”理解成方向正确的趋势，但 Koray 的解释更具技术深度。他指出：文本和图像的输出结构根本不同——文本是一维的，图像是二维的。这意味着训练方式、损失函数、优化器、token 化方式都要重新发明。

统一模型不是“时代潮流”这么简单，而是必须突破的工程极限。Google 的叙事没有浪漫，也没有玄学，只有工程难题。

十、DeepMind 的文化基因：谦逊、科学与大规模协作

这部分是整场访谈里最“人味”的地方。

DeepMind 的文化由三部分组成：

科学心态 —— 所有问题回到实验与学习，而不是路径依赖。谦逊 —— 那句“我们不知道终极配方”不是客套，而是策略。协作能力 —— 从 25 个人写论文到 2500 人一起推进单一模型。

在一个公司试图从科研转型为工程、从工程转型为产品的过程中，这种文化结构变得至关重要。

十一、规模是 Google 的最大难题，也是最大武器

Koray 承认：规模越大，一致性越难。但规模本身就是推进力。

Google 能够同时推进统一模型、多产品落地、跨部门协作、全球化数据管线、超大规模训练与部署，是因为它拥有世界上最成熟的基础设施链路。

过去两年，这条链路从“沉睡”变回“主力”，重启了 Google 的攻势。

十二、安全不是限制能力，而是训练能力

Google 与 OpenAI 在安全策略上最大的差异不是严格程度，而是方式：安全不是“训练后加过滤器”，而是“训练中学会安全”。

这是“让模型可靠”的关键，并且天然适配 Google 的基础设施规模。

十三、统一模型与专用模型不是路线争夺，而是成本优化

Koray 说得很实在：这不是意识形态问题，而是效率问题。未来一定会同时存在统一模型与专用模型，Google 的策略是用合适的工具做合适的任务，而不是坚持单一范式。

这种务实，是 Google 过去缺失、现在重新找到的品质。

十四、Google 的真正底气：基础设施的重新激活

“我们能成功，不是因为我们更聪明，而是因为基础设施足够强。”Koray 的这句话其实深刻揭示了大模型时代的一个底层事实——智能规模化不是靠天才，而是靠管线。

能训练、能部署、能迭代、能处理全球数据、能保持安全一致性的，是基础设施，而不是算法。

十五、Google 不相信有单一路径，也不相信“持续扩参”能走到终点

他说：

“我们不知道最终配方。”

这句话的潜台词是：

扩参不是终局

统一模型不是最终答案

多模态不是最后形态

未来模型的路线还远未定型

这种“带着不确定性继续前行”的姿态，反而比某些公司宣称的“xxx 是通往 AGI 的唯一路径”更具有长寿感。

十六、下一阶段的重点：推理、执行与真正的自主性

Gemini 3 的故事才刚开始。Google 的下一个目标是：

深层推理

多步任务执行

在复杂场景中的鲁棒性

从“会回答”到“会行动”，这是整个行业的共同方向，但 Google 给出了相对清晰的内部路径。

十七、Google 内部的时间结构：研究 × 工程 × 产品的等权分配

Koray 透露，团队的时间分配不是研究优先，而是三者等权。这意味着一个模型从训练到使用的全过程是统一推进的，而不是线性流程。

这是模型“真正可用”的关键原因。

十八、Gemini 是一个全公司规模的“科学工程项目”

访谈的最后，Koray 用“全公司的科学工程任务”来形容 Gemini 的诞生。那更像是一种内部视角的注脚：模型的进步来自结构性调整，而结构性调整本身比模型更难。训练、数据、工程、产品、安全、协作……这些环节重新对齐，才构成了今天的 Gemini。

过去两年，Google 不是在寻找捷径，而是在恢复一个体系应有的速度和一致性。

当这些基础再次稳固起来，一个属于 Google 的节奏也重新出现了。

整理：周华香

点个“爱心”，再走吧

??时事1：ROR手机版

??11月25日,上海大世界上演“似曾相识”的年,

　　最后一个是分享机制。这与我们的经营理念“与员工双赢”是一致的，就是经营成果大家分享。

,真钱赌钱手机版。

??11月25日,【大国新村：沿着总书记的足迹】评论：吹响乡村振兴幸福号角,

　　同学们，我们的家园富饶而美丽，我们生活，学习的地方空气是那样的清新，环境是那么的优美。地球就像妈妈一样给我们带来幸福，带来快乐。可是，你们知道吗我们生活的地球上，美好的环境正在遭到破坏，它将给我们人类带来无穷的灾难。

,买球规则开户,赛酷体育官网下载,大发体育注册送18。

??时事2：kok网站是多少

??11月25日,东西问·两岸“名”迹｜谒连横墓园寻台湾那一代文人情怀,

　　“这是以昆木嫩枝编成的蒲团，历经时间长河冲刷，神性不曾消磨殆尽，可令人静心凝神，利于悟道，是一件瑰宝。”

,皇马国际娱乐线路,杏耀登入官网,皇宫备用网址。

??11月25日,为什么加强相关两用物项对美出口管制？商务部回应,

　　我们兴高采烈地跑到果园里跟着农民伯伯学种树。我们认真地听着，农民伯伯说：“种树讲究“一垫、二提、三埋、四踩，一垫是在挖好的树坑内再垫一些松土;树木栽种的时候要提一提树干，起到梳理树根的作用;而埋树的土要分三次埋下;每埋一次要踩实土壤，其间至少要踩四次。”伯伯刚说完话，我们立刻跑没影儿了，原来，都急着去种树了。

,球天下体育平台,凯发k8AG旗舰,澳门永利app安卓版手机下载。

??时事3：365游戏官网

??11月25日,围棋爱好者“棋”聚上海这家咖啡馆以“棋”会友,　　下一步，常泰长江大桥将完成桥面护栏等钢结构附属设施施工，年底前完成桥面铺装，明年2月底前完成机电、照明、防撞等附属设施施工，4月底前完成动静载试验和交工验收检测，具备通车条件。大桥建成后将对完善区域路网布局，促进扬子江城市群协调发展，服务推进“一带一路”交汇点建设、长江经济带发展和长三角一体化发展等重大国家战略落地实施等具有重要意义。,足球比分捷报比分,世界杯买球倍数,乐鱼体育平台靠谱吗。

??11月25日,2024年医保目录现场谈判竞价正式开始 162个药品有望纳入医保,

　　“呜……”天空中，那只狈在长鸣，如一头厉鬼在哭嚎，声音吓人，它在驱动巨兽攻击，要铲除石村众人。有些巨兽被压迫，迟疑了，有几头猛然人立而起，向前踏来，要冲击石村众人。

,凯时官网APP,银河棋牌登录,伟德体育手机版登陆。

??时事4：第三张补牌的规则

??11月25日,山东半岛“慢节奏”滨海度假游受热捧游客“慢享”赶海垂钓乐趣,

　　1、精心安排，全面部署，成立林场防汛领导组织机构，制定林场防汛实施预案，落实防汛值班带班制度。2、严格执行防汛责任制，确保防汛工作落实，做好防汛工作，落实责任是关键，进一步建立健全了防汛责任制，确保责任落实到位，工作执行到位。3、扎实做好防汛的各项工作，认真做好防汛信息上传下达，对场、站区域水路隐患进行排除，全力做好防汛工作，抓好汛前大检查等，确保了广大职工人身安全、财产安全。

,联众天天单机斗地主,威尼斯人注册页面在哪,炸金花游戏哪个人最多。

??11月25日,今年春运铁路杭州站预计发送旅客1011万人次,

　　灭绝动物的多米诺骨牌，一块又一块地倒下，象翻过去的一页又一页的书。当这本生命历史的巨著翻到尽头的时候，人类也难逃成为“后记”的命运。那时的我们，连掩卷深思的机会都没有了。

,bet365入口登录,急速28,赌城直营平台。

【大熊猫“福宝”营业了！大家关心的问题请看这里↓↓↓】

【浙江东极渔民营救英俘纪念碑落成见证中英人民友谊】

责编：范凌

审核：杨宝忠

责编：缪蒂生

新万博体育

Google 首席 AI 架构师：Gemini 逆风翻盘的18个关键