机器之心报道
编辑:Panda
今天,谷歌有点忙。
一方面,他们与耶鲁大学合作基于 Gemma 研发的 Cell2Sentence-Scale 27B (C2S-Scale) 首次预测了一种新的潜在癌症疗法,引发世界广泛关注。另一方面,他们又更新上线了 Veo 3.1,为用户带来了大幅提升的视频生成能力,参阅报道《刚刚,谷歌 Veo 3.1 迎来重大更新,硬刚 Sora 2》。
再一方面,他们又推出了Coral NPU,可用于构建在低功率设备上持续运行的 AI。具体来说,其可在可穿戴设备上运行小型 Transformer 模型和 LLM,并可通过 IREE 和 TFLM 编译器支持 TensorFlow、JAX 和 PyTorch。
和前两个新闻一样,这也同样引起了开发者的广泛热议。
Coral NPU:一个为边缘设备打造的全栈开源 AI 平台
谷歌给 Coral NPU 的定位是「一个全栈、开源的平台,旨在解决性能、碎片化和隐私这三大核心挑战,而这些挑战限制了功能强大、始终在线的 AI 技术在低功耗边缘设备和可穿戴设备上的应用。」
也就是说,使用 Coral NPU,未来我们有望打造出能在智能手表等设备上本地持续运行的好用 AI,让智能直接嵌入到用户的个人环境中。
然而,要做到这一点却并非易事。谷歌总结了三大方面的挑战:
性能差距:复杂且先进的机器学习模型需要新万博体育:的计算资源,这远超边缘设备有限的功率、散热和内存预算。碎片化成本:为多样化的专有处理器编译和优化机器学习模型既困难又昂贵,这阻碍了跨设备实现一致的性能。用户信任缺失:要想真正发挥作用,个人 AI 必须优先保障个人数据和情境的隐私与安全。
而谷歌今天推出的 Coral NPU 基于其最初的 Coral 项目,「可为硬件设计者和机器学习开发者提供了构建下一代私密、高效边缘 AI 设备所需的工具。」
具体来说,Coral NPU 是与 Google Research 和 Google DeepMind 合作设计的成果,乃是一个 AI 优先的硬件架构,可用于支持下一代超低功耗、始终在线的边缘 AI。
它提供了统一的开发者体验,使部署环境感知等应用变得更加容易。它专为在可穿戴设备上实现全天候 AI 而设计,同时能最大限度地减少电池消耗,并且可通过适当配置来适应更高性能的应用场景。
谷歌已经发布了相关文档和工具,以便开发者和设计者可以立即开始构建。
项目主页:https://developers.google.com/coral代码库:https://github.com/google-coral/coralnpu
技术细节
顾名思义,Coral NPU 采用了 NPU(神经处理单元 /neural processing unit)架构,其为下一代高能效、针对机器学习优化的片上系统 (SoC) 提供了构建模块。
该架构基于一套符合 RISC-V 指令集架构 (RISC-V ISA) 的 IP 模块,专为最低功耗而设计,使其成为始终在线的环境感知的理想选择。
其基础设计可在仅消耗几毫瓦功率的情况下,提供512 GOPS(每秒十亿次操作) 级别的性能,从而可为边缘设备、耳戴式设备、AR 眼镜和智能手表带来强大的端侧 AI 能力。
Coral NPU 生态系统统一视图,展示了为 SoC 设计者和机器学习开发者提供的端到端技术栈。
这种基于 RISC-V 的开放且可扩展的架构为 SoC 设计者提供了灵活性,让他们可以修改基础设计,或将其用作一个预配置的 NPU。
Coral NPU 架构包含以下组件:
一个标量核心(scalar core): 一个轻量级、可用 C 语言编程的 RISC-V 前端,负责管理流向后端核心的数据流。它采用简单的「运行到完成」 (run-to-completion) 模型,以实现超低功耗和传统的 CPU 功能。一个向量执行单元(vector execution unit): 一个强大的单指令多数据 (SIMD) 协处理器,符合 RISC-V 向量指令集 (RVV) v1.0 规范,能够对大型数据集进行同步操作。一个矩阵执行单元(matrix execution unit): 一个高效的量化外积乘积累加 (MAC) 引擎,专为加速神经网络的基本运算而构建。请注意,该矩阵执行单元仍在开发中,将于今年晚些时候在 GitHub 上发布。
从传统设计到 Coral NPU 的架构转变示意图。
统一的开发者体验
Coral NPU 架构是一个简单的、可用 C 语言编程的目标平台,可以与 IREE 和 TFLM 等现代编译器无缝集成。这使得它能够轻松支持 TensorFlow、JAX 和 PyTorch 等机器学习框架。
Coral NPU 包含一个全面的软件工具链,其中包括针对 TensorFlow 的 TFLM 编译器等专用解决方案,以及一个通用的 MLIR 编译器、C 编译器、自定义内核和一个模拟器。这可为开发者提供了灵活的路径。
例如,一个来自 JAX 等框架的模型首先会使用 StableHLO 方言 (dialect) 导入为 MLIR 格式。这个中间文件随后被送入 IREE 编译器,该编译器会应用一个硬件特定的插件来识别 Coral NPU 的架构。之后,编译器会执行渐进式降低 (progressive lowering)—— 这是一个关键的优化步骤,在此过程中代码会通过一系列方言被系统地翻译,逐步接近机器的本地语言。优化后,工具链会生成一个最终的、紧凑的二进制文件,以便在边缘设备上高效执行。
下表展示了 Coral NPU 的软件开发优势:
这套行业标准的开发者工具有助于简化机器学习模型的编程,并能在各种硬件目标上提供一致的体验。
Coral NPU 编译器工具链,展示了从机器学习模型创建、优化、编译到设备端部署的完整流程。
Coral NPU 的协同设计过程聚焦于两个关键领域。
首先,该架构能高效加速当今设备端视觉和音频应用中领先的、基于编码器的架构。其次,谷歌正与 Gemma 团队紧密合作,针对小型 Transformer 模型优化 Coral NPU,以确保该加速器架构能够支持下一代边缘生成式 AI。
这种双重关注意味着 Coral NPU 有望成为首个开放、基于标准、专为将大语言模型 (LLM) 引入可穿戴设备而设计的低功耗 NPU。
对于开发者而言,这可提供一条单一且经过验证的路径,可以用最低的功耗和最高的性能来部署当前和未来的模型。
目标应用
Coral NPU 旨在支持超低功耗、始终在线的边缘 AI 应用,尤其侧重于环境感知系统。其主要目标是在可穿戴设备、手机和物联网 (IoT) 设备上实现全天候的 AI 体验,同时最大限度地减少电池消耗。
潜在用例包括:
情境感知:检测用户活动(如步行、跑步)、距离或环境(如室内 / 室外、移动中),以启用「免打扰」模式或其他情境感知功能。音频处理:语音和声音检测、关键词识别、实时翻译、转录以及基于音频的无障碍功能。图像处理:人物和物体检测、面部识别、手势识别以及低功耗视觉搜索。用户交互: 通过手势、音频提示或其他传感器驱动的输入进行设备控制。
硬件强制的隐私保护
Coral NPU 的一个核心原则是通过硬件强制的安全性来建立用户信任。
谷歌表示:「我们的架构正在被设计用来支持 CHERI 等新兴技术,该技术提供细粒度的内存级安全和可扩展的软件分区。我们希望通过这种方法,将敏感的 AI 模型和个人数据隔离在硬件强制的沙箱中,以抵御基于内存的攻击。」
构建生态系统
开源硬件项目的成功依赖于强大的合作伙伴关系。
为此,谷歌宣布了与 Synaptics 的合作关系,这也是其「第一个战略芯片合作伙伴」,同时也是物联网领域嵌入式计算、无线连接和多模态传感的领导者。
今天,Synaptics 在其技术日活动上宣布了其新的 Astra SL2610 系列 AI 原生物联网处理器。该产品线采用了他们的 Torq NPU 子系统,这是业界首个 Coral NPU 架构的量产实现。该 NPU 的设计支持 Transformer 并支持动态算子,使开发者能够为消费和工业物联网构建面向未来的边缘 AI 系统。
Astra SL2610,来自 X 用户 @TekStrategist
结语
谷歌表示 Coral NPU 有望「解决边缘计算的核心危机」:「借助 Coral NPU,我们正在为个人 AI 的未来构建一个基础层。我们的目标是通过提供一个通用的、开源的、安全的平台供业界在此基础上发展,从而催生出一个充满活力的生态系统。」
对此,你怎么看?有兴趣尝试基于这个平台进行开发吗?
https://x.com/GoogleResearch/status/1978449643437539378
https://research.google/blog/coral-npu-a-full-stack-platform-for-edge-ai
《亚新体育体育》,《Q8X2R7L1T4J5M9B6W3》爱玩体育官网登录
“买球赛用什么app”
a 国际音标真人发音
……
10月16日
“火狐体育网页版登录”梁洛施说和李泽楷只是孩子的父母
↓↓↓
10月16日,两会大家谈 |老外“催更”,中国故事如何“乘风破浪”,杏耀登陆地址,三中三,乐享游戏平台,世界杯竞猜投注公告
10月16日,浙江杭州:首届全国全民健身大赛气排球项目总决赛举行,万博注册平台,365足球外围官方网站,五人牛牛游戏,KU游娱乐登录入口
10月16日,开机率断崖式下跌,电视机如何重回客厅“C位”?,九州BET登录,真人国际在线娱乐,心博天下体育下载,幸运快三彩票官网
10月16日|印尼西苏门答腊省强降雨 因灾死亡人数升至21人|2004年欧洲杯在哪里举行|伟德下载手机app|ag九游会老站|澳门bet体育注册
10月16日|买车容易养车难!新能源车险的“两难”困境如何破解?|世界杯买球app网址|大发登录地址|沙巴体育真人盘口|新云顶娱乐官网登录
10月16日|总书记寄语新时代青年|沙巴在线娱乐|银河影视城app下载|bet365官网买球|百家乐网页版……
10月16日,明十三陵永陵、思陵首次对外开放,火博体育app官网,游客登录免费送2000试玩金,皇冠即时比分,澳门是不是不可以开网投的
10月16日,山东青岛:立体化海域防控体系维护口岸安全,澳门哪家有牛牛,银河线上棋牌,天博综合体育网页版,leyu乐鱼官方网站
10月16日|广东省广物控股集团有限公司党委书记、董事长方启超被查|365app怎么下载|大发投投资平台官网|日博体育官方平台|升博手机版注册
10月16日,【小新的Vlog】打卡正定小商品夜市 感受“梦中情市”魅力,斗地主游戏规则,188体育全网独家,易博国际,bbin官方版app
10月16日,我和总书记面对面丨全面提升新兴领域战略能力,世界杯投注网页,手机上彩票app,18luck新利手机版,威尼斯官方登入
10月16日,美防长奥斯汀继续在家休养 将线上参加对乌援助会议,十大娱乐平台官网,ag真人手机登录,外围足球哪个网站好,澳门mg体验金
10月16日|在热议AI时看见农村|吉祥坊登录|38手游在线客服|世界杯足球买球入口|必发集团7790会员
10月16日|南方降雨再度增多 北方大部以晴朗升温为主|千亿app下载官网|网页斗地主|凤凰平台注册用户|nba正规买球
10月16日|2023年云南林木植被碳储量达11.7亿吨 居全国第一|88网页游戏|大发888免费试玩|哈哈体育|亚慱体育app苹果官网下载
网传21岁重庆男子遭女友PUA后跳江,幻兽帕鲁玩家数突破1900万|【巴黎奥运会】张雨霏:眼泪为挥舞的五星红旗而流 观众都在挺我|天博体育官方地址|365亚洲唯一下载|威尼斯棋牌2299正版|博乐棋牌官网
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺