(华盛顿22日综合电)Google年度盛会“Google Cloud Next ’26”于美西时间4月22日至24日在拉斯维加斯登场,作为年度云端与AI技术盛会,今年最大亮点之一即是第八代TPU(Tensor Processing Unit)晶片的正式亮相。
Google Cloud执行长Thomas Kurian在会中宣布,AI产业正迈入“代理式企业(Agentic Enterprise)”新时代,并同步发布一系列涵盖AI技术堆叠、算力基础建设与应用层的创新布局,这些技术建立在统一的架构之上,使AI代理不再只是单纯的聊天工具,而是进一步升级为具备感知、推理并采取行动以推动实质成果的自主AI代理(autonomous agents)。
在这波技术发布中,Google正式推出第八代客制化TPU,采用“双晶片、一系统”设计,推出TPU 8t 与TPU 8i 两种架构,分别对应AI“训练”与“推理”的两种截然不同的需求,旨在重新定义AI的可能性,从建立最强大的AI模型、到完美调度庞大的AI代理群,以及管理最复杂的推理任务。

其中,“训练效能引擎”TPU 8t 经过最佳化处理,可将前沿模型的开发时间从数个月缩短至数周。为实现这个目标,Google表示,透过一个系统平衡了极致的运算吞吐量、共享记忆体和晶片间频宽,同时提供最佳能源效率和高产能的运算时间。
作为“推理引擎”的TPU 8i 专为驱动理想的代理式AI(agentic AI)使用者体验而打造,强调只需要提出问题、将任务委派给AI代理,就能立即获得回应,无需等待数秒。它结合了288 GB的高频宽记忆体,与内建384MB的SRAM(静态随机存取记忆体),容量较上一代增加3倍,能将模型使用中的工作集完全保存在晶片上。
Google表示,透过这套训练与推理分工的架构设计,第八代TPU在整体成本效能上较前代提升达80%,意味企业能以相同的成本服务近乎双倍的客户量,从而实现获利成长。这两款晶片预计于今年稍晚正式推出,也显示云端巨头正加速布局AI算力基础建设,抢占下一波企业转型与产业升级的关键主导权。
文 综合报导
图 互联网