巨人天成
产经 科技 企业 数据 峰会 快讯 商业

IBM全新大型机:Telum II与Spyre加速器引领AI革命

2025-04-09来源:ITBEAR编辑:瑞雪

IBM近期发布了其最新一代大型机,该产品在保持传统关键任务工作负载的安全性和可靠性基础上,融入了人工智能技术,特别是大型语言模型(LLM)、智能助手及代理功能,标志着大型机技术的一次重大飞跃。

z17系列大型机搭载了升级的Telum II处理器和Spyre AI加速器卡。这两款硬件在去年的Hot Chips大会上就已备受瞩目,据IBM宣称,其AI性能相较于前代z16提升了7.5倍。

IBM指出,Telum II处理器不仅延续了z16中引入的针对交易欺诈检测的改进AI推理能力,Spyre卡更是为扩展AI处理提供了新方法,支持生成式AI和LLM,通过运用多种模型来提升预测准确性和减少误报率。

IBM院士及Z系统架构师Elpida Tzortzatos在介绍这款大型机的硬件增强功能时比喻道:“如果将数据比作新的燃料,那么基础设施就是推动企业AI之旅迈向成功的引擎。”她进一步表示,IBM在开发z17时,深入了解了客户需求,客户期望看到应用程序的更新以及大型机更加智能化。

然而,IBM并没有盲目跟风,简单地将生成式AI技术植入大型机中,而是进行了深思熟虑的规划。Tzortzatos强调:“生成式AI(GenAI)对客户至关重要,但它并非唯一的AI工具。尽管近期GenAI备受关注,但预测性AI在企业中仍将发挥核心作用。”她补充道,GenAI为新的应用场景开辟了道路,例如智能助手、文档总结、开发人员支持及自动化代码编写等。

IBM的watsonx Code Assistant for Z和watsonx Assistant for Z等助手便是这些应用的实例。Tzortzatos还提到,一个新兴趋势是将预测AI与大型语言和代码模型的优势相结合,以提取新的特征或见解,从而提升AI模型的准确性和效率。她以保险公司为例,展示了如何从结构化数据库和非结构化文本中提取关键信息,输入预测AI模型,以获得更精确的结果。

据Hot Chips的详细介绍,z17中的Telum II处理器与前代一样采用八核设计,但时钟频率提升至5.5 GHz。其缓存容量增加了40%,并新增了片上IO加速器或数据处理单元(DPU),旨在减轻Spyre AI加速器卡在处理新型AI模型时所需处理的大量数据负担。

Tzortzatos解释,随着大型语言模型和GenAI的模型复杂性和尺寸激增百倍,对AI计算能力提出了更高要求。Spyre AI加速器卡可插入PCIe插槽,每张卡最多配备32个核心,与Telum II芯片中的AI加速器架构类似。z17系统最多可支持48张Spyre卡。

与此同时,IBM正在准备z/OS 3.2操作系统,这是其针对Z系统的下一个主要版本,计划于今年第三季度发布。新版本将为系统提供对硬件加速AI功能的支持,并引入运营AI来优化系统管理。IBM表示,新平台将增强对现代数据访问方法、NoSQL数据库及混合云数据处理的支持,使AI能够利用更广泛的企业数据,提供更具前瞻性的业务洞察。

尽管IBM大型机面临着国际贸易政策变动带来的市场挑战,但Gartner基础设施和运营集团执行副总裁Mike Chuba认为,IBM已充分了解客户需求。他指出,IBM在大型机研发过程中投入更多时间,专注于解决客户面临的直接挑战,如z16引入的专用加速器,以及z17的升级版直接针对交易欺诈检测等AI应用。

回顾去年,IBM推出了为其大型机系统设计的更强大处理器,承诺增强片上AI加速功能,用于推理,并集成数据处理单元(DPU)以加强IO处理能力。IBM还提供了一个独立的AI加速器,旨在支持更大规模的推理任务。

Telum II处理器在Hot Chips 2024大会上发布,预计为大型机带来显著性能提升。IBM同时预览了Spyre AI加速器,并表示这两款芯片预计于2025年上半年随下一代IBM Z系统推出。据IBM称,全球约70%的交易通过其大型机处理,Hot Chips上展示的技术进步将使IBM能够将生成式AI引入这些关键任务工作负载。

与前代产品一样,Telum II是一款八核芯片,时钟频率提升至5.5 GHz。每个核心配备一个36 MB二级缓存,另有一个用于DPU的缓存,以及一个整体芯片缓存,共十个缓存。随着虚拟L3和虚拟L4分别扩展至360 MB和2.88 GB,缓存容量增加了40%。首款Telum处理器于2022年为z16带来了内置AI推理功能,能够在处理金融交易时进行实时欺诈检测。

IBM表示,Telum II处理器上的AI加速器功能显著增强,达到每秒24万亿次运算(TOPS)。尽管TOPS可能是一个具有误导性的指标,但Telum II的设计旨在使模型运行时能够与企业中最苛刻的工作负载并行运行。片上DPU的加入旨在满足日益增长的工作负载需求,特别是针对未来的AI工作负载和即将推出的Z系统Spyre加速器。

每个DPU包含四个处理集群,每个集群有八个可编程微控制器和一个管理这些集群的IO加速器,以及两个IO子系统,服务于IO抽屉域。DPU还具有独立的L1缓存和请求管理器,用于跟踪未完成请求。DPU位于主处理器结构和PCIe结构之间,直接连接以减少数据传输开销,提高吞吐量和功率效率。

IBM透露,未来Z系统的最高配置可能配备多达32个Telum II处理器和12个IO笼,每个笼子最多有16个PCIe插槽,使系统总共支持192个PCIe卡,极大扩展了IO容量。Spyre加速器将包含32个核心,架构与Telum II芯片中的AI加速器相似。IBM Z可通过PCIe安装多个Spyre加速器,根据需要扩展AI加速能力。例如,一个包含八张卡的集群将为单个IBM Z系统增加256个加速器核心。

Telum II和Spyre加速器均旨在支持IBM所称的集成AI,即利用多个AI模型来提高预测性能和准确性,相较于单个模型有显著优势。IBM Z和LinuxONE产品管理副总裁Tina Tarquinio表示:“Telum II处理器和Spyre加速器旨在提供高性能、安全且节能的企业计算解决方案。经过多年的开发,这些创新将被引入下一代IBM Z平台,使客户能够大规模利用LLM和生成式AI。”

IBM还希望超越推理,在其大型机上进行模型微调和训练。这将使银行和其他希望将数据保存在本地场所的企业能够在组织内部完全训练和部署模型。

Telum II和Spyre加速器均由三星采用5纳米工艺节点为IBM生产。

未来十年科技新图景:智能硬件跃迁、AI赋能与网络无感化变革
本文将从智能硬件、AI 算法、未来网络、数字经济、安全体系等多个维度,分析科技浪潮下的核心趋势。 设备变得更聪明网络变得无形AI 成为能力底座数字经济成为主引擎安全体系成为关键支撑科技不是未来,而是现在正在发…

2025-11-15

避开苹果锋芒,聚焦外卖小哥:打造专属他们的超实用蓝牙耳机
试着聚焦一个特定人群,比如外卖小哥。电量要非常足,最好能用一整天。麦克风要特别好,因为外卖小哥大部分时间都在路上,环境嘈杂,麦克风不好的话,对方根本听不清。如果能将耳机固定在头盔上,那就更好了,不怕掉。如果…

2025-11-13

2025微信数据保护全攻略:误删聊天记录别急,多场景恢复方案来了
提前备份是数据安全的核心,2025年微信已支持电脑、云服务、外部存储等多种备份方式,恢复时只需简单操作即可找回记录。苹果和安卓厂商的云服务早已支持微信数据备份,关键是确认误删前有有效备份记录。 2. 选择…

2025-11-13

SK海力士VFO工艺打造HBS技术,为移动设备AI性能提升带来新突破
据闪德资讯获悉,SK海力士正在研发结合移动DRAM和NAND的高带宽存储(HBS)技术,可提高智能手机和平板电脑等移动设备的AI性能。 相比HBM使用的硅通孔(TSV)技术,VFO无需穿孔,成本更低、良率更高…

2025-11-12

等保2.0成企业必答题!网络合规差距与优化路径全解析
实践中发现,许多企业在宽带层面存在共性差距,亟需从专业角度优化改进。在网络核心节点部署流量探针,实现全量网络流量采集;建议搭建专用日志审计平台,统一存储日志并支持多维度分析,确保日志完整性与可追溯性。 1.…

2025-11-12

开放式蓝牙耳机怎么选?2025十款热门开放式耳机深度测评来助力
推荐理由:在百元价位中音质体验非常出色,可媲美千元级别耳机通常选择耳夹式耳机的消费者都有骑行和户外运动的爱好,难以避免遇到下雨天气和大量出汗的情况,因此耳机的防水级别也成了筛选的指标,建议选择防水等级在IP…

2025-11-11

立讯精密液冷方案:从前瞻布局迈入规模化商用新阶段
证券之星消息,立讯精密(002475)11月11日在投资者关系平台上答复投资者关心的问题。投资者提问:公司的液冷散热解决方案在AI服务器中的应用情况如何?是否已获得头部云服务提供商或AI企业的认可? 谢谢!…

2025-11-11

爱立信完成上行L4S技术测试,为5G时延敏感业务提供网络支撑
(全球TMT2025年11月11日讯)近日,在IMT-2020(5G)推进组的组织下,爱立信成功完成了上行L4S技术测试,验证了L4S在提升上行实时交互业务体验方面的显著效果。测试结果表明,L4S技术能够有效…

2025-11-11

上海贝尔发布《2025年AI-ICT赋能与重构白皮书》:剖析趋势、需求与战略方向
《2025年AI-ICT赋能与重构白皮书》由上海贝尔发布,系统剖析了AI与ICT产业融合的核心趋势、技术需求及战略方向,展现了全球AI发展浪潮下ICT基础设施的变革路径与机遇。实施路径上,需夯实数据与模型基础…

2025-11-11

2025年AI智能鼠标深度体验:星火大模型赋能,它能替代哪些办公工具?
AI智能鼠标2025深度测评:星火大模型加持,AI问答、AI绘图能替代哪些工具?当一款鼠标,内嵌了如科大讯飞星火这般强大的认知大模型时,它所带来的,远不止是光标移动的流畅,更是一场关于效率与创造力的革命。我们…

2025-11-10