英特尔旗下 Habana Labs 推出 Gaudi 2 深度学习训练处理器
由
airavadmin
·
英特尔今日在 Intel Vision 线上活动中,公开由旗下的 Habana Labs 推出Gaudi 2 处理器,此处理器专为人工智能(AI)深度学习应用而设计、采用 7 奈米制程打造。
英特尔表示,Gaudi 2 处理器是用于训练的第 2 代 Gaudi 处理器,其专为 AI 深度学习应用而设计,建立在 Habana 的高效率架构之上、采用 7nm 制程打造,能够在资料中心当中,针对电脑视觉与自然语言处理的模型训练与推论效能,提供客户更高的效能。
在活动中,Habana 特别展示 Gaudi 2 于电脑视觉—ResNet-50(v1.1)和自然语言处理—BERT Phase-1 和 Phase-2 的训练吞吐量效能,英特尔强调,其工作负载量几乎是 Nvidia A100 80GB 处理器的 2 倍。
英特尔指出,从第 1 代 Gaudi 到 Gaudi 2,架构上的进步包含制程技术从 16nm 提升至 7nm,导入新的资料类型,包含在 Matrix Multiplication Engine(MME)和 Tensor Processor Core 运算引擎当中的 FP8;Tensor Processor Core 从 8 个提升至 24 个;为了卸载主机子系统的负担,芯片整合媒体处理引擎。
此外,其封装内存容量从 32GB 变为 3 倍至 96GB,HBM2E 频宽达 2.45TB/sec,双倍 SRAM 容量达 48MB,而为了在产业标准上提供高效率的垂直扩充(scale-up)和水平扩充(scale-up),内建的 RDMA over Converged Ethernet(RoCE2)从整合 10 个 NIC 提升至 24 个。
英特尔表示,为了支援使用者将工作负载和系统,从现有的 GPU 模型转换至Gaudi 2,并协助他们保留软件开发的投资,Habana SynapseAI Software Suite 针对深度学习工作负载最佳化,专为简化模型建立和迁移所设计。为了满足深度学习开发者的需求,SynapseAI 整合 TensorFlow和PyTorch框架,并提供超过 30 种电脑视觉和自然语言参考模型。开发者可以从 Habana Developer Site 取得文件、方法内容和社群支援等相关资讯,并在 Habana GitHub 上提供参考模型和模型路线图。
英特尔指出,在以色列的 Habana Gaudi2 资料中心已部署 1000 台 HLS-Gaudi2,用来支援 Gaudi2 软件最佳化的研发,并为即将推出的 Gaudi 3 处理器的近一步发展提供参考。Habana 正在跟 Supermicro 合作,将于 2022 年第 3 季在市场上推出 Supermicro Gaudi 2 Training Server。