产品概述
AIX8680-G4 是针对互联网、IDC(Internet Data Center)、云计算、企业市场以及电信业务应用等需求,推出的全新一代人工智能基础设施。
AIX8680-G4 适用于大规模,超大规模模型训练,高性能计算场景。AIX8680-G4 具有高性能、高能效、易部署等优点。
AIX8680-G4 服务器是新一代旗舰级 GPU 服务器,超强算力,大容量高速存储,高效可靠易于维护。
产品外观
产品特点
1. 性能
支持第四代英特尔®至强®可扩展处理器(Sapphire Rapids)。单处理器最高拥有 60 个内核及 120 线程、最大支持 TDP 350W 处理器、最大睿频频率 4.1GHz、单核 2MB L2 缓存和 1.875MB L3 缓存及 4 组 16GT/s UPI 互连链路,使服务器拥有最高的处理性能。
支持最大 32 条 4800MT/s DDR5 RDIMM(Registered Dual In-line Memory Module)内存,可提供优异的速度、高可用性及最多 8192GB 的内存容量(按照 DDR5 内存单条最大容量 256GB 计算)。
支持 NVIDIA HGX 8-GPU NVLink 模组。
2. 可扩展性
支持 8x2.5 英寸 SATA/SAS 硬盘+后置 8x2.5 英寸 NVMe SSD 硬盘。
支持 12 个 PCIe5.0 x16 标准扩展插槽。
支持 1 个 OCP 3.0 网卡,支持 PCIe 5.0 x 16,默认配置 10GE 网卡,支持通知式热插拔。
3. 可用性和可服务性
整机采用模块化设计,GPU 模组,系统模块,IO 模组,风扇模组,电源模组均可单独维护。
单板硬件采用电信级器件及加工工艺流程,显著提高系统可靠性。
支持热插拔的 SAS/SATA 硬盘。SAS/SATA 硬盘支持 RAID 0/1/1E/10/5/50/6/60,不同的 RAID 控制卡支持的 RAID 级别不同。提供 RAID 缓存,支持超级电容掉电数据保护。
面板提供 UID/Healthy LED 指示灯、故障诊断数码管,iBMC Web 管理界面提供关键部件指示状态,能够指引技术人员快速找到已经发生故障或存在故障风险的组件,从而简化维护工作、加快解决问题的速度,并且提高系统可用性。
面板提供 iBMC 直连管理接口,支持 iBMC 近端运维,提升运维效率。
支持 54V 电源和 12V 电源,减少 54V-12V DC 转换,降低能源损耗。54V 电源最多支持 6 个,12V 电源最多支持 2 个,支持 N+M/N+N 冗余。
GPU 散热系统和系统散热系统解耦,两个算力平面独立风道设计,提供最优散热方案。
板载的 BMC 集成管理模块(iBMC)能够持续监控系统参数、触发告警,并且采取 恢复措施,以便最大限度地避免停机。
4. 能源效率
提供不同能效等级的 80PLUS Titanium 电源模块,50% 负载下电源模块效率最高达 96%。
支持主备供电,高压直流供电,提高供电系统的效率。
高效率的单板 VRD(Voltage Regulator Down)电源,降低主板 DC 电源转换的损耗。
支持系统散热风扇分区调速和 PID(Proportional-Integral-Derivative)智能调速、CPU 智能调频,从而实现节能降耗。
全方位优化的系统散热设计,高效节能的系统散热风扇,降低系统散热能耗。
提供功率封顶和功率控制措施。
支持硬盘错峰上电技术,降低服务器启动功耗。
物理结构
产品规格
1. 主板示意图
2. 主板逻辑图
支持 2 个新一代英特尔®至强®可扩展处理器(Sapphire Rapids)。
支持 32 条 DDR5 内存。处理器与处理器之间通过 3 组 UPI(UltraPath Interconnect)总线互连,传输速率最高可达 16GT/s。
CPU 的高速资源全部通过 PCB,高速连接器,背板等方式连接,实现 PCIe5.0 高速链路模块化,免线缆设计。
BMC 插卡集成 BMC 管理芯片,支持外出 VGA(Video Graphic Array)、管理网口、串口等接口。
3. 机箱示意图
机箱正面
机箱背面
4. 电源规格
5. 运行环境
工作温度:5°C 至 35°C(41°F 至 95°F)
6. 规格参数