除了基于3d v-cache堆叠缓存的升级版霄龙7003x系列处理器,amd还为数据中心带来了另一款神器:instinct mi200系列加速卡(加速器)。
这是amd的第一款exascale百亿亿次级别加速卡产品,号称在同类产品中拥有世界上最快的hpc性能、ai性能。
instinct mi200系列升级为新的cdna2计算架构,搭配升级的6nm finfet工艺,并使用2.5d efb桥接技术,业内首创多die整和封装(mcm),内部集成了两颗核心。
还有第三代infinity fabric总线互连技术,带宽100gb/s,最多8条与第三代霄龙处理器互通,实现cpu/gpu内存一致性。
软件api支持openmp、opencl、hip、rocm open、tensorflow、pytorch、kokkos、raja。
新系列分为两款型号,instinct mi250x集成了220个计算单元、14080个流处理器核心,最高频率1.7ghz,并有第二代矩阵核心,峰值性能为:fp16半精度383tflops、fp32单精度/fp64单精度47.9tflops、fp32单精度/fp64双精度矩阵95.7tflops、int4/int8/bf16 383tflops。
内存/显存搭配8192-bit位宽的128gb hbm2e,频率1.6ghz,峰值带宽3276.8gb/s,并支持全芯片ecc。
整卡采用oam模块形态(未来也会推出pcie扩展卡形态),支持pcie 4.0 x16,被动散热(系统散热),典型功耗500w,峰值功耗560w。
instinct mi250精简为208计算单元、13312流处理器核心,各项性能指标也顺应下降约5.5%,其他规格完全不变。
amd宣称,instinct mi200系列性能双精度性能比竞品高出最多4.9倍,比上代提升最多4倍。
mi200系列已经赢得了多项客户解决方案,包括atos bullsequana x410-a5 2u1n2s(双cpu四gpu)、戴尔poweredge r7525(双cpu三gpu)、技嘉g262-z00(双cpu四gpu)、hpe cray ex235a(单cpu四gpu)等等,其他客户还有话说、联想、koi cmputers等等。
尤其是与美国国防部橡树岭国家实验室、hpe合作打造的超级计算机“frontier”,采用第三代霄龙处理器、mi250x加速卡,峰值算力高达150亿亿次浮点计算每秒。
– the end –
转载请注明出处:快科技