去年11月,amd发布了instinct mi250/mi250x计算卡,不但升级6nm工艺、cdna2计算架构,还首次采用多die整合封装(mcm),内部集成两个芯片,达成最多220个计算单元、14080个核心、128gb hbm2e内存,成为amd的第一款exascale百亿亿次级别加速卡产品。
按照路线图,下一代产品要升级到cdna3架构,早先有曝料称将命名为instinct mi300系列,内部集成多达四个芯片,或者叫四个gcd。
现在,amd rocm开发者工具更新中出现了四个mcm封装芯片的设备id,分别是0x7408、0x740c、0x740f、0x7410,基本坐实了早先传闻。
虽然这份文件里对应的产品代号还是“alderbaran”,也就是mi250系列,但应该是个占位符,mi300系列的核心代号我们还不知晓。
四芯封装,如果每个还是110个计算单元、每单元64个核心,那么总计有望达到440单元、2.8万个核心。即便每个芯片的规模有所缩减,总体也有望超过2万个核心,相当疯狂。
很显然,狂堆核心已经是不二法门,nvidia下代游戏卡ada lovelace据说会有1.8万个核心。
也难怪功耗扶摇直上,pcie 5.0甚至制定了最多600w供电能力的新标准。
与此同时,linux补丁内出现了“amd gf940”的名字,显然是新的gpu编号,和目前mix250系列的“gfx90a”不但命名类似,而且支持的指令集也很接近,不出意外就是下一代cdna3架构产品。
当然,新架构自然有新特性、新指令,而且还不少: