今年的中国台北电脑展上,英伟达正式推出了基于 nvidia ampere 架构的 geforce rtx 3080 ti 显卡和 geforce rtx 3070 ti 显卡,这两款显卡公版产品国内售价分别为 8999 元和 4499 元。
天下苦挖矿久矣,今年随着虚拟货币市场的燥热,矿老板们都在疯狂采购各种显卡以及游戏本显卡,这就导致面向消费级显卡一卡难求,虽然英伟达也陆续推出了 rtx 3060 系列显卡,但是面对市场对显卡产品的巨大需求,显卡一上新立刻被抢购一空,矿老板赚的盆满钵满,消费者却没有显卡可买,最新的 rtx 30 系列显卡也成为大家口中的空气卡。
不过,英伟达似乎也意识到矿老板们对消费级市场的影响,也通过驱动层面,针对性的限制了新的 rtx 30 系列显卡算力,加上最近的虚拟货币市场的大崩盘,似乎让我们看到能买到新显卡的希望。
rtx 3080 ti 与 rtx 3090有什么区别?
这次我们已经拿到英伟达全新的 geforce rtx 3080 ti 显卡,这次英伟达 geforce rtx 3080 ti 依旧采用了与 geforce rtx 3080 一致的外观。虽然整体外形相比与 geforce rtx 3090 小了一圈,但是这次英伟达在核心的设计上,rtx 3080 ti 与 rtx 3090 相差不大,唯一差距比较大的就是显存,rtx 3080 ti 配备了 12gb 的美光 gddr6x 显存,而 rtx 3090 则是配备了 24gb 的 gddr6x 显存。
这次 geforce rtx 3080 ti 核心采用基于 nvidia ampere 架构的 ga102 核心,核心型号为 ga102-225,由于采用三星 8n 工艺,这次 ga102 单片面积相比于上一代 tu102 更小,单片面积为 628.4 平方毫米,但晶体管密度更高,总晶体管数量 283 亿个。
由于公版的 geforce rtx 3080 ti 显卡采用前后双风扇的设计,因此其 pcb 板也是采用了锯齿形的设计,整个 pcb 板上的各类元器件排布也是非常的紧密。围绕在 ga102-225 核心周围是 12 颗美光 gddr6x 显存,单颗显存大小为 1gb。
一个完整的 ga102 核心总共包含 7 组 gpc 单元,每组 gpc 单元包含 12 组 sm 单元,nvidia ampere sm 单元是 rtx30 系列显卡的核心构件,它由 cuda 核、第三代 tensor core、第二代 rt core、纹理单元、加载 / 存储单元、l0 和 l1 缓存、共享显存和寄存器等方面构成。
▲ga102 核心示意图
每个 sm 单元包含 4 个分区,每个分区包含第三代 tensor core,还包含由 16 个 fp32 单元、8 个 fp32+8 个 int32 单元组成的混合单元,可执行 fp32 或 int32 运算。完整的 ga102 核心总计 84 组 sm 单元。
此前发布的 geforce rtx 3090 显卡至屏蔽了 2 组 sm 单元,基本上是一个完整的 ga102 核心了,而这次 geforce rtx 3080 ti 相比于 geforce rtx 3090 仅仅阉割了 2 组 sm 单元,总计 80 组 sm 单元。如果抛去显存这个因素的来看的话,geforce rtx 3080 ti 在核心上和 geforce rtx 3090 差距基本不大。
英伟达 geforce rtx 3080 ti 显卡总共包含 10240 个 cuda 核、320 个第三代 tensor core、80 个第二代 rt core。同时还拥有 320 个纹理单元和 96 个光栅处理单元。其基础频率为 1365mhz,加速频率为 1665mhz。
负责光追运算的 rt core 在 nvidia ampere 架构上得到更新,其最大的更新是增加了动态模糊的加速运算支持,英伟达表示第二代 rt core 光追效率是上一代的 8 倍。负责 ai 计算的 tensor core 这次在 nvidia ampere 架构中也升级到第三代,作为显卡的 ai 大脑,tensor core 通过加速深度神经网络处理数据,相比第二代 tensor core,第三代的 tensor core 能效更高。
更强的 ai 处理能力也让 dlss 功能得到更大的进化,甚至可以触及 8k 这个现阶段显示行业的上限,dlss 8k 这一功能通过深度学习将画面分辨率从 2k 提升到 8k,这里第三代 tensor core 功能上的进化功不可没。
基于 nvidia ampere 架构的第三代 tensor core 还可以支持全新的 nvidia broadcast 技术。
nvidia broadcast 技术允许玩家在视频直播过程中进行 ai 实时声画处理,实现高质量、高帧率的流畅直播体验。通过这项技术可以实现 ai 智能降噪,虚拟背景和自动取景等功能。
这次 geforce rtx 3080 ti 配备了 12gb 的 gddr6x 显存,显存位宽达到 384bit,显存频率达到 19gbps。
相比于 geforce rtx 2080 ti 的 10gb 的 gddr6 显存有了更大的提升。gddr6x 舍弃了 gddr6 采用的 nrz 编码方式转而采用对电压控制更加精细的 pam4 编码。
pam4 编码方式可以通过四种不同的电平来代表 2 个 bit 的逻辑信息,分别是 00、01、10、11,而原先的 nrz 编码方式则只能在单位时间内由高低电平表示 0、1 两个数据,因此 pam4 编码的波特率仅为 nrz 编码的一半,因此采用 gddr6x 的 geforce rtx 3080ti 显存带宽可以达到 912gb/s。