重新定义PC显卡 AMD下代HD7900特性解析
第1页:AMD下代HD7900特性解析
● AMD下代HD7900特性解析
在经历了2010年底Cayman核心对AMD经典图形架构的改良之后,2011年底我们终于引来的了年底压轴产品——基于Tahiti构架的Radeon HD 7900系列显卡。在中关村在线之前的架构分析文章中我们已经领略了这一代显卡的不同之处,它彻底打碎了延续4年的VLIW超长字节指令流处理器结构,同时引入了多级可读写Cache,这是一颗更加趋近于CPU的高性能GPU。
那么除了在常规图形架构方面的改进之外,AMD还非常重视显卡的多功能化发展,ATI于1996年推出的的All-in-Wonder系列无疑是市场上的领导者,在随后的15年中我们看到即便在图形性能方面经常受到NVIDIA的强势挑战,但是AMD依然坚持在图形输出、视频编解码处理、多媒体处理方面的过人之处,同时显卡易用性也让更多用户认同。
随着GPU周边功能的不但增强,这已经不简单是一台桌面PC或者笔记本中的显示芯片,而是一个多功能的智能处理器。未来的显卡市场不但不会消亡,反而会成为帮助用户进行工作、学习融入高端计算领域和日常生活的重要工具。
从显卡基本情况来看,Radeon HD 7970拥有2048个流处理器,32个CU单元,核心频率为925MHz,相对Radeon HD 6970更进一步,搭载3GB GDDR5显存,显存频率为5500MHz,显存位宽为384Bit。输出接口方面则继续和Radeon HD 6970保持一致,为2个DVI接口,1个HDMI接口和2个Mini DisplayPort接口。
南方群岛演绎架构之外的精彩
Radeon HD系列早在2006年发布第一代HD2000就透露出多功能化的发展方向,下文就让我们用最精炼的文字来描述Radeon HD 7900系列显卡在周边和输出方面的特性,我们将体会到AMD如何使用新的思想来定义GPU在PC中的地位。
第2页:全面支持DirectX 11.1
● 全面支持DirectX 11.1
DirectX 11.1包含大量的D3D新特性支持,其中大多数是针对程序员编程进行的更新,包括为shader绑定作为子区间的常buffer、通过新的copy选项改进资源体系以及引入更多的UAV操作等等。整体更新量很大,甚至超过了DirectX 8.1以及10.1的更新规模。
第一款支持DirectX 11.1的显卡——HD7970
Radeon HD 7900系列显卡在图形架构设计之初就提供了对DirectX 11.1的支持,其主要原因是AMD已经在双精度浮点处理方面达到了一个新的技术层级,之前Cayman要通过3个ALU单元实现双精度计算,而本次Tahiti构架拥有独立的双精度加法、乘法、加乘处理器。
Tahiti构架CU结构细节
除了负责浮点吞吐的SIMD CORE之外,Tahiti构架的每个CU单元还拥有在一个Scalar Unit,Scalar单元中包含Int ALU单元,可以用来处理整数指令以及特殊函数。另外,对线程效率至关重要的原子操作(Atomic)也在该单元中执行。
在这些特性中与我们关系最为密切的,或者说直接作用在可见图形领域的最大亮点则来自Core Structures部分,包括D3D11 Feature data double的DoublePrecisionFloatShaderOps和D3D11 Feature data arthitecture的TileBasedDeferredRenderer,也就是我们通常所说的DP Shader Ops以及TBDR。
DirectX 11.1更新细节
DP shader(Double Precision Float Shader,双精度浮点shader)是微软在DirectX 11中首次引入的shader类型。与传统的常规shader相比,DP shader的最大特点在于在shader处理数据及运算过程中全面引入双精度规则,这让DP shader具备了远高于常规shader的运算精度,配合FMA的应用,DP shader可以称得上桌面应用范围内完全无损的shader类型。
精度更高的DP shader的引入,对光线追踪的交汇检查计算过程是至关重要的;TBDR的引入则代表着移动图形编程的需求。微软此次在DirectX 11.1中实现了上述两个功能,基本上意味着为光线追踪在桌面的应用以及DirectX进军移动图形领域打开了大门。两者无论哪一个,都是值得我们给予高度关注的。
第3页:PCI-E 3.0带来更大吞吐量
● PCI-E 3.0带来更大吞吐量
尽管PCI-E吞吐带宽从诞生以来就不是系统瓶颈,但是业界依然在推进这一传输标准的带宽提升。之前PCI-E 3.0标准长期不受各家厂商青睐,GPU芯片厂商一度被怀疑根本不会支持,现在终于出来了,并且通过强吞吐测试证明在一些并行计算应用和全局显存调用中,PCI-E 3.0的优势会凸显出来。
PCI-E 3.0标准主要是将信号传输率提高到8GT/s,两倍于PCI-E 2.0,同时还有一系列的信号增强、数据完整性优化,包括收发均等、PLL改进、时钟数据恢复、已支持拓扑的通道增强等等。