|登录 |注册

查看: 2693|回复: 15
打印 上一主题 下一主题

『转贴』HD5970寂寞终老 HD6990新卡皇全面测试

[复制链接]
cykhor
2011-11-12 04:47 PM
Radeon HD 5970是杯具?是洗具?它的出现令AMD成功稳居单卡性能榜首,不过它很无奈的是自己没有一个实力相当的对手孤老终生。今天发布的Radeon HD 6990又会怎样呢?
        也许是NVIDIA对高端Fermi架构核心的功耗、发热量没有信心,所以一直没有推出单卡双芯产品,同时其以单GPU绝对性能的强者自居。俗话说“公说公有理婆说婆有理”,由于AMD和NVIDIA公司在产品策略上的差异,导致了Radeon HD 5970似有种“独孤求败”的感觉。转眼Radeon HD 6990今日发布,有非官方消息称NVIDIA将会拿出传说中的GeForce GTX 590(单卡双芯产品)用以对抗,看来Radeon HD 6990不会重蹈Radeon HD 5970覆辙。
        Radeon HD 6000系列顶级一改往日命名规则,顶级单芯产品也被归于Radeon HD 6900系列,昔日Radeon HD 5970和Radeon HD 5870继承者,分别是Radeon HD 6990和Radeon HD 6970。不过无论型号命名规则如何变化,单卡双芯的实力依然不可忽视。

        Radeon HD 6990采用了两颗全规格的Cayman核心,同时每颗核心标配2GB显存容量,也就是说Radeon HD 6990可以完全看做是两个Radeon HD 6970合体而成。虽然Radeon HD 6990仅拥有3072个流处理器不及Radeon HD 5970,但是凭借优化后的4D微架构定会有出色表现。更详细产品规格如下:Radeon HD 6990 对 位 产 品 规 格 比 较 表显卡型号Radeon HD
6990 OCRadeon HD
6990Radeon HD
6970Radeon HD
5970GeForce GTX
580市场定价4999-5099 元4999-5099 元3099 元4599 元3999 元GPU代号CaymanCaymanCaymanRV870GF110GPU工艺40 nm40 nm40 nm40 nm40 nmGPU晶体管26.4 亿 *226.4 亿 *226.4 亿21.5 亿 *230 亿着色器数量1536 *21536 *215361600 *2512着色器组织4D *384 *24D *384 *24D *384(1D+4D)*320 *21D *512ROPs数量32 *232 *23232 *248纹理单元数量96 *296 *29680 *264核心频率880 MHz830 MHz880 MHz725 MHz772 MHz着色器频率880 MHz830 MHz880 MHz725 MHz1544 MHz理论计算能力2.70 TFLOPs *22.55 TFLOPs *22.70 TFLOPs2.32 TFLOPs *22.37 TFLOPs等效内存频率5000 MHz5000 MHz5500 MHz4000 MHz4008 MHz内存位宽256 bit *2256 bit *2256 bit256 bit *2384 bit内存带宽160.0 GB/s *2160.0 GB/s *2176.0 GB/s128 GB/s *2192.4 GB/s内存类型GDDR5GDDR5GDDR5GDDR5GDDR5内存容量2048 MB *22048 MB *22048 MB1024 MB *21536 MBDX版本支持1111111111HD视频技术UVD3UVD3UVD3UVD2PureVideoHD通用计算接口StreamStreamStreamStreamCUDA
        通过上表可以看到,在产品型号中出现了Radeon HD 6990 OC和Radeon HD 6990两款产品。其实二者并非两款产品,而是在Radeon HD 6900系列独有的双BIOS设计,同时设计了两个BIOS。其中BIOS-2为超频版,频率为880MHz/5000MHz;BIOS-1为默认版,频率为830MHz/5000MHz。

Radeon HD 6990
        Radeon HD 6990在产品技术上并没有过多创新,例如其使用了Cayman的核心架构,使用了成熟的单卡双芯PCB技术设计等。不过就是在这样已有技术的前提下,打造了全新的产品,提供了更强的性能,还是让人兴奋的。
        《Crysis》是2007年发布,笔者当时就在想这个硬件杀手何时才能被一块显卡彻底征服在2560*1600 4X AA / 16X AF的民用顶级画质下呢?随着AMD和NVIDIA一代又一代的产品发布,终于时隔4年后Radeon HD 6990终于第一个做到。
        当然《Crysis》不再是最BT的硬件杀手,当然《Crysis2》将在3月22日发布,不过笔者希望通过这个小剧透能够让你对Radeon HD 6990有一个性能上的初步认识。
cykhor
2011-11-12 04:48 PM
双剑合璧 HD6990标配最新Cayman核心
        在AMD进入图形芯片统一架构设计后,VLIW5的4D+1D微架构一直沿用至今,其中目前最新的产品为Radeon HD 6800系列。虽然VLIW5经过了Radeon HD 2000、Radeon HD 3000、Radeon HD 4000、Radeon HD 5000和Radeon HD 6000这五代单产品,但是在Radeon HD 6900系列中将其终止,全新的VIW4微架构诞生。
        当然,每代产品的升级并不是流处理器数量和频率的变化,例如同为VIW5微架构的Cypress核心和Barts核心上,Barts增加了一组超线程控制器,这样对流处理器调度和效率做了很大的改善。

Radeon HD 6990 Cayman核心架构
        Radeon HD 6900系列拥有的Cayman核心,相比之前AMD所有统一架构产品可以说是有了质的改变,并非像以前产品升级中给人一种小修小补的感觉。因为这颗Cayman核心从流处理器底层架构设计开始全新设计,然后到线程控制器,再到图形引擎改良。
        简单汇总就是:①核心采用VLIW4架构;②双路线程控制器;③两套图形计算引擎,即两个Tessellation计算单元。



基于40nm工艺制造的Cayman核心
        Radeon HD 6990标配两颗40nm工艺的Cayman核心,每颗核心拥有1536个流处理器、32个光栅单元和96个纹理单元。虽然在流处理器数量上,Radeon HD 6990并不是单卡最多,但是就单卡绝对性能而言其凭借总公3072个流处理器当之无愧的成为了新卡皇。
        值得一提的是,Cayman核心虽然定位顶级3D图形卡,但是在辅助功能和产品特性上将AMD现有的所有技能集于一身。例如Eyefinity宽域技术、例如HD3D技术、例如PowerTune技术等等……



标配8颗GDDR5显存芯片
        显卡为每颗核心搭配了8颗规格为32MB*32bit的hynix H5GQ2H24MFB T2C颗粒,构成256bit/2048MB的组合,同时为整个显卡提供160GB/s的高速显存带宽。



BIOS-1 默认频率830MHz/5000MHz



BIOS-2 超频频率880MHz/5000MHz
        AMD在Radeon HD 6900单芯产品中加入了双BIOS的设计,它的引入不仅为高端玩家提供了更灵活的产品玩法,同时保证了产品改造安全系数。值得一提的是,在Radeon HD 6990这款上不仅标配了双BIOS设计,还同时为两个BIOS做了不同设定。
        其中BIOS-1为默认频率——830MHz/5000MHz,而BIOS-2为880MHz/5000MHz。虽然两个BIOS的主要差别就是核心频率的50MHz差距,不过对于一款高端、高功耗、高发热量的双芯产品来说,这样的官方超频还是值得称赞。
cykhor
2011-11-12 04:49 PM
Cayman核心三大升级 铸就DX11高性能
        通过前文的介绍,我们已经稍微聊了一些Radeon HD 6900核心Cayman的变化,下面就让我们更进一步了解为何会有这些变化,同时这些变化又会带来何种功效。
        ● VLIW5到VLIW4的转变
        NVIDIA采用的1D+MIMD的设计和AMD采用的(4D+1D)搭配SIMD的设计,可以说二者各有优势平分秋色。不过AMD选择的4D+1D的设计必须要面临一个问题,那就是在非对称环境下编译4个简单流处理器器和1个复杂流处理器的完美搭配,这对驱动的仲裁机制算法及效率十分依赖。
       同时,工程师通过实践了解到,在用户的实际应用中3-4个流处理器处于忙时工作状态较为普遍,而。那么如让每组以4个流处理器为单位,这样设计不仅降低了ALU/BW比值,还符合了绝大多数用户使用习惯。

全新的VLIW4架构
        在全新的VLIW4里,4个流处理器地位相同,不再区分简单、复杂运算能力,降低里显卡对驱动仲裁的过分依赖,从而变相提升核心计算效能,如果将这样的改良转化为核心单位面积性能的话,没平方毫米约有10%的性能提升。



        Cayman核心的的渲染器后端计算也得以改善。每个组件表面16bit整数和每组件32bit浮点操作前提下,整数运算颗提升2倍、浮点运算颗提供2-4倍,总体性能客观。当然事实上,AMD工程师已经在驱动程序当中优化表面操作的地方,就是这种优化极大帮助提升性能的案例。
        ● 两组双向DMA引擎 激增内存带宽利用率



AMD Cayman核心架构图解
        当GPU再进一步的计算方面,老核心架构虽然能够做到同一周期运行多个流处理器计算,但是无奈老架构设计中只有一条命令通道,从而造成整体计算瓶颈。所以在Cayman核心中,AMD引入了异步调度的概念,从而最终实现命令队列根据优先级最终计算。
        在数据吞吐能力上,AMD工程师在原有核心架构上增加了2个DMA,更有效率的利用带宽资源。相同物理带宽模式下,加入两个双向DMA引擎后,带宽利用率翻倍。
        ● 双图形引擎 提供更强视觉计算



双图形引擎
        双图形引擎设计,不言而喻Tessellation单元将会由此设计倍增,从而更好的适应目前DirectX 11应用。当然加倍的不仅仅是Tessellation单元,在顶点、几何等计算中也会相对老核心架构有双倍提升。
cykhor
2011-11-12 04:49 PM
成熟的PCB设计 双核助力HD6990
        AMD在进入统一架构图形核心时代后,每代顶级双芯产品均采用了单PCB设计,这样设计的最直接好处就是在保证性能、性能等综合因素的前提下成本更低,消费者更容易接受。其次,散热器更容易设计,同时产品散热环境更佳。更多的好处笔者就不在此赘述,单PCB设计好处的最有利证据就是NVIDIA从双PCB改为了单PCB设计。

Radeon HD 6990产品规格
        通过上表我们能够了解到单张Radeon HD 6990将拥有超过3000个流处理器、64个光栅处理器和192个纹理单元,每颗GPU独享2GB显存。为了满足产品高性能的正常发挥,显卡外接供电搭配2个8pin外接供电,这意味着整卡最高设计了375瓦的功耗。



XFX讯景HD-699A-ENF总司令版
        本次Radeon HD 6990首测使用的是来自XFX讯景HD-699A-ENF总司令版,其严格按照公版产品设计,唯一与公版不同的就是散热器导风罩上酷炫的Logo贴纸。
        从正面我们能够了解到,Radeon HD 6990由于设计上的需求,使用了目前民用极限显卡PCB的11.5英寸长度。同时为了确保两颗核心收到相同的散热效果,散热器风扇中置,同时搭配离心式散热器。



Radeon HD 6990 PCB特写



Radeon HD 6990 PCB背面特写
        通过拆解公版Radeon HD 6990,我们看到整卡的PCB布局。与上几代单卡双芯产品一样,两颗核心分别位于PCB两侧,PCB中间是一颗内部交火桥接芯片和12相供电电气件。由于PCB正面面积上的紧张,显卡为每颗GPU设计的PCB正反两面各四颗显存。



公版Radeon HD 6990 PCB号为C206
        Radeon HD 6990的PCB版本好为C206,这是AMD工程师为其全新量身定做的PCB。



内部桥接芯片
        为了让两颗Cayman核心在一张PCB中组建交火并舒畅的运行,显卡内置了一颗桥接芯片。
        其实这颗核心大家并不陌生,它出现在了AMD历代单芯双卡产品上。其是来自于PLX的PCI Express Switch芯片,型号为PEX 8647。它曾服役在AMD的Radeon HD 3870 x2、Radeon HD 4870 x2和Radeon HD 5970上,今天我们在Radeon HD 6990产品中又见到他,看来其产品的性能、效能可靠性很高。
        PLX PEX8647是PLX第二代PCI Express Switch芯片的高端产品,它最多支持48 lanes的PCI Express总宽,可支持拆分最多成3个连接端口,单个连接最高支持16 lanes宽度。它的功耗仅3.9W,比上一代同档产品低了20%。
cykhor
2011-11-12 04:51 PM
AMD打造首款功耗支持450瓦产品
        高性能产品必须面对就是高功耗和高发热量,而此次Radeon HD 6990发布,AMD不但没有避讳这两个问题,反而更加积极主动的正面解决它们,同时宣布要打造一款功耗支持450瓦的怪兽。

Radeon HD 6990标配全新的供电电路
        AMD在高端产品中均会使用电气性能表现最好的电气件,例如两颗图形核心的核心供电就是由全新的数字可编程Volterra电源芯片,同时还有一体化高度集成的PWM/MOSFET整合电源芯片。
        他们的加入不仅在有限的PCB上节约了空间,同时其极佳的电器性能能让Radeon HD 6990运行在更高的功耗下,发挥更强的性能。



Volterra VT1556MF 主控IC
        Volterra VT1556MF供电主控芯片是Volterra的全新一代产品,不过这颗PWM IC并非第一次出现在我们的视野中,因为它同样服役在Radeon HD 6970/6950产品中,它能够实现对4相核心供电、2相显存供电的控制。



4+2相供电设计
        通过供电PCB局部特写我们能够看到,在两颗图形核心中间上部的PCB配有CLA1108-4-50TR-R 42CH10 A耦合电感,同时搭配整合Mosfet的VT1676SF高集成芯片,组成每颗图形核心的4相核心供电。
         在核心供电正下方便是显存供电电路,同样两颗图形核心配给的显存供电电路设计在一起,每相供电均有屏蔽式1005R1电感搭配VT262BWF芯片组成。



双8pin外接供电
        我们知道每个8pin外接供电可以提供150W的功耗支持,PCI-Express可以提供75W的供电支持,整体而言显卡可以获得375W的理论极限功耗。
        不过我们知道AMD在Radeon HD 6900系列产品中引入了PowerTune功能,它能够允许显卡运行在安全超负载功耗下,同时搭配双BIOS的组合,超频版BIOS-2可以允许最大450W的极限功耗(具体详细介绍请看下文的PowerTune技术章节)。
cykhor
2011-11-12 04:51 PM
强力HD6990必须面对的散热难题
         我们前文已经提及,高端产品必须要面对高功耗和高发热量的现实问题,前文介绍了高功耗那么本环节将介绍如何解决高发热量,究竟这款新一代卡皇Radeon HD 6990标配了怎样的散热器

全新改良一体化散热设计
        AMD工程师需要面对的一个棘手问题是,要设计一款能够冷却极限450W功耗的显卡。所以其在散热器整体设计上不仅采用了常规的一体化散热模组、全封闭导风罩等,还加入了全新的相变导热材料、核心吸热底标配真空腔、离心中央鼓风设计等等。



相位变化TIM及中央鼓风设计
        与前几代AMD的单卡双芯产品散热器不同,Radeon HD 6990首次采用了离心风扇中央设计,这样做的好处是能够更有效的吹透两颗图形核心的散热器。同时导风罩两头均为开放设计,这也有别于以往AMD单芯双卡产品导风罩设计。
       左侧出风口直接将热风排除机箱,而右侧出风口则通过机箱散热风道排出。根据官方资料显示,这样的设计相比Radeon HD 5970而言,气流量增加20%。



整卡一体化散热设计
        我们可以看到一体式的散热骨架不仅仅起到固定风扇和核心散热器的作用,同时还起到PCB加固和对显存、桥接芯片、供电芯片的整体吸热作用。
        同时在这些功能IC上均配有相变导热材料,根据官方资料显示它的引入可以增加8%的散热性能。



每颗图形核心吸热底均采用真空腔技术
        核心散热器吸热底采用纯铜真空腔产品,真空腔原理类似于热管,不过其导热、散热性能更加,是目前高端风冷散热中最佳的吸热底方案。



扣Fin工艺散热铝鳍
        当然仅是配备了高效吸热的纯铜真空腔远远不够,还必须搭配上图中优质扣Fin工艺的散热铝鳍,在中央鼓风离心风扇作用下快速将核心热量排出。



旗舰显卡也能超
        一般对于高端双芯旗舰产品而言,默认频率下温度就已经苦不堪言。而Radeon HD 6990没有因此而退缩,不仅设计了高频双BIOS,还在CCC超频选项中预留了充分的超频空间。
        我们可以看到,核心、显存的频率上限为1200MHz/6000MHz,这样的设定即使是单芯Radeon HD 6970在默认风冷散热条件下也无法完成的目标。而AMD工程师如此这般设计,必然是针对职业超频选手设计。
cykhor
2011-11-12 04:52 PM
Eyefinity宽域再升级 组建多屏更随意
        AMD Eyefinity宽域技术是随Radeon HD 5000系列一同发布的,随着产品、技术的逐步更新,在Radeon HD 6000系列中引入了“寻址显示”和MST集线器多屏拼接方案,这样设计的好处就是在显卡上不必设计过多的物理接口。
        当然像Radeon HD 6990这款物理标配5接口的产品而言,实现5屏屏拼接也是非常方便的。

Radeon HD 6990带来全新的Eyefinity宽域技术
        由于Radeon HD 6990标配的接口为Mini DP和DVI两种,所以为了让更多用户方便连接自己的显示终端设备,AMD规定每张Radeon HD 6990必须至少标配1个Mini DP to Single-Link DVI转接头、1个Mini DP to Single-Link DVI主动式转接头和1个Mini DP to HDMI主动式转接头。



Mini DP *4 + DVI *1五口组合
        Radeon HD 6990公版产品标配4个Mini DP接口和1个Dual-Link DVI接口。同时搭配附件中的三种转接头,可以让用户全面兼容现有显示终端设备。



保证多屏输出同时确保显卡散热效能
        由于显卡为了增加散热效能,所以采用了双槽位设计。不过同时又要满足产品在宽域技术上的多屏显示输出,所以AMD工程师选择了Mini DP这种节约空间的接口,而4个Mini DO和1个DVI的组合是单槽物理数量极限,所以Radeon HD 6990设计为5接口产品,同时另一槽为100%用于散热器排风。



AMD Eyefinity宽域多种组合方案
        AMD Eyefinity宽域技术可以实现单卡最多6屏的拼接,高宽极限分辨率可达到8000*8000,也就是说6台2560*1600分辨率的30寸显示器以3*2模式排列也无法超越极限。
        当然AMD Eyefinity宽域的显示器摆放很自由,根据不同数量可以实现数十种方案。同时目前为止,无论中高低端AMD共推出了21款显卡支持Eyefinity宽域。
cykhor
2011-11-12 04:53 PM
双BIOS设计 官方提供高性能超频版
        对于单卡双芯产品而言,它能够提供给用户最强的性能,但是无法提供更多的可玩性。例如超频能力不行,以为需要考虑散热问题;例如BIOS调校不便,因为双芯BIOS涉及技术更难;例如改造空间不大、因为超频空间已经在出厂前做了限制……
        所以,我们会看到屡破世界纪录的职业玩家们多会选择单芯产品。而Radeon HD 6990的出现,笔者认为也许会影响高端职业玩家的固有看法。

Radeon HD 6990双BIOS参数对比
        Radeon HD 6970/6950是AMD官方首次引入双BIOS开关设计,Radeon HD 6990是AMD官方首次引入不同设定的双BIOS设计。通过上表我们能够看出,默认BIOS和超频BIOS的区别主要是核心频率上的差别,还有就是PowerTune最大功耗的上限。



Radeon HD 6990双BIOS开关
        通过官方资料显示,Radeon HD 6990默认频率BIOS核心电压为1.12v,而超频BIOS的核心电压增至1.175v,也就是说在超频BIOS状态下会获得更好的超频表现。



双BIOS开关和CrossFireX桥接口
        双BIOS切换开关位于显卡CrossFireX桥接口旁边,在显卡PCB或者后挡板上都会明确印有1和2的标识,1为默认频率BIOS、2为超频频率BIOS。
cykhor
2011-11-12 04:54 PM
显卡功耗也超频 PowerTune技术介绍
        显卡性能的逐年增加,随之而来的功耗、温度问题成为不可回避,而且是必须解决的事情。AMD和NVIDIA在自己产品中尤其是高端产品中加入了很多节能、降温技术。例如AMD的PowerPlay、例如NVIDIA的Power Limiter等等,不过这些技术主要集中在根据GPU负载或者温度来调整风扇转速和频率。
        在最新的Radeon HD 6900系列产品中,AMD为其加入了一项全新的功耗控制技术——PowerTune。

PowerTune技术简介
        PowerTune技术核心思想就是通过特定的IC锁定GPU最高功耗为预定数值,简单理解就是通过特定IC将显卡的功耗控制在你想达到的功耗范围内,当然过分控制功耗的结果就是损失性能,这是不可避免的结果。当然AMD工程师也考虑到了这个问题,所以在PowerTune功能调整中,上下浮动为20%。



PowerTune功能开关
        功能实现非常简单,在AMD CCC控制面板中找到AMD Overdrive标签,同时开启用户自定义模式,我们发现在原来调整风扇转速功能模块上方多了一个Power Control settings功能模块。功能模块的可调节范围为-20%-20%,默认为0%。



实现原理



PowerTune实际应用
        我们以Radeon HD 6950运行《异形大战铁血战士》为例,当PowerTune开启至-10%和极限-20%状态下下,功耗有了大幅下降,但是在性能上虽有下滑却依然保证游戏流畅运行。不得不说PowerTune技术是用户寻找功耗、性能、温度,达到完美平衡点的唯一解决方案。
cykhor
2011-11-12 04:54 PM
● 新模式 HD6000提供最佳反锯齿效果
        我们知道,在电脑计算3D画面时不可避免的会出现锯齿效果,这种效果在物体边缘最为明显。为了消除这些碍眼的锯齿,反锯齿技术应运而生,目前最为广泛的就是MSAA(多重采样反锯齿技术),不过AMD和NVIDIA在现有反锯齿技术长衍生出了很多自由的反锯齿技术。
        例如在Radeon HD 6800系列产品发布时,一起到来的还有MLAA(形态反锯齿)技术。不过在Radeon HD 6900发布时,不仅继承了MLAA同时还加入了EQAA(增强质量反锯齿)。
        ● EQAA增强质量反锯齿模式

        EQAA是通过在一定的范围内采集色样样本,同时通过计算算出与样本数量相同的覆盖样本。通过这的计算方法,从而实现更小的芯能损失却更高的消除锯齿效果。例如将反锯齿设置设定在4xEQAA时,反锯齿质量将介于4xAA和8xAA之间,但性能损失更接近4xAA,画质更接近8xAA。不过需要说明的是EQAA技术只存储较大的样本,但在渲染过程中会使用所有样本采集点,所以这种反锯齿是有损反锯齿。



        当平台插入Radeon HD 6900系列产品时,EQAA选项包含在反锯齿调节模块中,例如2xEQAA选项介于2xAA和4xAA之间,同理4xEQAA位于4xAA和8xAA之间。
        ● MLAA形态反锯齿模式



        我们知道DirectX 11 API之中最重要的就是加入了DirectCompute,它的出现可以更有效的利用流处理器处理高负载度并行计算,而在反锯齿计算就可以利用其计算特性。
        MLAA,全称Morphological Anti-Aliasing(直译为形态反锯齿)模式,这种反锯齿模式的出现不再局限于多边形的反锯齿计算,而是在alpha图层通道中实现反锯齿效果。



        MLAA的实现非常简单,只需在CCC控制面板中就能开启,同时可以搭配MSAA或者EQAA等反锯齿模式一同使用。而且值得一提的是,MLAA能够兼容DirectX 9、DirectX 10、DirectX 11 API。
        MLAA的实现原理是通过使用DirectCompute计算图像、边缘位置的高对比度色差分析,同时预判合理的边缘,最终根据实际色彩分析提供更细腻的过度色来消除锯齿。
您需要登录后才可以回帖 登录 | 注册

JBTALKS.CC |联系我们 |隐私政策 |Share

GMT+8, 2024-11-30 10:29 AM , Processed in 0.086768 second(s), 24 queries .

Powered by Discuz! X2.5 © 2001-2012 Comsenz Inc.

本论坛言论纯属发表者个人意见,与本论坛立场无关
Copyright © 2003-2012 JBTALKS.CC All Rights Reserved

Dedicated Server powered by iCore Technology Sdn. Bhd.

合作联盟网站:
JBTALKS 马来西亚中文论坛 | JBTALKS我的空间 | ICORE TECHNOLOGY SDN. BHD.
回顶部