APU是什么

APU是什么
APU是什么

APU是什么?未来?

今天的主角不是CPU,而是APU。那么APU是什么?APU的英文全称是“Accelerated Processing Units”,意为加速处理器,她是一款融聚了AMD先进技术的产品。实际上在今年的1月份我们就已经接触过APU——AMD在2011年1月召开了主题为“I Love APU”的盛大发布会,而当时所发布的产品为Brazos E350,也就是APU的入门型号,在之前我们已经对E350平台做过详细评测。在等待了近半年之后,AMD终于发布其主流定位的APU型号,也就是本文的主角A系列,而在A系列APU发布之时,我们也将对这套被网友期待了半年之久的平台做详细评测,让我们体验一下APU所带来的异构计算的魅力。

其实早在去年(2010年)的2月,AMD技术部高级副总裁Chekib Akrout 就已经给我们带来了APU的消息,用Chekib Akrout先生的话来形容APU就是“最好的CPU和最好的GPU组成了APU”,在这一方面AMD是占有巨大优势的——目前AMD方面具备CPU和GPU这两颗PC最重要核心的研发实力,在其并购ATI之后的时间里AMD推出了一系列占据明显优势的集显产品,而APU又将是一款超越之前所有作品的大作,其内部的独显核心将带来比以往都更强的加速性能,更重要的是,新的32纳米制程将带来更低的功耗和更为紧密的融合,这是一次全面的进步。

产品:A8-3800AMD CPU

融聚的产物—1+1大于2的APU

◇融聚的产物—1+1大于2的APU

在此前我们和AMD高层沟通的过程中,“融聚”这个词出现的几率非常高,为什么?因为APU的特点就是融聚,APU将是融合了传统CPU核心以及独显核心的全新产品,这是由AMD研发团队带来的超时代产物——最好的CPU和最好的GPU 组成了APU,AMD技术部高级副总裁Chekib Akrout 的原话正是如此。

AMD高级副总裁兼技术事业部总经理Chekib Akrout向记者介绍APU

事实上在6月成功举办的ComputeX 2011(2011年台北电脑展)上,APU就已经获得了ComputeX展会委员会的认可并授予了ComputeX 2011最佳选择奖,而将这一奖项赠予一款CPU类产品是不多见的,可见IT官方组织对于APU的高度认可,而AMD全球高级副总裁、大中华区总裁邓元鋆也说过:“APU作为无缝融合架构的加速处理器,在视频图像上有着非常大的优势,将标清变身为高清等等功能让APU赋予了更大的潜力及市场。”

AMD全球高级副总裁、大中华区总裁邓元鋆盛赞APU

AMD的高层展现出了对APU产品的强烈自信,而APU的设计理念和融聚融合也让CPU+GPU的1+1有了大于2的趋势,互相补足、相互加速,这才是APU的设计思路,也是异构计算的核心理念所在。那么事实究竟是怎样的呢,这也正是本文将要和大家一起探讨的。

产品:A8-3800AMD CPU

产品布局A8-3850目前最高

◇产品布局A8-3850目前最高

AMD的A系列APU定位要高于之前发布的E系列APU,A系列APU的命名原则很有意思,其中A6和A8代表四核心(Core)APU产品、A4代表双核心(Core)产品,目前LIano APU的最高端型号是A8-3850,拥有物理四核心的Core和2.9GHz的高主频,而A系列中最低端的产品是A4-3400。A系列APU及其A系列主板所构架而成的平台就是“Lynx”平台。下面的表格将APU目前面世的型号都囊括在内了。

APU产品线布局

有人说APU的架构依然是K10的延续。这种说法并不算错,但也并非全对,事实上APU的Core架构确实是K10的延展,但却有不小的改进,在缓存方面,A系列APU依然完整保留了128KB容量的一级缓存,而二级缓存方面则为每颗核心设计了1MB容量,而三级缓存方面则并未保留。

LIano A系列APU产品架构图

三级缓存的剔除是否意味着A系列APU的效能会因此受到影响呢?如果AMD不做点什么的话,那么事情就会是这样,好在AMD也同时为APU做了新的改进:基于IP(Instruction Pointer,指令指示器)的HW Prefetcher(硬件预读器)设计被重新改进、Reorder缓冲器容量提高了20%、Load/Store单元的缓冲器容量直接翻倍,新增硬件除法器(Hardware Divider)……这些改变让APU的每时钟周期指令数(Instructions Per Clock)比当前的处理器高出了6%之多,所以我们不用担心因为未设计三级缓存而带来的性能问题,而应该欣喜于架构的改进和二级缓存的倍增。

产品:A8-3800AMD CPU

强大—融合HD6500系列独显核心

◇强大—融合HD6500系列独显核心

我们都知道AMD方面推出的集成显卡都很给力,而此次推出的独显核心是否给力呢?答案是肯定的,LIano A系列APU 内部所融合的GPU基于HD6500系列,而HD6000系列也是AMD目前最为先进的GPU产品系列。AMD的官方资料里也自信满满的描述:A系列APU里融合了一颗独显级别的显示核心,那么让我们先来回顾一下LIano APU的核心架构:

LIano APU架构示意图

从上面的LIano APU架构示意图中我们可以看出,在LIano APU中有几乎一半的空间是被GPU所占据了的,另外一半被CPU Core所占据,能够将CPU和GPU如此整合在一片小小的芯片之中,先进的制程工艺要记一大功。

AMD的HD6500系列显示核心提供了DirectX 11的支持,是目前最先进的显示核心之一,而根据AMD方面在产品设计和规划上来推测,其最高端APU型号A8-3850的独显核心HD6550D应当是HD5570级别的显示核心,从SP单元来看,A系列APU最高端的A8型号内部的显示核心拥有多达400个SP单元,单纯从数值上来看这已经是HD6570的水准了,而HD6570拥有480个SP单元,SP单元组比HD6550D多一组。

HD6570架构示意

事实上即使HD6550D的SP单元和HD6570一样多,其理论性能也应当比HD6570稍低,因为两者的存储控制器并不一样,而显存方面DDR3也不会比GDDR5更有优势。当然,基于共享原则,用户还是可以让APU的独显核心拥有容量更大的共享显存的,这样也能多少提升一下HD6550D的效能。

当然,HD6550D独显核心可不是只挂着HD6000系列的名号而已,实际上HD6000系列显卡所支持的功能也同样被HD6550D所支持,前面所说的DirectX 11 API支持仅是其中的重要一项而已,在下面的章节中我们将详细阐述HD6550D 的更多功能。

产品:A8-3800AMD CPU

延续UVD3—高清解码依然给力

◇延续UVD3—高清解码依然给力

UVD3(Unified Video Decoder 3)中文译为“第三代通用视讯解码器”,它是AMD AVIVOHD的重要技术之一,借助UVD3

技术,显示核心能完全硬体解码MPEG2、H.264和VC-1等格式的高清影片,除了对MPEG2、H.264和VC-1三大高清电

影的全程硬解支持外,还可以硬解Divx/Xvid编码影片,并支持蓝光3D加速,特别是对于VC-1的解码支持,更是UVD3的传统优势。

UVD3相对于UVD2和UVD1的改进

相对比UVD2和UVD1,UVD3能够支持更多编码格式的硬件解码,我们从上图中能看到历代UVD技术的升级改进,从UVD一代只提供了VC-1和H.264编码视频的硬解到如今UVD3支持目前几乎全部视频格式的硬件解码,进步确实是显而易见的。

UVD3对更多的视频格式提供了支持

目前我们接触到的暴风影音和各种其他影音软件都提供了硬件解码接口的支持,只要在软件选项中打开硬件解码支持即可,实际上我们接触到的视频播放软件中有一款才是最老牌也是最简便易用的,那就是CyberLink的PowerDVD,这款播放软件并非国产,但事实上不少的国产影音软件都采用了CyberLink的解码技术,而后面我们也将进行高清视频硬解的实际测试,就将采用PowerDVD软件。

产品:A8-3800AMD CPU

如何加速—APU异构计算简析

◇如何加速—APU异构计算简析

既然APU名为加速处理器,那么其设计理念就是以加速为主,而APU内部所融合的是CPU核心和独显核心,那么其加速就必然是建立在这两个基本核心之上的,而对于异构计算来说,CPU和GPU之间的互补加速也是其重要的构成部分。

异构计算的英文名称是Heterogeneous computing,主要是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式。常见的计算单元类别包括CPU、GPU等协处理器、DSP、ASIC、FPGA等。我们常说的并行计算正是异构计算中的重要组成部分。

CPU与GPU协作进行异构计算示意图(基于OpenCL)

异构计算近年来得到更多关注,主要是因为通过提升CPU时钟频率和内核数量而提高计算能力的传统方式遇到了散热和能耗瓶颈。而与此同时,GPU等专用计算单元虽然工作频率较低,具有更多的内核数和并行计算能力,总体性能/芯片面积的比和性能/功耗比都很高,却远远没有得到充分利用。

CPU的设计让其比较擅长于处理不规则数据结构和不可预测的存取模式,以及递归算法、分支密集型代码和单线程程序。这类程序任务拥有复杂的指令调度、循环、分支、逻辑判断以及执行等步骤。而GPU擅于处理规则数据结构和可预测存取模式。而APU的设计理念则正是让CPU和GPU完美合作,集合两者的长处,用异构计算来达到整体性能的最佳化。

OpenCL

在这里我们有必要提一下OpenCL,OpenCL的全称是Open Computing Language,意思是开放运算语言,是第一个面向异构系统通用目的并行编程的开放式、免费标准,也是一个统一的编程环境,便于软件开发人员为高性能计算服务器、桌面计算系统、手持设备编写高效轻便的代码,而且广泛适用于多核心处理器(CPU)、图形处理器(GPU)、Cell类型架构以及数字信号处理器(DSP)等其他并行处理器。目前大部分的异构计算都是基于OpenCL来进行的(之前AMD的Stream即基于OpenCL 1.1),而在APU开放之后,我们也会在Lynx平台上看到更多基于OpenCL或由OpenCL作为基础转变而来的异构计算应用,这些应用将充分利用APU中CPU和GPU单元的加速性能。

产品:A8-3800AMD CPU

不缩水—体验完美独显性能

◇不缩水—体验完美独显性能

之前的E350平台所搭配的主板只提供了四条PCI-E通道供独显使用,即使我们加装了独立显卡也无法完全发挥独显的性能,所以很多主流用户会觉得不爽,不过这次基于Llano A8 APU的Lynx平台所搭配的芯片组则提供了16组PCI-E通道,并支持拆分为8x+8x的模式以提供双独立显卡的交火功能。可以说,我们在Lynx平台上所体验到的将是完美的独显性能。

E350产品也就只能提供一条并不完整的PCI-E接口

A75主板产品大多提供了两条PCI-E接口

从已经公布的主板产品来看,E350的主板所提供的也就只能是一条并不算完整的PCI-E显示接口,只不过其独显核心性能却也大大超越传统的集显整合平台,足以满足入门用户需要。而A75主板产品则大多提供了两条PCI-E显示接口,在接一块显卡的时候则能享受到完整的16x PCI-E通道,而接两块显卡也能提供双8x的普通交火系统(CrossFire)。当然,更为重要的是混合交火系统(Hybrid CrossFire),下文将会详加描述。

产品:A8-3800AMD CPU

新产品有新接口—Socket FM1的变革

◇新产品有新接口—Socket FM1的变革

一直以来AMD在接口的传承方面做的都非常好,2008年的K10架构发布曾经令人在接口上担心过,但AMD则做到了很好的向下兼容性,即AM3接口的处理器能够用在AM2和AM2+的接口底座上,用户对AMD在兼容性方面所做出的努力还是非常欣赏的,而Intel方面则推出了较多不同的接口,从最初X58平台的LGA 775到LGA 1366到P55平台上的LGA 1156再到目前P67平台上的LGA 1155都是不兼容的,也让消费者颇为头痛。而这次AMD发布的A系列处理器则也同样改变了接口——A系列APU将起用Socket FM1的全新接口标准。那么用户会头痛吗?应该还好,因为APU和CPU并非同类产品。

Socket FM1 CPU插座

Socket FM1 CPU插座及A8-3850处理器阵脚

Socket FM1接口的针脚数为905个,和AM3+的941个完全不一样(AM3为938针、AM2为940针),而阵脚的定义和布局也和AM3+完全不同,所以两者理论上无法兼容。

AMD产品布局示意

我们可以看到AMD未来的计划正是让FM1和AM3/AM3+共存,不同的市场定位分配以不同的接口,AMD在APU之后将采用这样的产品战略。实际上也没什么坏处,这样能够告诉用户不要在不同的平台上使用与其并不相符的CPU/APU。

产品:A8-3800AMD CPU

速度与激情—主板原生USB3/SATA3

◇速度与激情—主板原生USB3/SATA3

性能当然要看整个平台而非只是看A系列APU本身,A系列APU将搭配怎样的主板呢?我们拿到的是基于A75芯片组的主板(华擎A75 Pro4/七彩虹战斧C.A75 X5),A75是Lynx平台的重要构成部分,在其下还有一款A55芯片组。实际上称其为芯片组有些不合适,因为Lynx平台的主板已经全面采用单芯片设计,AMD方面称其为FCH芯片(英文全称为Fusion Controller Hub),当然我们仍旧按照习惯将其称为芯片组。

AMD FCH芯片组

事实上FCH芯片组并不简单,在2011年的4月15日,USB接口标准规范组织USB-IF正式宣布了第一款通过其官方认证的USB 3.0原生芯片组产品,也就是我们在这里所提到的AMD专为Llano Fusion APU高性能融合平台打造的A75、A70M FCH。

实际上还不仅止于此,A75芯片组还原生支持SATA 6Gbps接口,这将提升Lynx平台的I/O效能,从而进一步提升性能,最佳化用户体验。而在数量上,A75提供了六个SATA 6Gbps的接口支持,扩展性也完全足够。

产品:A8-3800AMD CPU

测试平台软硬件环境介绍

◇测试平台软硬件环境介绍

我们将使用简体中文版Windows 7 SP1 32bit版本的操作系统,关闭所有Windows开机启动项,并不对操作系统进行任何优化,用以获取最大的系统稳定性与兼容性。所有测试软件运行过程中均使用“Windows 7 标准”默认桌面主题和“最佳效

果”以获得最平等的测试环境。我们将关闭屏幕保护、休眠、系统还原以及自动更新等功能,并统一使用公版主板和显示芯片组驱动程序,为获取最为真实原始的客观评测数据提供基础。最后需要说明的是,测试中所涉及的产品参数以及主板和显示芯片组驱动程序都会在测试平台说明中给予相应注释。

测试平台状态

产品:A8-3800AMD CPU

APU基准效能—3DMark V测试

◇APU基准效能—3DMark V测试

3DMark Vantage是业界第一套专门基于微软DX10 API打造的综合性基准测试工具,并能全面发挥多路显卡、多核心处理器的优势,能在当前和未来一段时间内满足PC系统游戏性能测试需求。和PCMark Vantage一样,新3DMark也改变了命名方式,不再以年份做结尾,而是同样使用了一个意为“优势”的单词。和3DMark05的DX9专用性质类似,3DMark Vantage是专门为DX10显卡量身打造的,而且只能运行在Windows Vista/7操作系统下。

A8-3850+A75平台测试成绩

3DMark Vantage对CPU和GPU的性能都有一定要求,算是综合实力的体现,在这里,A8-3850强大的综合性能体现得非常明显,超过第二平台1500分的最后成绩令人惊叹。

产品:A8-3800AMD CPU

APU基准效能—3DMark 11测试

◇APU基准效能—3DMark 11测试

3DMark 11最大的卖点就是使用原生DirectX 11引擎,在测试场景中应用了包括Tessellation曲面细分、Compute Shader 以及多线程在内的大量DX11新特性。3Dmark 11包含了深海(Deep Sea)和神庙(High Temple)两大测试场景,画面效果堪比CG电影,3DMark 11包含四个图形测试项目,一项物理测试和一组综合性测试,并重新提供了Demo演示模式。

除了Lynx平台之外的其他两套平台都无法运行3DMark 11

令人郁闷的是除了Lynx平台之外的其他两套平台都无法运行3DMark 11,因为3Dmark 11是专门为DirectX 11所准备的测试软件,而其他两套平台都并不支持DirectX 11,所以这里我们暂时无法给出对比数据。

产品:A8-3800AMD CPU

APU游戏效能—《生化危机5》

◇APU游戏效能—《生化危机5》

《生化危机5》的故事是在一片酷热沙漠中的无名小镇上展开的,根据竹内润的介绍,这个地区发生了类似种族冲突的纷争,居民们情绪激动且各种暴力事件频发。与真实世界中发生种族冲突乃至仇杀的地区一样,这里充满了混乱,社会失去了本来的秩序,正义和邪恶的界限已经变得模糊不清。我们的主人公克里斯,就是在这样一个背景下前往这个充满动荡的地区展开调查的。基于DirectX 10.0 API的全3D特效的《生化危机5》这款游戏对内存和显卡的要求都相当高。测试采用1280*720分辨率,画面特效为默认,运行三次游戏Benchmark程序并取最佳成绩。

在游戏测试中,LIano A8-3850表现出了绝对的强势,生化危机5这款DX10的游戏对于LIano A8-3850来说简直是如鱼得水,让我们对比其他两套平台的成绩——LIano A8-3850的平均帧数超出了几乎两倍。

产品:A8-3800AMD CPU

APU游戏效能—《街头霸王4》

◇APU游戏效能—《街头霸王4》

CAPCOM的2009年度大作《街头霸王4》(Street Fighter IV)于2009年2月12日正式发售,可惜CAPCOM旗下产品更为重视游戏机平台,而PC平台被延期至2009年7月2日。对于经济实力雄厚的玩家来说,他们已经等得迫不及待,

老早就手入PS3游戏主机,先睹游戏风采,但对于大多数国内的玩家来说,PC版才是最终的选择。《街头霸王4》支持DX9 API,对PC硬件性能的要求并不是很严苛,主流级别的硬件即可比较流畅地体验游戏。我们的测试采用1280*720分辨率,画面特效为默认,运行三次游戏Benchmark程序并取最佳成绩。

街头霸王4的测试同样令人吃惊,LIano A8-3850居然跑出了84.9的高分,而另外两套平台也以差不多200%的分差被远远拉开。

产品:A8-3800AMD CPU

APU游戏效能—《失落星球2》

◇APU游戏效能—《失落星球2》

《失落星球2》承袭前作内容第三人称射击游戏,针对多人连线部分加以强化,并加入4人Co-op连线合作共同对抗巨大异形怪兽”艾克里德(Akrid)“崭新玩法,玩家不只是要正面对抗艾克里德,甚至还要爬上AK小山般的庞大身躯展开攻击。《失落星球2》以前作完结十余年后因气候暖化而出景观丕变的”EDN-3rd“行星为舞台,透过不同雪贼集团的观点来描述故事剧情,游戏采用CAPCOM 独自研发并进一步强化的”MT-Framework 2.0“游戏引擎。

○ DX9模式

○ DX11模式

相关主题
相关文档
最新文档