IBM POWER8核心处理器
第43卷 第7期 2016年7月
天 津 科 技
TIANJIN SCIENCE & TECHNOLOGY
V ol.43 No.7Jul. 2016
收稿日期:2016-06-02
科技评论
IBM POWER8核心处理器
刘向红,张时光,李隐峰
(鸿富锦精密电子 天津300462)
摘 要:随着云运算和大数据产业的迅猛发展,数据处理和存储技术的发展如火如荼。IBM 作为服务器行业的先行者,不甘心Intel 一枝独大,在2015年3月对外部客户推出开放型平台POWER8。为使服务器开发者和用户快速了解该系列处理器,整理了POWER8的技术特点和产品特性,以利于快速比较和选型。 关键词:大数据 服务器 核心处理器 IBM POWER8
中图分类号:TP368.5 文献标志码:A 文章编号:1006-8945(2016)07-0012-04
A Brief Introduction of IBM POWER8
LIU Xianghong ,ZHANG Shiguang ,LI Yinfeng
(HongFuJin Electronic Precision ,Tianjin 300462,China )
Abstract :With the rapid development of cloud computing and big data industry ,data processing and storage technology are also growing vigorously .IBM ,as a pioneer of server industry ,is not willing to let Intel occupy the data processing market ,therefore it launched POWER8,an open platform ,for external customers in March 2015.To give server develop-ers and users a quick overview of the series processors ,this paper analyzes technical features and product characteristics of POWER8 to offer reference for rapid comparison and selection. Key words :big data ;server ;core processor ;IBM ;POWER8
0 引 言
2013年8月26日,在斯坦福大学举行的第25届HotChip 半导体大会上,IBM 发布了新一代服务器处理器POWER8。POWER8采用22nm S OI 工艺,芯片核心面积为650mm2。性能方面,POWER8采用超标量体系架构,对称型超线程设计8-WaySMT ,最大支持同时执行96个线程。该产品可联系OpenPOWER 基金会进行许可注册并开发设计,这是IBM 第1次对外开放如此高端处理器的开发许可。
1 12核心芯片设计
POWER8 最大支持12核心芯片多线程设计,每个核心能同时处理8个硬件线程,执行高速运算,总共可同时执行96个线程运算任务。处理器使用了大量的开关芯片 eDRAM 作为缓存,内存控制器在eDRAM 开启状态,可以为内存和系统I/O 打开很大
的带宽。对于大多数工作负荷,据说缓存芯片可达到
POWER7两到三倍的计算速度。
在POWER7及以前的处理器系列,使用GX +外部通信总线,POWER8 删除了这一设计并取而代之以CAPI 端口。CAPI 端口用于连接一些专业的辅助处理器,如GPU 、ASIC 和FPGA 。这些通过CAPI 总线外加的处理单元可以与CPU 使用相同的内存地址空间,从而减少了计算路径长度。在2013年ACM 和IEEE 超级计算大会上,IBM 和Nvidia 宣布了一项合作工程,在未来的HPC 系统中,Nvidia GPU 将与POWER8系统高度集成且已明确应用于第1款POWER 系统S824L 。
POWER8还包含1个OCC ,即所谓的集成于芯片上的控制器,也就是基于PowerPC 405处理器的电能和热能管理单片机。它有两个通用卸载引擎(GPE )和512KB 的嵌入式静态随机存取存储器(SRAM ),通过OCC 可直接访问主存——运行中的一个开源固件。OCC 管理POWER8的运行频率、电压、内存带
2016年7月刘向红等:IBM POWER8核心处理器·13·
宽、热控制处理器和内存,它可以通过1764个位于Fly之上的集成调节器调整电压。OCC也可以被编程用于超频POWER8处理器或降低其功耗降低工作频率(类似于一些Intel和AMD处理器中的可配置的TDP)。
POWER8已有4、6、8、10和12核等不同版本,每个版本都采用15层金属处理的22nm的绝缘硅(SOI)单元制造。12核心版本由42亿个晶体管构成,大小为650mm2,6核版本大小仅为362mm2。
2 存储控制器——Centaur
POWER8芯片的存储器控制器设计为可使用DDR3或DDR4内存。而作为一个存储缓冲区、L4高速缓存芯片和实际存储器,被配对至外部原件Centaur,设计为永不过时技术的内存控制器。当前,Centaur芯片采用DDR3内存,但未来版本可以使用DDR4或一些其他存储器技术,而不需要修改POWER8芯片本身的设计。
每一个Centaur由3条高速连接方式连接到POWER8(2读1写),运行带宽9.6GB/s,总运行带宽28.8GB/s,具有40ns的时间延迟。Centaur包含有16MB的eDRAM,可用作L4高速缓存。每个POWER8的每个Socket可以链接最多8个Centaur 芯片,合计每Socket最多允许链接高达1TB,带有128MB的L4高速缓存和230GB/s的持续存储器带宽,32GB DRAM的接口以及410GB/s的峰值内存带宽。Centaur芯片最终被集成到DRAM的DIMM 模块中。存储控制器Centaur 芯片采用与POWER8一样的制程技术。
3 规 格
每个POWER8核心拥有64KB的L1数据和32KB的L1指令缓存。每个核心的每个循环可以向16个执行通道发出10条指令并分派8条指令:2个固定点的通道,2个加载/存储通道,2个加载通道,4个双精度浮点通道,也可以充当8个单精度浮点运算通道,2条VMX通道,1个加密通道,1个十进制浮点通道,1个条件寄存器通道和1个分支执行 通道。
它有一个更大的4×16问题处理队列入口,能提高分支任务预测,处理多达两倍的高速缓存缺失。每个核包含8路硬件多线程,可被动和自动分配到具有1个、2个、4个或所有8个线程的运算。POWER8 还增加了对硬件事务存储器的支持。IBM估计,其每个内核是 POWER7 单线运算速度的1.6倍。
POWER8 处理器由12 颗芯片设计而成,可能由4、6、8、10或12 颗芯片集合构成,其中1组芯片集包括1颗核芯,S RAM 512KB 的L2 高速缓存总线(是上一代产品的两倍)和eDRAM 8MB的每颗芯片集的芯片之间的L3共享缓存。因此,6核芯处理器将有48MB L3的eDRAM缓存,而12 核芯处理器将总共有96MB 的L3eDRAM 缓存。该芯片还可以利用1个高达128MB的 eDRAM 缓存 L4 采用Centaur 配套芯片。集成于芯片上的内存控制器可以处理1TB RAM 和 230GB/s 的持续内存带宽。这些内核设计用来处理2.5~5GHz的时钟速率。
POWER8的6核版采用的是IBM安装在双芯片模块(DCM)对向外扩展的服务器。在大多数配置中,并不是全部的核心都可以被激活,因此出现了各种实际核心数量的不同配置。 12核心版本直到2014年5月还没有发布到任何系统。
IBM的单芯片POWER8模块被称为Turismo,双芯片变种被称为Murano。PowerCore 的修改版本被称为CP1。
4 许可授权
2014年1月19日,苏州Powercore技术公司宣布,他们将加入OpenPower基金会并注册POWER8核心应用,为客户定制设计大数据和云计算。
5 变异系列
IBM Murano——双6核的12核处理器。扩展型处理器在某些核心关闭的情况可以启用。
IBM Turismo——单芯片的12核处理器。替换型处理器在市售和注册时可以带有被关闭内核配置。
PowerCore CP1——POWER8是修订安全特性后的一个变种,由于美国和中国之间的出口限制,将在纽约East Fishkil的Global Foundries(IBM之前的工厂)生产。该产品已在2015年发布。
6 系统开发
针对该款功能强大的服务器平台,全球多家知名系统开发商在解决方案发布之初就已经开始投入巨资开发自己的POWER8系列产品,在服务器市场抢占先机。其中启动比较早的有以下公司及其产品:
·14· 天 津 科 技 第43卷 第7期
6.1 IBM 开发的3大系列产品线 6.1.1 扩展型服务器
支持双芯片模块的1个或2个插座有2个6核处理器的POWER8。“L ”版本只运行Linux ,而其他版本运行AIX 、IBM i 和Linux 。典型机型如: Power S ystems S 812L ①:1×POWER8DCM (4、6或8核心),2U ;Power S ystems S 814。1②×POWER8DCM (6或8核心),4U 或tower 。③Power S ystems S 822 和 S 822L :1×(2×)POWER8DCM (6、10、12或20核心),2U 。④Power S ystems S 824 和 S 824L :1×(2×)POWER8DCM (6、8、12、16或24核心),4U 。
6.1.2 企业级服务器
支持节点具有4套处理器插槽,各载8、10或12核心模块,最多的16套处理器插槽,128个内核和内存16TB 。这些机器能够运行AIX 、IBM i 或Linux 操作系统。
Power S ystems E85①0,2×POWER8、3×DCM 或4×POWER8DCM (8、10或12核心),4U ;Power Systems E870②(见图1),
1×5U 或2×5
U 节点,4套处理器插槽,8~10 核心,POWER8一体化芯片设计,最高支持到80核心;③Power S ystems E880,1×5U 、2×5U 、3×5U 或4×5U 节点,每节点4套处理器插槽,8~12核心,POWER8一体化芯片设计,最高支持到192核心。
(a )
(b )
图1 IBM Power E870
Fig.1 IBM Power E870
6.1.3 高性能计算机 典型机型如:Power S ystems S 812LC ①(Open-Power ),1×POWER8SCM (8或10核心),2U ;
PowerS ystems S 822LC ②“Firestone ”(OpenPower ),2×POWER8SCM (8或10核心),2U ,由制造商Wistron 为IBM 制造,两颗Nvidia K80GPUs 和达1TB 容量的自由选配DDR3RAM 。 6.2 泰安电脑
SP010GM2NR ①,集成POWER8一体化芯片设计,ATX 架构的主板;Palmetto GN70②-BP010 (OpenPower 参考设计用的主板),2U ,4核心POWER8SCM ,4RAM 插槽,基于泰安设计的主板;③Habanero TN-71-BP012.2U ,带有8核心POWER8SCM ,32 支RAM 插槽。 6.3 谷歌
谷歌曾展示过内部使用的设计方案,带有两套处理器插槽。 6.4 浪潮电子信息
浪潮已经与IBM 达成协议,采用POWER8平台和相关技术,开发服务器硬件。产品定型为:4U 服务器,两套 POWER8处理器插槽。 6.5 Cirrascale RM4950:4U ,4核心POWER8SCM 带有4颗Nvidia Tesla K40加速器,基于泰安电脑的主板方案。 6.6 ZoomNetcom
RedPOWER C210①和C22,2U 和4U ,服务器带有两套POWER8处理器插槽和 64支RAM 插槽;RedPOWER C310②和C320,2U 和4U ,服务器带有两套CP1插槽。 6.7 Rackspace Barreleye :1
U ,双处理器插槽,32支 RAM 插槽,基于Rackspace 的开放平台及其OnMetal 服务。 另外还有创和OP :1X (1U ,单处理器插槽, 32支RAM 插槽)等产品已经开发成功。
7 Scale -up 和Scale -out 架构选型
包括纵向扩展型(Scale-up )和横向扩展型(Scale-out )两种方案,如图2所示。
图2 纵向扩展型和横向扩展型方案示意
Fig.2 Schematic of Scale -up and Scale -out solutions
2016年7月刘向红等:IBM POWER8核心处理器·15·
纵向扩展型,就是当旧方案已无法满足应用需求时,重新采购新方案,切换到新方案后,淘汰旧方案。横向扩展型,就是当旧方案已无法满足需求时,在保留原有旧方案基础上,增加新方案投资,新旧方案同时运行。
关于系统架构选型,用户在采购之初很难准确预测未来数据增长的速度和总量,因而往往不得不采购比自己目前实际需求容量更大的存储,这就导致两个问题,一是预算的浪费,很多存储空间都是为未来数据增长采购的,花了10TB的钱,但是可能只利用了5TB,另外5TB的资金白白闲置。另一个问题是,随着时间推移,数据增长,数据量超过了10TB。按照过去Scale-up的理念,解决方案就是购买更大容量的存储,则难免面临数据迁移的问题,用户必须停机迁移数据,意味着服务的中断。而Scale-out架构解决了这个矛盾。用户按需采购存储,一旦容量不够了,再购置一台接到原有存储上即可,所以横向扩展型方案对于连续运行型需求有绝对优势。■参考文献
[1]IBM Announces POWER8 with OpenPOWER Part-ners[EB/OL]. https://www.360docs.net/doc/2f8603089.html,/wp-
content/uploads/2014/04/IBM-Announces-POWER8-with-
OpenPOWER-Partners-by-Moor-Insights-and-Strategy.
Pdf.
[2]IBM POWER8[EB/OL]. http://komplex-it.dk/media/ 128719/ibm_power8. pdf.
[3]POWER8[EB/OL]. https://https://www.360docs.net/doc/2f8603089.html,/wiki/ POWER8.
[4]Life at the Intersection:OpenPOWER,Open Compute,and the Future of Cloud Software & Infrastruc-
ture[EB/OL]. https://www.360docs.net/doc/2f8603089.html,/blogs/life-
at-the-intersection-openpower-open-compute-and-the-
future-of-cloud-software-infrastructure.
[5]IBM to help China's Inspur to design servers [EB/OL].
https://https://www.360docs.net/doc/2f8603089.html,/news/ibm-help-chinas-inspur-
design-servers-123642000--finance.html?ref=gs.
上接第11页
desalinated water and introduction of a novel,cost ef-
fective and advantageous post treatment process [J]. De-
salination,2008,221(1-3):70-83.
[2]Lahav O,Birnhack L. Q uality criteria for desalinated water following post-treatment [J]. Desalination,
2007,207(1-3):286-303. [3]葛云红,刘艳辉,赵河立,等. 海水淡化水进入市政管网需考虑和解决的问题[J]. 中国给水排水,2009,
25(8):84-87.
[4]骆碧君,刘志强,郑毅,等,海水淡化水在既有管网中的水质变化研究[J]. 中国给水排水,2009,
25(23):57-60.