简述天河一号架构
超级计算机研究报告

超级计算机研究报告1. 引言1.1 超级计算机的定义与意义超级计算机,又称巨型机,是指具有极高计算速度和强大数据处理能力的计算机系统。
其计算能力通常以每秒浮点运算次数(FLOPS)来衡量,远超一般个人计算机和服务器。
超级计算机在科学、工程、国防、气象、生物医学等领域发挥着至关重要的作用,是支撑国家科技发展、提升综合国力的关键设施。
1.2 研究目的与背景随着全球科技竞争的加剧,超级计算机已成为各国争夺的战略制高点。
我国在超级计算机领域取得了一定的成绩,但与国际先进水平仍有一定差距。
为了深入了解超级计算机的发展现状、关键技术及其应用,本报告旨在系统研究超级计算机的发展历程、技术特点和应用领域,为我国超级计算机的发展提供参考。
1.3 报告结构及主要内容本报告共分为八个章节,分别为:引言、超级计算机的发展历程、超级计算机的关键技术、超级计算机的应用领域、我国超级计算机的代表案例、超级计算机的性能评价与排名、我国超级计算机发展的挑战与对策以及结论。
报告将详细介绍超级计算机的各个方面,以期为我国超级计算机的研究和发展提供有力支持。
2. 超级计算机的发展历程2.1 国际超级计算机发展概况超级计算机的发展可以追溯到20世纪60年代。
自那时以来,超级计算机在技术、性能和应用领域等方面取得了巨大进步。
国际上的超级计算机发展主要集中在欧美、日本等国家。
其中,美国一直处于领先地位,其研发的超级计算机多次荣登全球最快超级计算机的宝座。
从历史发展来看,超级计算机的发展经历了多次变革。
最初,超级计算机主要采用大型主机架构,随后逐渐发展到向量机、大规模并行处理(MPP)系统,再到如今的云计算和众核处理器架构。
这些变革不仅提高了超级计算机的性能,还使其在更广泛的领域发挥重要作用。
2.2 我国超级计算机发展历程及现状我国超级计算机的发展始于20世纪70年代,经历了从无到有、从弱到强的发展过程。
特别是近年来,我国在超级计算机领域取得了举世瞩目的成绩。
天津计算机考试三级

天津计算机等级考试三级一、选择题(每题2分,共30分)1. 我国“天河一号”超级计算机的计算速度为2.507PFlops。
这里PFlops的P 代表10的15次方,那么该浮点运算速度为每秒钟:A) 2.507万亿次B) 2.507百万亿次C) 2.507千万亿次D) 2.507亿亿次2. 下列哪项不是必需的灾前预防性措施?A) 防火设施B) 数据备份C) 配置冗余设备D) 不间断电源(仅给关键设备配备)3. 根据《计算机信息系统国际联网保密管理规定》,涉及国家秘密的计算机信息系统,不得直接或间接地与国际互联网或其他公共信息网络相连接,必须实行:A) 逻辑隔离B) 物理隔离C) 安装防火墙D) VLAN划分4. 认证是防止哪种攻击的重要技术?A) 主动攻击B) 被动攻击5. 关于TCP/IP参考模型的描述中,正确的是:A) 分为7个层次B) 最底层是互联层C) 由ISO组织制定D) 最高层是应用层6. IP地址中,关于C类IP地址的说法正确的是:A) 可用于中型规模的网络B) 在一个网络中最多只能连接256台设备C) 此类IP地址用于多目的地址传送D) 此类地址保留为今后使用7. 下列哪项不属于软件的概念描述?A) 汇编语言是符号化的机器语言,可在机器上直接运行B) 程序由指令序列组成,用自然语言直接编写C) 系统软件最核心部分是操作系统D) 软件按授权方式分为正版软件和盗版软件(此选项虽现实存在,但非软件概念描述)8. 防火墙一般由哪两部分组成?A) 分组过滤路由器和网桥B) 分组过滤路由器和应用网关C) 杀毒软件和防病毒卡D) 路由器和交换机9. 在OSI参考模型中,提供路由选择与拥塞控制功能的是:A) 物理层B) 网络层C) 传输层D) 应用层10. 不可逆加密算法在加密过程中:A) 需要使用公用密钥B) 需要使用私有密钥C) 需要使用对称密钥D) 不需要使用密钥11. 下列叙述中是数字签名功能的是:A) 防止交易中的抵赖行为发生B) 防止计算机病毒入侵C) 保证数据传输的安全性D) 以上都不对(仅A项正确,但选项设计为多选形式,此处简化为单选)12. 下列哪项不属于“三网合一”的“三网”?A) 电信网B) 有线电视网C) 计算机网D) 交换网13. 下列哪项不是影响计算机网络性能的主要因素?A) 网络带宽B) 网络拓扑结构C) 网络协议D) 打印机型号14. 调制解调器(Modem)的分类中,不包括以下哪种类型?A) 基带调制解调器B) 音频调制解调器C) 光纤调制解调器(通常为无线或有线,光纤不直接用于调制解调器分类)D) 无线调制解调器15. 如果一个信息系统,其业务信息安全性或业务服务保证性受到破坏后,会对社会秩序和公共利益造成一定损害,但不损害国家安全,那么该信息系统属于等级保护中的:A) 强制保护级B) 监督保护级C) 指导保护级D) 自主保护级二、简答题(每题10分,共40分)16. 简述计算机三级信息安全技术中,安全评估技术采用的主要工具及其功能。
天河二号

天河二号——我国的巨型计算机由国防科大研制的天河二号超级计算机系统,以峰值计算速度每秒5.49亿亿次、持续计算速度每秒3.39亿亿次双精度浮点运算的优异性能位居榜首,成为全球最快超级计算机。
2010年11月,天河一号曾以每秒4.7千万亿次的峰值速度,首次将五星红旗插上超级计算领域的世界之巅。
2013年11月18日,国际TOP500组织公布了最新全球超级计算机500强排行榜榜单,中国国防科学技术大学研制的“天河二号”以比第二名—美国的“泰坦”快近一倍的速度再度登上榜首。
广州大学城广州超算中心。
组成结构天河2号由16000个节点组成,每个节点有2颗基于Ivy Bridge-E Xeon E5 2692处理器和3个Xeon Phi,累计共有32000颗Ivy Bridge处理器和48000个Xeon Phi,总计有312万个计算核心。
每个Xeon Phi使用其中的57个核心,使用57个核心能够加速4个执行线程,运行在1.1GHz的Xeon Phi可以生产1003 Tflops的双精度运算能力。
单个节点可以有3.431 Tflops运算能力,16000个节点总计可达54.9PFlops性能。
每个运算节点有64GB主存、而每个Xeon Phi板载8GB内存,因此每个节点共有88GB 内存,总计16000个节点一共有1.404 PB内存,而外部存储器容量方面更是高达12.4PB.在每个主板上有2个计算节点,而每个框架则有16个主板,4个框架组成一个机柜,整个系统由125个机柜组成。
每个计算节点主板分为两块,一块CPM 一块APU,CPM上有4核Ivy Bridge、内存和一个Xeon Phi,而APU基板上则承载着5个Xeon Phi.CPM和APU之间有5个水平插入的链接口,由Ivy Bridge内置的PCI-E 2.0进行连接,虽然Ivy Bridge内置为PCI Express 3.0接口,但Xeon Phi仅支持2.0,单个通路为10Gbps带宽。
基于统一资源管理的超级计算机系统节能方案

IS 1o .0 1 S N o 1 9 8
2 2— 3— 01 0 01
计 算 机 应 用 ,0 2 3 ( ) 85—8 8 2 1 ,2 3 :3 3
C EN J I OD YIDU
Po r s v ng s he e f r s e c m p i y t m s d o i e e o c na e e t we a i c m o up r o utng s se ba e n un f d r s ur e ma g m n i
Ab t a t h s p p r p e e t d a s p i iae o r s v n c e a e n s se l v lr s u c n g me t fr sr c :T i a e r s n e o h s c td p we a i g s h me b s d o y tm—e e e o re ma a e n o t T 1 s p r o u e y t m. T e s h me ito u e nf r f me r o e t l e n g me t o ai u o r H・ u e c mp tr s se A h c e n r d c d a u i m a wok fr c n r i d ma a e n f v r s p we - o r az o c n u n e o r e ,i e c mp t g ee n s c mmu ia in c mp n n s o e u p y a d c oi g d vc s An n o s mi g r s u c s . . o u i lme t, o n n c t o o e t ,p w r s p l n o l e ie . o n d ma y e ce tma a e n oi is s c sL t .wee a p id wi i h rme r . i f i n n g me tp l e u h a RU ec c r p l t n t e fa wo k e h Ke r s u e c mp tr s se lv lp we a i g a d a e f me o k r s u c n g me t y wo d :s p r o u e ; y t m—e e o r s vn ;h r w r a w r ; e o r e ma a e n r
大学计算机习题参考答案.

《大学计算机基础与计算思维》习题参考答案第一章计算机引论一、简答题(1)什么是数据?什么是信息?二者有什么关系?答:数据是记录下来的可以鉴别的符号,它可以通过语言、文字、符号、图形、声音、光、电等来记录客观事物的状态。
数据是对客观事物的一种符号描述,而信息是经过加工后的数据,是可以用来通信的知识。
信息是用来消除随机不确定性的东西。
二者关系为:数据是信息的原材料,而信息则是数据加工后的产品。
(2)支撑人类社会文明的三要素是什么?如何理解三者在不同历史时期的地位和作用?答:三要素为:信息、物质、能源。
不同历史时期三种要素的利用比例不同。
(3)什么是数字化?在计算机领域内又如何理解?答:数字化分为广义和狭义二种,广义的数字化:指信息经过数字化处理的广泛应用。
狭义的数字化:是指由数字信号(数码)取代模拟信号来表征、处理、存储、传输各种信息的过程。
在计算机领域内,我们可以将数字化理解为将许多复杂的信息转变为可以度量的数字、数据,再以这些数字、数据建立起适当的数字化模型,把它们转变成一系列二进制代码,引入计算机内部,进行统一处理。
(4)简述计算机的发展阶段。
答:1932年英国数学家亚伦.图灵(Alan Turing)提出一人计算模型,称图灵机,现在的计算机在本质上与图灵机是一样的。
1936年,Konrad Zuse建造了一台可编程的数字化计算机,它引入了二进制系统和电子管的使用。
第一代计算机:1946至1956年,世界上第一台计算机ENIAC,电子管元件。
宾夕法尼亚大学的美籍匈牙利数学家冯.诺依曼改进了ENIAC研制出了世界上第二台计算机EDVAC,作了重要改进:一是采用了二进制,二是程序和数据存入计算机内部。
冯.诺依曼为现代计算机在体系结构和工作原理奠定了基础。
当今的计算机依然遵循的是冯.诺依曼提出的计算机体系结构。
第二代计算机:(5) 简述计算机的特点。
运算速度快、计算精度高、存储容量大、具有逻辑判断功能、可靠性高、自动化程度高、通用性强等。
计算机组成原理 第1章 绪论

超级计算机——天河一号
运算速度 “天河一号”峰值运算速度为每秒4700 万亿次。做个换算对比:“天河一号”运 算1小时,相当于全国13亿人同时计算340 年以上的时间;“天河一号”运算1天, 相当于1台双核的高档桌面电脑运算620年 以上的时间。 存储容量 “天河一号”存储容量为两千万亿个字节。 做个换算对比:一个汉字平均为两个字节, “天河一号”可在线存储一千万亿个汉字, 相当于存储100万汉字的书籍10亿册。
电子数字计算机以离散量即数字量表示数据,应
用算术运算法则实现运算。 由于具有很强的逻辑判断功能、庞大的存储能力,以及 计算、模拟、分析问题、操作机器、处理事务等能力, 因而得到了极其广泛的应用。
电子计算机的诞生
• 第一台电子计算机ENIAC(Electronic Numerical Integrator and Computer)于1946年在美国诞生。 ① 每秒5000次加法运算; ② 每秒50次乘法运算;
1.1.1 更新换代的计算机硬件
(1) 电子管时代(1946年-1959年) (2) 晶体管时代(1959年-1964年) (3) 中、小规模集成电路时代(1964年-1975年)
(4) 超、大规模集成电路时代(1975年-1990年)
(5) 超级规模集成电路时代(1990年-现在)
代
一 二 三
1.1.2 日臻完善的计算机软件
汇编语言阶段(20世纪50年代)
程序批处理阶段(20世纪60年代)
分时多用户阶段(20世纪70年代)
分布式管理阶段(20世纪80年代)
软件重用阶段(20世纪90年代)
Web服务阶段(21世纪初期-现在)
天河二号超级计算机

4
二、特点
高性能 • 峰值速度和持续速度都创造了新的世界纪录;
低能耗
• 能效比为每瓦特19亿次,达到了世界先进水平; 应用广 • 主打科学工程计算,兼顾了云计算; 易使用 • 创新发展了异构融合体系结构,提高了软件兼容性和易编程性; 性价比高 • 性能世界第一,研制经费仅为美国“泰坦”超级计算机的一半。
7
五、应用领域
“天河二号”由280人历时两年多研制完成,耗资约1亿 美元。2013年下半年,它将在广州超级计算中心投入运 行,其先导系统已开始为生物医药、新材料等领域用户 提供服务。 目前,天河二号已应用于生物医药、新材料、工程设计 与仿真分析、天气预报、智慧城市、电子商务、云计算 与大数据、数字媒体和动漫设计等多个领域,还将广泛 应用于大科学、大工程、信息化等领域,为经济社会转 型升级提供重要支撑。
6
四、自主创新
天河二号自主创新了新型异构多态体系结构,在强化科 学工程计算的同时,可高效支持大数据处理、高吞吐率 和高安全信息服务等多类应用需求,设计了微异构计算 阵列和新型并行编程模型及框架,提升了应用软件的兼 容性、适用性和易用性。天河二号服务阵列采用了国家 核高基重大专项支持、该校研制的新一代“FT1500”CPU,这是当前国内主频最高的自主高性能通 用CPU。天河二号还在高速互连、新型层次式加速存储 架构、容错设计与故障管理、综合化能效控制、高密度 高精度结构工艺等方面取得了一系列创新和突破。“中 国创造”在天河二号上比比皆是,涌现了多个国际领先 和国际先进。
天河二号超级计算机
——2014年再登世界超算榜首
2
一、概况
由国防科大研制的天河二号超级计 算机系统,以峰值计算速度每秒 5.49亿亿次、持续计算速度每秒 3.39亿亿次双精度浮点运算的优异 性能位居榜首,成为全球最快超级 计算机。2010年11月,天河一号 曾以每秒4.7千万亿次的峰值速度, 首次将五星红旗插上超级计算领域 的世界之巅。此次是继天河一号之 后,中国超级计算机再次夺冠。
天河二号介绍

做的不好,谢谢大家支持!
制作人:张鑫钰
天河二号自主创新了新型异构多态体系结构,在强化科学工程计算 的同时,可高效支持大数据处理、高吞吐率和高安全信息服务等多类 应用需求,设计了微异构计算阵列和新型并行编程模型及框架,提升 了应用软件的兼容性、适用性和易用性。天河二号服务阵列采用了国 家核高基重大专项支持、该校研制的新一代“FT-1500”CPU,这是 当前国内主频最高的自主高性能通用CPU。天河二号还在高速互连、 新型层次式加速存储架构、容错设计与故障管理、综合化能效控制、 高密度高精度结构工艺等方面取得了一系列创新和突破 天河二号共有16,000个运算节点,每节点配备两颗Xeon E5 12核心 的中央处理器、三个Xeon Phi 57核心的协处理器(运算加速卡)。 累计32,000颗Xeon E5主处理器和48,000个Xeon Phi协处理器,共 312万个计算核心。
天河二号
超级计算机
天河二号
天河二号,是一组由中国大陆国防科技大学等单 位研制的异构超级计算机,为天河一号超级计算 机的后继,置放于广东广州的国家超级计算广州 中心。天河二号的组装和测试由国防科技大学和 浪潮集团来负责,于2013 年底入驻广东省广州的 国家超级计算广州中心并进行验收,2013年底交 付使用后对外开放接受运算项目任务,用于实验、 科研、教育、工业等领域。天河二号造价达一亿 美元,整个系统占地面积达720平方米。2013年6 月起天河二号成为世界上最快的超级计算机。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
透过天河一号看超级计算机技术 在 去年10月底,长沙举办的中国高性能计算学术年会上,国防科技大学研制的千万亿次超级计算机“天河一号”成为焦点,这是我国国内计算能力最高的超级计算 机,而且标志着我国超级计算机的研发能力成功实现了千万亿次计算的跨越。超级计算机不仅体现了一个国家战略性高技术的发展水平,也是与科技创新、国计民生 密切相关的重要基础设施。超级计算机的各种应用,实际上会以不同的方式影响到我们每个人,这些似乎遥不可及的超级计算机实际上离我们“非常近”。
你应该知道的超级计算机 目前各种超级计算机的高速处理能力基本上都是利用并行体系结构实现的,并行计算(Parallel Computing)已成为提高处理性能的关键技术之一。简单地讲,并行计算技术就是用同时运行的多个处理机或计算机来处理同一任务,从而大幅度提高任务 的处理速度、缩短了任务的处理时间。
超级计算机的五大形态 在超级计算机技术的发展历程中,先后出现过多种超级计算机并行体系结构,主要有如下5种。
●并行向量处理(Parallel Vector Processing,PVP)系统
并行向量处理结构 采用一定数量的、并行运行的向量处理器和共享式内存(Shared Memory,SM)结构的计算机系统。PVP系统的SM结构,也就是采用高带宽的交叉开关将各个向量处理器与其共享的内存模块连接。向量处理器 (Vector Processor)的一条指令能够同时对多个数据项(向量矩阵)执行运算,而一般的通用CPU属于标量处理器(Scalar Processor),每次只能对一个数据项进行处理。其代表机型有Cray XMP、Cray YNP、NEC SX2、我国的银河一号和二号等。 ●对称式多处理(Symmetric Multi Processing,SMP)系统 对称式多处理结构 采用一定数量、并行运行的微处理器和共享式内存(SM)结构的计算机系统,各处理器通过系统总线或交叉开关连接共享的内存模块,可“均等”或“对称”地共 享内存和其它系统资源并由同一操作系统管理,提高整个系统的数据处理能力,因此SMP属于“一致性内存访问”(Uniform Memory Access,UMA)方式,SMP的代表机型有IBM R50、SGI Power Challenge、Sun SPARC Center 2000、曙光一号等。
●分布式共享内存(DistributedShared Memory,DSM)系统
分布式共享内存结构 由一定数量的并行处理节点(Node)组成,每个节点都是一个相对完整的计算单元(配置有处理器和内存模块),各节点通过高速网络互连,系统由单一操作系 统管理,分布于各个节点的全部内存被统一编址,可由所有用户共享。与SMP不同,DSM对内存资源的共享是非对称的,因为每个节点访问本地内存与远程节点 内存时的延迟和带宽是不同的,故DSM系统属于“非一致性内存访问”(Non-Uniform Memory Access,NUMA)方式,其代表机型有SGI Origin 2000/3000、Sequent NUMA-Q、HP/Convex SPP 1600、银河三号和神威一号等。 ●大规模并行处理(Massive Parallel Processing,MPP)系统 大规模并行处理结构 由成百上千计算节点组成的并行处理计算机系统,每个计算节点配置一个或多个处理器,各个节点相对独立,有各自独立的内存模块和操作系统。MPP系统的特点 是可以获得很高的峰值运算速度,且由于系统的内存分布于各个节点,所以MPP属于“分布式内存”(Distributed Memory,DM)结构,具有易扩展性。MPP的易扩展性使其能够与SMP、DSM等结合,于是出现了SMP-MPP(各个MPP节点采用SMP并行多 处理机)和DSMMPP(各个节点采用DSM并行多处理机)等复合型超级计算机系统。MPP系统的代表机型主要有IBM SP2、Intel Paragon、CRAY T3E、曙光1000等。
●机群式超级计算机系统
机群式超级计算机结构 上世纪90年代中后期,随着Intel芯片等造价低廉的微型计算机组件的出现和网络技术的迅速发展,使采用普通微型机或工作站作为计算节点并采用高速网络 互连的并行计算系统成为了可能,超级计算机体系结构由此开始迈入工作站机群(Cluster of Workstations,COW)或工作站网络(Network of Workstations,NOW)时代。2000年以后,又出现了节点采用商用级处理器的机群系统(Cluster),以及采用SMP并行机作为计算节 点的SMP机群或星群(Constellation)。从内存访问方式上看, 机群系统采用了与MPP相同的分布式内存(DM)结构,因而具有很高的可扩展性。机群系统的代表机型有洛斯阿拉莫斯国家实验室的Avalon Cluster、ASCI Blue Mountain、深腾1800/6800和曙光2000/3000等。
当今主流:机群式超级计算机概况 机群式超级计算机系统具有结构灵活、通用性强、安全性高、易于扩展、高可用性和高性价比等诸多优点,所以目前新建的超级计算机大都使用这种结构,只不过在具体采用的节点机型、拓扑结构及互连技术会有所不同。
机群式系统的基本组成 高性能计算专业网站TOP500的全球超级计算机500强排名中,机群式系统所占比率连年上升,现已达到83%以上。机群是采用高速网络将大量的节点相互 连接起来的系统,每个机群节点都是一个配置有处理器、内存、I/O设备、网卡和操作系统的计算机,各个节点以协同方式并行完成计算任务。机群系统与MPP 一样,也是属于分布式内存结构,因而具有很强的可扩展性。具体而言,机群系统主要由节点计算机、高速互连网络、操作系统、单一系统映像等中间件、并行编程 环境和应用程序等部分组成。
●机群节点的计算机 机群节点可以灵活采用高性能的微型机、工作站或SMP并行机等,节点机处理器的处理性能是影响机群系统整体性能的一个最关键的因素。理论上节点机处理器的主频和浮点运算速度是决定机群计算速度的主要因素(见后面介绍的峰值速度计算公式)。
由于图形加速处理器(GPU)具有很强的浮点和向量(矩阵数组)计算能力,所以在机群中采用一定数量以GPU作为处理器的计算加速节点,将能提升机群的性 能,例如“天河一号”就采用GPU加速节点并提升了GPU的计算效率,实现了CPU与GPU融合的异构协同计算。
●机群的互联技术 机群系统一般可以采用高带宽的以太网、异步传输模式(ATM)、可扩展一致性接口(SCI)、QsNet、Myrinet和InfiniBand等网络技 术实现节点机的互连,其中千兆/万兆级以太网、Myrinet和InfiniBand使用比较广泛,尤其是后者InfiniBand互连技术也被称为“无 限带宽”InfiniBand最初由Mellanox公司提出,是一种基于输入输出总线的通用宽带互连技术,原本是为了解决因PCI等并行总线结构速度较 慢而导致的服务器CPU输入输出瓶颈问题,这种瓶颈制约了服务器与存储设备、网络节点、其它服务器之间的通信能力,但由于InfiniBand非常适合于 高性能计算系统,所以后来便成为一种广泛应用于超级计算机系统的开放性高速互连网络技术标准。
InfiniBand规范中定义了交换机、通道适配卡、线缆和子网管理器等标准设备,InfiniBand交换机在各个节点、各种设备之间建立点对点的串 行连接并进行流量控制,可有效避免数据流量的阻塞。基于交换方式的点对点的串行连接使InfiniBand网络具有极强的可扩展性,一个网络可有数千个子 网(Subnet)组成,每个子网有一个子网管理器、可支持上万个节点,这种子网架构实现了更有效的分散管理。 InfiniBand体系架构模型 InfiniBand采用串行双向数据传输方式,利用多路复用信号传输技术可实现并发的多通道数据传送,单个InfiniBand连接通道的线缆由4根信 号线组成、可达2.5GB/s的基本传输速率,通过增加信号线数目并将多个通道组合成一个端口,就能使传输带宽成倍增加,最新的4倍数据率 (QDR)InfiniBand已达到了10Gb/s的通道基本传输率,在1、4、12倍通道连接模式可使传输带宽分别达到10Gb/s、40Gb/s、 120Gb/s的传输带宽。目前,InfiniBand在超级计算机的应用日益广泛,例如2009 China HPC TOP 10排名中有5套超级计算机都采用了InfiniBand互连技术,包括排名前2位的“天河一号”和“曙光5000A”。
机群的软件系统 超级计算机除了具备非常强大的计算能力,对操作系统以及软件的要求也比较高。 ●节点机操作系统 操作系统为机群提供支持环境,决定了节点机之间的交互方式,应具备较强的适应性和稳定性,机群采用的操作系统主要有Linux、Sun Solaris UNIX和Windows NT等。其中,Linux因具有支持多种硬件平台、对系统资源的低占用率、开放代码、高安全性、稳定性和可靠性等诸多优点,特别是Linux提供了大量节 点并行计算系统所需的标准消息传递机制(如后面介绍的MPI等)和高性能网络支持,使其在越来越多的机群系统中被广为采用。
●SSI和HA等中间件 机群系统是由大量节点计算机组成的并行处理系统,但从机群用户和程序员的角度而言,最好能使结构复杂的机群像一台计算机一样便于使用和管理,具有单机式的 管理控制、单一的地址空间和单一的文件系统等特性,以有效降低用户操作和程序员编程的复杂度,即具有“单一系统映像”(Single System Image,SSI)特性。
SSI由相应的机群中间件实现,所谓的机群中间件(Middleware)是指在上层连接各个节点机的操作系统、实现对机群系统资源和网络通信等进行有效 控制和管理的软件系统或服务程序, 并且能提供便于用户管理和配置系统的图形化操作界面的接口。除了SSI之外,机群一般还有“高可用性”(High Availability,HA)管理等中间件,HA用来快速检测和排除机群系统的故障点,以确保系统能可靠地连续运行。
●并行编程环境 适用于机群、MPP等分布式内存结构的并行编程环境,通常可由“并行虚拟机”(Parallel Virtual Machine,PVM)或“消息传递接口”(Message Passing Interface,MPI)等来实现。利用PVM工具,可以把互连的各种计算机虚拟为一台并行机,从而为编程人员提供了一个便于管理和使用的编程环境, 而由PVM的编译库对程序进行转换,将程序的计算任务分解为若干子任务后合理分配到各个节点机进行并行处理。MPI是一种基于消息传递的并行计算规范,消 息(Message)一般包括数据、指令或其它各种控制信号等,MPI提供了一套消息传递库,基于消息传递的并行编程实际上就是通过调用MPI的消息传递 库函数实现节点机