超级计算机技术
超级计算技术的基本原理与使用教程详解

超级计算技术的基本原理与使用教程详解超级计算技术是一种高性能计算技术,能够在极短的时间内完成大规模的复杂计算任务。
它在科学研究、工程设计、天气预报、医学研究等领域有着广泛的应用。
本文将详细介绍超级计算技术的基本原理,并提供一个使用教程,帮助读者更好地理解和应用这一技术。
超级计算技术的基本原理:1. 并行计算:超级计算机通过同时运行多个处理器来实现并行计算。
它将复杂的计算任务分解成多个小任务,每个处理器负责处理其中一个小任务,然后将计算结果合并得到最终结果。
这种并行计算的方式大大提高了计算速度和计算能力。
2. 分布式存储:超级计算机通常拥有庞大的存储系统,将数据分布存储在多个硬盘中。
这种分布式存储的方式可以提高数据的读写速度,并且能够保证数据的可靠性和容错性。
3. 高速网络:超级计算机通过高速网络连接各个处理器和存储设备,以实现数据的快速传输和处理。
高速网络的使用可以减少数据传输的延迟和通信瓶颈,提高计算效率。
4. 并行编程模型:为了充分发挥超级计算机的计算能力,需要使用并行编程模型来编写并行程序。
常用的并行编程模型包括MPI(Message Passing Interface)和OpenMP(Open Multi-Processing)。
通过这些编程模型,程序员可以将复杂的计算任务分解成多个并行的子任务,进而提高计算效率。
超级计算技术的使用教程:1. 了解计算需求:在使用超级计算技术之前,首先需要明确自己的计算需求。
确定需要解决的问题是什么,计算的规模是多大,所需的计算资源是多少等。
这些信息将有助于选择合适的超级计算机和并行编程模型。
2. 选择超级计算机:根据计算需求选择合适的超级计算机。
可以通过查询超级计算机的性能指标、计算能力和可用资源等信息,来进行选择。
对于大规模的计算任务,需要注意超级计算机的并行计算能力和存储资源是否足够。
3. 编写并行程序:选择合适的并行编程模型,根据计算需求编写并行程序。
超级计算机技术的发展和应用

超级计算机技术的发展和应用一、超级计算机技术的发展概述超级计算机是指具有数以万亿次计算能力,并具有大规模集成、高速运算、高可靠性等特点的计算机。
其历史可以追溯到20世纪60年代,当时美国NASA为了开展太空探索活动而开发了第一台超级计算机Cray-1。
此后,超级计算机在科学研究领域的应用逐渐增多,成为推动各个行业尤其是科学研究领域发展的重要力量。
二、超级计算机技术的发展方向目前,超级计算机技术发展的方向主要集中在以下几个方面:1.高性能并行计算:采用多处理器和大规模并行结构,实现多任务、多线程同时运算,实现高容错、高可扩展性的计算。
2.大规模数据存储和处理:数据爆发式增长和高速传输的需求,使得超级计算机需要具备可扩展存储系统和高效的数据传输、处理、索引等功能。
3.节能降耗:依靠更先进的芯片设计、更优化的机器架构、系统管理和调度等技术,全面提高超级计算机的能效比和各种设备的可靠性,实现长期、稳定地运行。
4.新型计算模式:基于量子计算、人工智能等技术研究的新型计算模式,正在改变传统计算机的结构和技术,为超级计算机的发展提供了新的契机。
三、超级计算机技术的应用领域由于超级计算机所具备的计算能力和存储能力,使其有着极为广泛的应用领域,下面列举几个典型的应用领域:1.气象预测:超级计算机被广泛用于气象预测领域,可以通过大规模的数据分析和处理,提供更加准确的天气、风暴、洪灾等预警信息,有助于提高人们的安全防范意识和应对能力。
2.航空航天:超级计算机可以运用在航空航天领域,模拟飞行器的气动特性、飞行控制、空气动力学等,细致地研究和测试各种航空航天系统和设备。
3.地震预测:超级计算机可以在地震预测领域发挥重要作用,通过海量的地震数据和模拟实验,快速、准确地预测和预报地震和地质灾害,有效地减少损失。
4.医学研究:超级计算机可以在生物医学领域发挥重要作用,可以帮助科学家在疾病诊断、药物研发等方面提供大量的数据分析和处理,进一步加速新型药物的研发和临床应用。
超级计算机的核心技术与应用

超级计算机的核心技术与应用超级计算机是一种能够完成大规模的数值计算,复杂的图像处理以及重要科学研究的高性能计算机。
超级计算机是现代科学技术的重要基石,它为人类社会带来了重大的历史性贡献。
一、超级计算机的核心技术超级计算机的核心技术主要包括三个方面:硬件技术、软件技术以及应用技术。
其中,硬件技术包括高性能处理器、高速存储设备、高速输入输出设备以及高性能网络等。
软件技术包括并行编程技术以及高性能算法和数据结构等。
应用技术包括超级计算机的在天气预报、航空航天、基因组学、地震模拟以及物理学等领域的应用。
高性能处理器是超级计算机的核心之一,它的性能取决于处理器的计算能力以及存储和带宽的速度。
目前,超级计算机的处理器采用多核心的设计,能够实现大规模并行计算。
同时,超级计算机的处理器还采用了先进的指令集,支持向量化计算和流水线技术,提高了处理器的运算速度。
高速存储设备是超级计算机性能的另一个关键因素。
超级计算机要求存储设备能够快速读取和写入数据,达到高速的输入输出要求。
目前,超级计算机的存储设备包括高速存储器、固态硬盘和磁盘阵列等。
高速输入输出设备是超级计算机中处理数据的重要组成部分。
高速输入输出设备能够快速地传送数据,提高了数据的处理和运算速度。
高性能网络是超级计算机中的另一个核心技术。
网络的带宽和延迟对于超级计算机的性能有很大的影响。
高性能网络能够实现超级计算机节点之间的快速通信。
并行编程是超级计算机中的另一个核心技术。
并行编程是一种分布式编程技术,能够将任务分解成多个子任务,并在不同的处理器上并行地执行。
这种技术能够提高超级计算机的效率和性能。
高性能算法和数据结构是超级计算机中的另一个关键因素。
高性能算法和数据结构能够有效地利用计算资源,实现高效的计算,能够优化代码结构,提高算法的执行速度和效率。
二、超级计算机的应用超级计算机在科学研究和应用领域有着广泛的应用。
下面列举一些超级计算机的应用领域:1、天气预报超级计算机在天气预报领域具有很高的应用价值。
超级计算机技术的发展及其应用

超级计算机技术的发展及其应用随着科技的不断进步,计算机技术的快速发展也成为了当前时代的热点话题。
其中,超级计算机技术的发展成为了人们关注的焦点。
本文将从超级计算机技术的概念、演化历程、发展现状及其应用等方面进行探讨。
一、超级计算机技术的概念超级计算机技术(Supercomputing)是一种运算能力极强,功能强大的计算机系统,主要用于执行海量数据、复杂模拟和数值计算任务等。
通常,超级计算机以向量计算和并行计算为基础,其计算速度可以达到每秒数万亿次或甚至更快,是目前计算机技术中最高端的代表。
二、超级计算机技术的演化历程超级计算机技术从20世纪60年代开始发展,并经历了多个发展阶段。
早期的超级计算机主要采用向量计算结构,性能较强,但由于硬件成本较高,难以被广泛应用。
1980年代末,超级计算机技术开始进入并行计算阶段,计算速度大幅提高。
随着处理器密度的上升,超级计算机的内部结构逐渐转向多核心、多处理器结构,各处理单元之间协同作用,性能更加优越。
2000年代,超级计算机又开始采用异构计算结构,通过CPU和GPU的协同计算,提高计算速度和效率。
当前,超级计算机正逐步向更高端的领域发展,涉及机器学习、人工智能等方面,成为很多重大科学问题和工程计算的重要手段。
三、超级计算机技术的发展现状目前,超级计算机已经发展到第三代阶段,采用异构计算结构,如美国能源部开发的“顶点”(Summit)超级计算机,采用了多达4608颗IBM POWER9处理器和27000多个Nvidia V100 Tensor Core GPU,总计算能力高达200万亿次。
此外,中美、欧洲等地的多个国家和地区也在积极发展超级计算机。
超级计算机在大气环境模拟、材料科学、医学、生物学、天体物理学等领域有着广泛的应用,如全球气候模拟、天体演化、新药研发等。
当前,超级计算机在人工智能等领域也扮演着重要的角色。
四、超级计算机技术的应用1.天文学超级计算机在天文学中的应用,主要表现在模拟天体的形态、演化和长期变化的研究。
超级计算机技术:现状、挑战与未来

超级计算机技术:现状、挑战与未来
一、引言
随着科技的飞速发展,超级计算机已经成为现代社会不可或缺的一部分。
它们在科研、工业、军事等领域发挥着重要作用,为人类带来了前所未有的便利和进步。
本文将探讨超级计算机技术的现状、挑战以及未来发展趋势。
二、超级计算机技术现状
1.硬件技术
目前,超级计算机的硬件技术已经取得了长足的进步。
从早期的单处理器到现在的多处理器系统,再到分布式计算和云计算,超级计算机的硬件架构不断优化,性能不断提升。
同时,随着半导体技术的不断发展,处理器芯片的集成度越来越高,功耗越来越低,为超级计算机的性能提升提供了有力支持。
2.软件技术
超级计算机的软件技术也日益成熟。
操作系统、编程语言、并行计算框架等软件技术的发展为超级计算机的应用提供了便利。
例如,Linux操作系统的普及为超级计算机的稳定运行提供了保障;MPI、OpenMP等并行计算框架的广泛应用为超级计算机的并行计算提供了支持;深度学习框架如TensorFlow、PyTorch等的出现为超级计算机在人工智能领域的应用提供了可能。
三、超级计算机面临的挑战。
超级计算机技术解析

超级计算机技术解析随着科技的不断发展,超级计算机技术也得到了飞速的发展,成为推动人类进步的主要力量之一。
超级计算机技术可以被视为计算机领域中的顶尖技术,而其在各个领域的应用也可以被视为人类智慧和科学技术发展的结晶。
超级计算机是如何定义的?首先,我们需要了解什么是超级计算机。
在计算机领域中,超级计算机通常是指性能高于一般计算机的计算机。
其机器性能以浮点运算速度(FLOPS)为单位进行测量。
1FLOPS即表示每秒钟能够进行一次浮点运算。
一般而言,超级计算机的性能可以达到单精度浮点运算百万亿次(petascale)级别,甚至可以达到百万亿亿次(exascale)级别。
超级计算机技术的应用领域超级计算机技术不仅有利于科学领域的研究,也对人类社会的发展有着显著的推动作用。
以下是超级计算机技术在各个领域的应用:1.科学研究:超级计算机可以帮助科学家在分子结构、天体物理学、气候变化等领域开展复杂的数值模拟和分析,进而加深人们对自然现象的理解。
2.制药研发:利用超级计算机,可以对药物分子进行模拟计算,以寻找新的药物设计思路和理解药物设计的结构与功能之间的关联性,从而更加高效地进行药物研发。
3.数值计算:超级计算机能够解决领域中最棘手的计算问题,如气候变化、流体力学、结构力学等。
4.金融业:超级计算机可以在股市、期货等领域进行复杂的数据分析,从而提高投资决策的准确性。
5.军事应用:超级计算机可以在核武器设计、情报分析等领域进行应用,加强国家安全保障。
超级计算机技术的发展现状当前,超级计算机技术的研究方向主要分为两个:提高计算机性能的硬件技术和提高计算机并行计算效率的软件技术。
在硬件方面,超级计算机的发展方向主要是提高计算机的可扩展性、能耗效率和实用性等方面的提高。
超级计算机未来将会采用更加先进的处理器芯片、更多的内存等硬件设备来提高机器的性能和运算速度。
而在软件方面,超级计算机技术需要进一步开发并行运算优化软件,以提高机器的运行效率。
超级计算机技术的发展历程及应用案例

超级计算机技术的发展历程及应用案例超级计算机是指运算速度极快、运算能力极强的计算机。
从20世纪50年代开始,人类就开始进入了计算机时代,并不断地追逐着计算速度、运算能力更高的计算机。
70年代末,超级计算机迎来了它的Golden Age,成为那个时代计算能力的代表。
本文将带你回顾一下超级计算机技术的发展历程以及应用案例。
一、超级计算机技术的发展历程1. 第一代超级计算机第一代超级计算机出现在20世纪60年代。
当时,美国国防部为了解决国防科技问题,开始了计算机领域的研究工作。
1964年,美国控制数据公司生产了CDC6600号计算机,成为第一代超级计算机。
这台计算机的运算速度达到了当时最快的3百万次每秒,它的出现震惊了全世界。
2. 第二代超级计算机第二代超级计算机在70年代末出现。
美国开始大量投资超级计算机的研究,美国国家标准技术研究所与国家航空航天局合作研发的Cray-1号采用了全新的向量技术,可以实现处理极大数据集和复杂模型的应用。
它的运算速度达到了当时最快的80亿次每秒,成为了当时最快的计算机。
3. 第三代超级计算机第三代超级计算机在80年代末出现。
日本的NEC公司和富士通公司开始大力发展超级计算机,与此同时,美国的Cray公司也在研发自己的新一代超级计算机。
在当时,最强的超级计算机是NEC公司推出的SX-3,在1990年代初,它的运算速度已经达到了11亿次每秒。
4. 第四代超级计算机第四代超级计算机出现在21世纪初。
凭借在半导体芯片制造技术上的突破,超级计算机变得更加具有实用价值。
2004年,中国的天河一号成为世界上第一台没有使用美国芯片技术的超级计算机,它的运算能力达到了每秒340万亿次。
5. 第五代超级计算机第五代超级计算机是我们目前所在的时代。
它们的运算能力已经达到了10亿亿次每秒的级别,也被称为“万亿次计算机”。
目前世界上最快的超级计算机是中国的神威太湖之光。
二、超级计算机的应用案例超级计算机的应用案例是非常广泛的,下面我们就来看几个例子。
超级计算机技术的应用与发展前景

超级计算机技术的应用与发展前景超级计算机指的是能够进行大规模高速计算的计算机,它具有超强的处理能力和存储能力。
超级计算机被广泛应用于科学研究、工程设计、医学诊断、气象预测等领域,对促进科学技术的发展和人类社会的进步具有重要意义。
一、超级计算机技术的应用领域1.科学研究超级计算机在科学研究中的应用十分广泛,如天文学、物理学、化学、生物学等。
它可以模拟自然现象、开展数值计算和仿真实验,促进科学家们对各种自然现象的认识和理解。
举例来说,超级计算机可以用来模拟黑洞、宇宙演化、气象变化、空气动力学等。
2.工程设计超级计算机在工程设计领域的应用也十分广泛,如航空航天、汽车制造、建筑设计等。
它可以帮助设计师们进行设计方案的优化,降低产品研发成本和时间,提高产品质量和性能。
3.医学诊断超级计算机在医学领域的应用也十分重要,如基因组学、蛋白质结构预测、药物研发等。
它可以帮助医学研究人员进行更加准确和精细的医学研究和诊断,提高治疗效果和患者的生存率。
4.气象预测超级计算机在气象领域的应用也是十分关键的一环,它可以帮助气象学家们进行气象预测和灾害预报,提前做好防灾减灾措施,降低人民群众的损失。
二、超级计算机技术的发展前景超级计算机技术的发展前景非常广阔,主要体现在以下几个方面。
1.硬件和软件技术的提升一方面,随着芯片工艺的不断进步,超级计算机的硬件配置将会越来越高。
超级计算机可能采用更加先进的处理器、存储器、互连等技术,可以实现更加快速和可靠的计算。
另一方面,随着超级计算机计算规模的不断扩大,对于计算和存储的软件需求也会随之增加。
例如,能够更好地协调计算和存储的软件系统、更加智能的数据管理和调度系统,都将是未来超级计算机技术发展的趋势。
2.应用领域的拓展目前,超级计算机的应用领域主要集中在科学、工程、医学和气象等领域。
未来,随着社会的不断发展,超级计算机在人工智能、金融、物流等领域也将会逐步渗透,为这些领域带来更加高效、准确的决策。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录你应该知道的超级计算机 (2)超级计算机的五大形态 (2)当今主流:机群式超级计算机概况 (5)机群的软件系统 (8)衡量机群的计算性能的指标 (9)试试看,构建一个低成本的小型机群系统! (9)“天河一号”的硬件与软件系统有啥不同? (10)超级计算机都有哪些用武之地? (13)写在最后:超级计算机的未来征程 (15)在去年10月底,长沙举办的中国高性能计算学术年会上,国防科技大学研制的千万亿次超级计算机“天河一号”成为焦点,这是我国国内计算能力最高的超级计算机,而且标志着我国超级计算机的研发能力成功实现了千万亿次计算的跨越。
超级计算机不仅体现了一个国家战略性高技术的发展水平,也是与科技创新、国计民生密切相关的重要基础设施。
超级计算机的各种应用,实际上会以不同的方式影响到我们每个人,这些似乎遥不可及的超级计算机实际上离我们“非常近”。
你应该知道的超级计算机目前各种超级计算机的高速处理能力基本上都是利用并行体系结构实现的,并行计算(Parallel Computing)已成为提高处理性能的关键技术之一。
简单地讲,并行计算技术就是用同时运行的多个处理机或计算机来处理同一任务,从而大幅度提高任务的处理速度、缩短了任务的处理时间。
超级计算机的五大形态在超级计算机技术的发展历程中,先后出现过多种超级计算机并行体系结构,主要有如下5种。
●并行向量处理(Parallel Vector Processing,PVP)系统并行向量处理结构采用一定数量的、并行运行的向量处理器和共享式内存(Shared Memory,SM)结构的计算机系统。
PVP系统的SM结构,也就是采用高带宽的交叉开关将各个向量处理器与其共享的内存模块连接。
向量处理器(Vector Processor)的一条指令能够同时对多个数据项(向量矩阵)执行运算,而一般的通用CPU属于标量处理器(Scalar Processor),每次只能对一个数据项进行处理。
其代表机型有Cray XMP、Cray YNP、NEC SX2、我国的银河一号和二号等。
●对称式多处理(Symmetric Multi Processing,SMP)系统对称式多处理结构采用一定数量、并行运行的微处理器和共享式内存(SM)结构的计算机系统,各处理器通过系统总线或交叉开关连接共享的内存模块,可“均等”或“对称”地共享内存和其它系统资源并由同一操作系统管理,提高整个系统的数据处理能力,因此SMP属于“一致性内存访问”(Uniform Memory Access,UMA)方式,SMP的代表机型有IBM R50、SGI Power Chal lenge、Sun SPARC Center 2000、曙光一号等。
●分布式共享内存(DistributedShared Memory,DSM)系统分布式共享内存结构由一定数量的并行处理节点(Node)组成,每个节点都是一个相对完整的计算单元(配置有处理器和内存模块),各节点通过高速网络互连,系统由单一操作系统管理,分布于各个节点的全部内存被统一编址,可由所有用户共享。
与SMP不同,DSM对内存资源的共享是非对称的,因为每个节点访问本地内存与远程节点内存时的延迟和带宽是不同的,故DS M系统属于“非一致性内存访问”(Non-Uniform Memory Access,NUMA)方式,其代表机型有SGI Origin 2000/3000、Sequent NUMA-Q、HP/Convex SPP 1600、银河三号和神威一号等。
●大规模并行处理(Massive Parallel Processing,MPP)系统大规模并行处理结构由成百上千计算节点组成的并行处理计算机系统,每个计算节点配置一个或多个处理器,各个节点相对独立,有各自独立的内存模块和操作系统。
MPP系统的特点是可以获得很高的峰值运算速度,且由于系统的内存分布于各个节点,所以MPP属于“分布式内存”(Di stributed Memory,DM)结构,具有易扩展性。
MPP的易扩展性使其能够与SMP、DSM 等结合,于是出现了SMP-MPP(各个MPP节点采用SMP并行多处理机)和DSMMPP(各个节点采用DSM并行多处理机)等复合型超级计算机系统。
MPP系统的代表机型主要有IBM SP2、Intel Paragon、CRAY T3E、曙光1000等。
●机群式超级计算机系统机群式超级计算机结构上世纪90年代中后期,随着Intel芯片等造价低廉的微型计算机组件的出现和网络技术的迅速发展,使采用普通微型机或工作站作为计算节点并采用高速网络互连的并行计算系统成为了可能,超级计算机体系结构由此开始迈入工作站机群(Cluster of Workstations,C OW)或工作站网络(Network of Workstations,NOW)时代。
2000年以后,又出现了节点采用商用级处理器的机群系统(Cluster),以及采用SMP并行机作为计算节点的SMP机群或星群(Constellation)。
从内存访问方式上看,机群系统采用了与MPP相同的分布式内存(D M)结构,因而具有很高的可扩展性。
机群系统的代表机型有洛斯阿拉莫斯国家实验室的Av alon Cluster、ASCI Blue Mountain、深腾1800/6800和曙光2000/3000等。
当今主流:机群式超级计算机概况机群式超级计算机系统具有结构灵活、通用性强、安全性高、易于扩展、高可用性和高性价比等诸多优点,所以目前新建的超级计算机大都使用这种结构,只不过在具体采用的节点机型、拓扑结构及互连技术会有所不同。
机群式系统的基本组成高性能计算专业网站TOP500的全球超级计算机500强排名中,机群式系统所占比率连年上升,现已达到83%以上。
机群是采用高速网络将大量的节点相互连接起来的系统,每个机群节点都是一个配置有处理器、内存、I/O设备、网卡和操作系统的计算机,各个节点以协同方式并行完成计算任务。
机群系统与MPP一样,也是属于分布式内存结构,因而具有很强的可扩展性。
具体而言,机群系统主要由节点计算机、高速互连网络、操作系统、单一系统映像等中间件、并行编程环境和应用程序等部分组成。
●机群节点的计算机机群节点可以灵活采用高性能的微型机、工作站或SMP并行机等,节点机处理器的处理性能是影响机群系统整体性能的一个最关键的因素。
理论上节点机处理器的主频和浮点运算速度是决定机群计算速度的主要因素(见后面介绍的峰值速度计算公式)。
由于图形加速处理器(GPU)具有很强的浮点和向量(矩阵数组)计算能力,所以在机群中采用一定数量以GPU作为处理器的计算加速节点,将能提升机群的性能,例如“天河一号”就采用GPU加速节点并提升了GPU的计算效率,实现了CPU与GPU融合的异构协同计算。
●机群的互联技术机群系统一般可以采用高带宽的以太网、异步传输模式(ATM)、可扩展一致性接口(S CI)、QsNet、Myrinet和InfiniBand等网络技术实现节点机的互连,其中千兆/万兆级以太网、Myrinet和InfiniBand使用比较广泛,尤其是后者InfiniBand互连技术也被称为“无限带宽”InfiniBand最初由Mellanox公司提出,是一种基于输入输出总线的通用宽带互连技术,原本是为了解决因PCI等并行总线结构速度较慢而导致的服务器CPU输入输出瓶颈问题,这种瓶颈制约了服务器与存储设备、网络节点、其它服务器之间的通信能力,但由于Infini Band非常适合于高性能计算系统,所以后来便成为一种广泛应用于超级计算机系统的开放性高速互连网络技术标准。
InfiniBand规范中定义了交换机、通道适配卡、线缆和子网管理器等标准设备,Infini Band交换机在各个节点、各种设备之间建立点对点的串行连接并进行流量控制,可有效避免数据流量的阻塞。
基于交换方式的点对点的串行连接使InfiniBand网络具有极强的可扩展性,一个网络可有数千个子网(Subnet)组成,每个子网有一个子网管理器、可支持上万个节点,这种子网架构实现了更有效的分散管理。
InfiniBand体系架构模型InfiniBand采用串行双向数据传输方式,利用多路复用信号传输技术可实现并发的多通道数据传送,单个InfiniBand连接通道的线缆由4根信号线组成、可达2.5GB/s的基本传输速率,通过增加信号线数目并将多个通道组合成一个端口,就能使传输带宽成倍增加,最新的4倍数据率(QDR)InfiniBand已达到了10Gb/s的通道基本传输率,在1、4、12倍通道连接模式可使传输带宽分别达到10Gb/s、40Gb/s、120Gb/s的传输带宽。
目前,Infin iBand在超级计算机的应用日益广泛,例如2009 China HPC TOP 10排名中有5套超级计算机都采用了InfiniBand互连技术,包括排名前2位的“天河一号”和“曙光5000A”。
机群的软件系统超级计算机除了具备非常强大的计算能力,对操作系统以及软件的要求也比较高。
●节点机操作系统操作系统为机群提供支持环境,决定了节点机之间的交互方式,应具备较强的适应性和稳定性,机群采用的操作系统主要有Linux、Sun Solaris UNIX和Windows NT等。
其中,Linux因具有支持多种硬件平台、对系统资源的低占用率、开放代码、高安全性、稳定性和可靠性等诸多优点,特别是Linux提供了大量节点并行计算系统所需的标准消息传递机制(如后面介绍的MPI等)和高性能网络支持,使其在越来越多的机群系统中被广为采用。
●S SI和HA等中间件机群系统是由大量节点计算机组成的并行处理系统,但从机群用户和程序员的角度而言,最好能使结构复杂的机群像一台计算机一样便于使用和管理,具有单机式的管理控制、单一的地址空间和单一的文件系统等特性,以有效降低用户操作和程序员编程的复杂度,即具有“单一系统映像”(Single System Image,SSI)特性。
SSI由相应的机群中间件实现,所谓的机群中间件(Middleware)是指在上层连接各个节点机的操作系统、实现对机群系统资源和网络通信等进行有效控制和管理的软件系统或服务程序,并且能提供便于用户管理和配置系统的图形化操作界面的接口。
除了SSI之外,机群一般还有“高可用性”(High Availability,HA)管理等中间件,HA用来快速检测和排除机群系统的故障点,以确保系统能可靠地连续运行。
●并行编程环境适用于机群、MPP等分布式内存结构的并行编程环境,通常可由“并行虚拟机”(Parall el Virtual Machine,PVM)或“消息传递接口”(Message Passing Interface,MPI)等来实现。