天津大学并行计算1

合集下载

基于SketchUp建筑性能模拟软件的介绍与展望

基于SketchUp建筑性能模拟软件的介绍与展望

基于SketchUp建筑性能模拟软件的介绍与展望高莹;侯寰宇;吴伟东【摘要】方案设计阶段的建筑性能模拟是实现建筑低能耗目标的关键阶段,基于SketchUp的建筑性能模拟插件的应用为建筑师提供了进行建筑性能分析的可能性.实际应用中由于性能插件信息的专业性和复杂性,其在方案设计阶段的应用并不普遍.通过比较目前基于SketchUp平台的常用建筑性能模拟软件的应用特点,来探讨适应方案设计阶段的性能模拟软件开发的发展趋势.【期刊名称】《建筑技艺》【年(卷),期】2016(000)007【总页数】3页(P96-98)【关键词】SketchUp;性能模拟软件;插件;方案设计阶段【作者】高莹;侯寰宇;吴伟东【作者单位】大连理工大学建筑与艺术学院;天津大学建筑学院;天津大学建筑学院【正文语种】中文建筑性能模拟软件是预测建筑性能和设计方案优化比较有用的工具,然而大多数性能模拟都在设计的中后期进行。

虽然设计过程中绿色技术工程师介入越来越早,但在早期方案设计阶段,由于能耗模拟的专业性和复杂性,建筑师很难较好地运用能耗模拟工具辅助设计,模拟工具并未在设计的关键阶段发挥作用。

[1]随着可持续绿色建筑议题的不断深化,建筑师也在设计过程中逐渐注重建筑能耗,特别是在方案设计阶段,建筑的形体、空间和表皮都对最终的建筑性能和舒适度水平有很大的影响。

建筑的节能设计不能靠感觉来实现,与计算机辅助设计软件的广泛应用相比,建筑师对于建筑能耗模拟软件的应用还非常有限(此类软件多为具有相关专业知识的工程师所用)。

基于这种情况,许多研究者正试图将建筑能耗模拟工具的使用更贴近建筑师,理想的目标是让建筑师利用建筑能耗模拟,从项目的最初阶段就开始指导建筑设计。

迄今各国都已意识到性能模拟分析的重要性。

从20世纪60年代到今天,随着计算机技术的发展完善和能耗动态模拟分析计算方法的日趋成熟,很多国家都根据自己的特点及要求研发了建筑能耗计算程序,可以便捷地对建筑物进行全年动态模拟。

天津大学计算机学院研究生导师简介

天津大学计算机学院研究生导师简介
虚拟现实 计算机体系结构: 计算机网络、分布式系统、CSCW、并行计算、网络信息
安全
当前工作
正在主持的科研项目有: 国家自然科学基金项目:“实时体绘制关键技术及支撑体系结构研究” 国家自然科学基金项目:“3D 水墨画效果仿真绘制技术的研究” 天津市重点科技攻关项目:“大规模网络入侵检测软件系统的研究与开发” 天津市重点科技攻关项目:“支持 ERP 的中间件与组件系统” 天津市自然科学基金重点项目:“支持工业造型设计的关键技术与软件工具” 天津市社会发展计划项目:“特大城市公共危机应急指挥体系及核心技术” 美国 IBM/SUR 项目:“基于计算机集群的图形引擎系统研究”
学术兼职 中国计算机学会模式识别与人工智能专委会委员
(1)人工智能应用基础:
包括机器学习,自动推理,草图理解
近年主要研 (2)智能软件与环境:
究方向简介
多 Agent 系统理论与模型,新型计算环境和开发平台
(3)计算机应用和知识工程:
机器视觉检测,基于内容检索,基于知识的系统
当前工作
(1)人工智能应用基础 (2)智能软件与环境
实时计算机应用 核领域计算机应用要求实时性强,自动化程度高,信号形式复杂 多样,既有连续运行方式,也有脉冲运行方式,数据流的脉冲峰 值可达 GB/S 级,且要求系统具有灵活性,能在强干扰条件下可靠 工作.研究内容包括:系统体系结构,并行处理,分布式系统与计 算机网络;系统软件结构,实时操作系统;实时数据库;接口总 线;信息处理,数据分析变换,特殊要求下的图形,图象(静动)显 示技术以及数算机科学与技术系导师基本情况
姓名
舒炎泰
性别

出生年月
42.9
导师类型 博导,硕导
学 位 研究生毕业 职称/职务 教授,博导

天津大学并行计算4

天津大学并行计算4

17/2/28
http://cs.tju.eቤተ መጻሕፍቲ ባይዱ/orgs/hpclab/
China Research Laboratory
编译制导语句(Compiler Directive)
§ 并行域 § 共享任务 § 同步 § 数据域
– threadprivate – 数据域属性子句
17/2/28
#pragma omp sections [ clause[[,]clause]…] newline { [#pragma omp section newline] … [#pragma omp section newline] … }
17/2/28
/orgs/hpclab/
China Research Laboratory
Sections编译制导语句
§ clause=
– private (list) – firstprivate (list) – lastprivate (list) – reduction (operator: list) – nowait
§ 在sections语句结束处有一个隐含的路障,使用了 nowait子句除外
• if(scalar-expression) • private(list) • firstprivate(list) • default(shared | none) • shared(list) • copyin(list) • reduction(operator: list) • num_threads(integer-expression)
17/2/28
/orgs/hpclab/
China Research Laboratory
Sections编译制导语句

新工科背景下计算机本科专业人才“并行计算”思维与能力培养途径的探索

新工科背景下计算机本科专业人才“并行计算”思维与能力培养途径的探索

新工科背景下计算机本科专业人才“并行计算”思维与能力培养途径的探索1. 引言1.1 背景介绍在新工科背景下,计算机本科专业人才的培养逐渐成为教育界关注的热点。

随着信息技术的快速发展和应用领域的不断拓展,计算机本科专业人才的需求量也在不断增加。

传统的计算机专业教育往往难以满足行业的实际需求,尤其是在并行计算领域,学生缺乏相关的思维和能力。

针对新工科背景下计算机本科专业人才的培养,尤其是在并行计算方面的思维和能力,已经成为一个亟待解决的问题。

只有通过深入探讨并实践相应的培养途径,才能更好地培养出适应行业需求的计算机专业人才。

1.2 问题提出在当前新工科背景下,计算机本科专业人才的培养已经成为一个亟待解决的重要问题。

随着科技的不断发展和应用领域的不断拓展,传统的计算机专业教育已经不能满足行业的需求。

其中一个重要问题就是如何培养具有并行计算思维和能力的人才。

.并行计算在当今的科技领域中扮演着至关重要的角色,可以大大提高计算效率和性能。

传统的计算机教育往往忽视了并行计算的重要性,导致学生在毕业后缺乏必要的并行计算思维和能力。

这不仅影响了他们在工作中的表现,也影响了整个行业的发展进步。

我们亟需探索一种适合新工科背景下的计算机本科专业人才“并行计算”思维与能力培养途径。

这不仅是为了满足行业的需求,也是为了培养更加优秀的计算机专业人才,推动整个行业的持续发展。

接下来,我们将从不同的角度对这一问题展开讨论,探索最佳的解决方案。

1.3 研究意义在新工科背景下,计算机本科专业人才“并行计算”思维与能力的培养途径具有重要的研究意义。

随着信息技术的快速发展和应用,计算机本科专业人才在并行计算方面的需求日益增加。

并行计算已成为处理大数据、人工智能、云计算等领域中不可或缺的技术手段,因此培养具备并行计算思维与能力的人才对于满足社会对计算机专业人才的需求具有重要意义。

加强对并行计算思维与能力的培养也有助于提升计算机本科专业人才的综合竞争力。

并行计算与高性能计算

并行计算与高性能计算

并行计算与高性能计算近年来,随着计算机技术的不断发展,人们对计算效率的要求也越来越高。

并行计算和高性能计算作为解决效率问题的重要手段,正在被广泛应用于科学研究、工程设计等领域。

本文将对并行计算与高性能计算进行探讨,并分析其在实际应用中的优势和挑战。

一、并行计算的概念和原理1.1 并行计算的定义并行计算是指将一个计算任务划分为多个子任务,并通过多个处理单元同时进行计算的一种计算模式。

它可以大幅提高计算效率。

1.2 并行计算的原理并行计算依赖于处理器的并行能力和通信机制。

多个处理单元可以同时执行不同的子任务,通过互联网络进行通信和数据交换。

二、高性能计算的概念和特点2.1 高性能计算的定义高性能计算是指利用最新的硬件和软件技术,通过提高计算机的运算速度和数据处理能力,实现大规模、复杂问题的高效求解。

2.2 高性能计算的特点高性能计算具有运算速度快、存储容量大、并行处理能力强等特点。

它能够应对复杂问题的计算需求,并提供准确、高效的计算结果。

三、并行计算与高性能计算的关系3.1 并行计算是高性能计算的重要手段并行计算是实现高性能计算的重要手段之一。

通过充分利用并行计算的特点,可以提高计算任务的并行度,从而提高计算效率和性能。

3.2 高性能计算与并行计算相辅相成高性能计算依赖于并行计算的技术支持。

并行计算可以通过划分任务、优化算法等方法,提高高性能计算的效率和性能。

四、并行计算与高性能计算的应用案例4.1 科学研究领域在物理学、化学、天文学等科学研究领域,通过并行计算和高性能计算,可以模拟和计算复杂的物理过程,加速科学研究的进程。

4.2 工程设计领域在航空航天、汽车制造等工程设计领域,通过并行计算和高性能计算,可以对复杂的结构和流体进行数值模拟,提高产品的性能和安全性。

五、并行计算与高性能计算面临的挑战5.1 算法设计与优化并行计算和高性能计算需要设计和优化适合并行计算环境的算法,以提高计算效率和性能。

5.2 数据分布与通信开销在并行计算过程中,数据的分布和通信开销是一个关键问题。

2021年天津大学数据科学与大数据技术专业《计算机组成原理》科目期末试卷B(有答案)

2021年天津大学数据科学与大数据技术专业《计算机组成原理》科目期末试卷B(有答案)

2021年天津大学数据科学与大数据技术专业《计算机组成原理》科目期末试卷B(有答案)一、选择题1、在对破坏性读出的存储器进行读/写操作时,为维持原存信息不变,必须辅以的操作是()。

A.刷新B.再生C.写保护D.主存校验2、有效容量为128KB的Cache,每块16B,8路组相联。

字节地址为1234567H的单元调入该Cache,其tag应为()。

A.1234HB.2468HC.048DHD.12345H3、下列为8位移码机器数[x]移,当求[-x]移时,()将会发生溢出。

A.11111111B.00000000C.10000000D.011l1l114、若x=103,y=-25,则下列表达式采用8位定点补码运算时,会发生溢出的是()。

A.x+yB.-x+yC.x-yD.x-y5、在原码两位乘中,符号位单独处理,参加操作的数是()。

A.原码B.绝对值的补码C.补码D.绝对值6、总线的数据传输速率可按公式Q=Wf/N计算,其中Q为总线数据传输速率,W为总线数据宽度(总线位宽/8),f为总线时钟频率,N为完成一次数据传送所需的总线时钟周期个数。

若总线位宽为16位,总线时钟频率为8MHz,完成一次数据传送需2个总线时钟周期,则总线数据传输速率Q为()。

A.16Mbit/sB.8Mbit/sC.16MB/sD.8MB/s7、为了对n个设备使用总线的请求进行仲裁,如果使用独立请求方式,则需要()根控制线。

A.nB.log2n+2C.2nD.38、假定编译器对高级语言的某条语句可以编译生成两种不同的指令序列,A、B和C三类指令的CPl和执行两种不同序列所含的三类指令条数见下表。

则以下结论错误的是()。

I.序列一比序列二少l条指令Ⅱ.序列一比序列二的执行速度快Ⅲ.序列一的总时钟周期数比序列二多1个Ⅳ.序列一的CPI比序列二的CPI大A.I、llB.1、ⅢC. ll、1VD.Ⅱ9、某计算机主频为1.2GHz,其指令分为4类,它们在基准程序中所占比例及CPI如下表所示。

并行计算基础

并行计算基础

并行计算基础并行计算是指通过同时进行多个计算任务来提高计算机的计算能力和效率。

随着计算机技术的不断发展,越来越多的应用需要处理大规模的数据和复杂的计算任务,传统的串行计算已经不能满足需求,因此并行计算成为了一种重要的解决方案。

本文将介绍并行计算的基础概念、主要应用领域以及常用的并行计算模型。

一、并行计算的基础概念1.1 并行计算的定义并行计算是指在多个处理单元(如CPU、GPU等)同时进行计算任务,以提高计算效率和性能。

1.2 并行计算的优势并行计算具有以下几个主要优势:(1)加速计算:通过同时进行多个计算任务,可以大幅提高计算速度,缩短任务完成时间。

(2)处理大规模数据:并行计算可以有效处理大规模数据,提高数据处理的效率。

(3)解决复杂问题:并行计算可以将复杂的计算问题分解成多个子问题,分别进行计算,然后将结果合并,从而解决复杂问题。

1.3 并行计算的挑战并行计算也面临一些挑战,包括:(1)任务划分和调度:如何将一个大的计算任务划分成多个子任务,并合理调度各个处理单元进行计算,是一个较为复杂的问题。

(2)数据一致性:多个处理单元同时进行计算时,需要确保数据的一致性,避免出现数据竞争和冲突。

(3)通信效率:由于并行计算中各个处理单元之间需要进行通信,通信效率对整体计算性能有较大的影响。

二、并行计算的主要应用领域2.1 科学计算科学计算是并行计算的主要应用领域之一。

例如在天气预报、地震模拟、空气动力学等领域,需要进行大规模的数值模拟和计算,而并行计算可以显著提高计算速度和精度。

2.2 数据挖掘与机器学习数据挖掘和机器学习是处理大规模数据的重要任务,而并行计算可以极大地提高数据处理的效率。

通过并行计算,可以同时对不同的数据进行处理和分析,从而实现更快速、准确的数据挖掘和机器学习。

2.3 图像和视频处理图像和视频处理是另一个需要处理大量数据的领域,例如图像识别、图像处理、视频编解码等。

通过并行计算,可以将图像和视频的处理任务分配给多个处理单元,并行进行处理,从而提高处理速度和效率。

2160286计算机系统结构-天津大学计算机学院

2160286计算机系统结构-天津大学计算机学院

2160286计算机系统结构-天津大学计算机学院天津大学《计算机系统结构》课程教学大纲课程编号:2160286 课程名称:计算机系统结构学时: 40 学分: 2学时分配:授课:28 上机:实验:12 实践:实践(周):授课学院:计算机学院适用专业:计算机工程先修课程:数字逻辑一.课程的性质与目的该课程介绍计算机的组织与结构,课程目的是向学生展示计算机系统的特性与结构。

通过该课程的学习,使同学掌握计算机体系结构的基本概念,基本理论,包括CPU结构和功能、精简指令集计算机、指令级并行性和超标量处理器、并行处理等内容。

为同学继续深造和就业奠定重要的理论基础。

二.教学基本要求该课程重点讲解计算机的主要结构部件,包括CPU结构和功能、精简指令集计算机、指令级并行性和超标量处理器、并行处理等。

要求学生了解这些部件的基本结构和功能。

并结合在教学、科研中取得的新成果及最新发展,进行讲授。

三.教学内容第1章导论1.1 计算机组织与体系结构1.2 结构和功能1.3 本书概要1.4 网络资源第2章计算机的演变和性能2.1 计算机简史2.2 性能设计2.3 Pentium和PowerPC的演变2.4 参考文献和Web站点2.5 复习题和习题第7章操作系统支持7.1 操作系统概述7.2 调度7.3 存储器管理7.4 Pentium II和PowerPC存储器管理7.5 参考文献和Web站点7.6 复习题和习题第11章CPU的结构和功能11.1 处理器组织11.2 寄存器组织11.3 指令周期11.4 指令流水线技术11.5 Pentium处理器11.6 PowerPC处理器11.7 参考文献11.8 复习题和习题第12章精简指令集计算机12.1 指令执行特征12.2 大寄存器文件的使用12.3 基于编译器的寄存器优化12.4 精简指令集结构123.5 RISC流水线技术12.5 MIPS400012.6 SPARC12.7 RISe与CISC的争论12.8 参考文献12.9 复习题和习题第13章超标量处理器13.1 概述13.2 设计问题13.3 Pentium413.4 PowerPC13.5 MIPS R1000013.6 UltraSPARC13.7 IA-64/Pentium13.8 参考文献13.9 复习题和习题第16章并行处理16.1 多处理器组织16.2 对称多处理器16.3 高速缓存一致性和MESI协议16.4 机群系统16.5 非对称存储器存取16.6 向量计算16.7 参考文献16.8 复习题和习题四.学时分配教学内容授课上机实验实践实践(周) 第1章导论 1第2章计算机的演变和性2能第7章操作系统支持 4第11章CPU的结构和功能 5第12章精简指令集计算4 4机第13章超标量处理器 6第16章并行处理 6 8总计: 28 12五.评价与考核方式平时成绩20%,期末试卷80%六.教材与主要参考资料教材:William Stallings, “Computer Organization and Architecture: Designing for Performance”,Pearson Education, Fifth Edition,2002参考教材:Patterson & Hennessy, "Computer Organization and Design -- The Hardware/Software Interface", Morgan Kaufmann, Fourth Edition,2004制定人:审核人:批准人:批准日期:年月日TU Syllabus for Computer ArchitectureCode:2160286 Title: Computer Architecture Semester Hours: 40Credits:2Semester Hour Structure Lecture :28 Computer Lab :Experiment :12 Practice :Practice (Week):Offered by: School of Computer Science and Technologyfor: Computer Engineering Prerequisite: Digital logic1. ObjectiveThis course is about computer organization and architecture. Its purpose is to present the nature and characteristics ofmodern-day computer systems. In this course, students will learn the basic theory and concepts of computer architecture, including CPU structure and function, reduced instruction set computers, instruction-level parallelism and superscalar processors, parallel processing etc.2. Course DescriptionComputer architecture deals with the functionality of all the major components of a computer: ALU, control and data paths, cache and main memory, I/O, interconnections etc. The programmer's view of the instruction set and user interface will be considered along with CPU structure and function, instruction-level parallelism and superscalar processors, parallel processing and a multitude of performance issues and trade-offs. The main focus will be on the following topics: performance measures of computer systems, CPU design, pipelining, RISC computers and parallel programming. 3. TopicsChapter 1 Introduction1.1 Organization and Architecture 1.2 Structure and Function 1.3 Outline of the Book 1.4 Internet and Web ResourcesChapter 2 Computer Evolution and Performance2.1 A Brief History of Computers2.2 Designing for Performance2.3 Pentium and PowerPC Evolution2.4 Recommended Reading and Web Sites2.5 ProblemsChapter 7 Operating System Support7.1 Operating System Overview7.2 Scheduling7.3 Memory Management7.4 Pentium II and PowerPC Memory Management7.5 Recommended Reading and Web Sites7.6 ProblemsChapter 11 CPU Structure and Function11.1 Processor Organization11.2 Register Organization11.3 The Instruction Cycle11.4 Instruction Pipelining11.5 The Pentium Processor11.6 The PowerPC Processor11.7 Recommended Reading11.8 ProblemsChapter 12 Reduced Instruction Set Computers (RISCs)12.1 Instruction Execution Characteristics12.2 The Use of a Large Register File12.3 Compiler-Based Register Optimization12.4 Reduced Instruction Set Architecture12.5 RISC Pipelining12.6 MIPS R400012.7 SPARC12.8 The RISC versus CISC Controversy12.9 Recommended Reading12.10 ProblemsChapter 13 Instruction-Level Parallelism and Superscalar Processors13.1 Overview13.2 Design Issues13.3 Pentium II13.4 PowerPC13.5 MIPS R1000013.6 UltraSPARC-II13.7 IA-64/Merced13.8 Recommended Reading13.9 ProblemsChapter 16 Parallel Processing16.1 Multiple Processor Organizations16.2 Symmetric Multiprocessors16.3 Cache Coherence and the MESI Protocol 16.4 Clusters16.5 Nonuniform Memory Access16.6 Vector Computation16.7 Recommended Reading and Web Sites 16.8 Problems4. Semester Hour StructureTopics Lecture ComputerLab.ExperimentPracticePractice (Week)Chapter 1 Introduction 1Chapter 2 Computer Evolution and Performance 2 Chapter 7 Operating SystemSupport4 Chapter 11 CPU Structureand Function 5Chapter 12 Reduced Instruction Set Computers(RISCs)4 4Chapter 13 Instruction-Level Parallelism and SuperscalarProcessors 6Chapter 16 ParallelProcessing6 8Sum: 28 125. GradingCoursework will be weighted as follows: 1. Final exam: 80% 2. Homework: 20%6. Text-Book & Additional ReadingsTextbook: William Stallings, “Computer Organization and Architecture: Designing for Performance”, Pearson Education, Fifth Edition, 2002Additional reading: Patterson & Hennessy, "Computer Organization and Design -- The Hardware/Software Interface", Morgan Kaufmann, Fourth Edition, 2004Constitutor: Reviewer: Authorizor: Date:。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ห้องสมุดไป่ตู้
17/2/21
/orgs/hpclab/
China Research Laboratory
FAST
§ 2007年立项,2016年竣工(国家大科学工程) § 1TB/天
15
17/2/21
/orgs/hpclab/
China Research Laboratory
China Research Laboratory
生命科学
§ DNA
9
17/2/21
/orgs/hpclab/
China Research Laboratory
天气预报
§ 由连续方程、热力学方程、 水汽方程、状态方程和 3个 运动方程(大气动力方程) 共 7个方程所构成的方程组。 § 网格点尺度决定预报精度
– 精度提高一倍,计算量提高 16倍
10
17/2/21
/orgs/hpclab/
China Research Laboratory
在线交易
§ 阿里,2016.11.11
– 成交1207亿元 – 物流定单数6.57亿 – 支付宝支撑12万笔/秒支付洪峰
11
17/2/21
并行计算概述
于策
17/2/21
/orgs/hpclab/
China Research Laboratory
Outline
§ 并行计算基本概念
– 应用需求 – 并行计算硬件 – 并行程序设计
§ 并行化方法
– 域分解(Domain decomposition) – 任务分解(Task decomposition) – 流水线(Pipelining)
5
17/2/21
/orgs/hpclab/
China Research Laboratory
为什么需要并行计算?
§ 单处理器性能提升受限
– 1986 – 2002,50%/年
• 每10年增长60倍
– 2002 以后,20%/年
• 每10年增长6倍
§ 存储、I/O
AST3
§ 10K*10K CCD § 200MB/2.4分钟 § 360GB/天 § 43.2TB/四个月
16
17/2/21
/orgs/hpclab/
CSTAR
China Research Laboratory
PLATO
Pre-HEAT HEAT
Quad cpu blade
FT-1000
On-line storage
Chips
30
17/2/21
/orgs/hpclab/
China Research Laboratory
天河一号计算系统
§ 计算处理系统:包含7168个计算结点和1024个服务结 点。
为什么需要并行计算?
§ 为满足不断增长的计算力需求 – 用速度更快的硬件,也就是减少每一条指令所需时间 – 优化算法(或者优化编译) – 用多个处理机(器)同时解决一个问题
• 并行计算
§ 计算机硬件及网络技术的发展 – 集群的广泛应用 – 多核处理器技术的驱动
• 并行计算环境无处不在,应用程序必须能够支持并行执行才能够充 分利用计算能力
Sparse Aperture Arra
Dense Aperture Arra
Radio Dishes
/orgs/hpclab/
China Research Laboratory
LAMOST
§ 同时观测4000个天体 § 3-5GB/天,1-2TB/年
14
/orgs/hpclab/
China Research Laboratory
12
数值模拟(Simulation)
§ Evolution of the universe, galaxy, star……
/orgs/hpclab/
China Research Laboratory
Observation data sources
§ Hubble Space Telescope
• 5GB/day
18 /orgs/hpclab/
China Research Laboratory
Observation data sources
7
17/2/21
/orgs/hpclab/
China Research Laboratory
应用需求
http://www.aics.riken.jp/en/kcomputer/what.html
8 17/2/21 /orgs/hpclab/
China Research Laboratory
并行计算硬件发展
§ 超级计算机
– Top500排名 – 我国的超级计算机
§ 多核处理器
– IBM、SUN、Intel、AMD。。。。。。
§ GPU/Cell BE
– Nvidia、AMD(ATI)、IBM
23
17/2/21
/orgs/hpclab/
Outline
§ 并行计算基本概念
– 应用需求 – 并行计算硬件 – 并行程序设计
§ 并行化方法
– 域分解(Domain decomposition) – 任务分解(Task decomposition) – 流水线(Pipelining)
22
17/2/21
/orgs/hpclab/
3
17/2/21
/orgs/hpclab/
China Research Laboratory
并行计算
任务队列 可分解的 计算任务
处理器
...
串串行行行

并行行行

4
17/2/21
/orgs/hpclab/
China Research Laboratory
§ LSST (under construction, Chile)
– Large Synoptic Survey Telescope – 18TB/day (estimation)
21 /orgs/hpclab/
China Research Laboratory
§ 首次完全用“中国芯”制造的中国最强大的超级计算机
/orgs/hpclab/
China Research Laboratory

26
17/2/21
/orgs/hpclab/
China Research Laboratory
AST3
FTS
2.5m optical/IR
6-8m Optical/IR
5m THz 15m THz
Extremely Large Optical/IR Telescope
17 17/2/21
FIR Interferometer
/orgs/hpclab/
§ 13.7m-aperture radio-telescope on the milimetre waveband
– China – 1TB/day
19 /orgs/hpclab/
China Research Laboratory
Observation data sources
31
17/2/21
/orgs/hpclab/
China Research Laboratory
天河:自主研发
§ 芯片:飞腾-1000 CPU,高阶路由芯片NRC ,高速网 络接口芯片NIC § 结点:计算、服务、I/O管理、I/O存储 § 网络:互联通信网、维护诊断网 § PCB板:15种
China Research Laboratory
Top500, 2016.11
/orgs/hpclab/
China Research Laboratory
神威-太湖之光
§ 全球第一台运行速度超过10亿亿次/秒的超级计算机
– 峰值性能高达12.5亿亿次/秒,持续性能达到9.3亿亿次 /秒,接近“天河二号”的3倍。
– 数据访问/传输的速度提升,远落后于处理器
6
17/2/21
/orgs/hpclab/
China Research Laboratory
Outline
§ 并行计算基本概念
– 应用需求 – 并行计算硬件 – 并行程序设计
§ 并行化方法
– 域分解(Domain decomposition) – 任务分解(Task decomposition) – 流水线(Pipelining)
China Research Laboratory
Square Kilometer Array (SKA) ~2024
§ 1 EB per day § 100 PFlop/s processing power § ~1 EB processed data/year § Headquarters in UK
28 17/2/21 /orgs/hpclab/
China Research Laboratory
天河一号
§ 一期系统于2009年9月研制成功,峰值性能为每秒1206 万亿次双精度浮点运算(TFlops),持续性能为 563.1TFlops(LINPACK实测值),2009年11月TOP 500排名,位列亚洲第一、世界第五。 § 二期系统于2010年8月在国家超级计算天津中心升级完 成,峰值性能提升为4700TFlops,持续性能提升为 2507TFlops(LINPACK实测值),部分采用了自主研 制的飞腾-1000中央处理器,2010年11月TOP 500排 名世界第1。
29
17/2/21
/orgs/hpclab/
China Research Laboratory
天河一号
Cabinet (4 x rack) rack Twin GPU blade Compute node
相关文档
最新文档