华南理工大学《高性能计算与云计算》复习资料
云计算考试复习资料

云计算考试复习资料Web搜索引擎:⼀个能够在合理响应时间内,根据⽤户的查询关键词,返回⼀个包含相关信息的结果列表(hits list)服务的综合体。
IC卡:集成电路卡。
即“集成电路卡”在⽇常⽣活中已随处可见。
实际上是⼀种数据存储系统,如有必要还可附加计算能⼒。
条形码是由⼀组规则排列的条、空以及对应的字符组成的标记。
当使⽤专门的条形码识别设备如⼿持式条码扫描器扫描这些条码时,条码中包含的信息就转化为计算机可识别的数据。
Wi-Fi:最常见的⽆线接⼊⽅式,是⼀种短距离传输技术,适⽤于办公室及家庭环境,有11Mbps,54Mbps,300Mbps等速率范围。
物联⽹的特点:1、感知识别普适化:⽆所不在的感知和识别将传统上分离的物理世界和信息世界⾼度融合。
2、异构设备互联化:各种异构设备利⽤⽆线通信模块和协议⾃组成⽹,异构⽹络通过“⽹关”互通互联。
3、联⽹终端规模化:物联⽹时代每⼀件物品均具通信功能成为⽹络终端,5-10年内联⽹终端规模有望突破百亿。
4、管理调控智能化物联⽹⾼效可靠组织⼤规模数据,与此同时,运筹学,机器学习,数据挖掘,专家系统等决策⼿段将⼴泛应⽤于各⾏各业。
5、应⽤服务链条化以⼯业⽣产为例,物联⽹技术覆盖从原材料引进,⽣产调度,节能减排,仓储物流到产品销售,售后服务等各个环节。
6、经济发展跨越化物联⽹技术有望成为从劳动密集型向知识密集型,从资源浪费型向环境友好型国民经济发展过程中的重要动⼒。
物联⽹的定义:1、通过射频识别(RFID)、红外感应器、全球定位系统、激光扫描器等信息传感设备,按约定的协议,把任何物品与互联⽹相连接,进⾏信息交换和通信,以实现智能化识别、定位、跟踪、监控和管理的⼀种⽹络概念2、实际是中国⼈的发明,整合了美国CPS(Cyber-Physical Systems)、欧盟IoT(Internet of Things)和⽇本U-Japan等概念。
是⼀个基于互联⽹、传统电信⽹等信息载体,让所有能被独⽴寻址的普通物理对象实现互联互通的⽹络。
华南理工大学《高级计算机网络》复习资料

华南理工大学《高级计算机网络》复习资料[Part1]. IPv6协议【IPv4的危机】地址危机(最大的危机,但可通过NAT、CIDR、VLSM)、端到端业务模式无法实施、QoS和性能问题、配置复杂、安全问题、路由表的膨胀、移动性支持不够【IPV4与IPV6地址空间】IPV4:232 ≈ 43亿IPv6:2128=3.4×1038 ≈ 340涧【IPv6的改进之处】简化的报头格式,地址扩展到128位,增强的安全性和服务质量,可以实现更高效得路由基础,提供了对移动特性得支【IPv9网络】每个y是32bit部分,如。
【TCP/IPv6参考模型】【IPv6特点】地址及寻址全新的报文格式,高效的报头全新的地址配置方式,即插即用更好的QoS支持内置的安全性全新的邻居发现协议良好的扩展性内置的移动性端点分片【IPv6地址分类】单播地址用于唯一标识支持IPv6 的设备上的接口。
源地址必须是单播地址●单播地址(Unicast Address)-本地链路地址、环回地址、未指唯一本地地址、嵌入式Ipv4地址、全局单播地址、定地址●组播地址(Multicast Address)●任播地址(Anycast Address)【1.本地链路地址】●用在单一链路上●带有链路本地源或目的地址的数据包不转发到其它链路●支持IPv6的网络接口都需要有本地链路地址●IPv4不会自动生成,IPv6主机会自动创建。
【1.本地链路地址生成】只在同一本地链路中使用,范围:FE80::/64后64位为EUI-64地址:EUI-64生成:【1.本地链路地址用途】●主机使用路由器本地链路地址作为默认网关地址。
●路由器使用本地链路地址交换动态路由协议消息。
●转发数据包时,路由器的路由表使用本地链路地址确定下一跳路由器。
【2.环回地址】* 地址:::1/128* 主机用来将数据包发送给本身,不能分配给物理接口* 启用Ping命令,测试本地主机TCP/IP配置【3.未指定地址】地址:::/128不能分配给接口,仅作为源地址【4.唯一本地地址】地址:从FC00::/7 到FDFF::/7在一个站点内或有限站点数之间用作本地地址,在全局不具可路由性。
《高性能计算技术》练习题word精品文档13页

高性能计算与云计算练习题1. 解释以下基本概念●HPC, HPCC, Distributed computing, Cloud computing●MIMD, SIMD, SISDHPC:High Performance Computing 高性能计算,即并行计算。
在并行计算机或分布式计算机等高性能计算系统上所做的超级计算。
HPCC:High Performance Computing and Communication 高性能计算与通信。
指分布式高性能计算、高速网络和Internet的使用。
Distributed computing:分布式计算。
在局域网环境下进行的计算。
比起性能来说,它更注重附加功能。
一个计算任务由多台计算机共同完成,由传统的人和软件之间的交互变成软件和软件之间的数据交互。
Cloud computing:云计算(Cloud Computing)是一种新兴的商业计算模型。
它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和各种软件服务。
MIMD:多指令多数据流。
每台处理机执行自己的指令,操作数也是各取各的。
SIMD:单指令多数据流。
所有“活动的”处理器在同一时刻执行同一条指令对多个数据流进行操作。
SISD:单指令单数据流。
传统的串行处理机。
CPU执行单一的指令流对单一的数据流进行操作。
2. 试比较PVP、SMP、MPP、DSM和Cluster并行机结构的不同点,以典型系统举例说明。
3. 列出常用静态和动态网络的主要参数(节点度、直径、对剖带宽和链路数)以及复杂度、网络性能、扩展性和容错性等。
常用的标准互联网络有哪些?答:静态网络(Static Networks)是指处理单元间有着固定连接的一类网络,在程序执行期间,这种点到点的链接保持不变;动态网络(Dynamic Networks)是用交换开关构成的,可按应用程序的要求动态地改变连接组态。
华南理工大学《高级操作系》复习资料2

华南理工大学《高级操作系》复习资料一、名词解释写时拷贝:写时拷贝是一种可以推迟甚至免除拷贝数据的技术,它让父子进程共享同一份拷贝,而不需要复制整个进程地址空间。
只有在需要写入的时候,数据才会被复制,从而使各个进程拥有各自的拷贝。
即,资源的复制只有在需要写入的时候才进行。
内核抢占:在内核空间中,当重新调度安全时,内核可以抢占正在执行的内核级的任务的行为延迟写:在进程进行写数据的时候,内核并不直接把数据写入硬件设备里,而是先把数据写到缓冲区,使缓冲区变“脏”,此时内核认为数据已经写入设备但实际却还未写入,等缓冲区满或者定时器到时才将缓冲区的数据写入硬件设备。
系统调用:是用户空间进程和硬件设备之间的一个中间层接口,是用户空间访问内核的唯一手段。
内核模块:可以在内核运行时动态地向内核插入或者删除的代码,它是一组把相关子例程、数据、函数入口和函数出口一并组合在一起的单独的二进制镜像。
二、在进程控制处理模块方面,linux和unix的实现区别是什么?为什么会产生这种区别?进程线程:从内核角度上说,Linux并没有线程的概念,Linux把所有线程都当作进程来实现,线程仅仅被视为一个与其他进程共享某些资源的进程。
每个线程和进程都有属于自己的task_struct,在内核看来两者没什么区别。
而对于Unix,从内核角度有线程的概念,在有些系统如Solaris 10有LWP(轻量级进程),它使用户线程可以独立与同一进程中的其他线程而执行和进入内核。
进程创建:Linux采用了写时拷贝(copy-on-write)技术。
创建新进程时,不是复制父进程的整个地址空间,而是让父进程与子进程共享同一个拷贝。
当其中一进程写数据时,数据才会被复制,从而使各个进程拥有各自的拷贝。
当子进程需要执行另一段程序时,可以调用exec()一族的系统调用。
在一般的情况下,进程创建后都会马上运行一个可执行文件,这种优化可以避免拷贝大量根本就不会被使用的数据。
华南理工大学-高性能计算与云计算-复习资料

1.Map/Reduce 定义:分布式编程模型,互联网应用的大规模数据计算解决方案 多应用于:日志分析、商业智能服务与分析、大规模索引 Map:映射、空间变换 Reduce:汇总、规约
第七讲 文件存储及云存储
1.分布式文件系统的特点有哪些? ①扩展能力高 ②可用性强 ③存储灵活 2. GFS 体系结构 一个 GFS 集群由一个 master 和大量 chunkserver 构成,并被许多客户(Client)访问。
5
2.什么是加速比(speed up)、并行效率(efficiency)和可扩展性(scalability)?如何描述 在不同约束下的加速比? ①加速比:对于一个给定的应用,并行算法(或并行程序)相对于串行算法(或串行程序) 的性能提高程度。加速比性能定律:Amdahl 定律、Gustafson 定律、SunNi 定律 ②并行效率:处理器的利用率 ③可扩展性:当系统和问题规模增大时,可维持相同性能的能力,即指系统、算法和程序能 否充分利用不断增长的处理器的能力。等效率、等速度、平均延迟度量标准 (2)不同约束下的加速比
第一讲 绪论
1.静态互联网络特性 节点度:射入或射出一个节点的边数。在单向网络中,入射和出射边之和称为节点度。 网络直径:网络中任意两个结点之间的最长距离,即最大路径数。 对剖宽度:对分网络各半必须移去的最少边数。
2.简要介绍虚拟化技术。 (1)虚拟化技术是一种资源管理技术,能将计算机的各种实体资源如服务器、网络、内存 等予以抽象、转换呈现,用更好的方式利用这些资源。在虚拟化技术中,可以同时运行多个 操作系统,而且每一个操作系统中都有多个程序运行,每一个操作系统都运行在一个虚拟的 CPU 或者是虚拟主机上。 (2)服务器虚拟化的类型:
高性能计算与云计算-第04讲-2014

并行开销的表达式:点到点通信
通信开销 t(m) = t0 + m/ r∞
通信启动时间 t0 渐近带宽r :传送无限长的消息时的通信速 率
∞
半峰值长度m1/2 :达到一半渐近带宽所要的 消息长度 特定性能π0:表示短消息带宽 这四个参数的关系 t0 = m1/2 / r∞ = 1 /π0
25/56
T = ∑ t ph + B × 同步障次数
优缺点
易编程和分析算法的复杂度,但与现实相差较远,其上并行算法 非常有限,也不适合MIMD-DM模型。
10/56
异步APRAM模型
计算时间
设局部操作为单位时间;全局读/写平均时间为d,d随 着处理器数目的增加而增加;同步路障时间为B=B(p)非 降函数。 满足关系 2 ≤ d ≤ B ≤ p ;B = B( p) = O(d log p) 或 O(d log p / log d ) 令 t ph 为全局相内各处理器执行时间最长者,则APRAM 上的计算时间为 T = ∑ t ph + B × 同步障次数
指令类型
(1)全局读
(3)局部操作 (2)全局写 (4)同步
8/56
异步APRAM模型
计算过程
由同步障分开的全局相组成
9/56
异步APRAM模型
计算时间
设局部操作为单位时间;全局读/写平均时间为d,d随着处理器数 目的增加而增加;同步路障时间为B=B(p)非降函数。 满足关系 2 ≤ d ≤ B ≤ p ;B = B( p) = O(d log p)或 O(d log p / log d ) 令 t ph为全局相内各处理器执行时间最长者,则APRAM上的计算时 间为
并行开销的表达式:整体通信
云计算架构复习题

云计算架构复习题一、云计算的基本概念1、什么是云计算?云计算是一种基于互联网的计算方式,通过这种方式,共享的软件资源、硬件资源和信息可以按需提供给计算机和其他设备。
简单来说,就是将计算任务分布在大量的分布式计算机上,而非本地计算机或远程服务器中,使得企业数据中心的运行与互联网更相似。
2、云计算的特点(1)按需自助服务:用户可以根据自己的需求,随时获取所需的计算资源,如服务器、存储、网络等,而无需与服务提供商进行人工交互。
(2)广泛的网络访问:用户可以通过各种网络设备,如电脑、手机、平板等,随时随地访问云计算服务。
(3)资源池化:服务提供商将计算资源汇集到资源池中,以便多个用户共享使用,并根据用户的需求动态分配和重新分配资源。
(4)快速弹性:云计算服务能够快速、灵活地根据用户的需求增加或减少计算资源,以满足业务的变化。
(5)按使用量计费:用户只需为其使用的计算资源付费,类似于使用水电一样,用多少付多少。
二、云计算架构的服务模型1、 IaaS(基础设施即服务)IaaS 提供了服务器、存储和网络等基础设施服务。
用户可以按需租用这些基础设施,并在上面部署和运行自己的操作系统、应用程序等。
例如,亚马逊的 AWS EC2 就是一种 IaaS 服务。
2、 PaaS(平台即服务)PaaS 提供了一个平台,包括操作系统、数据库、中间件等,让开发者能够在上面快速开发、部署和管理应用程序,无需关心底层的基础设施。
例如,谷歌的 App Engine 就是一种 PaaS 服务。
3、 SaaS(软件即服务)SaaS 直接为用户提供了可以使用的软件应用程序,用户无需安装和维护软件,只需通过网络访问即可使用。
例如,Salesforce 的 CRM 系统就是一种 SaaS 服务。
三、云计算架构的部署模型1、公有云由云服务提供商拥有和运营,面向公众提供服务。
多个用户共享资源,具有成本低、可扩展性强等优点,但数据安全性和隐私性可能存在一定风险。
华南理工大学《高性能计算与云计算》复习资料

《高性能计算与云计算》复习资料2012计算机全英创新班黄炜杰(201230590051)1.解释并比较以下基本概念PVP, SMP, MPP, DSM, Cluster, ConstellationUMA, NUMA, CC_NUMA, CORMA, NORMAHPC, HPCC, Distributed computing, Cloud computingPVP:并行向量处理机。
系统中包含为数不多的高性能特制的向量处理器,使用专门设计的高带宽交叉开关网络将向量处理器连向共享存储模块。
通常不使用高速缓存,而使用大量的向量寄存器和指令缓冲器。
交叉开关SMP:对称多处理机。
节点包含两个或两个以上完全相同的处理器,在处理上没有主/从之分。
每个处理器对节点计算资源享有同等访问权。
SMP系统使用商品微处理器(具有片上或外置高速缓存),它们经由高速总线或交叉开关连向共享存储器。
MPP:大规模并行处理机。
节点传统上是由单一CPU、少量的内存、部分I/O、节点间的互联以及每个节点的操作系统的一个实例组成。
节点间的互联(以及驻留于各节点的操作系统实例)不需要硬件一致性,因为每个节点拥有其自己的操作系统以及自己唯一的物理内存地址空间。
因而,一致性是在软件中通过“消息传送”(message passing)实现的。
DSM:分布共享存储多处理机。
在物理上有分布在各节点的局部存储器,从而形成一个共享的存储器。
对用户而言,系统硬件和软件提供了一个单地址的编程空间。
Cluster:集群。
系统中的每个节点拥有小于16个处理器。
Cluster是一种并行或分布式处理系统,由一系列通过网络互连的互相协同工作的单机组成,形成单一、整合的计算资源。
Constellation:系统中的每个节点拥有大于或等于16个处理器。
UMA:Uniform Memory Access. 均匀存储访问模型。
特点:1.物理存储器被所有处理器均匀共享,所有处理器访问任何存储单元花费相同的时间;2.每台处理器可带私有高速缓存;3.外围设备也可以一定形式共享。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《高性能计算与云计算》复习资料2012计算机全英创新班黄炜杰(201230590051)1.解释并比较以下基本概念PVP, SMP, MPP, DSM, Cluster, ConstellationUMA, NUMA, CC_NUMA, CORMA, NORMAHPC, HPCC, Distributed computing, Cloud computingPVP:并行向量处理机。
系统中包含为数不多的高性能特制的向量处理器,使用专门设计的高带宽交叉开关网络将向量处理器连向共享存储模块。
通常不使用高速缓存,而使用大量的向量寄存器和指令缓冲器。
交叉开关SMP:对称多处理机。
节点包含两个或两个以上完全相同的处理器,在处理上没有主/从之分。
每个处理器对节点计算资源享有同等访问权。
SMP系统使用商品微处理器(具有片上或外置高速缓存),它们经由高速总线或交叉开关连向共享存储器。
MPP:大规模并行处理机。
节点传统上是由单一CPU、少量的内存、部分I/O、节点间的互联以及每个节点的操作系统的一个实例组成。
节点间的互联(以及驻留于各节点的操作系统实例)不需要硬件一致性,因为每个节点拥有其自己的操作系统以及自己唯一的物理内存地址空间。
因而,一致性是在软件中通过“消息传送”(message passing)实现的。
DSM:分布共享存储多处理机。
在物理上有分布在各节点的局部存储器,从而形成一个共享的存储器。
对用户而言,系统硬件和软件提供了一个单地址的编程空间。
Cluster:集群。
系统中的每个节点拥有小于16个处理器。
Cluster是一种并行或分布式处理系统,由一系列通过网络互连的互相协同工作的单机组成,形成单一、整合的计算资源。
Constellation:系统中的每个节点拥有大于或等于16个处理器。
UMA:Uniform Memory Access. 均匀存储访问模型。
特点:1.物理存储器被所有处理器均匀共享,所有处理器访问任何存储单元花费相同的时间;2.每台处理器可带私有高速缓存;3.外围设备也可以一定形式共享。
NUMA:Nonuniform Memory Access. 非均匀存储访问模型。
特点:1.被共享的存储器在物理上是分布在所有的处理器中的,组成全局地址空间;2.处理器访问存储器的时间是不同的,访问本地存储器或群内共享存储器较快,访问外地存储器或全局存储器较慢;3.每台处理器可带私有高速缓存,外设可以某种形式共享。
CC_NUMA:Coherent-Cache Nonuniform Memory Access. 高速缓存一致性非均匀存储访问模型。
实际上是将一些SMP机器作为一个单节点而彼此连接起来所形成的一个较大的系统。
特点:1. 使用基于目录的高速缓存一致性协议;2.保留SMP结构易于编程的优点,改善了常规SMP的可扩放性问题;3.实际上是一个分布共享存储的DSM多处理机系统;4.最显著的优点是程序员无需明确地在节点上分配数据,在运行时高速缓存一致性硬件会自动地将数据迁移到要用到的它的地方。
COMA:Cache-Only Memory Access. 全高速缓存存储访问。
是NUMA的一种特例。
特点:1.各处理器节点中没有存储层次结构,全部高速缓存组成了全局地址空间;2.利用分布的高速缓存目录进行远程高速缓存的访问;3.高速缓存容量一般大于2级高速缓存容量;4.使用COMA时,数据开始可以任意分配,因为在运行时它最终会被迁移到要用到的它的地方。
NORMA:No-Remote Memory Access. 非远程存储访问模型。
分布存储的多计算机系统,所有的存储器都是私有的,仅能由其处理器访问。
绝大多数NORMA不支持远程存储器访问。
HPC:High Performance Computing 高性能计算,即并行计算。
在并行计算机或分布式计算机等高性能计算系统上所做的超级计算。
HPCC:High Performance Computing and Communication 高性能计算与通信。
指分布式高性能计算、高速网络和Internet的使用。
Distributed computing:分布式计算。
在局域网环境下进行的计算。
比起性能来说,它更注重附加功能。
一个计算任务由多台计算机共同完成,由传统的人和软件之间的交互变成软件和软件之间的数据交互。
Cloud computing:云计算是一种新兴的共享基础架构的方法,通过互联网将资源以“按需服务”的形式提供给用户,利用互联网连接的数据中心和服务器进行高效计算和信息存取的系统,使计算能力可以向电能一样提供给客户(高度可扩展)2.试比较SMP、MPP和Cluster并行机结构的不同点,并以典型系统举例说明。
3.列出常用静态和动态网络的主要参数(节点度、直径、对剖带宽和链路数)以及复杂度、网络性能、扩展性和容错性等。
常用的标准互联网络有哪些?常用的标准互联网络有:4.比较并行计算模型PRAM、BSP和logP。
评述它们的差别、相对优点以及在模型化真实并行计算机和应用时的局限性。
PRAM优缺点BSP优缺点logP优缺点5. 比较在PRAM模型和BSP模型上,计算两个N阶向量内积的算法及其复杂度。
PRAM模型BSP模型6. 什么是加速比(speed up)、并行效率(efficiency)和可扩展性(scalability)? 如何描述在不同约束下的加速比?加速比(Speedup):对于一个给定的应用,并行算法(或并行程序)相对于串行算法(或串行程序)的性能提高程度.并行效率(Parallel Efficiency ):处理器的利用率Efficiency = (Sequential execution time) / (Number of processors * Parallel execution time)可扩展性(Scalability ):当系统和问题规模增大时,可维持相同性能的能力,即指应用、算法和结构能否充分利用不断增长的处理器的能力固定负载(Amdahl 定律):计算负载是固定不变,增加处理器数来提高计算速度。
加速比为:(W s 串行分量,W p 可并行分量)带通信开销的计算公式式不带通信开销的计算公o p s p x p s ps W pW W W W s p W W W W S +++=++=;/ 固定时间(Gustafson 定律):时间固定不变,为了提高精度加大计算量,相应的增多处理器数目。
加速比为:(考虑额外开销)不考虑额外开销Wo Wp Ws pWp Ws S Wp Ws pWp Ws p W p Ws pW Ws S p p +++=++=++=')(/*'存储受限(Sun -Ni 定律):只要存储空间许可,尽量增大问题的规模以产生更好的或更精确的解,加速比为: (f:串行分量比例(Ws/W) G(p):存储容量增加到P 倍))(//)()1()()1(/)()1()()1(''S )(/)()1()()1(/)()1()()1(''考虑额外开销不考虑额外开销W Wo p p G f f p G f f Wo p W p G f fW W p G f fW p p G f f p G f f p W p G f fW W p G f fW S +-+-+=+-+-+=-+-+=-+-+=7. 如何进行并行计算机性能评测?什么是基准测试程序? 并行计算机性能评测:通过CPU 和存储器的某些基本性能指标、并行和通信开销分析、并行机的可用性与好用性以及机器成本、价格与性价比进行机器级性能测评;通过加速比、效率、扩展性进行算法级性能测评;通过Benchmark 进行程序级性能测评。
基准测试程序:用于测试和预测计算机系统的性能,揭示了不同结构机器的长处和短处,为用户决定购买和使用哪种机器最适合他们的应用要求提供决策。
8. 什么是可扩放性测量标准?等效率函数的涵义是什么? 可扩放性测量标准:增加系统规模(处理器数)会增大额外开销和降低处理器利用率,所以对于一个特定的并行系统(算法或程序),它们能否有效利用不断增加的处理器的能力应是受限的,而度量这种能力就是可扩放性这一指标。
等效率函数的涵义:如果问题规模W 保持不变,处理器数p 增加,开销To 增大,效率E 下降。
为了维持一定的效率(介于0与1之间),当处理数p 增大时,需要相应地增大问题规模W 的值。
由此定义函数f E (p)为问题规模W 随处理器数p 变化的函数,为等效率函数。
9. 什么是分治策略的基本思想?举例说明如何应用平衡树方法、倍增技术和流水线技术。
分治策略的基本思想:将一个大而复杂的问题分解成若干特性相同的子问题分而治之。
平衡树方法:可应用于求n个数的最大值:叶节点存放待处理的数据,内节点执行相应子问题计算,根节点给出问题的解。
倍增技术:可以应用于求森林根,对于n个节点的树执行log n次指针跳跃即可找到树的根。
流水线技术:可应用于执行一维脉动阵列上的DFT计算。
10. 什么是均匀划分、方根划分、对数划分和功能划分?如何用划分方法解决PSRS排序、归并排序和(m,n)选择问题?均匀划分:将n个元素分割成p段,每段含有n/p个元素且分配给一台处理器。
方根划分:取每第i√n(i=1,2,…)个元素作为划分元素,而将序列划分成若干段,然后分段处理之。
对数划分:取每第i log n(i=1,2,….)个元素作为划分元素,而将序列划分成若干段,然后分段处理之。
功能划分:将长为n的序列划分成等长的一些组,每组中的元素应大于或等于m(最后一组除外),然后各组可并行处理。
采用均匀划分方法,解决PSRS排序:均匀划分待排序序列成n份,对每份作局部排序,再从每份中抽取n个样本,对n²个正则样本进行排序,选择主元然后对每部分进行主元划分,把每部分按段号进行全局交换,最后进行归并排序。
采用方根划分方法,解决归并排序:先对序列进行方根划分,然后进行段间、段内比较,最后进行段组归并。
采用功能划分方法解决(m,n)选择问题:先对序列进行功能划分,然后对每个子序列进行局部排序,将排序的各组进行两两比较,形成MIN序列,最后重复局部排序和两两比较直至出现m个最小者。
11. 并行算法设计的一般过程PCAM是指什么?各个步骤中的主要判据是什么?PCAM是Partitioning(划分)、Communication(通信)、Agglomeration(组合)和Mappin (映射)首字母的拼写,它们代表了使用此法设计并行算法的四个阶段。
划分判据:划分是否具有灵活性?划分是否避免了冗余计算和存储?划分任务尺寸是否大致相当?任务数与问题尺寸是否成比例?任务数与问题尺寸是否成比例?功能分解是一种更深层次的分解,是否合理?通信判据:所有任务是否执行大致相当的通信?是否尽可能的局部通信?通信操作是否能并行执行?同步任务的计算能否并行执行?组合判据:增加粒度是否减少了通信成本?重复计算是否已权衡了其得益?是否保持了灵活性和可扩展性?组合的任务数是否与问题尺寸成比例?是否保持了类似的计算和通信?有没有减少并行执行的机会?映射判据:采用集中式负载平衡方案,是否存在通信瓶颈?采用动态负载平衡方案,调度策略的成本如何?12. 什么是域分解和功能分解?如何将全局通信转换为局部通信?什么是表面-容积效应和重复计算?映射的策略是什么?域分解:也叫数据划分。