并行计算试卷
并行计算试题及答案(20011.1)

计算机学院研究生《并行计算》课程考试试题(2010级研究生,2011.1)1.(12分)定义图中节点u和v之间的距离为从u到v最短路径的长度。
已知一个d维的超立方体,1)指定其中的一个源节点s,问有多少个节点与s 的距离为i,其中0≤i≤d。
证明你的结论。
2)证明如果在一个超立方体中节点u与节点v的距离为i,则存在i!条从u到v的长度为i的路径。
1)有个节点与s的距离为i。
证明:由超立方体的性质知:一个d维的超立方体的每个节点都可由d位二进制来表示,则与某个节点的距离为i的节点必定在这d位二进制中有i位与之不同,那么随机从d位中选择i位就有种选择方式,即与s的距离为i得节点就有个。
2)证明:由1)所述可知:节点u与节点v的距离为i则分别表示u、v节点的二进制位数中有i 位是不同的。
设节点u表示为:,节点v表示为:,则现在就是要求得从变换到的途径有多少种。
那么利用组合理论知识可知共有即中途径。
所以存在i!条从u到v的长度为i的路径。
2.(18分)6个并行程序的执行时间,用I-VI表示,在1-8个处理器上执行了测试。
下表表示了各程序达到的加速比。
加速比处理器数I II III IV V VI1 1.00 1.00 1.00 1.00 1.00 1.002 1.67 1.89 1.89 1.96 1.74 1.943 2.14 2.63 2.68 2.88 2.30 2.824 2.50 3.23 3.39 3.67 2.74 3.655 2.78 3.68 4.03 4.46 3.09 4.426 3.00 4.00 4.62 5.22 3.38 5.157 3.18 4.22 5.15 5.93 3.62 5.848 3.33 4.35 5.63 6.25 3.81 6.50对其中的每个程序,选出最适合描述其在16个处理器上性能的陈述。
a)在16个处理器上的加速比至少比8个处理器上的加速比高出40%。
中南大学并行计算试卷

中南大学并行计算试卷填充题: (每小题3分、共12分)1.计算机系统结构定义是程序设计者所看到的计算机属性,即概念性,结构,功能性。
2.虚拟存储系统,辅存容量为2*Byte,主存容量为2l'Byte,页面为1Kbyte,则MEM系统提供的程序空间有__ 218页,对应实存空间_ 26 .页,若采用组相联,则整个虚存应分为。
212区。
3.流水线结构的并行性是采用___时间重迭的技术途径。
4.在系统结构中,程序访问局部化性质应用于cache,流水线,虚拟存储器等方面。
简答题: (每小题4分、共24分)1.简述系列机的概念。
.先设计一-种系统结构;按其设计它的系统软件;按照器件状况和硬件技术,研究这种结构的各种实现方法;按速度,价格等不同要求分别提供不同速度,不同配置的各档机器。
2.存储器层次结构是怎样的?其容量、速度、价格是怎样分布的。
速度越来越↑寄存器组容量越来越cache快,价格越主存储器大来越高辅助存储器后援存储器↓3.简述虚拟计算机概念。
计算机只对观察者而存在;功能体现在广义语言上;对该语言提供解释手段;作用在信息处理或控制对象上;简言之,是由软件实现的机器。
4. What is the policy of“write back"" when writing to the cache? (answer in English)The information is written only to the block in the cache.The modified cache block is written to main memory only when it is replaced.5.什么是“数据相关”、“转移相关”?简述之。
数据相关:当前一条指令的执行结果可能在流水线中是后续指令的操作数,它们可能发生了“先读后写”等相关。
它是一种局部相关。
转移相关:由转移指令引起流水线“断流”。
并行算法考试题

1、名词解释:(1)等分宽度:把网络划分为两个相等的部分(节点数之多差1),所需要去掉的网络边的条数。
(2)网络直径:网络中两个节点之间的最远的距离(3)并行运行时间:从第一台处理机开始执行任务开始,到最后一台处理机执行完任务所经历的时间。
(4)并行步:能够同时执行的操作数。
(5)加速比:同一任务在串行计算下的运行时间/并行计算下的运行时间。
2、介绍超立方体网络互连方式的性能指标解答:q维超立方体,等分宽度为2q-1,网络直径:q,网络接口数:q3、按照指令流和数据流,并行计算机可以分为哪些类型?各自适合什么样的并行计算?排名在前20的计算机都是什么类型的计算机?它们的区别是什么?解答:(1)SIMD:适合指令/操作级并行(2)MIMD:适合块、回路或子程序级的并行4、并行算法有哪些设计方法?(1)流水线技术(2)分而治之策略(3)平衡二叉树方法(4)倍增技术(5)加速级联策略5、举例说明平衡树方法的原理?参考:使用n/2台计算机,可以在⎡⎤nlog步完成运算。
26、Logp模型有哪些参数?BSP模型有哪些参数?这两个模型之间的关系是什么?(1) L :源处理机与目标处理机之间进行消息通信所需要等待的延迟时间上限(2) o :处理机用于发送或接收每个消息的时间开销(3) g :连续发送/接收消息的时间间隙(4) P :处理机个数BSP 模型:(1) P :处理机数(2) g :选路器吞吐率(3) L :全局同步之间的时间间隔关系:(1) 本质上等效,可以相互模拟(2) 用BSP 模拟LOGP 所进行的计算时,通常会慢常数倍。
(3) 反之,慢对数倍7、 题目记不清了,只要知道两个公式就可以了,对于logp :L+2o 对于logGp :t α+t β8、 计算加速比和效率的题,具体记不清了,只要会使用公式就可以了。
9、 关于群集系统中QR 分解的题目。
将矩阵的行列都分成5等分,得到它的25个任务,按照贪婪算法的调度思想,画出子任务执行的并行步。
并行算法题库.doc

1.并行计算机是指两台或两台以上的处理机,通过高速网络连接起来而成的并行计算机系统。
2.按指令流和数据流的Flynn分类法,可将并行计算机的分为4类: 单指令流单数据流(SISD),单指令流多数据流(SIMD),多指令流单数据流(MISD),多指令流多数据流(MIMD).3.数值并行算法是为数值计算方法设计的并行算法,它基本上属于的数值分析范畴。
4.并行机的规模是指某一具体并行计算机所具有的。
5.并行算法是适合于并行操作的一类算法总称。
它通常由一些可同时执行的进程来表示,这些进程在执行过程中相互作用于协调工作,以完成对给定问题的求解。
6.在matlab中,矩阵运算A/B表示。
7.内在并行度为100个单位操作的某个算法,相对于每秒只能执行一个单位操作速度的处理机来说是—大粒度还是小粒度—o 内在并行度为10个单位操作的某个算法,相对于每秒能执行一百个单位操作速度的处理机来说是- 大粒度还是小粒度—O8.并行算法的分类:基于运算对象的不同可分为:1)数值并行算法;2)非数值并行算法基于进程间相互执行顺序关系的不同可分为:1)同步并行算法;2)异步并行算法;3)独立的并行算法基于各处理机承担的计算任务粒度的不同可分为:1)细粒度并行算法;2)中粒度并行算法;3)大粒度并行算法9.并行算法运行时间主要包括:算法所需的输入输出(I/O)时间;CPU计算时间;并行开销时间。
10.为简单起见,在进行并行算法性能分析时,一般将并行机的规模视为并行机含有的处理器个数。
11.并行算法的设计方法主要通过哪几种途径实现。
12.算法的并行度是指该算法中可并行执行的单位操作数。
例如:设a,b是两个长度为n的向量,其对应的分量之和为:"知i=l,2,...,n, 则该算法的并行度为n。
13.给出使用并行计算机求解一个应用问题的基本过程图。
应用问题-今理论模型与算法,应用程序与结果14.如果用户想从键盘输入数据,则可以使用函数来进行。
并行计算与高性能计算考核试卷

(以下为答题纸区域,请考生在此区域作答,超出此区域作答无效。)
三、填空题(本题共10小题,每小题2分,共20分,请将正确答案填到题目空白处)
1.并行计算中,将一个大的任务分解成多个子任务的过程称为______。
2.在并行计算中,______是指使用多个处理器执行单个任务的不同部分。
3.高性能计算中,______是一种衡量计算机性能的指标,表示每秒能够执行的浮点运算次数。
C. CUDA
D. Java
5.并行计算中,任务分解与任务分配是()
A.相同的过程
B.互相独立的
C.相互依赖的
D.无关的
6.以下哪个部件不是并行计算机的主要组成部分?()
A.处理器
B.存储器
C.网络接口卡
D.显卡
7.高性能计算领域中,计算速度的主要指标是()
A. MIPS
B. MFLOPS
C. GHz
D. OpenCL
11.并行计算中,以下哪种通信方式开销最小?()
A.同步通信
B.异步通信
C.广播通信
D.全局通信
12.以下哪个术语不是高性能计算中的术语?()
A.性能
B.效能
C.并行度
D.带宽
13.并行计算中,以下哪种同步机制可能会导致死锁?()
A.互斥锁
B.条件变量
C.信号量
D.读写锁
14.以下哪个选项不属于并行计算中的数据依赖类型?()
3. MFLOPS
4.点对点
5.数据并行
6.可扩展性
7.图形处理单元
8.互斥锁
9. SRAM
10.并发
四、判断题
1. ×
2. ×
3. √
并行算法设计与分析考题与答案

《并行算法设计与分析》考题与答案一、1.3,处理器PI的编号是:解:对于n ×n 网孔结构,令位于第j行,第k 列(0≤j,k≤n-1)的处理器为P i(0≤i≤n2-1)。
以16处理器网孔为例,n=4(假设j、k由0开始):由p0=p(j,k)=p(0,0) P8=p(j,k)=p(2,0)P1=p(j,k)=p(0,1) P9=p(j,k)=p(2,1)P2=p(j,k)=p(0,2) P10=p(j,k)=p(2,2)P3=p(j,k)=p(0,3) P11=p(j,k)=p(2,3)P4=p(j,k)=p(1,0) P12=p(j,k)=p(3,0)P5=p(j,k)=p(1,1) P13=p(j,k)=p(3,1)P6=p(j,k)=p(1,2) P14=p(j,k)=p(3,2)P7=p(j,k)=p(1,3) P15=p(j,k)=p(3,3)同时观察i和j、k之间的关系,可以得出i的表达式为:i= j * n+k一、1.6矩阵相乘(心动算法) a)相乘过程 设A 矩阵=1212211221214321 B 矩阵=1234432121211212 【注】矩阵元素中A(i,l)表示自左向右移动的矩阵,B(l,j)表示自上向下移动的矩阵,黑色倾斜加粗标记表示已经计算出的矩阵元素,如12, C(i,j)= C(i,j)+ A(i,l)* B(l,j) 12、4、6、8、10计算完毕b)可以在10步后完成,移动矩阵长L=7,4*4矩阵N=4,所以需要L+N-1=10二、(2.1)a)示例n=8时算法的计算过程:b)证明上述算法的复杂度T(n)=O(LOG n),W(n)=O(n)证明:ALGORITHM Prefix Sum T(n ) W (n) (1)if n=1 then ……O (1) W1(n )=O (1)(2) for ……O (1) W2 (n)= O (n/2)(3) Recursively ……T (n/2) W3 (n/2)(4) for ……O (1) W4 (n )=O (n) 则:T (n )={ O (1) n=1{ T(n/2)+O(1) , n>1W(n)= { O(1) , n=1{ W(n/2)+O(n) , n>1展开解得:T(n)=O (log n )W(n)= O(n)二(2.3)、a) lgnb)如果不是2的幂次,增加一个空分量构成2的幂次,它不会影响算法的复杂度。
并行计算 - 练习题

并行计算 - 练习题2021年《并行计算系统》复习题1. (15分)给出五种并行计算机体系结构的名称,并分别画出其典型结构。
①并行向量处理机(PVP)②对称多机系统(SMP)③大规模并行处理机(MPP)④分布式共享存储器多机系统(DSM)⑤工作站机群(COW)2. (10分)给出五种典型的访存模型,并分别简要描述其特点。
①均匀访存模型(UMA):物理存储器被所有处理机均匀共享所有处理机访存时间相同适于通用的或分时的应用程序类型②非均匀访存模型(NUMA):是所有处理机的本地存储器的集合访问本地LM的访存时间较短访问远程LM的访存时间较长③Cache一致性非均匀访存模型(CC-NUMA): DSM结构④全局Cache访存模型(COMA):是NUMA的一种特例,是采用各处理机的Cache组成的全局地址空间远程Cache的访问是由Cache目录支持的⑤非远程访存模型(NORMA):在分布式存储器多机系统中,如果所有存储器都是专用的,而且只能被本地存储机访问,则这种访问模型称为NORAM 绝大多数的NUMA支持NORAM 在DSM中,NORAM的特性被隐匿的3. (15分)对于如下的静态互连网络,给出其网络直径、节点的度数、对剖宽度,说明该网络是否是一个对称网络。
网络直径:8 节点的度数:2对剖宽度:2该网络是一个对称网络4. (15分)设一个计算任务,在一个处理机上执行需10个小时完成,其中可并行化的部分为9个小时,不可并行化的部分为1个小时。
问:(1)该程序的串行比例因子是多少,并行比例因子是多少?串行比例因子:1/10 并行比例因子:9/10(2)如果有10个处理机并行执行该程序,可达到的加速比是多少? 10/(9/10 + 1) = 5.263(3)如果有20个处理机并行执行该程序,可达到的加速比是多少? 10/(9/20 + 1)= 6.8975. (15分)什么是并行计算系统的可扩放性?可放性包括哪些方面?可扩放性研究的目的是什么?一个计算机系统(硬件、软件、算法、程序等)被称为可扩放的,是指其性能随处理机数目的增加而按比例提高。
北京大学《并行与分布式计算导论》2020-2021学年第一学期期末试卷

北京大学《并行与分布式计算导论》2020-2021学年第一学期期末试卷《并行与分布式计算导论》院/系——年纪——专业——姓名——学号——考试范围: 《并行与分布式计算导论》;满分:120 分;考试时间:120 分钟一、选择题(每题2分,共20分)1. 在并行计算中,下列哪种技术被用于将任务分配给多个处理器以加快计算速度?A. 串行计算B. 并行处理C. 云计算D. 网格计算2. 在并行与分布式计算中,下列哪个术语描述了处理单元之间的通信和协调?A. 同步B. 异步C. 分布式系统D. 消息传递3. 云计算中的IaaS 基础设施即服务务主要提供哪哪种类型的务务?A. 软件开发工具B. 虚拟机C. 应用软件D. 存储空间4. 在并行计算中,共享内存系统通常通过哪种方式实现处理器之间的数据共享?A. 网络B. 共享总线C. 磁盘D. 分布式数据库5. Flynn的分类法要提用于描述什么?A. 并行计算机的硬件架构B. 分布式系统的通信协议C. 云计算的务务模式D. 软件并行化技术6. 在分布式系统中,下列哪项技术常用于确保数据的一致性?A. 分布式锁B. 负载均衡C. 缓存技术D. 容错处理7. 关于MapReduce,下列哪个说法是正确的?A. 它是串行计算模型B. 要提用于图计算C. 适用于大规模数据处理D. 只能在单台机器上运行8. 在并行计算中,哪项技术常用于降低任务的粒度以供高并行度?A. 负载均衡B. 任务划分C. 冗余计算D. 同步控制9. 下列哪项技术不是用于分布式系统中的数据同步?A. PaxosB. RaftC. ZookeeperD. MPI10. 弹性计算要提指的是什么?A. 根据需求动态调整计算资源B. 使用高性能计算硬件C. 分布式存储系统D. 并行算法优化二、简答题(每题10分,共40分)1. 简述并行计算与分布式计算的要提区别。
2. 描述一种常见的并行编程模型,并解释其工作原理。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第 1 页 ( 共 8 页 )
命题纸使用说明:1、字迹必须端正,以黑色碳素墨水书写在框线内,文字与图均不得剪贴,以保证“扫描”质量;
2、命题纸只作考试(测验)命题所用,不得移作他用。
第 2 页 ( 共 8 页 )
第 3 页 ( 共 8 页 )
命题纸使用说明:1、字迹必须端正,以黑色碳素墨水书写在框线内,文字与图均不得剪贴,以保证“扫描”质量;
2、命题纸只作考试(测验)命题所用,不得移作他用。
第 5 页 ( 共 8 页 )
命题纸使用说明:1、字迹必须端正,以黑色碳素墨水书写在框线内,文字与图均不得剪贴,以保证“扫描”质量;
2、命题纸只作考试(测验)命题所用,不得移作他用。
第 7 页 ( 共 8 页 )
命题纸使用说明:1、字迹必须端正,以黑色碳素墨水书写在框线内,文字与图均不得剪贴,以保证“扫描”质量;
2、命题纸只作考试(测验)命题所用,不得移作他用。
命题纸使用说明:1、字迹必须端正,以黑色碳素墨水书写在框线内,文字与图均不得剪贴,以保证“扫描”质量;
2、命题纸只作考试(测验)命题所用,不得移作他用。
命题纸使用说明:1、字迹必须端正,以黑色碳素墨水书写在框线内,文字与图均不得剪贴,以保证“扫描”质量;
2、命题纸只作考试(测验)命题所用,不得移作他用。
命题纸使用说明:1、字迹必须端正,以黑色碳素墨水书写在框线内,文字与图均不得剪贴,以保证“扫描”质量;
2、命题纸只作考试(测验)命题所用,不得移作他用。
命题纸使用说明:1、字迹必须端正,以黑色碳素墨水书写在框线内,文字与图均不得剪贴,以保证“扫描”质量;
2、命题纸只作考试(测验)命题所用,不得移作他用。