并行处理技术习题2012

合集下载

并行计算题目答案汇总

并行计算题目答案汇总

并⾏计算题⽬答案汇总第1题(1)什么是并⾏计算?(2)它的优点有哪些?(3)可以通过哪些结构完成并⾏计算?1.并⾏计算就是在并⾏计算或分布式计算机等⾼性能计算系统上所做的超级计算。

(P3)2.计算极⼤地增强了⼈们从事科学研究的能⼒,⼤⼤地加速了把科技转化为⽣产⼒的过程,深刻地改变着⼈类认识世界和改造世界的⽅法和途径。

计算科学的理论和⽅法,作为新的研究⼿段和新的设计与创造技术的理论基础,正推动着当代科学与技术向纵深发展。

(P4)3.单指令多数据流SIMD、对称多处理机SMP、⼤规模并⾏处理机MPP、⼯作站机群COW、分布共享存储DSM多处理机。

(P22)第2题什么是⽹络计算?它的特点?它与分布式计算、集群计算的关系?(P104)⽹络计算:在⼯作站机群COW环境下进⾏的计算称为⽹络计算。

特点:⽹络计算结合了客户机/服务器结构的健壮性、Internet⾯向全球的简易通⽤的数据访问⽅式和分布式对象的灵活性,提供了统⼀的跨平台开发环境,基于开放的和事实上的标准,把应⽤和数据的复杂性从桌⾯转移到智能化的⽹络和基于⽹络的服务器,给⽤户提供了对应⽤和信息的通⽤、快速的访问⽅式。

与分布式计算、集群计算的关系:分布式计算是⼀门计算机科学,它研究如何把⼀个需要⾮常巨⼤的计算能⼒才能解决的问题分成许多⼩的部分,然后把这些部分分配给许多计算机进⾏处理,最后把这些计算结果综合起来得到最终的结果。

集群计算是使⽤多个计算机,如典型的个⼈计算机或UNIX⼯作站;多个存储设备;冗余互联,来组成⼀个对⽤户来说单⼀的⾼可⽤性的系统。

因此,⽹络计算与分布式计算和集群计算都是属于计算密集型,数据密集型和⽹络密集型应⽤。

第3题表征并⾏系统的性能指标有哪些?并⾏系统的加速⽐如何定义?它能否完全确定系统的性能?为什么?a.表征并⾏系统的性能指标主要有:CPU和存储器的基本性能指标,通信开销以及系统机器的成本、价格与性价⽐,还有系统加速⽐和系统可扩放性(p88页3.3);其中CPU和存储器的基本性能指标包括:⼯作负载,并⾏执⾏时间,存储器的层次结构和存储器的带宽。

数字电子习题及参考答案2012

数字电子习题及参考答案2012

专用数字电子技术基础试题(一)一、选择题: (选择一个正确的答案填入括号内,每题3分,共30分 )1.设下图中所有触发器的初始状态皆为0,找出图中触发器在时钟信号作用下,输出电压波形恒为0的是:()图。

2.下列几种TTL电路中,输出端可实现线与功能的电路是()。

A、或非门B、与非门C、异或门D、OC门3.对CMOS与非门电路,其多余输入端正确的处理方法是()。

A、通过大电阻接地(>1.5KΩ)B、悬空C、通过小电阻接地(<1KΩ)D、通过电阻接V CC4.图2所示电路为由555定时器构成的()。

A、施密特触发器B、多谐振荡器C、单稳态触发器D、T触发器5.请判断以下哪个电路不是时序逻辑电路()。

图2A、计数器B、寄存器C、译码器D、触发器6.下列几种A/D转换器中,转换速度最快的是()。

图2A、并行A/D转换器B、计数型A/D转换器C、逐次渐进型A/D转换器D、双积分A/D转换器7.某电路的输入波形 u I 和输出波形 u O 如图 3所示,则该电路为()。

图3A、施密特触发器B、反相器C、单稳态触发器D、JK触发器8.要将方波脉冲的周期扩展10倍,可采用()。

A、10级施密特触发器B、10位二进制计数器C、十进制计数器D、10位D/A转换器9、已知逻辑函数与其相等的函数为()。

A、B、C、D、10、一个数据选择器的地址输入端有3个时,最多可以有()个数据信号输出。

A、4B、6C、8D、16二、填空题 : (每空1分,共10分)1. (30.25) 10 = ( )2 = ( )16。

2 . 逻辑函数L = + A+ B+ C +D = 。

3 . 三态门输出的三种状态分别为:、和。

4 . 主从型JK触发器的特性方程= 。

5 . 用4个触发器可以存储位二进制数。

6 . 存储容量为4K×8位的RAM存储器,其地址线为条、数据线为条。

三、逻辑函数化简(每题5分,共10分)1、用代数法化简为最简与或式Y= A +2、用卡诺图法化简为最简或与式Y= + C +A D,约束条件:A C + A CD+AB=0四、分析下列电路。

并行计算-习题及答案-第12章 并行程序设计基础

并行计算-习题及答案-第12章 并行程序设计基础

第十二章 并行程序设计基础习题例题:1、假定有n 个进程P(0),P(1),…,P(n -1),数组元素][i a 开始时被分配给进程P(i )。

试写出求归约和]1[]1[]0[-+++n a a a 的代码段,并以8=n 示例之。

2、假定某公司在银行中有三个账户X 、Y 和Z ,它们可以由公司的任何雇员随意访问。

雇员们对银行的存、取和转帐等事务处理的代码段可描述如下:/*从账户X 支取¥100元*/atomic {if (balance[X] > 100) balance[X] = balance[X]-100; }/*从账户Y 存入¥100元*/atomic {balance[Y] = balance[Y]-100;}/*从账户X 中转¥100元到帐号Z*/atomic {if (balance[X] > 100){balance[X] = balance[X]-100;balance[Z] = balance[Z]+100;} }其中,atomic {}为子原子操作。

试解释为什么雇员们在任何时候(同时)支、取、转帐时,这些事务操作总是安全有效的。

3、考虑如下使用lock 和unlock 的并行代码:parfor (i = 0;i < n ;i++){noncritical sectionlock(S);critical sectionunlock(S);}假定非临界区操作取T ncs时间,临界区操作取T cs时间,加锁取t lock时间,而去锁时间可忽略。

则相应的串行程序需n( T ncs + T cs )时间。

试问:①总的并行执行时间是多少?②使用n个处理器时加速多大?③你能忽略开销吗?4、计算两整数数组之内积的串行代码如下:Sum = 0;for(i = 0;i < N;i++)Sum = Sum + A[i]*B[i];试用①相并行;②分治并行;③流水线并行;④主-从行并行;⑤工作池并行等五种并行编程风范,写出如上计算内积的并行代码段。

2012级操作系统试题

2012级操作系统试题

Operating System Exam (For Grade 2000)Class Name Student ID一、For each of the following statements, Choosing T rue or False (24 marks)1. Binary semaphores are those that are used by no more than two threads.2. The Banker's algorithm is a way of preventing deadlock .3. A multi-level indexed file permits faster random access than a contiguously allocated file.4. An atomic operation is a machine instruction or a sequence of instructions that must be executed to completion without interruption.5. Deadlock is a situation in which two or more processes (or threads) are waiting for an event that will occur in the future.6. Starvation is a situation in which a process is denied access to a resource because of the competitive activity of other, possibly unrelated, processes.7. While a process is blocked on a semaphore's queue, it is engaged in busy waiting.8. Mutual exclusion can be enforced with a general semaphore whose initial value is greater than 1.9. External fragmentation can be prevented (almost completely) by frequent use of compaction, but the cost would be too high for most systems.10. A page frame is a portion of main memory.11. The working set of a process can be changed in response to actions by other processes.12. Thrashing will never be a problem if the system has 1 GB of real memory.13. A printer is an example of a logical resource.14. Versions of OS/360 are still widely used today.15. When an executing process is stopped by the scheduler, it is said to be blocked.16.Interrupts are used to achieve a typical timesharing OS.1.二进制信号量是指那些不能超过两个线程使用。

并行计算-习题及答案-例题习题讲解

并行计算-习题及答案-例题习题讲解

例题习题讲解例1 SIMD-SM上求最大值算法Beginfor k=m-1 to 0 dofor j=2k to 2k+1-1 par-doA[j]=max{A[2j], A[2j+1]}end forend forend时间分析t(n)=m×O(1)=O(logn)p(n)=n/2c(n)=O(nlogn) 非成本最优例2 令n=2k(k>=0),求n个数和的并行算法算法运行时间:t(n)=O(logn)总运算量: W(n)=W(1)(n)+W(2)(n)+W(3)(n)=n+∑n/2h+1=O(n)由Brent定理知: t(n)=O(n/p+logn)例3 设A为矩阵,有如下串行程序段:f o r i=1t o n d of o r j=1t o n d oa[3i,2j]=a[3i-2,2j-1]e n df o re n df o r其相关方向向量为,可知行和列间同时存在数据相关。

在此我们可以试用行划分、列划分和方块划分.在行划分的情况下令m=┌n/p┐,例1的串行程序段可以转化为如下的并行程序段:f o r k=1t o P P a r-d of o r i1=1t o m d of o r j=1t o n d oa[3(k-1)m+3i1,2j]=a[3(k-1)m+3i1-2,2j-1]e n df o re n df o re n df o r例4 设A为一个n阶方阵,有如下串行程序段:f o r i=1t o n d of o r j=1t o n d oa[i,j]=a[i-1,j]e n df o re n df o r分析矩阵A的元素下标i和j,则i和j的相关方向向量为,各列之间数据无任何相关关系。

因此对矩阵A可按列划分。

串行程序段可转化为如下并行程序段:f o r k=1t o P P a r-d of o r j1=1t o m d of o r i=1t o n d oa[i,(k-1)m+j1]=a[i-1,(k-1)m+j1] e n d f o re n df o re n df o r例5注:本例无链路竞争和死锁现象例6 E立方选路0110(S)1101(D)1011(R)例7 DNS乘法示例C00=1×(-5)+2×7=9C01=1×(-6)+2×8=10C10=3×(-5)+4×7=13C11=3×(-6)+4×8=14例8 上三角方程组的回代解法并行化(1)SISD上的回代算法Begin(1)for i=n downto 1 do(1.1)x i=b i/a ii(1.2)for j=1 to i-1 dob j=b j-a ji x ia ji=0endforendforEnd(2)SIMD-CREW上的并行回代算法- 划分: p个处理器行循环带状划分- 算法Beginfor i=n downto 1 dox i=b i/a iifor all P j, where 1≤j≤p do for k=j to i-1 step p do b k=b k-a ki x ia ki=0endforendforendforEnd // p(n)=n, t(n)=n例9 n=8的BF网络表示P r,i与上层P r-1,i, P r-1,j相连, 这里j与i仅在第r位不同例10 一个在MPI中创建新通信域的例子M P I_C o m m M y W o r l d,S p l i t W o r l d;i n t m y_r a n k,g r o u p_s i z e,C o l o r,K e y;M P I_I n i t(&a r g c,&a r g v);M P I_C o m m_d u p(M P I_C O M M_W O R L D,&M y W o r l d);M P I_C o m m_r a n k(M y W o r l d,&m y_r a n k);M P I_C o m m_s i z e(M y W o r l d,&g r o u p_s i z e);C o l o r=m y_r a n k%3;K e y=m y_r a n k/3;M P I_C o m m_s p l i t(M y W o r l d,C o l o r,K e y,&S p l i t W o r l d);例11 考虑如下程序段:L1:f o r I=1t o50d o...S:X(2*I)=......T:...=...X(3*I+1)......e n df o r这里:f1(I)=2*I;g1(J)=3*J+1。

计算机系统结构习题课(2012)-万继光

计算机系统结构习题课(2012)-万继光
• 计算机系统有三个部件可以改进,这三个部件的加速比如下: 部件加速比1=30; 部件加速比2=20; 部件加速比3=10; • (1) 如果部件1和部件2的可改进比例为30%,那么当部件3的可改进 比例为多少时,系统的加速比才可以达到10? • (2) 如果三个部件的可改进比例为30%、30%和20%,三个部件同时 改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例 是多少?
M W B S S S S S S E X M W B S S S E X I D I F M W B E X I D I F M W B S S S S E X I D I F M W B S S S E M W X B S S S I F
CPU时间 = IC ×CPI×时钟周期时间 n = (CPIi×ICi)×时钟周期时间
i=1
n (CPIi×ICi) n ICi 时钟周期数 i=1 CPI = = = (CPIi× IC ) IC IC i=1
f MIPS速 率 CPI 10 6
▲ 2/101
习题1.7
对于一台400MHz计算机执行标准测试程序,程序中指令类型, 执行数量和平均时钟周期数如下:
习题2.14
IEEE754
e N m rm
为便于软件的移植,浮点数的表示格式应该有统一标准 (定义)。1985年IEEE提出了IEEE754标准。 该标准规定基数为2,阶码E用移码表示,尾数M用原码表 示,根据原码的规格化方法,最高数字位总是1,该标准 将这个1缺省存储,使得尾数表示范围比实际存储的多一 位。
采用定向技术消除数据相关
习题3.11(1)
1 LOOP: LW R1 0(R2) IF ADDI R1 R1 #1 SW 0(R2) R1 ADDI R2 R2 #4 SUB R4 R3 R2 BNZ R4 LOOP 2 ID IF 3 EX ID IF 4 5 6 7 8 9 1 0 1 1 1 2 1 3 1 4 1 1 1 1 1 5 6 7 8 9

电子科技大学2012微机原理半期试题及答案

电子科技大学2012微机原理半期试题及答案

10. 某 CRT 显示器的分辨率为 1024×1024 像素,每个像素的颜色数为 256,则其刷新存储器的容量至
少是
1
MB。
注:
颜色数为 256 色即颜色位数为 8bit。
进行 2D 应用时占用显存容量=水平分辨率×垂直分辨率×颜色位数 /8bit=1024x1024x8bit/8bit=1048576byte=1MB。
37. 存储器内容不会因电源的关闭而消失的存储器类型是(D)。
A、DRAM
B、SRAM
C、SDRAM
D、EEROM
38. 在主机与外围设备进行数据交换时,为解决两者之间的同步与协调、数据格式转换等问题,必须 要引入(C)。
A、数据缓冲器 B、I/O 总线 C、I/O 接口
D、串/并转换器
39. 除了 I/O 设备本身的性能外,影响嵌入式系统 I/O 数据传输速度的主要因素是:(D)。
A.执行完当前指令之后响应中断
B.停止执行当前指令
C.中断执行当前指令
D.放弃执行当前指令
26. 下列关于闪速存储器(Flash Memory)说法错误的是(B)。
A.抗震能力比硬盘强
B.掉电以后信息消失
C.可以整块芯片电擦除和部分电擦除
D.可反复使用
27. 下面关于总线的叙述中,错误的是(D)。
A、总线位宽指的是单位时间内能同时传送的最大数据位数
C、寄存器,Cache,主存储器,辅存 D、寄存器,主存储器,Cache,辅存
33. 分页管理存储系统中,通过地址映射表来完成虚拟地址到物理地址转换的部件是:(C)。
A、寄存器
B、ALU
C、MMU
D、.接口
34. 为了提高系统总线的驱动能力可采用( B )

江苏省一级计算机信息技术真题2012年春(4)

江苏省一级计算机信息技术真题2012年春(4)

江苏省一级计算机信息技术真题2012年春(4)(总分:103.00,做题时间:90分钟)一、基础知识必做题(总题数:0,分数:0.00)二、单选题(总题数:23,分数:23.00)1.下列有关信息技术和信息产业的叙述错误的是______。

(分数:1.00)A.信息技术与传统产业相结合,对传统产业进行改造,极大提高了传统产业的劳动生产率B.信息产业是指生产制造信息设备的相关行业与部门√C.信息产业已经成为世界范围内的朝阳产业和新的经济增长点D.我国现在已经成为世界信息产业的大国解析:2.二进制数01与01分别进行算术加和逻辑加运算,其结果用二进制形式分别表示为______。

(分数:1.00)A.01、10B.01、01C.10、01 √D.10、10解析:3.十进制算式7×64+4×8+4的运算结果用二进制数表示为______。

(分数:1.00)A.111001100B.111100100 √C.110100100D.111101100解析:4.就计算机对人类社会的进步与发展所起的作用而言,下列叙述不够确切的是______。

(分数:1.00)A.增添了人类发展科学技术的新手段B.提供了人类创造和传承文化的新工具C.引起了人类工作与生活方式的新变化D.创造了人类改造自然所需要的新物质资源√解析:5.构成一个完整的计算机系统,比较确切的说法是:它应该包括______。

(分数:1.00)A.运算器、存储器、控制器B.主存和外部设备C.主机和实用程序D.硬件系统和软件系统√解析:6.PC机使用的芯片组大多由两块芯片组成,它们的功能主要是______和I/O控制。

(分数:1.00)A.寄存数据B.存储控制√C.运算处理D.高速缓冲解析:7.下列选项中,______不包含在BIOS中。

(分数:1.00)A.加电自检程序B.扫描仪、打印机等设备的驱动程序√C.CMOS设置程序D.系统主引导记录的装入程序解析:8.下面有关计算机输入输出操作的叙述错误的是______。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、针对PVP,SMP,MPP,DSM,COW五种并行结构,指出每一种结构的2
个独特特性(独特特性指在任何其它模型中没有)。

2、写出三个可扩展定律的加速比:固定工作负载加速比、固定时间加速比和受
限于存储器加速比。

Ch2:
1、比较超标量处理器和超流水线处理器。

2、就指令系统规模、指令格式、寻址方式以及每条指令周期数5个方面,比较RISC和CISC 处理器的指令系统。

Ch3:
1、比较WI,WU,WT,WB。

2、从存储器结构的角度列出MIMD的详细分类。

1、对于n维带环立方体(CCC,Cube-Connected Cycles)、具有N个结点的完全二叉树(Binary Tree)网络和具有N个结点的二维网格(2D Mesh),填写下列空格:
2、请画出用2×2开关(switch)和均匀洗牌拓扑连接(Perfect Shuffle)的8×8 Omega (Ω) 网络。

Ch5&Ch6:
1、专用机群和非专用机群比较。

2、如图为一个共享磁盘的双结点机群,假定只有结点会发生故障,且每个结点的可用性为99%。

系统中其他部分(如:互连结构和共享的RAID磁盘)为100%可用。

另外假定当一个结点发生故障时,将它的工作负载转移到其他结点上所用的时间为0。

a.如果忽略预期关机时间,机群的可用性为多少?
b.如果机群每月要用1小时维护,其可用性是多少?
Ch7:
1、比较SIMD,MIMD,SPMD,MPMD四种执行方式。

2、在以下的代码中,进程P向进程Q发送包含在变量M中的一个消息,Q将此消息接收到它的变量S中:
进程P 进程Q
M = 10; S = -100;
Send M to Q; Receive S from P;
M = 20; X = S + 1;
Output(X);
试分别在同步、锁定和非锁定方式下,分析可能的结果(X的可能值)。

Ch8:
1、用MPI 编写计算π值的SPMD 程序。

注:
2、观察由三个进程执行的一个MPI 程序,开始时它们全都执行下列代码: int i, j, my_rank, group_size, A[3], B[3], tag=1, root=0; MPI_Comm comm; MPI_Init(&argc, &argv);
Comm = MPI_COMM_WORLD;
MPI_Comm_rank(comm, &my_rank); MPI_Comm_size(comm, &group_size); for (i=0; i<3; i++)
{ A[i]=B[i]=my_rank*group_size+i;}
则在执行以下的每一段代码后,第2个进程中的A[2]和B[1]分别是多少? 1) if (my_rank==0) {
MPI_Bcast(A,3,MPI_INT,root,comm); MPI_Send(B,3,MPI_INT,2,tag,comm); } else if (my_rank == 1) MPI_Bcast(A,3,MPI_INT,root,comm); else { MPI_Recv(B,3,MPI_INT,0,tag,comm); MPI_Bcast(A,3,MPI_INT,root,comm); };
2) MPI_Bcast(A,3,MPI_INT,root,comm);
3)MPI_Scan(A,B,1,MPI_INT,MPI_SUM,comm);
N
N
i dx x N
i 1
*
))
5.0(14(
1402
1
2∑

<≤++≈+=π
3、扫描(Scan)是对归约(Reduction)的通用化。

假设有n个进程,进程P(i)含有一个记作a[i]
的值,i=0,1,…,n-1。

在扫描之后,进程P(i)将得到结果a[i]+…+a[n-1]。

1)给出一个短单代码程序以计算此扫描。

扫描操作用logn个超步实现;
2)画出一张图,说明你的程序当n=8时,如何计算此扫描。

请沿用如下例图(归约操作)的风格。

相关文档
最新文档