并行计算课程报告

合集下载

并行计算与分布式系统实验报告

并行计算与分布式系统实验报告1. 引言“彼岸花，开过就只剩残香。

”这是一句来自中国古代文学名篇《红楼梦》的名言。

它告诉我们，珍贵的事物往往难以长久保持，只有通过合理的分工与协作，才能实现最大的效益。

在计算机科学领域，这句话同样适用。

并行计算和分布式系统正是通过有效地利用计算资源，实现高效的数据处理与任务分工，从而提高计算效率和系统性能。

2. 并行计算介绍并行计算是一种利用多个处理器或计算节点同时执行计算任务的方法。

它通过将大型计算问题划分为多个小的子问题，并同时解决这些子问题，大幅提高计算速度。

并行计算有两种主要的形式：数据并行和任务并行。

数据并行将大型数据集分割成多个小块，分别交给不同的处理器进行处理；任务并行将不同的任务分配到不同的处理器上同时执行。

3. 分布式系统介绍分布式系统是一组互连的计算机节点，通过网络相互协作以实现共同的目标。

分布式系统可以分布在不同地理位置的计算机上，通过消息传递和远程过程调用等通信机制实现节点间的协作。

分布式系统具有高可靠性、可扩展性和容错性的特点，并广泛应用于云计算、大数据处理和分布式存储等领域。

4. 并行计算和分布式系统的关系并行计算和分布式系统之间存在密切的关系。

分布式系统提供了并行计算所需的底层基础设施和通信机制，而并行计算则借助分布式系统的支持，实现任务的并行处理和数据的高效交换。

通过充分利用分布式系统中的计算资源，可以实现更高效的并行计算，并加速大规模数据处理和科学计算。

5. 并行计算与分布式系统实验在完成本次实验中，我们使用了一台集群式分布式系统，包括8台计算节点和1台主控节点。

我们利用MPI（Message Passing Interface）实现了一个并行计算的案例，该案例通过并行处理大规模图像数据，实现图像的快速处理和分析。

实验中，我们首先将图像数据划分成多个小块，并分发给不同的计算节点进行处理。

每个计算节点利用并行算法对图像进行滤波和边缘检测，然后将处理结果返回给主控节点。

并行计算课程报告.docx

成绩：并行计算导论课程报告专业：软件工程班级：软件二班学号：************姓名：*** 2017 年6 月 1 日1、并行计算的实际意义并行计算或称平行计算是相对于串行计算来说的。

它是一种一次可执行多个指令的算法，目的是提高计算速度，及通过扩大问题求解规模，解决大型而复杂的计算问题。

所谓并行计算可分为时间上的并行和空间上的并行。

时间上的并行就是指流水线技术，而空间上的并行则是指用多个处理器并发的执行计算。

在应用需求方面，人类对计算机性能的需求总是永无止境的，在诸如预测模型的构造和模拟、工程设计和自动化、能源勘探、医学、军事以及基础理论研究等领域中都对计算提出了极高的具有挑战性的要求。

例如，在作数值气象预报时，要提高全球气象预报的准确性，据估计在经度、纬度和大气层方向上至少要取 200*100*20 ＝40 万各网格点。

并行计算机产生和发展的目的就是为了满足日益增长的大规模科学和工程计算、事务处理和商业计算的需求。

问题求解最大规模是并行计算机的最重要的指标之一，也是一个国家高新技术发展的重要标志。

2、拟优化的应用介绍应用 jacobi 迭代近似求解二维泊松方程。

二维泊松方程：u( x, y) f (x, y), ( x, y)u( x, y)g( x, y), ( x, y)其中2 2(0,W ) * (0, H ) ，u( x, y)x 2u ( x, y)y 2u( x, y)f (x, y) 和g (x, y) 已知函数，分定在的内部和界上。

于任意正整数Mx和 N y，将网格剖分成 Mx* Ny个相同的方格。

在网格点上，用二中心差分来近似二偏数。

2ui 1, j2ui , jui 1, jx2u(ih x, jh y)h x 22 ui , j 12ui, jui , j 1u(ih x , jh y )h y 2y2将差分近似代入泊松方程，便得到了五点差分离散格式，泊松方2(h 2h 2 )uh 2 (ui 1, jui 1, j ) h 2 (ui , j 1 ui , j 1) h 2h 2 fi , jxyi , jyxx y 程的求1 iM x 1,1 jN x之后用典的 jacobi 算法来求解此方程。

并行计算实训课程学习总结并行程序设计与性能优化

并行计算实训课程学习总结并行程序设计与性能优化并行计算实训课程学习总结：并行程序设计与性能优化在本学期的并行计算实训课程中，我学习了并行程序设计与性能优化的基本概念和技巧。

通过课程的学习，我对并行计算的原理和应用有了更深入的了解，并且掌握了一些重要的并行编程工具和技术。

本文将对我在课程学习中所获得的收获和体会进行总结。

一、并行计算基础知识的学习在课程的初期，我们首先系统地学习了并行计算的基础知识。

我们了解了并行计算的定义和特点，并且学习了一些常用的并行计算模型和编程范式，如共享内存和分布式内存，并行编程的基本概念等。

通过这些学习，我对并行计算的概念和原理有了更加清晰的认识，并且了解到了并行计算在大规模数据处理和科学计算领域的重要性。

二、并行程序设计的实践在掌握了并行计算的基础知识后，我们进行了一系列的并行程序设计实践。

我们采用了不同的并行编程模型和工具，如OpenMP和MPI，并编写了一些简单的并行程序。

通过实践，我学会了如何在程序中进行任务划分和数据划分，并且掌握了一些常用的并行编程技巧，如粒度调整、负载平衡等。

这些实践帮助我更好地理解了并行程序设计的思想和方法，并且提高了我的编程能力。

三、性能优化的策略与技术在实践的基础上，我们进一步学习了性能优化的策略与技术。

我们了解了一些常见的性能瓶颈，如数据传输、负载不平衡等，并学习了一些性能优化的方法和工具，如并行算法设计、并行调试和性能分析工具等。

通过对这些策略和技术的学习，我学会了如何在编程过程中尽可能地提高程序的并行性和性能，并且提高了我的问题分析和解决能力。

综上所述，通过本学期的并行计算实训课程，我不仅学会了并行程序设计与性能优化的基本理论和技术，还提高了我的实践能力和问题解决能力。

这门课程对我今后的学习和研究具有重要的指导意义。

我将继续努力学习，并将所学知识应用到实际项目中，为实现高效的并行计算做出贡献。

注：本文仅为参考范文，具体内容需要根据实际情况和要求进行修改和补充。

并行计算实验一报告

并行计算实验一报告广东技术师范学院实验报告计算机科学与学院: 计算机科学学院专业: 班级: 成绩: 技术姓名: 学号: 组别: 组员: 实验地点: 工业中心203 实验日期: 指导教师签名: 预习情况操作情况考勤情况数据处理情况实验 (一) 项目名称: 建立并行计算平台一、实验目的在一个局域网中建立能够互相通信的两台计算机，为以后实验建立一个实验平台。

二、实验内容:1.1 系统要求安装MPICH for Microsoft Windows 对系统有如下要求:Windows NT4/2000/XP 的Professional 或Server 版(不支持Windows 95/98) 所有主机必须能够建立TCP/IP 连接MPICH 支持的编译器有:MS VC++ 6.x，MS VC++.NET，Compaq Visual Fortran 6.x，Intel Fortran，gcc ，以及g77 。

安装MPICH ，必须以管理员的身份登录。

1.2 安装以管理员的身份登录每台主机，在所有主机上建立一个同样的账户(当然也可以每个机器使用不同的用户名和账户，然后建立一个配置文件，使用命令行的方式运行程序)，然后，运行下载的安装文件，将MPICH 安装到每台主机上。

打开“任务管理器”中的“进程”选项卡，查看是否有一个mpd.exe 的进程。

如果有的话说明安装成功。

以后每次启动系统，该进程将自动运行。

打开任务管理器如下:1.3 注册与配置安装好MPICH 之后还必须对每台计算机进行注册和配置才能使用。

其中注册必须每台计算机都要进行，配置只要在主控的计算机执行就行了。

注册的目的是，将先前在每台计算机上申请的账号与密码注册到MPICH 中去，这样MPICH 才能在网络环境中访问每台主机。

配置方法:运行“mpich\mpd\bin\MPIRegister.exe”首先会提示输入用户账号，然后会提示输入两边密码，之后会问你是否保持上面的设定。

并行计算实验报告一

并行计算实验报告一江苏科技大学计算机科学与工程学院实验报告评定成绩指导教师实验课程:并行计算宋英磊实验名称:Java多线程编程学号: 姓名: 班级: 完成日期:2014年04月22日1.1 实验目的(1) 掌握多线程编程的特点;(2) 了解线程的调度和执行过程;(3) 掌握资源共享访问的实现方法。

1.2 知识要点1.2.1线程的概念(1) 线程是程序中的一个执行流,多线程则指多个执行流;(2) 线程是比进程更小的执行单位,一个进程包括多个线程;(3) Java语言中线程包括3部分:虚拟CPU、该CPU执行的代码及代码所操作的数据。

(4) Java代码可以为不同线程共享，数据也可以为不同线程共享; 1.2.2 线程的创建(1) 方式1:实现Runnable接口Thread类使用一个实现Runnable接口的实例对象作为其构造方法的参数，该对象提供了run方法，启动Thread将执行该run方法;(2) 方式2:继承Thread类重写Thread类的run方法;1.2.3 线程的调度(1) 线程的优先级, 取值范围1,10，在Thread类提供了3个常量，MIN_PRIORITY=1、MAX_ PRIORITY=10、NORM_PRIORITY=5;, 用setPriority()设置线程优先级，用getPriority()获取线程优先级; , 子线程继承父线程的优先级，主线程具有正常优先级。

(2) 线程的调度:采用抢占式调度策略，高优先级的线程优先执行，在Java 中，系统按照优先级的级别设置不同的等待队列。

1.2.4 线程的状态与生命周期说明:新创建的线程处于“新建状态”，必须通过执行start()方法，让其进入到“就绪状态”，处于就绪状态的线程才有机会得到调度执行。

线程在运行时也可能因资源等待或主动睡眠而放弃运行,进入“阻塞状态”,线程执行完毕，或主动执行stop方法将进入“终止状态”。

1.2.5 线程的同步--解决资源访问冲突问题(1) 对象的加锁所有被共享访问的数据及访问代码必须作为临界区，用synchronized加锁。

并行计算实验报告（高性能计算与网格技术）

并行计算实验报告（高性能计算与网格技术）高性能计算和网格技术实验报告实验题目OpenMP和MPI编程姓名学号专业计算机系统结构指导教师助教所在学院计算机科学与工程学院论文提交日期一、实验目的本实验的目的是通过练习掌握OpenMP 和MPI 并行编程的知识和技巧。

1、熟悉OpenMP 和MPI 编程环境和工具的使用；2、掌握并行程序编写的基本步骤；3、了解并行程序调试和调优的技巧。

二、实验要求1、独立完成实验内容；2、了解并行算法的设计基础；3、熟悉OpenMP和MPI的编程环境以及运行环境；4、理解不同线程数，进程数对于加速比的影响。

三、实验内容3.1、矩阵LU分解算法的设计：参考文档sy6.doc所使用的并行算法：在LU分解的过程中，主要的计算是利用主行i对其余各行j，(j>i)作初等行变换，各行计算之间没有数据相关关系，因此可以对矩阵A 按行划分来实现并行计算。

考虑到在计算过程中处理器之间的负载均衡，对A采用行交叉划分：设处理器个数为p，矩阵A的阶数为n，??p=，对矩阵A行交叉划分后，编号为i(i=0,1,…,p-1)的处理器存有m/nA的第i, i+p,…, i+(m-1)p行。

然后依次以第0,1,…,n-1行作为主行，将其广播给所有处理器，各处理器利用主行对其部分行向量做行变换，这实际上是各处理器轮流选出主行并广播。

若以编号为my_rank 的处理器的第i行元素作为主行，并将它广播给所有处理器，则编号大于等于my_rank的处理器利用主行元素对其第i+1,…,m-1行数据做行变换，其它处理器利用主行元素对其第i,…,m-1行数据做行变换。

根据上述算法原理用代码表示如下（关键代码）：for(k = 0;k<n;k++)< p="">{for (i = 0; i < THREADS_NUM; i++) {thread_data_arrray[i].thread_id = i;thread_data_arrray[i].K_number = k;thread_data_arrray[i].chushu = a[k][k];//创建线程rc = pthread_create(&pid[i], NULL, work,(void*)&thread_data_arrray[i]);…}for (i = 0; i < THREADS_NUM; i++){//等待线程同步rc = pthread_join(pid[i], &ret); …}}void *work(void *arg){struct thread_data *my_data;my_data = (struct thread_data*)arg;int myid = my_data->thread_id; //线程IDint myk = my_data->K_number; //外层循环计数Kfloat mychushu = my_data->chushu; //对角线的值int s, e;int i, j;s = (N-myk-1) * myid / THREADS_NUM; //确定起始循环的行数的相对位置e = (N-myk-1) * (myid + 1) / THREADS_NUM;//确定终止循环的行数的相对位置for (i = s+myk+1; i < e+myk+1; i++) //由于矩阵规模在缩小，找到偏移位置 { a[i][myk]=a[i][myk]/mychushu; for (j = myk+1; j < N; j++) a[i][j]=a[i][j]-a[i][myk]*a[myk][j]; }//printMatrix(a); return NULL;}第一部分为入口函数，其创建指定的线程数，并根据不同的线程id 按行划分矩阵，将矩阵的不同部分作为参数传递给线程，在多处理器电脑上，不同的线程并行执行，实现并行计算LU 分解。

并行与分布式计算实训课程学习总结搭建并行与分布式计算环境与应用实践

并行与分布式计算实训课程学习总结搭建并行与分布式计算环境与应用实践在并行与分布式计算实训课程的学习中，我们学习了搭建并行与分布式计算环境以及进行相关应用实践。

通过这门课程的学习，我获得了宝贵的经验和知识，并深刻理解了并行与分布式计算的重要性。

在实训课程中，我们首先了解了并行与分布式计算的基础概念与原理。

并行计算是指多个计算单元同时进行独立计算，并通过协同工作以提高计算效率和性能。

而分布式计算是指将计算任务划分为多个子任务，并分配给多台计算机进行同时计算。

接着，我们学习了如何搭建并行与分布式计算环境。

通过使用一些常见的工具和框架，如Hadoop和Spark，我们可以轻松地搭建起一个强大的并行与分布式计算环境。

在搭建过程中，我们需要配置集群节点、网络连接以及相关软件的安装与配置。

通过这一步骤，我们能够创建一个高效的计算环境，以应对大规模计算任务。

在搭建完环境之后，我们进行了一系列的应用实践。

其中，最主要的应用之一是数据处理和分析。

通过使用并行与分布式计算的框架和技术，我们可以快速地处理大规模的数据集，并提取出有价值的信息和洞察。

这对于现代大数据时代的数据处理和决策支持至关重要。

此外，我们还进行了一些并行计算和任务调度的实践。

通过将计算任务划分为多个子任务，并在集群中进行分布式计算，我们可以大大提高计算效率。

同时，我们还学习了任务调度的原理和算法，以实现任务的优先级调度和资源分配。

通过这门课程的学习，我认识到了并行与分布式计算在现代计算领域的重要性。

随着科技的发展和数据量的不断增加，使用传统的串行计算方式已经无法满足需求。

而并行与分布式计算则可以通过充分利用计算资源和并行处理能力，提高计算效率和性能。

除了理论知识和技术实践，这门课程还培养了我们的团队合作和沟通能力。

在搭建环境和进行应用实践时，我们需要相互协作、分享资源和解决问题，这培养了我们的团队精神和合作意识。

总而言之，通过并行与分布式计算实训课程的学习，我不仅掌握了搭建并行与分布式计算环境的技巧，还获得了实际应用的经验。

并行计算实验报告

并行计算实验报告并行计算实验报告引言：并行计算是一种有效提高计算机性能的技术，它通过同时执行多个计算任务来加速计算过程。

在本次实验中，我们将探索并行计算的原理和应用，并通过实验验证其效果。

一、并行计算的原理并行计算是指将一个计算任务分成多个子任务，并通过多个处理器同时执行这些子任务，以提高计算速度。

其原理基于两个关键概念：任务划分和任务调度。

1. 任务划分任务划分是将一个大的计算任务划分成多个小的子任务的过程。

划分的目标是使得每个子任务的计算量尽可能均衡，并且可以并行执行。

常见的任务划分方法有数据划分和功能划分两种。

- 数据划分：将数据分成多个部分，每个处理器负责处理其中一部分数据。

这种划分适用于数据密集型的计算任务，如图像处理和大规模数据分析。

- 功能划分：将计算任务按照功能划分成多个子任务，每个处理器负责执行其中一个子任务。

这种划分适用于计算密集型的任务，如矩阵运算和模拟仿真。

2. 任务调度任务调度是将划分后的子任务分配给不同的处理器，并协调它们的执行顺序和通信。

任务调度的目标是最大程度地减少处理器之间的等待时间和通信开销，以提高整体计算效率。

二、并行计算的应用并行计算广泛应用于科学计算、大数据处理、人工智能等领域。

它可以加速计算过程，提高计算机系统的性能，并解决一些传统计算方法难以处理的问题。

1. 科学计算并行计算在科学计算中起到至关重要的作用。

例如，在天气预报模型中，通过将地球划分成多个网格，每个处理器负责计算其中一个网格的气象数据，可以加快模型的计算速度，提高预报准确性。

2. 大数据处理随着大数据时代的到来，传统的串行计算方法已经无法满足大规模数据的处理需求。

并行计算可以将大数据分成多个部分，通过多个处理器同时处理，提高数据的处理速度。

例如，谷歌的分布式文件系统和MapReduce框架就是基于并行计算的思想。

3. 人工智能人工智能算法通常需要大量的计算资源来进行模型训练和推理。

并行计算可以在多个处理器上同时执行算法的计算任务，加快模型的训练和推理速度。

并行计算实验报告

并行计算实验报告《并行计算实验报告》摘要：本实验报告旨在介绍并行计算的基本概念和原理，并通过实验结果展示并行计算在提高计算效率和性能方面的优势。

实验采用了不同的并行计算技术和工具，并对比了串行计算和并行计算的性能表现，以验证并行计算在处理大规模数据和复杂计算任务时的优越性。

1. 引言并行计算是一种利用多个处理器或计算节点同时进行计算任务的技术。

它可以显著提高计算效率和性能，特别是在处理大规模数据和复杂计算任务时。

本实验报告将通过一系列实验来展示并行计算的优势和应用场景。

2. 实验设计本次实验采用了多种并行计算技术和工具，包括MPI（Message Passing Interface）、OpenMP和CUDA。

实验分为两个部分：第一部分是对比串行计算和并行计算的性能表现，第二部分是针对特定应用场景的并行计算实验。

3. 实验结果在第一部分实验中，我们对比了串行计算和MPI并行计算的性能表现。

实验结果显示，随着计算规模的增加，MPI并行计算的性能优势逐渐显现，尤其在处理大规模数据时表现更为明显。

而在第二部分实验中，我们针对图像处理任务使用了OpenMP和CUDA进行并行计算，实验结果显示，这两种并行计算技术都能够显著提高图像处理的速度和效率。

4. 结论通过实验结果的对比和分析，我们可以得出结论：并行计算在处理大规模数据和复杂计算任务时具有明显的优势，能够显著提高计算效率和性能。

不同的并行计算技术和工具适用于不同的应用场景，选择合适的并行计算方案可以最大程度地发挥计算资源的潜力。

5. 展望未来，随着计算资源的不断增加和并行计算技术的不断发展，我们相信并行计算将在更多领域得到应用，为我们解决更多复杂的计算问题提供强大的支持和帮助。

综上所述，本实验报告通过实验结果展示了并行计算在提高计算效率和性能方面的优势，为并行计算技术的应用和发展提供了有力的支持和验证。

并行编程实验报告

课程实验报告课程名称：并行编程专业班级：学号：姓名：指导教师：报告日期：计算机科学与技术学院目录实验一 (3)1. 实验目的与要求 (3)2. 实验内容 (3)3. 实验结果 (3)实验二 (4)1. 实验目的与要求 (4)2. 算法描述 (4)3. 实验方案 (4)4. 实验结果与分析 (6)实验三 (7)1. 实验目的与要求 (7)2. 算法描述 (7)3. 实验方案 (7)4. 实验结果与分析 (8)实验四 (9)1. 实验目的与要求 (9)2. 算法描述 (9)3. 实验方案 (9)4. 实验结果与分析 (12)实验五 (13)1．实验目的与要求 (13)2.算法描述 (13)3.实验方案 (13)4.实验结果与分析 (15)PROJECT2 (17)AIM: (17)HYPOTHESIS: (17)METHODS: (17)RESULT: (17)DICUSSION&CONCLUSION (18)REFERENCE (19)1.实验目的与要求become familiar with the parallel development environments, and the basic principles and methods of parallel programming and performance optimization by using tools and frameworks like pthread, OpenMP, MPI under Linux system. 2.实验内容熟悉并行开发环境，掌握并行编程用到的工具如线程、OpenMP,、MPI等。

3.实验结果通过上机操作熟悉了各种命令，编写了简单的程序熟悉开发环境。

1.实验目的与要求a)master the basic principles and methods of parallelprogramming design and performance optimization using pthreadb)understand the basic method for data partition and taskdecomposition in parallel programmingc)implement the parallel algorithm of calculating the value of piusing pthreadd)then carries on the simple analysis and summary of theprogram execution results2.算法描述采用蒙特卡洛方法计算圆周率，利用单位圆与边长为1的正方形面积之比计算圆周率的近似值。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

并行计算课程报告
1．学习总结
1.1并行计算简介
并行计算是相对于串行计算来说的。

它是一种一次可执行多个指令的算法，目的是提高计算速度，及通过扩大问题求解规模，解决大型而复杂的计算问题。

所谓并行计算可分为时间上的并行和空间上的并行。

时间上的并行就是指流水线技术，而空间上的并行则是指用多个处理器并发的执行计算。

1.2并行计算机分类和并行机体系结构的特征
按内存访问模型、微处理器和互联网络的不同，当前流行的并行机可分为对称多处理共享存储并行机（SMP：Symmetric Multi-Processing）、分布共享存储并行机（DSM：Distributed Shared Memory）、机群（cluster）、星群（constellation）和大规模并行机（MPP：Massively Parallel Processing）等五类。

SMP并行机有如下主要特征：对称共享存储、单一的操作系统映像、局部高速缓存cache 及其数据一致性、低通信延迟、共享总线带宽、支持消息传递、共享存储并行程序设计。

SMP 并行机具有如下缺点：欠可靠、可扩展性（scalability）较差。

DSM 并行机具有如下主要特征：并行机以结点为单位，每个结点包含一个或多个CPU，每个CPU 拥有自己的局部cache，并共享局部存储器和I/O设备，所有结点通过高性能互联网络相互连接；物理上分布存储；单一的内存地址空间；非一致内存访问（NUMA）模式；单一的操作系统映像；基于cache 的数据一致性；低通信延迟与高通信带宽；DSM 并行机可扩展到数百个结点，能提供每秒数千亿次的浮点运算性能；支持消息传递、共享存储并行程序设计。

机群(cluster)有三个明显的特征：
①系统由商用结点构成，每个结点包含2-4 个商用微处理器，结点内部
共享存储。

②采用商用机群交换机连接结点，结点间分布存储。

③在各个结点上，采用机群Linux 操作系统、GNU 编译系统和作业管理
系统。

星群(constellation)有三个明显的特征：
①系统由结点构成，每个结点是一台共享存储或者分布共享存储的并行
机子系统，包含数十、数百、乃至上千个微处理器，计算功能强大。

②采用商用机群交换机连接结点，结点间分布存储。

③在各个结点上，运行专用的结点操作系统、编译系统和作业管理系统。

大规模并行机系统主要特征为：
①系统由结点构成，每个结点含10 个左右处理器，共享存储。

处理器
采用专用或者商用CPU。

②采用专用高性能网络互连，结点间分布存储。

③系统运行专用操作系统、编译系统和作业管理系统。

1.3开展并行计算所必须具备的三个条件
①并行机。

并行机至少包含两台或者以上的处理机，这些机器通过互联的网络进行通信。

②应用问题必须具有并行度。

也就是说，应用问题可以分解为多个子任务，这些子任务可以并行的执行。

将一个应用分解的过程，成为并行算法的设计。

③并行编程。

在并行机提供的并行编程环境上，具体实现并行算法，编制并运行并行程序，从而达到解决问题的目的。

1.4并行计算的主要研究内容
①并行机的高性能特征抽取。

主要任务在于充分理解和抽取当前并行机体系结构的高性能特征，提出实用的并行计算模型和并行性能评价方法，指导并行算法的设计和并行程序的实现。

②并行算法设计与分析。

针对应用领域专家求解各类应用问题的离散计算方法，设计高效率的并行算法，将应用问题分解为可并行计算的多个子任务并具体分析这些算法的可行性和效果。

③并行实现技术。

主要包含并行程序设计和并行性能优化。

基于并行机提供的并行编程环境，例如消息传递平台MPI或者共享存储平台OpenMP具体实现并行算法，研制求解应用问题的并行程序。

同时结合并行机的高性能特征和实际应用的特点，不断优化并行程序的性能。

④并行应用。

这是并行计算研究的最终目的。

通过验证和确认并行程序的正确性和效率，进一步将程序发展为并行应用软件，应用于求解实际问题。

同时结合实际应用出现的各种问题，不断地改进并行算法和并行程序。

1.5并行计算模型
计算模型实际上就是硬件和软件之间的一种桥梁，使用它能够设计分析算法，在其上高级语言能被有效地编译且能够用硬件来实现。

并行计算模型主要包括：PRAM模型、异步PRAM模型、BSP模型、logP模型等等。

1.6并行计算的数值算法
并行计算的数值算法比较深奥。

主要学习了线性方程组求解、矩阵的运算。

线性方程组求解的并行算法主要学习了：有带回的高斯消去法、无带回的高斯-约旦法、迭代求解的高斯-塞德尔法、雅可比迭代法等等。

矩阵运算的并行算法主要学习了：矩阵的带状划分、矩阵的棋盘划分、基于矩阵划分的矩阵乘法（简单并行分块乘法、Cannon乘法、Fox乘法、DNS乘法）等等。

1.7消息传递接口编程模型（MPI）
一个MPI 并行程序由一组运行在相同或不同计算机/计算结点上的进程或线程构成。

这些进程或线程可以运行在不同处理机上，也可以运行在相同的处理机上。

为统一起见MPI程序中一个独立参与通信的个体称为一个进程(process)。

一个MPI 进程通常对应于一个普通进程或线程，但是在共享存储/消息传递混合模式程序中，一个MPI 进程可能代表一组UNIX 线程。

MPI 并行程序和串行程序没有很大的差别，它们通过对MPI 函数的调用来实现特定的并行算法。

一个MPI 并行程序主要由三个部分组成：
①进入并行环境。

调用MPI_Init 来启动并行计算环境。

它包括在指定的计算结点上启动构成并行程序的所有进程以及构建初始的MPI 通信环境和通信器MPI_COMM_WORLD、MPI_COMM_SELF。

②主体并行任务。

这是并行程序的实质部分。

所有需要并行来完成的任务都在这里进行。

在这个部分中，实现并行算法在并行计算机上的执行过程。

③退出并行环境。

调用MPI_Finalize 退出并行环境。

一般说来，退出并行计算环境后程序的运行亦马上结束。

2．我的想法
通过这个学期的学习，我对并行计算有了一定的认识，了解了其发展史以及现今的应用现状，了解了其硬件并行机制和软件编程机制，并对其前景有了一定的了解。

并行计算可谓前景远大。

学习了并行计算里边的MPI（消息传递接口），这是一种软件层面的并行编程规范。

同时，我也了解到了Hadoop、Spark等并行计算框架，这些都可以部署在普通机组成的集群上，用来进行大数据处理。

因此，下一步我想学习一下它们的区别与应用范围，并进一步深入学习其中之一。

同时，这也是建立在对并行计
算硬件架构有一定的了解的基础之上的，因此，我还会进一步深入的学习一下并行计算的方方面面。

最后，感谢老师的辛勤教授，让我们对并行计算的主要内容和原理有了较深入的了解和掌握，增长了我们的知识，提高了我们的能力，让我们在未来的道路上有了更明确的目标。