系统结构实验报告一

《计算机系统结构课内实验》

实验报告

班级：计算机01

姓名：陈世阳

学号：10055008

日期：2013.5.10

一、实验目的及要求

1. 熟练掌握WinDLX模拟器的操作和使用，熟悉DLX指令集结构及其特点；

2. 加深对计算机流水线基本概念的理解；

3. 进一步了解DLX基本流水线各段的功能以及基本操作；

4. 加深对数据相关、结构相关的理解，了解这两类相关对CPU性能的影响；

5. 了解解决数据相关的方法，掌握如何使用定向技术来减少数据相关带来的暂停。

二、实验环境

WinDLX模拟器

三、实验内容

1.用WinDLX模拟器执行下列三个程序（任选一个）：

●求阶乘程序fact.s

●求最大公倍数程序gcm.s

●求素数程序prim.s

分别以步进、连续、设置断点的方式运行程序，观察程序在流水线中的执行情况，观察CPU中寄存器和存储器的内容。熟练掌握WinDLX的操作和使用。

注意：fact.s中调用了input.s中的输入子程序。load程序时，要两个程序一起装入（都select后再点击load）。gcm.s也是如此。

2.用WinDLX运行程序structure_d.s，通过模拟：

●找出存在结构相关的指令对以及导致结构相关的部件；

●记录由结构相关引起的暂停时钟周期数，计算暂停时钟周期数占总执行周期

数的百分比；

●论述结构相关对CPU性能的影响，讨论解决结构相关的方法。

3.在不采用定向技术的情况下（去掉Configuration菜单中Enable Forwarding选项

前的勾选符），用WinDLX运行程序data_d.s。记录数据相关引起的暂停时钟周期数以及程序执行的总时钟周期数，计算暂停时钟周期数占总执行周期数的百分比。

4.在采用定向技术的情况下（勾选Enable Forwarding），用WinDLX再次运行程序

data_d.s。重复上述3中的工作，并计算采用定向技术后性能提高的倍数。

四、实验步骤及结果

1.（1）用winDLX执行求最大公倍数程序gcm.s:

File->load code or data->分别选中gcm.s和input.s->select.

（2）首先直接运行整个程序（enable forwarding），execute->run(或按F

例如，输入如下：

求得的结果为gcm =7，显然，这是正确的。

（3）再来看此时statistics栏和register栏的情况。如下图：

从statistics 可以看出共执行了147个cycle，共有64个冲突（43.54%）。

其中有32个RAW stall，5个LD stall。

再来看Register,这里我们主要关注的是R1，R2和R14.R1，R2的内容是7，, R14的内容是1028，分析代码我们可以发现，这是采用辗转相减法来求最大公约数的。代码中有两个循环体，一个是（R1）-（R2），一个是（R2）-（R1），循环的终止条件是R1=R2.求7和21的终止条件则是R1中的值和R2中的值是7，此时我们要求的结果就在R1或R2中。并且我们将结果存入内存中，内存地址为0X00001028，这个地址存放在R14中。

做这个实验主要是为了熟悉WinDXL软件的使用方法和分析statistics结果及Regis ter的内容。

2.用WinDLX运行程序structure_d.s（enable forwarding）

找出引起结构相关的指令和部件：

（1）代码中存在最多的是IF和ID部件引起的结构冲突，因为上一条指令一直占据着IF或ID而导致下一条指令迟迟无法进入流水线和进入ID，我认为这是一种结构相关引起的冲突。如下图：

又如以下两条指令：

不仅有RAW冲突，还有ID和fddEX部件上的结构冲突。

通过手数，发现一共存在9个cycle由于结构相关引起的stall。一共执行了139cycle s,共占6.47%。

解决结构相关最直接的方法就是部件冗余技术。另一种方法是进行指令调度。指令调度的方法在下一个小实验中会用到。

3.在不采用定向技术的情况下（去掉Configuration菜单中Enable Forwarding选项前的勾选符），用WinDLX运行程序data_d.s。

执行的结果如下：

由于数据相关引起的stall为104个cycles,总cycle数为202.共占51.48%。

采用定向技术后（勾选Enable Forwarding），

明显地发现，数据相关引起的stall减少了，只有30个，占23.44%。导致total cycles 也减少为128.

性能提高为原来的202/128=1.578倍。

4.我自己编写了一个test.s的代码。

代码比较短，直接分析如下：

multf f10,f0,f2

subd f10,f4,f6 //这两条间存在WAW

multf f6,f8,f14

addd f10,f4,f6 //这两条间存在RAW

addi r1,r0,#32 //给r1初值32.用来作循环计数变量

Loop:

lf f0,0(r1) //把r1指向的内存单元的值送给f0

addd f4,f0,f2 //跟上一条存在RAW冲突

sd 0(r1),f4 //跟上一条存在RAW冲突

addi r1,r1,#-8 //r1自减每次减8

bnez r1,Loop //判断循环是否终止

trap 0

（1）首先在不使用定向技术，只有一个加法器，一个乘法器下，执行这一程序：

基本statistics如下：

可以看到共执行了74 cycles，26条指令，一共47个stalls，37个RAW stalls,4个W A W stalls,没有结构冲突，3个控制冲突（因为循环执行了4次，第一次为必执行）。

现在来看采用了定向技术后对性能的影响：

可以知道性能提高了1.37倍。

再来对代码进行循环展开和指令调度。4次循环完全展开，并进行指令调度如下：

multf f10,f0,f2

subd f10,f4,f6

multf f6,f8,f14

addd f10,f4,f6

addi r1,r0,#32

Loop:

lf f0,0(r1)

lf f6,-8(r1)

lf f10,-16(r1)

lf f14,-24(r1)

addd f4,f0,f2

addd f8,f6,f2

addd f12,f10,f2

addd f16,f14,f2

sd 0(r1),f4

sd -8(r1),f8

addi r1,r1,#-32

sd 16(r1),f12

bnez r1,Loop

sd 8(r1),f16

trap 0

在不采用定向技术下，执行的结果如下：

可以看出，优化后，数据冲突引起的停顿已经大幅度减少，但是引入了新的冲突-结构冲突。这是循环展开和指令调度的带价：将几条性质相同的指令连续执行，必然要求有几套重复的部件。

性能提高了74/43=1.72倍。采用了定向技术后：

性能提高了74/37=2倍。

五、总结

1.通过本次试验，我对于DLX仿真平台和DLX指令有了一定程度的认识，基本上能够读懂DLX编写的程序。

2，进一步掌握和巩固了流水线的基本知识，加深了对数据相关和结构相关的理解。同时通过观察实验数据，对流水线的冲突和解决冲突的方法有了更深入的认识，当出现冲突时，对指令进行调度是一个比较好的解决方法。

3.加强了在编程时，数据间相关性的意识，不自觉就想尽量让写的程序中相关性少点。

七、附录（源程序清单）

Test.s

multf f10,f0,f2

subd f10,f4,f6

multf f6,f8,f14

addd f10,f4,f6

addi r1,r0,#32

Loop:

lf f0,0(r1)

addd f4,f0,f2

sd 0(r1),f4

addi r1,r1,#-8

bnez r1,Loop

trap 0

************************************************ Test2.s

multf f10,f0,f2

subd f10,f4,f6

multf f6,f8,f14

addd f10,f4,f6

addi r1,r0,#32

Loop:

lf f0,0(r1)

lf f6,-8(r1)

lf f10,-16(r1)

lf f14,-24(r1)

addd f4,f0,f2

addd f8,f6,f2

addd f12,f10,f2

addd f16,f14,f2

sd 0(r1),f4

sd -8(r1),f8

addi r1,r1,#-32

sd 16(r1),f12

bnez r1,Loop

sd 8(r1),f16

trap 0

计算机体系结构实验报告二

实验二结构相关一、实验目得: 通过本实验,加深对结构相关得理解,了解结构相关对CPU性能得影响。二、实验内容: 1、用WinDLX模拟器运行程序structure_d、s 。 2、通过模拟,找出存在结构相关得指令对以及导致结构相关得部件。 3、记录由结构相关引起得暂停时钟周期数,计算暂停时钟周期数占总执行周期数得百分比。 4、论述结构相关对CPU性能得影响,讨论解决结构相关得方法。三、实验程序structure_d、s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; < A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit < this is a ment !! A: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 四、实验过程打开软件,load structure_d、s文件,进行单步运行。经过分析,此程序一次循环中共有五次结构相关。(Rstall 数据相关Stall 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面得数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关得部件:译码部件。

数值分析实验报告1

ve=zeros(1,21); ve(n)=ess; r=roots(a+ve); -6-m s=max(abs(r-rr)) end end 利用符号函数：（思考题一）a=poly(1:20); y=poly2sym(a); rr=solve(y) n

很容易的得出对一个多次的代数多项式的其中某一项进行很小的扰动，对其多项式的根会有一定的扰动的，所以对于这类病态问题可以借助于MATLAB来进行问题的分析。学号：06450210 姓名：万轩实验二插值法

数值计算实验报告

(此文档为word格式，下载后您可任意编辑修改！) 2012级6班###(学号)计算机数值方法实验报告成绩册姓名:宋元台学号：成绩：

数值计算方法与算法实验报告学期： 2014 至 2015 第 1 学期 2014年 12月1日课程名称: 数值计算方法与算法专业:信息与计算科学班级 12级5班实验编号： 1实验项目Neton插值多项式指导教师：孙峪怀姓名：宋元台学号：实验成绩：一、实验目的及要求实验目的：掌握Newton插值多项式的算法，理解Newton插值多项式构造过程中基函数的继承特点，掌握差商表的计算特点。实验要求： 1. 给出Newton插值算法 2. 用C语言实现算法二、实验内容三、实验步骤(该部分不够填写.请填写附页)

1.算法分析：下面用伪码描述Newton插值多项式的算法： Step1 输入插值节点数n，插值点序列{x(i),f(i)},i=1,2,……,n,要计算的插值点x. Step2 形成差商表 for i=0 to n for j=n to i f(j)=((f(j)-f(j-1)(x(j)-x(j-1-i)); Step3 置初始值temp=1,newton=f(0) Step4 for i=1 to n temp=(x-x(i-1))*temp*由temp(k)=(x-x(k-1))*temp(k-1)形成 (x-x(0).....(x-x(i-1)* Newton=newton+temp*f(i); Step5 输出f（x）的近似数值newton(x)=newton. 2.用C语言实现算法的程序代码 #includeMAX_N) { printf("the input n is larger than MAX_N,please redefine the MAX_N.\n"); return 1; } if(n<=0) { printf("please input a number between 1 and %d.\n",MAX_N); return 1; } printf("now input the (x_i,y_i)i=0,...%d\n",n); for(i=0;i<=n;i++) { printf("please input x(%d) y(%d)\n",i,i);

《数值计算方法》上机实验报告

《数值计算方法》上机实验报告华北电力大学实验名称数值il?算方法》上机实验课程名称数值计算方法专业班级：电力实08学生姓名：李超然学号:200801001008 成绩: 指导教师:郝育黔老师实验日期：2010年04月华北电力大学实验报告数值计算方法上机实验报吿一. 各算法的算法原理及计算机程序框图1、牛顿法求解非线性方程 *对于非线性方程，若已知根的一个近似值，将在处展开成一阶 xxfx ()0, fx ()xkk 泰勒公式 "f 0 / 2 八八,fxfxfxxxxx 0 0 0 0 0 kkkk2! 忽略高次项，有，fxfxfxxx 0 ()()()，，, kkk 右端是直线方程，用这个直线方程来近似非线性方程。将非线性方程的 **根代入，即fx ()0, X ，* fxfxxx 0 0 0 0, ,, kkk fx 0 fx 0 0,

解出 fX 0 *k XX,, k' fx 0 k 水将右端取为，则是比更接近于的近似值，即xxxxk, Ik, Ik fx ()k 八XX, Ikk* fx()k 这就是牛顿迭代公式。 ,2,计算机程序框图:，见, ,3,输入变量、输出变量说明: X输入变量:迭代初值，迭代精度，迭代最大次数，\0 输出变量:当前迭代次数，当前迭代值xkl ,4,具体算例及求解结果: 2/16 华北电力大学实验报吿开始读入 l>k /fx()0?,0 fx 0 Oxx，，01* fx ()0 XX,,，?10 kk, ,1，kN, ?xx, 10 输出迭代输出X输出奇异标志1失败标志

,3,输入变量、输出变量说明: 结束例：导出计算的牛顿迭代公式，并il ?算。（课本P39例2-16） 115cc （0）, 求解结果: 10. 750000 10.723837 10. 723805 10. 723805 2、列主元素消去法求解线性方程组，1,算法原理: 高斯消去法是利用现行方程组初等变换中的一种变换，即用一个不为零的数乘 -个方程后加只另一个方程，使方程组变成同解的上三角方程组，然后再自下而上对上三角 3/16 华北电力大学实验报告方程组求解。列选主元是当高斯消元到第步时，从列的以下（包括）的各元素中选出绝 aakkkkkk 对值最大的，然后通过行交换将其交换到的位置上。交换系数矩阵中的两行（包括常ekk 数项），只相当于两个方程的位置交换了，因此，列选主元不影响求解的结 ,2,计算机程序框图:，见下页, 输入变量:系数矩阵元素，常向量元素baiji 输出变量:解向量元素bbb,,12n

数值分析实验报告

数值分析实验报告姓名：周茹学号： 912113850115 专业：数学与应用数学指导老师：李建良

线性方程组的数值实验一、课题名字：求解双对角线性方程组二、问题描述考虑一种特殊的对角线元素不为零的双对角线性方程组（以n=7为例） ?????????? ?????? ? ???? ?d a d a d a d a d a d a d 766 55 44 3 32 211??????????????????????x x x x x x x 7654321=?????????? ? ???????????b b b b b b b 7654321 写出一般的n （奇数）阶方程组程序（不要用消元法，因为不用它可以十分方便的解出这个方程组）。三、摘要本文提出解三对角矩阵的一种十分简便的方法——追赶法，该算法适用于任意三对角方程组的求解。四、引言对于一般给定的d Ax =，我们可以用高斯消去法求解。但是高斯消去法过程复杂繁琐。对于特殊的三对角矩阵，如果A 是不可约的弱对角占优矩阵，可以将A 分解为UL ，再运用追赶法求解。

五、计算公式（数学模型）对于形如????? ?? ????? ??? ?---b a c b a c b a c b n n n n n 111 2 2 2 11... ... ...的三对角矩阵UL A =，容易验证U 、L 具有如下形式： ??????? ????? ??? ?=u a u a u a u n n U ...... 3 3 22 1 ， ?? ????? ? ?? ??????=1 (1) 1132 1l l l L 比较UL A =两边元素，可以得到 ? ?? ??-== = l a b u u c l b u i i i i i i 111 i=2, 3, ... ,n 考虑三对角线系数矩阵的线性方程组 f Ax = 这里()T n x x x x ... 2 1 = ,()T n f f f f ... 2 1 = 令y Lx =，则有 f Uy = 于是有 ()?????-== --u y a f y u f y i i i i i 1 1 11 1 * i=2， 3, ... ,n 再根据y Lx =可得到

体系结构实验报告

中南大学软件学院软件体系结构设计模式实验报告学生姓名：宋昂所在学院：软件学院学生学号： 3901080115 学生班级：软件0801 指导老师：刘伟完成日期： 2010-12-7

一、实验目的熟练使用PowerDesigner和任意一种面向对象编程语言实现几种常见的设计模式，包括简单工厂模式、工厂方法模式、抽象工厂模式、单例模式和适配器模式，理解每一种设计模式的模式动机，掌握模式结构，学习如何使用代码实现这些模式，并学会分析这些模式的使用效果。二、实验内容使用PowerDesigner和任意一种面向对象编程语言实现简单工厂模式、工厂方法模式、抽象工厂模式、单例模式和适配器模式，包括根据实例绘制模式结构图、编写模式实例实现代码，运行并测试模式实例代码。 (1) 简单工厂模式使用简单工厂模式设计一个可以创建不同几何形状(Shape)的绘图工具类，如可创建圆形(Circle)、方形(Rectangle)和三角形(Triangle) 对象，每个几何图形都要有绘制draw()和擦除erase()两个方法，要求在绘制不支持的几何图形时，提示一个UnsupportedShapeException，绘制类图并编程实现。 (2) 简单工厂模式使用简单工厂模式模拟女娲(Nvwa)造人(Person)，如果传入参数“M”，则返回一个Man 对象，如果传入参数“W”，则返回一个Woman对象，使用任意一种面向对象编程语言实现该场景。现需要增加一个新的Robot类，如果传入参数“R”，则返回一个Robot对象，对代码进行修改并注意女娲的变化。 (3) 工厂方法模式某系统日志记录器要求支持多种日志记录方式，如文件记录、数据库记录等，且用户可以根据要求动态选择日志记录方式，现使用工厂方法模式设计该系统。用代码实现日志记录器实例，如果在系统中增加一个中的日志记录方式——控制台日志记录(ConsoleLog)，绘制类图并修改代码，注意增加新日志记录方式过程中原有代码的变化。

数值分析实验报告模板

数值分析实验报告模板篇一：数值分析实验报告(一)(完整) 数值分析实验报告 1 2 3 4 5 篇二：数值分析实验报告实验报告一题目：非线性方程求解摘要：非线性方程的解析解通常很难给出，因此线性方程的数值解法就尤为重要。本实验采用两种常见的求解方法二分法和Newton法及改进的Newton法。利用二分法求解给定非线性方程的根，在给定的范围内，假设f(x,y)在[a,b]上连续，f(a)xf(b) 直接影响迭代的次数甚至迭代的收敛与发散。即若x0 偏离所求根较远，Newton法可能发散的结论。并且本实验中还利用利用改进的Newton法求解同样的方程，且将结果与Newton法的结果比较分析。前言：（目的和意义）掌握二分法与Newton法的基本原理和应用。掌握二分法的原理，验证二分法，在选对有根区间的前提下，必是收

敛，但精度不够。熟悉Matlab语言编程，学习编程要点。体会Newton使用时的优点，和局部收敛性，而在初值选取不当时，会发散。数学原理：对于一个非线性方程的数值解法很多。在此介绍两种最常见的方法：二分法和Newton法。对于二分法，其数学实质就是说对于给定的待求解的方程f(x)，其在[a,b]上连续，f(a)f(b) Newton法通常预先要给出一个猜测初值x0，然后根据其迭代公式xk?1?xk?f(xk) f'(xk) 产生逼近解x*的迭代数列{xk}，这就是Newton法的思想。当x0接近x*时收敛很快，但是当x0选择不好时，可能会发散，因此初值的选取很重要。另外，若将该迭代公式改进为 xk?1?xk?rf(xk) 'f(xk) 其中r为要求的方程的根的重数，这就是改进的Newton 法，当求解已知重数的方程的根时，在同种条件下其收敛速度要比Newton法快的多。程序设计：本实验采用Matlab的M文件编写。其中待求解的方程写成function的方式，如下 function y=f(x);

(完整版)哈工大-数值分析上机实验报告

实验报告一题目：非线性方程求解摘要：非线性方程的解析解通常很难给出，因此线性方程的数值解法就尤为重要。本实验采用两种常见的求解方法二分法和Newton法及改进的Newton法。前言：（目的和意义）掌握二分法与Newton法的基本原理和应用。数学原理：对于一个非线性方程的数值解法很多。在此介绍两种最常见的方法：二分法和Newton法。对于二分法，其数学实质就是说对于给定的待求解的方程f(x)，其在[a,b]上连续，f(a)f(b)<0，且f(x)在[a,b]内仅有一个实根x*，取区间中点c，若，则c恰为其根，否则根据f(a)f(c)<0是否成立判断根在区间[a,c]和[c,b]中的哪一个，从而得出新区间，仍称为[a,b]。重复运行计算，直至满足精度为止。这就是二分法的计算思想。

Newton法通常预先要给出一个猜测初值x0，然后根据其迭代公式产生逼近解x*的迭代数列{x k}，这就是Newton法的思想。当x0接近x*时收敛很快，但是当x0选择不好时，可能会发散，因此初值的选取很重要。另外，若将该迭代公式改进为其中r为要求的方程的根的重数，这就是改进的Newton法，当求解已知重数的方程的根时，在同种条件下其收敛速度要比Newton法快的多。程序设计：本实验采用Matlab的M文件编写。其中待求解的方程写成function的方式，如下 function y=f(x); y=-x*x-sin(x); 写成如上形式即可，下面给出主程序。二分法源程序： clear %%%给定求解区间 b=1.5; a=0;

%%%误差 R=1; k=0;%迭代次数初值 while (R>5e-6) ; c=(a+b)/2; if f12(a)*f12(c)>0; a=c; else b=c; end R=b-a;%求出误差 k=k+1; end x=c%给出解 Newton法及改进的Newton法源程序：clear %%%% 输入函数 f=input('请输入需要求解函数>>','s') %%%求解f(x)的导数 df=diff(f);

数值分析实验报告

实验一、误差分析一、实验目的 1．通过上机编程，复习巩固以前所学程序设计语言及上机操作指令； 2．通过上机计算，了解误差、绝对误差、误差界、相对误差界的有关概念； 3．通过上机计算，了解舍入误差所引起的数值不稳定性。二．实验原理误差问题是数值分析的基础，又是数值分析中一个困难的课题。在实际计算中，如果选用了不同的算法，由于舍入误差的影响，将会得到截然不同的结果。因此，选取算法时注重分析舍入误差的影响，在实际计算中是十分重要的。同时，由于在数值求解过程中用有限的过程代替无限的过程会产生截断误差，因此算法的好坏会影响到数值结果的精度。三．实验内容对20,,2,1,0 =n ，计算定积分 ?+=10 5dx x x y n n . 算法1：利用递推公式 151--=n n y n y , 20,,2,1 =n , 取 ?≈-=+=1 00182322.05ln 6ln 51dx x y . 算法2：利用递推公式 n n y n y 51511-= - 1,,19,20 =n . 注意到 ???=≤+≤=10 10202010201051515611261dx x dx x x dx x , 取 008730.0)12611051(20120≈+≈y .: 四.实验程序及运行结果程序一： t=log(6)-log(5);

n=1; y(1)=t; for k=2:1:20 y(k)=1/k-5*y(k-1); n=n+1; end y y =0.0884 y =0.0581 y =0.0431 y =0.0346 y =0.0271 y =0.0313 y =-0.0134 y =0.1920 y =-0.8487 y =4.3436 y =-21.6268 y =108.2176 y =-541.0110 y =2.7051e+003 y =-1.3526e+004 y =6.7628e+004 y =-3.3814e+005 y =1.6907e+006 y =-8.4535e+006 y =4.2267e+007 程序2： y=zeros(20,1); n=1; y1=(1/105+1/126)/2;y(20)=y1; for k=20:-1:2 y(k-1)=1/(5*k)-(1/5)*y(k); n=n+1; end 运行结果：y = 0.0884 0.0580 0.0431 0.0343 0.0285 0.0212 0.0188 0.0169

计算机系统结构实验报告

计算机系统结构实验报告一．流水线中的相关实验目的： 1. 熟练掌握WinDLX模拟器的操作和使用，熟悉DLX指令集结构及其特点； 2. 加深对计算机流水线基本概念的理解； 3. 进一步了解DLX基本流水线各段的功能以及基本操作； 4. 加深对数据相关、结构相关的理解，了解这两类相关对CPU性能的影响； 5. 了解解决数据相关的方法，掌握如何使用定向技术来减少数据相关带来的暂停。实验平台： WinDLX模拟器实验内容和步骤： 1.用WinDLX模拟器执行下列三个程序：求阶乘程序fact.s 求最大公倍数程序gcm.s 求素数程序prim.s 分别以步进、连续、设置断点的方式运行程序，观察程序在流水线中的执行情况，观察 CPU中寄存器和存储器的内容。熟练掌握WinDLX的操作和使用。 2. 用WinDLX运行程序structure_d.s，通过模拟找出存在资源相关的指令对以及导致资源相关的部件；记录由资源相关引起的暂停时钟周期数，计算暂停时钟周期数占总执行周期数的百分比；论述资源相关对CPU性能的影响，讨论解决资源相关的方法。 3. 在不采用定向技术的情况下（去掉Configuration菜单中Enable Forwarding选项前的勾选符），用WinDLX运行程序data_d.s。记录数据相关引起的暂停时钟周期数以及程序执行的总时钟周期数，计算暂停时钟周期数占总执行周期数的百分比。在采用定向技术的情况下（勾选Enable Forwarding），用WinDLX再次运行程序data_d.s。重复上述3中的工作，并计算采用定向技术后性能提高的倍数。 1. 求阶乘程序用WinDLX模拟器执行求阶乘程序fact.s。这个程序说明浮点指令的使用。该程序从标准输入读入一个整数，求其阶乘，然后将结果输出。该程序中调用了input.s中的输入子程序，这个子程序用于读入正整数。实验结果：在载入fact.s和input.s之后，不设置任何断点运行。 a.不采用重新定向技术，我们得到的结果

数值计算实验报告

2012级6班###(学号)计算机数值方法实验报告成绩册姓名：安元龙学号：2012060501 成绩：

数值计算方法与算法实验报告学期： 2014 至___2015 第 1 学期 2014年 10月26日课程名称:__数值计算方法与算法 __ 专业:信息与计算科学 12级5班实验编号： 1实验项目Neton插值多项式指导教师__孙峪怀姓名：安元龙学号： 2012060501 实验成绩：一、实验目的及要求实验目的：掌握Newton插值多项式的算法，理解Newton插值多项式构造过程中基函数的继承特点，掌握差商表的计算特点。实验要求： 1. 给出Newton插值算法 2. 用C语言实现算法二、实验内容三、实验步骤(该部分不够填写.请填写附页) 1.算法分析：下面用伪码描述Newton插值多项式的算法： Step1 输入插值节点数n，插值点序列{x(i),f(i)},i=1,2,……,n,要计算的插值点x. Step2 形成差商表 for i=0 to n for j=n to i f(j)=((f(j)-f(j-1)/(x(j)-x(j-1-i)); Step3 置初始值temp=1,newton=f(0) Step4 for i=1 to n temp=(x-x(i-1))*temp/*由temp(k)=(x-x(k-1))*temp(k-1)形成 (x-x(0).....(x-x(i-1)*/ Newton=newton+temp*f(i); Step5 输出f（x）的近似数值newton(x)=newton. #include #define MAX_N 20 typedef struct tagPOINT { double x; double y; }POINT; int main() { int n; int i,j; POINT points[MAX_N+1];double diff[MAX_N+1]; double x,tmp,newton=0;

数值分析2016上机实验报告

序言数值分析是计算数学的范畴，有时也称它为计算数学、计算方法、数值方法等，其研究对象是各种数学问题的数值方法的设计、分析及其有关的数学理论和具体实现的一门学科，它是一个数学分支。是科学与工程计算（科学计算）的理论支持。许多科学与工程实际问题（核武器的研制、导弹的发射、气象预报）的解决都离不开科学计算。目前，试验、理论、计算已成为人类进行科学活动的三大方法。数值分析是计算数学的一个主要部分,计算数学是数学科学的一个分支,它研究用计算机求解各种数学问题的数值计算方法及其理论与软件实现。现在面向数值分析问题的计算机软件有：C,C++,MATLAB,Python,Fortran等。 MATLAB是matrix laboratory的英文缩写，它是由美国Mathwork公司于1967年推出的适合用于不同规格计算机和各种操纵系统的数学软件包，现已发展成为一种功能强大的计算机语言，特别适合用于科学和工程计算。目前，MATLAB应用非常广泛，主要用于算法开发、数据可视化、数值计算和数据分析等，除具备卓越的数值计算能力外，它还提供了专业水平的符号计算，文字处理，可视化建模仿真和实时控制等功能。本实验报告使用了MATLAB软件。对不动点迭代，函数逼近（lagrange插值，三次样条插值，最小二乘拟合），追赶法求解矩阵的解，4RungeKutta方法求解，欧拉法及改进欧拉法等算法做了简单的计算模拟实践。并比较了各种算法的优劣性，得到了对数值分析这们学科良好的理解，对以后的科研数值分析能力有了极大的提高。

目录序言 (1) 问题一非线性方程数值解法 (3) 1.1 计算题目 (3) 1.2 迭代法分析 (3) 1.3计算结果分析及结论 (4) 问题二追赶法解三对角矩阵 (5) 2.1 问题 (5) 2.2 问题分析（追赶法） (6) 2.3 计算结果 (7) 问题三函数拟合 (7) 3.1 计算题目 (7) 3.2 题目分析 (7) 3.3 结果比较 (12) 问题四欧拉法解微分方程 (14) 4.1 计算题目 (14) 4.2.1 方程的准确解 (14) 4.2.2 Euler方法求解 (14) 4.2.3改进欧拉方法 (16) 问题五四阶龙格-库塔计算常微分方程初值问题 (17) 5.1 计算题目 (17) 5.2 四阶龙格-库塔方法分析 (18) 5.3 程序流程图 (18) 5.4 标准四阶Runge-Kutta法Matlab实现 (19) 5.5 计算结果及比较 (20) 问题六舍入误差观察 (22) 6.1 计算题目 (22) 6.2 计算结果 (22) 6.3 结论 (23) 7 总结 (24) 附录

计算机体系结构实验报告二

实验二结构相关一、实验目的：通过本实验，加深对结构相关的理解，了解结构相关对CPU性能的影响。二、实验内容： 1. 用WinDLX模拟器运行程序structure_d.s 。 2. 通过模拟，找出存在结构相关的指令对以及导致结构相关的部件。 3. 记录由结构相关引起的暂停时钟周期数，计算暂停时钟周期数占总执行周期数的百分比。 4. 论述结构相关对CPU性能的影响，讨论解决结构相关的方法。三、实验程序structure_d.s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ；浮点运算，两个周期，结构相关 ADDD F2, F0, F2 ; <- A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ；条件跳转 TRAP #0 ;; Exit <- this is a comment !! A: .double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: .double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10

四、实验过程打开软件，load structure_d.s文件，进行单步运行。经过分析，此程序一次循环中共有五次结构相关。（R-stall 数据相关Stall- 结构相关） 1)第一个结构相关：addd f2,,f0,f2 由于前面的数据相关，导致上一条指令addd f0,f0,f4暂停在ID阶段，所以下一条指令addd f2,,f0,f2发生结构相关，导致相关的部件：译码部件。 2)第二个结构相关：ADDI R2, R2, #8，与第一个结构相关类似。由于数据相关，上一条指令暂停在ID阶段，所以导致下一条指令发生结构相关。

数值分析实验报告总结

数值分析实验报告总结随着电子计算机的普及与发展，科学计算已成为现代科学的重要组成部分，因而数值计算方法的内容也愈来愈广泛和丰富。通过本学期的学习，主要掌握了一些数值方法的基本原理、具体算法，并通过编程在计算机上来实现这些算法。算法算法是指由基本算术运算及运算顺序的规定构成的完整的解题步骤。算法可以使用框图、算法语言、数学语言、自然语言来进行描述。具有的特征：正确性、有穷性、适用范围广、运算工作量少、使用资源少、逻辑结构简单、便于实现、计算结果可靠。误差计算机的计算结果通常是近似的，因此算法必有误差，并且应能估计误差。误差是指近似值与真正值之差。绝对误差是指近似值与真正值之差或差的绝对值；相对误差：是指近似值与真正值之比或比的绝对值。误差来源见表第三章泛函分析泛函分析概要泛函分析是研究“函数的函数”、函数空间和它们之间变换的一门较新的数学分支，隶属分析数学。它以各种学科

如果 a 是相容范数，且任何满足为具体背景，在集合的基础上，把客观世界中的研究对象抽范数范数，是具有“长度”概念的函数。在线性代数、泛函分析及相关的数学领域，泛函是一个函数，其为矢量空间内的所有矢量赋予非零的正长度或大小。这里以 Cn 空间为例， Rn 空间类似。最常用的范数就是 P-范数。那么当P 取1, 2 ,s 的时候分别是以下几种最简单的情形: 其中2-范数就是通常意义下的距离。对于这些范数有以下不等式: 1 < n1/2 另外，若p 和q 是赫德尔共轭指标，即 1/p+1/q=1 么有赫德尔不等式: II = ||xH*y| 当p=q=2时就是柯西-许瓦兹不等式般来讲矩阵范数除了正定性，齐次性和三角不等式之矩阵范数通常也称为相容范数。象为元素和空间。女口：距离空间，赋范线性空间，内积空间。 1-范数: 1= x1 + x2 +?+ xn 2-范数: x 2=1/2 8 -范数: 8 =max oo ，那外，还规定其必须满足相容性: 所以

数值分析实验报告资料

机电工程学院机械工程陈星星 6720150109 《数值分析》课程设计实验报告实验一函数插值方法一、问题提出对于给定的一元函数)(x f y =的n+1个节点值(),0,1,,j j y f x j n ==。试用Lagrange 公式求其插值多项式或分段二次Lagrange 插值多项式。数据如下：（1 求五次Lagrange 多项式5L ()x ，计算(0.596)f ,(0.99)f 的值。（提示：结果为(0.596)0.625732f ≈, (0.99) 1.05423f ≈）实验步骤：第一步：先在matlab 中定义lagran 的M 文件为拉格朗日函数代码为： function[c,l]=lagran(x,y) w=length(x); n=w-1; l=zeros(w,w); for k=1:n+1 v=1; for j=1:n+1 if(k~=j) v=conv(v,poly(x(j)))/(x(k)-x(j)); end end l(k,:)=v; end c=y*l; end

第二步：然后在matlab命令窗口输入： >>>> x=[0.4 0.55 0.65 0.80,0.95 1.05];y=[0.41075 0.57815 0.69675 0.90 1.00 1.25382]; >>p = lagran(x,y) 回车得到： P = 121.6264 -422.7503 572.5667 -377.2549 121.9718 -15.0845 由此得出所求拉格朗日多项式为 p（x）=121.6264x5-422.7503x4+572.5667x3-377.2549x2+121.9718x-15.0845 第三步：在编辑窗口输入如下命令： >> x=[0.4 0.55 0.65 0.80,0.95 1.05]; >> y=121.6264*x.^5-422.7503*x.^4+572.5667*x.^3-377.2549*x.^2+121.9718 *x-15.0845; >> plot(x,y) 命令执行后得到如下图所示图形，然后 >> x=0.596; >> y=121.6264*x.^5-422.7503*x.^4+572.5667*x.^3-377.2549*x.^2+121.9718 *x-15.084 y =0.6257 得到f（0.596）=0.6257 同理得到f（0.99）=1.0542

软件设计与体系结构实验报告

福建农林大学计算机与信息学院实验报告课程名称：软件设计与体系结构姓名：陈宇翔系：软件工程系专业：软件工程年级：2007 学号：070481024 指导教师：王李进职称：讲师 2009年12月16日

实验项目列表

福建农林大学计算机与信息学院实验报告学院：计算机与信息学院专业：软件工程系年级：2007 姓名：陈宇翔学号：070481024 课程名称：软件设计与体系结构实验时间：2009-10-28 实验室田实验室312、313计算机号024 指导教师签字：成绩：实验1：ACME软件体系结构描述语言应用一、实验目的 1）掌握软件体系结构描述的概念 2）掌握应用ACMESTUDIO工具描述软件体系结构的基本操作二、实验学时 2学时。三、实验方法由老师提供软件体系结构图形样板供学生参考，学生在样板的指导下修改图形，在老师的指导下进行软件体系结构描述。四、实验环境计算机及ACMESTUDIO。五、实验内容利用ACME语言定义软件体系结构风格，修改ACME代码，并进行风格测试。六、实验操作步骤一、导入Zip文档建立的一个Acme Project，并且命名为AcmeLab2。如下图：

接着导入ZIP文档，导入完ZIP文档后显示的如下图：二、修改风格在AcmeLab2项目中,打开families下的TieredFam.acme.如下图：修改组件外观 1. 在组件类型中，双击DataNodeT; 在其右边的编辑器中，将产生预览；选择Modify 按钮，将打开外观编辑器对话框。 2. 首先改变图形：找到Basic shape section，在Stock image dropdown menu中选择Repository类型. 3. 在Color/Line Properties section修改填充颜色为深蓝色。 4. 在颜色对话框中选择深蓝色，并单击 [OK]. 5. 修改图形的边框颜色为绿色 7. 单击Label tab，在Font Settings section, 设置字体颜色为白色,单击[OK] 产生的图形如下图：

计算机体系结构实验报告2 华东理工大学

实验名称多通路运算器和寄存器堆实验地点信息楼420 实验日期2012-12-7 一、实验目的 1．了解多通路的运算器与寄存器堆的组成结构。 2．掌握多通路的运算器与寄存器堆的工作原理及设计方法。二、实验设备 PC 机一台， TD-CMX 实验系统一套。三、实验原理 1．ALU® 单元的结构 ALU®单元由运算器和双端口寄存器堆构成，通过不同的控制信号SEL1、SEL0 产生不同结构的运算器。运算器内部含有三个独立运算部件，分别为算术、逻辑和移位运算部件，要处理的数据存于暂存器A 和暂存器B。 SEL0 和SEL1 用于选择运算器和寄存器堆的通路： (1)当SEL1=0、SEL0=0，ALU 的输出D7…D0、REG（右口）的输出OUT7…OUT0 和ALU与REG 的输入IN7…IN0 接到CPU 内总线上时，如图1-2-1 所示，寄存器堆只能从右口进行操作，相当于只有一组控制线的单端口寄存器堆，一般计算机组成原理实验涉及到的运算器和寄存器就是采用这种结构。 (2)当SEL1=1、SEL0=0，REG（右口）的输出OUT7…OUT0 和ALU 与REG（右口）的输入IN7…IN0 接到CPU 内总线上时，运算器和双端口寄存器堆的结构如图1-2-2 所示，寄存器堆由两组控制信号来分别进行控制，每组控制信号都可以相对独立的对寄存器堆进行读写操作，同时增加了执行专用通道A 总线，以利于提高指令执行的效率。

(3)当SEL1=1、SEL0=1，REG（右口）的输出OUT7…OUT0 和ALU 与REG（右口）的输入IN7…IN0 接到CPU 内总线上时，运算器和双端口寄存器堆的结构如图1-2-3 所示，在双通道双端口运算器和寄存器堆的基础上增加了暂存器旁路，把运算结果写回到寄存器堆的同时也可以写到暂存器A、暂存器B 中。由于在运算型指令中把运算的结果写到通用寄存器中的指令很多，占运算型指令的大多数，发生通用寄存器数据相关的概率相当高，因此，可以用硬件设置专用路径来解决这种通用寄存器数据相关问题。上面介绍了运算器和寄存器堆的三种典型的数据通路图，在计算机组成原理这门课程中我们已经对运算器有了初步的了解，明白运算器的主要功能是完成算术和逻辑类运算。在系统结构这门课程中经过进一步的研究，还会了解到运算器与寄存器堆的结构对于计算机系统的设计有着重要的作用，对于计算机性能的优劣有着很大的影响。 2．ALU® 单元的应用在了解运算器与寄存器堆结构的基础上，基于如图1-2-3 所示的双通道双端口运算器和双端口寄存器堆的结构可以设计一段程序：从IN 单元读入一个数据，存入R0；从IN 单元读入另一个数据，存于R1；将R0 和R1 相加，结果存于R0；将R0 和R1 相加，结果存于R3，同时打入暂存器A 中；再将R0 的值送OUT 单元显示。

数值分析实验报告1

实验一误差分析实验1.1（病态问题）实验目的：算法有“优”与“劣”之分，问题也有“好”与“坏”之别。对数值方法的研究而言，所谓坏问题就是问题本身对扰动敏感者，反之属于好问题。通过本实验可获得一个初步体会。数值分析的大部分研究课题中，如线性代数方程组、矩阵特征值问题、非线性方程及方程组等都存在病态的问题。病态问题要通过研究和构造特殊的算法来解决，当然一般要付出一些代价（如耗用更多的机器时间、占用更多的存储空间等）。问题提出：考虑一个高次的代数多项式 )1.1() ()20()2)(1()(20 1∏=-=---=k k x x x x x p 显然该多项式的全部根为1,2,…,20共计20个，且每个根都是单重的。现考虑该多项式的一个扰动 )2.1(0 )(19=+x x p ε 其中ε是一个非常小的数。这相当于是对（1.1）中19x 的系数作一个小的扰动。我们希望比较（1.1）和（1.2）根的差别，从而分析方程（1.1）的解对扰动的敏感性。实验内容：为了实现方便，我们先介绍两个Matlab 函数：“roots ”和“poly ”。 roots(a)u = 其中若变量a 存储n+1维的向量，则该函数的输出u 为一个n 维的向量。设a 的元素依次为121,,,+n a a a ，则输出u 的各分量是多项式方程 01121=+++++-n n n n a x a x a x a 的全部根；而函数 poly(v)b = 的输出b 是一个n+1维变量，它是以n 维变量v 的各分量为根的多项式的系数。可见“roots ”和“poly ”是两个互逆的运算函数。 ;000000001.0=ess );21,1(zeros ve = ;)2(ess ve =

数值分析实验报告

实验五解线性方程组的直接方法实验5.1 （主元的选取与算法的稳定性）问题提出：Gauss 消去法是我们在线性代数中已经熟悉的。但由于计算机的数值运算是在一个有限的浮点数集合上进行的，如何才能确保Gauss 消去法作为数值算法的稳定性呢？Gauss 消去法从理论算法到数值算法，其关键是主元的选择。主元的选择从数学理论上看起来平凡，它却是数值分析中十分典型的问题。实验内容：考虑线性方程组编制一个能自动选取主元，又能手动选取主元的求解线性方程组的Gauss 消去过程。实验要求：（1）取矩阵?? ? ?? ?? ?????????=????????????????=1415157,6816816816 b A ，则方程有解T x )1,,1,1(* =。取n=10计算矩阵的条件数。让程序自动选取主元，结果如何？（2）现选择程序中手动选取主元的功能。每步消去过程总选取按模最小或按模尽可能小的元素作为主元，观察并记录计算结果。若每步消去过程总选取按模最大的元素作为主元，结果又如何？分析实验的结果。（3）取矩阵阶数n=20或者更大，重复上述实验过程，观察记录并分析不同的问题及消去过程中选择不同的主元时计算结果的差异，说明主元素的选取在消去过程中的作用。（4）选取其他你感兴趣的问题或者随机生成矩阵，计算其条件数。重复上述实验，观察记录并分析实验结果。思考题一：（Vadermonde 矩阵）设 ?? ??????????????????????=? ? ? ?????????????=∑∑∑∑====n i i n n i i n i i n i i n n n n n n n x x x x b x x x x x x x x x x x x A 0020 10022222121102001111 ，，其中，n k k x k ,,1,0,1.01 =+=，（1）对n=2,5,8，计算A 的条件数；随n 增大，矩阵性态如何变化？（2）对n=5，解方程组Ax=b ；设A 的最后一个元素有扰动10-4，再求解Ax=b （3）计算（2）扰动相对误差与解的相对偏差，分析它们与条件数的关系。（4）你能由此解释为什么不用插值函数存在定理直接求插值函数而要用拉格朗日或牛顿插值法的原因吗？相关MATLAB 函数提示： zeros(m,n) 生成m 行，n 列的零矩阵 ones(m,n) 生成m 行，n 列的元素全为1的矩阵 eye(n) 生成n 阶单位矩阵 rand(m,n) 生成m 行,n 列(0,1)上均匀分布的随机矩阵 diag(x) 返回由向量x 的元素构成的对角矩阵 tril(A) 提取矩阵A 的下三角部分生成下三角矩阵

系统结构实验报告一

计算机体系结构实验报告二

数值分析实验报告1

数值计算实验报告

《数值计算方法》上机实验报告

数值分析实验报告

体系结构实验报告

数值分析实验报告模板

(完整版)哈工大-数值分析上机实验报告

数值分析实验报告

计算机系统结构实验报告

数值计算实验报告

数值分析2016上机实验报告

计算机体系结构实验报告二

数值分析实验报告总结

数值分析实验报告资料

软件设计与体系结构实验报告

计算机体系结构 实验报告2 华东理工大学

数值分析实验报告1

数值分析实验报告

计算机体系结构实验报告2 华东理工大学