厦门大学---算法分析——6

合集下载

厦门大学高级人工智能复习review

• (0.791,0.209) • 如果是5分钟，可得（0.583，0.417） • 0分钟的时候才是概率一样。
第14章
• 贝叶斯网络 • 会根据网络和CPT计算各类概率
• 求P(a,b,c,d,e),P(a|d,c,e)
• 根据结构得
P(a,b,c,d,e)=P(a)P(b|a)P(c|a)P(d|b)P(e|b,c)
– 比如给定一个贝叶斯网络，计算某个条件概率
• 综合运用
– 比如“羊、菜、人坐小船过河”问题
第2章
• 智能体及其分类、评价 • 环境的描述（PEAS)
第3章
• 基本概念：状态空间，最初状态、目标测试、后继函数、代价函数
• 搜索方法
– 广度优先 – 深度优先 – 有限深度 – 迭代深入深度优先 – 双向搜索
• P(a|d,c,e)=αΣBP(a,B,c,d,e)=αP(a,b,c,d,e)+ α P(a,-b,c,d,e)
• 再求出P(-a|d,c,e)
第15章
15.1-15.3
4个问题：filtering,prediction,smoothing,most likely explanation(Viterbi算法)
=αP(word)P(image|word) 前者称为字母的语言模型，后者称为光学
模型为了提高准确率，往往在（1）中增加基于
词的语言模型
第16-17章
MDP：states, actions, rewards,utilities,transitions,discounts,policy
• 贝叶斯法则
– P(Y|X) = P(X|Y) P(Y) / P(X) = αP(X|Y) P(Y) – P(Y|X,e) = P(X|Y,e) P(Y|e) / P(X|e)

(陈慧南第3版)算法设计与分析——第6章课后习题答案

⑥ 选择作业 1，则 X 6, 2,3,5,1 。将其按照期限 di 非减次序排列可
得：
ID
di
5
1
6
2
3
3
1
3
2
4
作业5
作业3 作业2
-1
0
1
2
3
4
作业6 作业1（冲突）
该集合无可行排序，因此 X 6, 2,3,5,1 不可行， X 6, 2,3,5 ；
3
⑦ 选择作业 0，则 X 6, 2,3,5, 0 。将其按照期限 di 非减次序排列
可得：
ID
di
5
1
0
1
6
2
3
3
2
4
作业5
作业3 作业2
-1
0
1
2
3
4
作业0（冲突）作业6
该集合无可行排序，因此 X 6, 2,3,5, 0 不可行，X 6, 2,3,5 ；
⑧ 选择作业 4，则 X 6, 2,3,5, 4 。将其按照期限 di 非减次序排列
可得：
ID
Hale Waihona Puke di516
12,5,8,32, 7,5,18, 26, 4,3,11,10, 6 。请给出最优存储方案。
解析：首先将这 13 个程序按照程序长度非降序排列，得：
程序 ID
9 8 1 5 12 4 2 11 10 0 6 7 3
程序长度 ai 3 4 5 5 6 7 8 10 11 12 18 26 32
根据定理可知，按照程序编号存放方案如下：
解析：已知 Prim 算法时间复杂度为 O n2 ，受顶点 n 影响；
Kruskal 算法时间复杂度为 O m logm ，受边数 m 影响；

厦门大学软件工程专业课程表

Assembly 汇编语 TX15 Language 言 Programming
本课程是计算机类专业的基础课程。介绍 8086/8088 CPU 的主要学指令集，学会从汇编语言的角度考科计算机导虑问题的解决方法，掌握微机系统通论、计算机的编程结构。强调对底层编程能力修硬件基础和意识的培养，从具体应用出发，课对 CPU 所提供的指令集的典型特程点、寻址方式等内容进行理论上的
件体系结构的整体分析和处理能力，为开发大型软件打下基础在熟悉 Java 程序开发的基础上，学生应该进入更高一个层次，使用 Java2 平台企业版（J2EE）来创建企业级应用程序。本课程应以丰富的实例提供当前这一技术的最新动向，对于每一位在 J2EE 平台上开发和部署应用程序的开发人员，提供入门以及进一步提高的基础。本课程将使用许多构思精巧的实例程序（包括源码）来描述 J2EE 关键面向对象的概念。此外，也有助于学生快速程序设计掌握 J2EE 平台的多项技术，包括: (Java) Enterprise JavaBean, Java Servlet, JavaServer Pages, Java Message Service (JMS，Java 消息服务), Java Naming and Directory Interface (JNDI， Java 名字与目录接口 ), XML, J2EE Connector Architecture（J2EE 连接器架构） , JavaMail, JDBC。为学生以后创建自己的大型企业级应用系统时，通过本课程获得进一步的技术指导、知识和经验。本课程也称为“用户界面设计（User’s interface design）， ” 主要介绍软件界面的基本概念、要其它专业求、基本特性和分析方法；介绍人课程机界面的快速原型及其开发工具、可视化界面、人机接口技术等内容，同时使学生了解当前最新的界面设计技术本课程的任务是培养学生计算机软件开发与应用的综合能力。介绍软件的基本概念和软件工程的目标，通过对传统的面向过程的软件开发方法和面向对象的软件开发方法的介绍，使学生掌握开发高质量软件的方法；通过对软件开发过程和过程管理技术的学习，使学生了解如何进行软件度量和管理，怎样进行质量保证活动，从而能够有效

厦门大学应用多元统计分析第章聚类分析

4．距离选择的原则
一般说来，同一批数据采用不同的距离公式，会得到不同的分类结果。产生不同结果的原因，主要是由于不同的距离公式的侧重点和实际意义都有不同。因此我们在进行聚类分析时，应注意距离公式的选择。通常选择距离公式应注意遵循以下的基本原则：
（1）要考虑所选择的距离公式在实际应用中有明确的意义。如欧氏距离就有非常明确的空间距离概念。马氏距离有消除量纲影响的作用。
1．明考夫斯基距离
p
dij (q) (
X ik X jk )q 1/ q
k 1
(5.1)
明考夫斯基距离简称明氏距离，按的取值不同又可分成：
（1）绝对距离（ q 1）
p
dij (1) X ik X jk k 1
（2）欧氏距离（ q 2）
p
dij (2) (
X ik X jk )2 1/ 2
p
( Xik Xi )( X jk X j )
rij
k 1 p
p
( Xik Xi )2 ( X jk X j )2
k 1
k 1
(5.8)
显然也有，∣rij∣ 1。
无论是夹角余弦还是相关系数，它们的绝对值都小于1，作为变量近似性的度量工具，我们把它们统记为cij。当∣cij∣ = 1时，说明变量Xi与Xj完全相似；当∣cij∣近似于1时，说明变量Xi与Xj非常密切；当∣cij∣ = 0时，说明变量Xi与Xj完全不一样；当∣cij∣近似于0时，说明变量Xi与Xj差别很大。据此，我们把比较相似的变量聚为一类，把不太相似的变量
聚类分析就是分析如何对样品（或变量）进行量化分类的问题。通常聚类分析分为Q型聚类和R型聚类。Q型聚类是对样品进行分类处理，R型聚类是对变量进行分类处理。

厦大数据结构习题及解答

1. 数据元素是数据的基本单位，有些情况下也称为元素、结点、顶点、记录等。

2 何谓算法?它与程序有何区别?算法是解决某一特定类型问题的有限运算序列。

程序＝数据结构＋算法3. 算法分析是对一种算法所消耗的计算机资源的估算，其中包括计算机运行时间的长短和占据空间的大小。

4. 何谓频度、时间复杂度、空间复杂度？说明其含义。

算法中语句的重复次数称为该语句的频度。

时间复杂度是算法执行所需要的时间，也就是算法中每一个语句的执行次数乘以每一次执行所需的时间的总和。

空间复杂度是算法对空间占用的量度。

（一般在考虑空间复杂度时，只估算算法所需增添的辅助空间，而对问题中原始数据所占的空间，由于与算法无关，不予考虑。

）5. 时间复杂度的计算：语句2的频度为n-l，语句4的额度为(n-1)(2n+1)＝2n2-n-l，因此时间复杂度T(n)＝O(n2)。

语句3的频度为n，语句7的频度为n2，因此时间复杂度为T(n)＝O(n2)。

【解】语句3的频度不仅与n有关，而且和x及数组A中各分量的值有关。

这时通常考虑最坏的情况，由于while循环的最大次数为n-1，因此时间复杂度为T(n)＝O(n)。

i=1;while(i<=n)i=i*5;【解】设语句“i=i*5;”的频度为x，则5x<=n，x<=log5n，O(log5n)i=0;s=0;while(s<n){i++; s+=i;}【解】i=1,s=1i=2,s=1+2i=3,s=1+2+3,s就是对等差数列求和，因此s=i(i+1)/2<n，其中i就是循环语句的频度，因此O(n)6. 在一个具有n个结点的有序单链表中插入一个新结点，使得链表仍然有序，该算法的时间复杂度是( )A.O(log2n)B.O(1)C.O(n2)D.O(n)(D)7. 如果某线性表中最常用的操作是取第i个结点及其前驱，则采用（）存储方式最节省时间。

A.单链表B.双向链表C.单循环链表D.顺序表（D）8. 写出带头结点的双向循环链表L为空表的条件（假设结点包括data, next, prior三个域）：(L==L->Next) && (L==L->Prior)注：L->Next==L->Prior不行，因为表长为1时该条件也成立。

厦门大学数据结构与算法(陈海山)期末习题答案解析

A 2-9 设 L 是不带头结点的单链表的头指针，功能是 ( )。 LinkSearch (LinkList L, int k) {
k0=0; p=L->next; // next 为单链表的指针域 q=p; while ( p ) {
if (k0<=k) k0++; else q=q->next;
有 (相对 )顺序不变，则平均要移动 ( )个元素。
(A) 7
(B) 32
(C) 64
(D) 127
C n/2+1
2-3 将关键字 2，4，6，8，10， 12，14， 16依次存放于一维数组 A[0...7] 中，如
果采用折半查找方法查找关键字，在等概率情况下查找成功时的平均查找长度为
( )。
(A) 21/8
A 中的负数调整到前半区
1-7 将上三角矩阵 A=(aij)n n 的非 0 元素逐行存于 B[(n*(n+1)/2] 中，使得 B[k]=aij 且 k=f1(i)+f2(j)+c (f1, f2 不含常数项 )，试推导函数 f1, f2 和常数 c。 k+1=1+2+3+, +(i-1)+j k=1/2*i*(i-1)+j-1;
g(m-1, 2n)+n， m>0且 n≥0
double g(double m,double n) {
If(m==0&&n>=0) return 0;
else return g(m-1,2*n)+n;
}
1-10 将下列递归过程改写为非递归过程。 void test(int &s) {

厦门大学操作系统5-6章习题讲解

– 一个进程在等待其它资源分配时，继续占有已分配的资源
③ 非抢占
– 不能强行抢占已分配给其它进程的资源 – 除非进程主动释放
p211复习题6.3
• 产生死锁的第四个条件：循环等待
– 资源分配图中存在一条封闭的进程链
p212习题6.3
• 证明图6.3所反映的情况不会发生死锁（图见P186）
资源可重用的，P、Q同时申请B，Q获得B，P、 Q同时申请A，P获得A， Q释放B，P得到A，P释放A，Q得到A，不构成死锁的第四个条件。
P182习题5.14
P182习题5.14
• 信号量s控制对临界区的访问，在临界区只包含append 或take 操作。 • AC会导致死锁。 • BD不变，但效率变低（临界区变长）。
p211复习题 6.2
• 可能发生死锁所必需的三个条件： ① 互斥
– 一次只有一个进程可以使用一个资源
② 占有且等待
不会死锁，剩下存储单元数： 150-（45+40+15+25）=25 满足进程1，2，可任选一个，执行完后可满足其它
安全顺序是1－2－3－4 • • 银行家算法：测试进程对资源的最大需求，若系统当前的剩余资源满足它的最大需求，则满足进程的当前的申请，否则，推迟分配。这样能保证至少有一个进程获得资源的最大需求而运行，结束后释放资源供其它进程用。
P182习题5.3
b、在a的假设下，允许任意多的进程并发执行，tally值的范围？
对一般有N个进程的情况,tally值的最终范围是[2,N*50],因为对其他所有进程来说,从最初开始运行到在第五步完成.但最后都被进程B破坏掉它们的最终结果.
P182习题5.13
• 考虑图5.10中定义的无限缓冲区生产者/消费者问题的解决方案，设生产者与消费者都以大致相同的速度运行，运行情况如下：生产者： append;semSignal;produce;...; append;semSignal;produce;...; 消费者： consume;...;take;semWait;con sume;...;take;semWait;...; • 生产者通常管理给缓冲区添加一个新元素，并在消费者消费了前面的元素后发出信号。生产者通常添加到一个空缓冲区中，而消费者通常取走缓冲区中的惟一元素。消费者从不在信号量上阻塞，但必须进行大量的信号量调用，产生相当多的开销。构造新程序，使之更有效。提示：允许n的值为-1，这表示不仅缓冲区为空，而且消费者也检测到这个事实并将被阻塞，直到生产者产生新的数据。这个方案不要图5.10中的局部变量m 。

厦门大学微机原理

[ -0]原码 = 1 000,0000 = 80H
0的表示不唯一
反码表示法：正数的反码同原码，负数的反码数值位与原码相反例：n=8bit [+5]反码 = 0 000,0101 = 05H [ -5]反码 = 1 111,1010 = FAH [+0]反码 = 0 000,0000 = 00H
二进制数二进制数十六进制数十进制数
十进制数十六进制数
9
1、算术运算
二进制
1.3 运算（算术运算和逻辑运算）
加法规则 0+0=0 0+1=1 1+0=1 1+1=0 （进位1）
05C3H + 3D25H
乘法规则 00=0 01=0 10=0 11=1
3D25H - 05C3H
十六进制
A B 0 0 0 1 1 0 1 1
AB 0 1 1 0
11
例：X=000 0000 1111 1111 B Y= 0101 0101 0101 0101 B
Z= 0101 0101 1010 1010 B
Z=55AAH
12
1.4.1 数（机器数）的表示：

1. 位（ bit比特）： 1个二进制位
位是计算机所能表示的最基本最小的数据单元。

2.字和字长
字是计算机内部进行数据处理的基本单位，通常它与计算机内部的寄存器、运算装置、总线的宽度相一致。字长：计算机的每一个字所包含的二进制位数称为字长。

3.字节（ Byte）：8个二进制位，即1Byte=8bit
负数的补码：
第一种表示法：[X]补码 = 2n-|X| 第二种表示法：正数补码求反加1 （1）写出与该负数相对应的正数的补码（2）按位求反（3）末位加一

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

x X n
t
A
( x) / X n
— —显然不能排除存在x X n，使得t A ( x) t A (n)
希望获得一个概率算法B，使得对问题的输入规模为n的每一个实例x X n , 均有t B ( x) t A (n) s (n)。定义算法B关于规模为n的随机实例的平均时间为 t B ( n)
结论

结论

非递归的舍伍德型选择算法Select可以在O(n)平均时间内找出ｎ个输入元素中的第ｋ小元素

提示

对于某些确定性算法，可以将其改造成舍伍德算法，使得该算法以高概率对任何实例均有效。对于某些不能直接改造的情况，可以借助预处理技术，不改变原有的确定性算法，而仅对其输入元素进行随机洗牌，同样可以收到舍伍德算法的效果。
Y=f(x)
G
x 1
用平均值法计算定积分
任取一组相互独立、同分布的随机变量{ i } , i 在[a, b]中 g ( x) 服从分布律f ( x)。令g ( x) , 则{g * ( i )}也是一组互 f ( x)
*
独立、同分布的随机变量，而且 E ( g * ( i )) g * ( x) f ( x)dx f ( x)dx I
方法直观、简单，但工作量较大
算法改进
随机搜索算法在指定求根区域D内，选定一个随机点x0作为随机搜索的出发点。在算法搜索过程中，假设第j步随机搜索得到的随机搜索点为x j。在j 1步，首先计算出下一步的随机搜索方向r，然后计算搜索步长a，由此得到第j 1步的随机搜索增量x j。从当前点x j 根据随机搜索增量x j 得到第j 1步的随机搜索点 x j 1 x j x j。当 ( x j 1 ) 时，取x j 1为所求非线性方程组的近似解否则，进行下一步新的随机搜索过程
n 1 1 T (n) (T (max( 1, n 1)) T (max( i, n i ))) O (n) n i 1 n 1 1 2 n 1 (T (n 1) 2 T (i )) O (n) T (i ) O (n) n n i n / 2 i n / 2

舍伍德算法的精髓

不是避免算法的最坏情况，而是设法消除这种最坏情形行为与特定实例之间的关联性。
提纲

随机数数值概率算法舍伍德算法拉斯维加斯算法蒙特卡罗算法本章小结
提纲

随机数数值概率算法舍伍德算法拉斯维加斯算法蒙特卡罗算法本章小结
随机数

舍伍德型选择算法

Select算法分析
划分基准：随机划分当算法对含有n个元素的数组进行划分时划分出的低区子数组中 i 2,3,..., n) ( 含有1个元素的概率为2 / n；含有i个元素的概率为 / n； 1
Select算法分析
假设对于一个含有n个元素的输入数组， T (n)是算法作用于该数组上所需的期望时间的一个上界，且T (n)是单调递增的。在最坏情况下，第k小元素总被划分在较大的子数组内。
如何选取常数b、c、m将直接影响到所产生随机序列的随机性。
该随机序列的种子
随机序列的产生与实验

随机序列的产生

参看教材page241-242

Random fRandom

模拟抛硬币实验

参看教材page243-244
提纲

随机数数值概率算法舍伍德算法拉斯维加斯算法蒙特卡罗算法本章小结
算法思想：进行投点试验，随机点落在曲线y f ( x)下面的概率为 Pr { y f ( x)}
0 1 f ( x) 1
dydx f ( x)dx I
0 0
1 y
随机点( xi , yi )落在曲线y f ( x)下，即yi f ( xi ) m 如果有m个点落在曲线y f ( x)下，在I 近似等于 n m 随机点落在曲线y f ( x)下的概率，即I 0 n
a xb x a, x b
在[a, b]区间随机抽取n个点x(i 1,2,..., n)， ba n 则均值I g ( xi )可作为所求积分I的近似值。 n i 1
算法实现

用随机投点法计算定积分

参看教材page245-246 参看教材page246-247

用平均值法计算定积分

反映在求解时间、结果质量等方面。
概率算法的主要类型

概率算法的主要类型

数值概率算法蒙特卡罗算法拉斯维加斯算法舍伍德算法
数值概率算法

数值概率算法

常用于数值问题的求解，得到的往往是近似解

解的精度随计算时间的增加而提高在许多情况下，计算出问题的精确解是不可能或没必要
蒙特卡罗算法
a
b
在区间[a, b]内可积。任意选择一个有简单方法可以进行抽样的概率密度函数f ( x)，满足下列条件：（）f ( x) 0, 当g ( x) 0时（a x b）； 1 （2） f ( x)dx 1
a b
g ( x) 记g * ( x ) f ( x ) 0
求解过程会出现一些麻烦，甚至使方法失效而无法获得一个近似解
利用概率算法求解
构造一函数 ( x) f i 2 ( x)
i 1 n
其中，x ( x1 , x2 ,..., xn )。该函数的零点即是所求非线性方程组的一组解。算法设计：在指定求根区域内，选定一个x0作为根的初值。按预先选定的分布（如以 x0为中心的正态分布，均匀分布，三角分布等），逐个选取随机点x。计算目标函数 ( x)，并将满足精度要求的随机点x作为所求非线性方程组的近似解。
f ( x) 0 f ( x) 0
b
则所求积分可以写成为I g * ( x) f ( x)dx
a
取f ( x)为均匀分布：f ( x) b a 0 1 I (b a ) g ( x) dx ba a
b
算法设计与分析
——概率算法
概率算法

概率算法

同前几章算法的区别

概率算法允许算法在执行过程中随机地选择下一个计算步骤。

在许多情况下，当算法在执行过程中面临一个选择时，随机性选择常比最优选择省时。

概率算法的一个基本特征：对所求解问题的同一实例用同一概率算法求解两次，可能得到完全不同的效果。
a a b b
1 n * 由强大数定理Pr ( lim g ( i ) I ) 1 n n i 1
平均值法
1 n * 如果I g ( i ), 则I 以概率1收敛于I。就是用I 作为I的近似值 n i 1
假定要计算的积分形式为I g ( x)dx，其中被积函数g ( x)

随机数

在科学计算中扮演非常重要的角色。

现有的随机数产生器所产生的随机数都是伪随机数

在一定程度上是随机的

常用的随机数产生方法

线性同余法
线性同余法
线性同余法由线性同余法产生的随机序列a0 , a1 ,..., an满足 a0 d n0 an (ban 1 c) mod m n 1,2,... 其中, b 0, c 0, d m。
• 概率算法在求解非线性方程组时，虽然有些耗时，但实际应用中还是比较有效的，对于那些精度要求较高的问题，概率算法往往会为其提供一个较好的初始值。
• 算法实现过程参看教材page248-249
提纲

随机数数值概率算法舍伍德算法拉斯维加斯算法蒙特卡罗算法本章小结
舍伍德算法
通过实例学习数值概率算法

用随机投点法计算π值计算定积分解非线性方程组
用随机投点法计算π值计算定积分解非线性方程组
用随机投点法计算π值

算法思想

设有一半径为r的圆及其外切四边形。向该正方形随机投掷n个点。落入圆内的点数为k。
4r 4 当n足够大时，k与n之比将逼近这一概率 4k n

找到正确解的概率随算法计算时间的增加而提高

用同一拉斯维加斯算法反复对问题实例求解足够多次，可使求解失败的概率任意小。
舍伍德算法

舍伍德算法

总能求解得到问题的一个解，而且所求得得解总是正确的。

当一个确定性算法在最坏情况下的计算复杂性与其在平均情况下的计算复杂性有较大差别时，可在这个确定算法中引入随机性，将它改造成一个舍伍德算法，消除或减少问题的好坏实例间的差别。

蒙特卡罗算法

用于求解问题的准确解

在有些情况下，近似解没有意义，比如“0/1”判定问题

可以求得问题的一个解，但该解未必正确

求得正确解的概率依赖于算法的计算时间蒙特卡罗算法的主要缺点就在于无法有效判定所得到的解是否肯定正确。
拉斯维加斯算法

拉斯维加斯算法

不会得到不正确的解

但有时找不到问题的解
x X n
t
B
( x) / X n
— —舍伍德算法设计的基本思想。当s (n)与t A (n)相比可以忽略时，舍伍德算法可获得很好的平均性能。
实例说明

线性时间选择跳跃表
线性时间选择
跳跃表
线性时间选择

线性时间选择

问题所在：选择合适的划分基准

对于选择问题，用拟中位数作为划分基准可以保证在最坏情况下用线性时间完成选择。随机选择一个组元素作为划分基准，既保证算法的线性时间平均性能，又可以避免计算中位数的麻烦。