算法设计与分析基础习题参考答案
习题1.1
5..证明等式gcd(m,n)=gcd(n,m mod n)对每一对正整数m,n都成立.
Hint:
根据除法的定义不难证明:
如果d整除u和v, 那么d一定能整除u±v;
如果d整除u,那么d也能够整除u的任何整数倍ku.
对于任意一对正整数m,n,若d能整除m和n,那么d一定能整除n和r=m mod n=m-qn;显然,若d 能整除n和r,也一定能整除m=r+qn和n。
数对(m,n)和(n,r)具有相同的公约数的有限非空集,其中也包括了最大公约数。故gcd(m,n)=gcd(n,r)
6.对于第一个数小于第二个数的一对数字,欧几里得算法将会如何处理?该算法在处理这种输入的过程中,上述情况最多会发生几次?
Hint:
对于任何形如0<=m gcd(m,n)=gcd(n,m) 并且这种交换处理只发生一次. 7.a.对于所有1≤m,n≤10的输入, Euclid算法最少要做几次除法?(1次) b. 对于所有1≤m,n≤10的输入, Euclid算法最多要做几次除法?(5次) gcd(5,8) 习题1.2 1.(农夫过河) P—农夫W—狼G—山羊C—白菜 2.(过桥问题) 1,2,5,10---分别代表4个人, f—手电筒 4. 对于任意实系数a,b,c, 某个算法能求方程ax^2+bx+c=0的实根,写出上述算法的伪代码(可以假设sqrt(x)是求平方根的函数) 算法Quadratic(a,b,c) //求方程ax^2+bx+c=0的实根的算法 //输入:实系数a,b,c //输出:实根或者无解信息 If a≠0 D←b*b-4*a*c If D>0 temp←2*a x1←(-b+sqrt(D))/temp x2←(-b-sqrt(D))/temp return x1,x2 else if D=0 return –b/(2*a) else return ―no real roots‖ else //a=0 if b≠0 return –c/b else //a=b=0 if c=0 return ―no real numbers‖ else return ―no real roots‖ 5. 描述将十进制整数表达为二进制整数的标准算法 a.用文字描述 b.用伪代码描述 解答: a.将十进制整数转换为二进制整数的算法 输入:一个正整数n 输出:正整数n相应的二进制数 第一步:用n除以2,余数赋给Ki(i=0,1,2...),商赋给n 第二步:如果n=0,则到第三步,否则重复第一步 第三步:将Ki按照i从高到低的顺序输出 b.伪代码 算法DectoBin(n) //将十进制整数n转换为二进制整数的算法 //输入:正整数n //输出:该正整数相应的二进制数,该数存放于数组Bin[1...n]中 i=1 while n!=0 do { Bin[i]=n%2; n=(int)n/2; i++; } while i!=0 do{ print Bin[i]; i--; } 9.考虑下面这个算法,它求的是数组中大小相差最小的两个元素的差.(算法略) 对这个算法做尽可能多的改进. 算法MinDistance(A[0..n-1]) //输入:数组A[0..n-1] //输出:the smallest distance d between two of its elements 习题1.3 考虑这样一个排序算法,该算法对于待排序的数组中的每一个元素,计算比它小的元素个数,然后利用这个信息,将各个元素放到有序数组的相应位置上去. a.应用该算法对列表‖60,35,81,98,14,47‖排序 b.该算法稳定吗? c.该算法在位吗? 解: a. 该算法对列表‖60,35,81,98,14,47‖排序的过程如下所示: b.该算法不稳定.比如对列表‖2,2*‖排序 c.该算法不在位.额外空间for S and Count[] 4.(古老的七桥问题) 习题1.4 1.请分别描述一下应该如何实现下列对数组的操作,使得操作时间不依赖数组的长度. a.删除数组的第i个元素(1<=i<=n) b.删除有序数组的第i个元素(依然有序) hints: a. Replace the ith element with the last element and decrease the array size of 1 b. Replace the ith element with a special symbol that cannot be a value of the array’s element(e.g., 0 for an array of positive numbers ) to mark the ith position is empty. (―lazy deletion‖) 习题2.1 1 欧几里得算法的时间复杂度 欧几里得算法, 又称辗转相除法, 用于求两个自然数的最大公约数. 算法的思想很简单, 基于下面的数论等式 gcd(a, b) = gcd(b, a mod b) 其中gcd(a, b)表示a和b的最大公约数, mod是模运算, 即求a除以b的余数. 算法如下: 输入: 两个整数a, b 输出: a和b的最大公约数 function gcd(a, b:integer):integer; if b=0 return a; else return gcd(b, a mod b); end function 欧几里得算法是最古老而经典的算法, 理解和掌握这一算法并不难, 但要分析它的时间复杂度却并不容易. 我们先不考虑模运算本身的时间复杂度(算术运算的时间复杂度在Knuth的TAOCP中有详细的讨论), 我们只考虑这样的问题: 欧几里得算法在最坏情况下所需的模运算次数和输入的 a 和 b 的大小有怎样的关系? 我们不妨设a>b>=1(若a=2), 显然, 若算法需要n 次模运算, 则有un=gcd(a, b), un+1=0. 我们比较数列{un}和菲波那契数列{Fn}, F0=1<=un, F1=1<=un-1, 又因为由uk mod uk+1=uk+2, 可得uk>=uk+1+uk+2, 由数学归纳法容易得到uk>=Fn-k, 于是得到a=u0>=Fn, b=u0>=Fn-1. 也就是说如果欧几里得算法需要做n 次模运算, 则b 必定不小于Fn-1. 换句话说, 若 b 习题2.2 7.对下列断言进行证明:(如果是错误的,请举例) a. 如果t(n)∈O(g(n),则g(n)∈Ω(t(n)) b.α>0时,Θ(αg(n))= Θ(g(n)) 解: a. 这个断言是正确的。它指出如果t(n)的增长率小于或等于g(n)的增长率,那么 g(n)的增长率大于或等于t(n)的增长率 由 t(n)≤c ·g(n) for all n ≥n0, where c>0 则:) ()()1 (n g n t c ≤ for all n ≥n0 b. 这个断言是正确的。只需证明))(())(()),(())((n g n g n g n g ααΘ?ΘΘ?Θ。 设f(n)∈Θ(αg(n)),则有: )()(n g c n f α≤ for all n>=n0, c>0 )()(1n g c n f ≤ for all n>=n0, c1=c α>0 即:f(n)∈Θ(g(n)) 又设f(n)∈Θ(g(n)),则有:)()(n cg n f ≤ for all n>=n0,c>0 ) ()()(1n g c n g c n f ααα =≤ for all n>=n0,c1=c/α>0 即:f(n)∈Θ(αg(n)) 8.证明本节定理对于下列符号也成立: a.Ω符号 b.Θ符号 证明: a 。we need to proof that if t1(n)∈Ω(g1(n)) and t2(n)∈Ω(g2(n)), then t1(n)+ t2(n)∈Ω(max{g1(n), g2(n)})。 由 t1(n)∈Ω(g1(n)), t1(n)≥c1g1(n) for all n>=n1, where c1>0 由 t2(n)∈Ω(g2(n)), T2(n)≥c2g2(n) for all n>=n2, where c2>0 那么,取c>=min{c1,c2},当n>=max{n1,n2}时: t1(n)+ t2(n)≥c1g1(n)+ c2g2(n) ≥c g1(n)+c g2(n)≥c[g1(n)+ g2(n)] ≥cmax{ g1(n), g2(n)} 所以以命题成立。 b. t1(n)+t2(n) ∈Θ()))(2),(1max (n g n g 证明:由大?的定义知,必须确定常数c1、c2和n0,使得对于所有n>=n0,有: ))(2),(1max ()(2)(1))(2),(1max ((1n g n g n t n t n g n g c ≤+≤ 由t1(n)∈Θ(g1(n))知,存在非负整数a1,a2和n1使: a1*g1(n)<=t1(n)<=a2*g1(n)-----(1) 由t2(n)∈Θ(g2(n))知,存在非负整数b1,b2和n2使: b1*g2(n)<=t2(n)<=b2*g2(n)-----(2) (1)+(2): a1*g1(n)+ b1*g2(n)<=t1(n)+t2(n) <= a2*g1(n)+ b2*g2(n) 令c1=min(a1,b1),c2=max(a2,b2),则 C1*(g1+g2)<= t1(n)+t2(n) <=c2(g1+g2)-----(3) 不失一般性假设max(g1(n),g2(n))=g1(n). 显然,g1(n)+g2(n)<2g1(n),即g1+g2<2max(g1,g2) 又g2(n)>0,g1(n)+g2(n)>g1(n),即g1+g2>max(g1,g2)。 则(3)式转换为: C1*max(g1,g2) <= t1(n)+t2(n) <=c2*2max(g1,g2) 所以当c1=min(a1,b1),c2=2c2=2max(c1,c2),n0=max(n1,n2)时,当n>=n0时上述不等式成立。 证毕。 10. 切忌算法走的步数和人真实走的步数的区别,算法是不需要走回头路的。 习题2.4 解下列递推关系 (做a,b ) a. 解: ?? ?=+-=0)1(5 )1()(x n x n x 当n>1时 b. 解: 对于计算n!的递归算法F(n),建立其递归调用次数的递推关系并求解。 解: 考虑下列递归算法,该算法用来计算前n 个立方的和:S(n)=13+23+…+n3。 算法S(n) //输入:正整数n //输出:前n 个立方的和 if n=1 return 1 else return S(n-1)+n*n*n a. 建立该算法的基本操作次数的递推关系并求解 b. 如果将这个算法和直截了当的非递归算法比,你做何评价? 解: a. ?? ?=-=4 )1()1(3)(x n x n x 当n>1时 6. 汉诺塔的非递归问题请见F:\work\继续教育\算法设计与分析基础 7. a. 请基于公式2n=2n-1+2n-1,设计一个递归算法。当n是任意非负整数的时候,该算法能够计算2n的值。 b. 建立该算法所做的加法运算次数的递推关系并求解 c. 为该算法构造一棵递归调用树,然后计算它所做的递归调用次数。 d. 对于该问题的求解来说,这是一个好的算法吗? 解: a.算法power(n) //基于公式2n=2n-1+2n-1,计算2n //输入:非负整数n //输出: 2n的值 If n=0 return 1 Else return power(n-1)+ power(n-1) c. ∑=+-==n i n i n C 0 11 22)( 8.考虑下面的算法 算法 Min1(A[0..n-1]) //输入:包含n 个实数的数组A[0..n-1] If n=1 return A[0] Else temp ←Min1(A[0..n-2]) If temp ≤A[n-1] return temp Else return A[n-1] a.该算法计算的是什么? b.建立该算法所做的基本操作次数的递推关系并求解 解: a.计算的给定数组的最小值 b.?? ?+-=01 )1()(n C n C 9.考虑用于解决第8题问题的另一个算法,该算法递归地将数组分成两半.我们将它称为Min2(A[0..n-1]) 算法 Min(A[r..l]) If l=r return A[l] Else temp1← Min2(A[l..(l+r)/2]) Temp2←Min2(A[l..(l+r)/2]+1..r) If temp1≤temp2 return temp1 Else return temp2 a.建立该算法所做的的操作次数的递推关系并求解 b.算法Min1和Min2哪个更快?有其他更好的算法吗? 解: a. for all n>1 n=1 习题2.5 4. 假设n格梯子有f(n)种方法。 则: f(1) = 1 f(2) = 2 对n>2,有: f(n) = (先上一格,再上n-1格的方法数)+ (先上两格,再上n-2格的方法数)即 f(n) = f(n-1) + f(n-2) 所以f(n)是Fibonacci数列的第n+1项? #include long fib(int n) { if (n == 1 || n == 2) return 1; return fib(n - 1) + fib(n - 2); } main() { int n; scanf("%d", &n); printf("%ld\n", fib(n+1)); return 0; } 习题2.6 考虑下面的排序算法,其中插入了一个计数器来对关键比较次数进行计数. 算法SortAnalysis(A[0..n-1]) //input:包含n个可排序元素的一个数组A[0..n-1] //output:所做的关键比较的总次数 count←0 for i←1 to n-1 do v←A[i] j←i-1 while j>0 and A[j]>v do count←count+1 A[j+1]←A[j] j←j+1 A[j+1]←v return count 比较计数器是否插在了正确的位置?如果不对,请改正. 解:应改为: 算法SortAnalysis(A[0..n-1]) //input:包含n个可排序元素的一个数组A[0..n-1] //output:所做的关键比较的总次数 count←0 for i←1 to n-1 do v←A[i] j←i-1 while j>=0 and A[j]>v do count←count+1 A[j+1]←A[j] j←j-1 if j>=0 count=count+1 A[j+1]←v return count 7. b gcd(m,n)算法性能最坏情况下为两个整数为斐波那锲数列,即k时间最长时,最小的整数对必定为斐波那锲数列。 9. 我认为埃拉托色尼筛的效率为根号n。 10. gcd(a,b)复杂性估计 c = a % b ; c < a/2; 在算法中即表现为n(余数)每两次循环至少减少为原来的一半,所以该算法时间复杂度估算为2logn = O( logn ); 由于能力有限,更精确复杂的时间复杂度的计算还没有掌握。在最坏的情况下(如m和n是两个相邻的斐波那契数时)可以稍微改进成1.44logn。欧几里德算法在平均情况下的性能需要大量篇幅的高度复杂的数学分析,其迭代的平均次数约为(12ln2lnn)/pi2+1.47。 习题3.1 4. a.设计一个蛮力算法,对于给定的x0,计算下面多项式的值: P(x)=anxn+an-1xn-1+…+a1x+a0 并确定该算法的最差效率类型. b.如果你设计的算法属于Θ(n2),请你为该算法设计一个线性的算法. C.对于该问题来说,能不能设计一个比线性效率还要好的算法呢? 解: Algorithms BruteForcePolynomialEvaluation(P[0..n],x) //由高幂到低幂用蛮力法计算多项式p 在给定点x 的值 //输入:P[0..n]是多项式按低幂到高幂的常系数,以及定值x //输出: 多项式p 在给定点x 的值 p=0.0 for i=n to 0 do power=1 for j=1 to i do power=power*x p=p+P[i]*power return p 算法效率分析: 基本操作:两个数相乘,且M(n)仅依赖于多项式的阶n ∑∑∑===Θ∈+= ==n i n i i j n n n i n M 020 1 )(2) 1(1)( tha above algorithms is very inefficient, because we recompute powers of x again and again as if there were no relationship among them.In fact ,we can move from the lowest term to the highest and compute xi by using xi-1. Algorithms BetterBruteForcePolynomialEvaluation(P[0..n],x) //由高幂到低幂用蛮力法计算多项式p 在给定点x 的值 //输入:P[0..n]是多项式按低幂到高幂的常系数,以及定值x //输出: 多项式p 在给定点x 的值 P=P[0] power=1 for i←1 to n do power←power*x p←p+P[i]*power return p 基本操作乘法运算总次数M(n): ) (22)(1 n n n M n i Θ∈==∑= c.不行.因为计算任意一个多项式在任意点x 的值,都必须处理它的n+1 个系数.例如: (x=1,p(x)=an+an-1+..+a1+a0,至少要做n 次加法运算) 5.应用选择排序对序列example 按照字母顺序排序. 6.选择排序是稳定的吗?(不稳定) 回到主题,现在分析一下常见的排序算法的稳定性,每个都给出简单的理由。 (1)冒泡排序 冒泡排序就是把小的元素往前调或者把大的元素往后调。比较是相邻的两个元素比较,交换也发生在这两个元素之间。所以,如果两个元素相等,我想你是不会再无聊地把他们俩交换一下的;如果两个相等的元素没有相邻,那么即使通过前面的两两交换把两个相邻起来,这时候也不会交换,所以相同元素的前后顺序并没有改变,所以冒泡排序是一种稳定排序算法。 (2)选择排序 选择排序是给每个位置选择当前元素最小的,比如给第一个位置选择最小的,在剩余元素里面给第二个元素选择第二小的,依次类推,直到第n-1个元素,第n个元素不用选择了,因为只剩下它一个最大的元素了。那么,在一趟选择,如果当前元素比一个元素小,而该小的元素又出现在一个和当前元素相等的元素后面,那么交换后稳定性就被破坏了。比较拗口,举个例子,序列5 8 5 2 9,我们知道第一遍选择第1个元素5会和2交换,那么原序列中2个5的相对前后顺序就被破坏了,所以选择排序不是一个稳定的排序算法。 (3)插入排序 插入排序是在一个已经有序的小序列的基础上,一次插入一个元素。当然,刚开始这个有序的小序列只有1个元素,就是第一个元素。比较是从有序序列的末尾开始,也就是想要插入的元素和已经有序的最大者开始比起,如果比它大则直接插入在其后面,否则一直往前找直到找到它该插入的位置。如果碰见一个和插入元素相等的,那么插入元素把想插入的元素放在相等元素的后面。所以,相等元素的前后顺序没有改变,从原无序序列出去的顺序就是排好序后的顺序,所以插入排序是稳定的。 (4)快速排序 快速排序有两个方向,左边的i下标一直往右走,当a[i] <= a[center_index],其中center_index 是中枢元素的数组下标,一般取为数组第0个元素。而右边的j下标一直往左走,当a[j] > a[center_index]。如果i和j都走不动了,i <= j, 交换a[i]和a[j],重复上面的过程,直到i>j。交换a[j]和a[center_index],完成一趟快速排序。在中枢元素和a[j]交换的时候,很有可能把前面的元素的稳定性打乱,比如序列为5 3 3 4 3 8 9 10 11,现在中枢元素5和3(第5个元素,下标从1开始计)交换就会把元素3的稳定性打乱,所以快速排序是一个不稳定的排序算法,不稳定发生在中枢元素和a[j]交换的时刻。 (5)归并排序 归并排序是把序列递归地分成短序列,递归出口是短序列只有1个元素(认为直接有序)或者2个序列(1次比较和交换),然后把各个有序的段序列合并成一个有序的长序列,不断合并直到原序列全部排好序。可以发现,在1个或2个元素时,1个元素不会交换,2个元素如果大小相等也没有人故意交换,这不会破坏稳定性。那么,在短的有序序列合并的过程中,稳定是是否受到破坏?没有,合并过程中我们可以保证如果两个当前元素相等时,我们把处在前面的序列的元素保存在结果序列的前面,这样就保证了稳定性。所以,归并排序也是稳定的排序算法。 (6)基数排序 基数排序是按照低位先排序,然后收集;再按照高位排序,然后再收集;依次类推,直到最高 位。有时候有些属性是有优先级顺序的,先按低优先级排序,再按高优先级排序,最后的次序就是高优先级高的在前,高优先级相同的低优先级高的在前。基数排序基于分别排序,分别收集,所以其是稳定的排序算法。 (7)希尔排序(shell) 希尔排序是按照不同步长对元素进行插入排序,当刚开始元素很无序的时候,步长最大,所以插入排序的元素个数很少,速度很快;当元素基本有序了,步长很小,插入排序对于有序的序列效率很高。所以,希尔排序的时间复杂度会比o(n^2)好一些。由于多次插入排序,我们知道一次插入排序是稳定的,不会改变相同元素的相对顺序,但在不同的插入排序过程中,相同的元素可能在各自的插入排序中移动,最后其稳定性就会被打乱,所以shell排序是不稳定的。 (8)堆排序 我们知道堆的结构是节点i的孩子为2*i和2*i+1节点,大顶堆要求父节点大于等于其2个子节点,小顶堆要求父节点小于等于其2个子节点。在一个长为n的序列,堆排序的过程是从第n/2开始和其子节点共3个值选择最大(大顶堆)或者最小(小顶堆),这3个元素之间的选择当然不会破坏稳定性。但当为n/2-1, n/2-2, ...1这些个父节点选择元素时,就会破坏稳定性。有可能第n/2个父节点交换把后面一个元素交换过去了,而第n/2-1个父节点把后面一个相同的元素没有交换,那么这2个相同的元素之间的稳定性就被破坏了。所以,堆排序不是稳定的排序算法。 7.用链表实现选择排序的话,能不能获得和数组版相同的Θ(n2)效率? Yes.Both operation—finding the smallest element and swapping it –can be done as efficiently with the linked list as with an array. 9.a.请证明,如果对列表比较一遍之后没有交换元素的位置,那么这个表已经排好序了,算法可以停止了. b.结合所做的改进,为冒泡排序写一段伪代码. c.请证明改进的算法最差效率也是平方级的. Hints: 第i趟冒泡可以表示为: 如果没有发生交换位置,那么: b.Algorithms BetterBubblesort(A[0..n-1]) //用改进的冒泡算法对数组A[0..n-1]排序 //输入:数组A[0..n-1] //输出:升序排列的数组A[0..n-1] count←n-1 //进行比较的相邻元素对的数目 flag←true //交换标志 while flag do flag←false for i=0 to count-1 do