2013年中国科学院自动化研究所考博真题 算法设计与分析
2017-2018年中国科学院自动化研究所考博试题 模式识别

第1页 共2页
6. (20 分) 在一个模式识别问题中,有下列 8 个样本,每个样本为一个二维特征向量: (4, 1),(2, 1),(4, 1),(2, 1),(4,1),(2, 1),(4, 1),(2, 1)。其中,括号内的第 一个数据表示该样本点的第一个特征,括号内的第二个数据表示该样本点的第二个特 征。 (1) 现在考虑对这 8 个样本进行聚类。采用 C 均值聚类算法,并假定聚类中心的个数为 2,两个初始聚类点分别为(-5,0)和(5,0)。根据上述初始条件,请写出 C 均值聚类算 法的计算步骤,并给出最后的聚类中心;(10 分) (2) 对上述 8 个样本,假设前 4 个样本属于第一类,后 4 个样本属于第二类,现在要求 只使用一个特征达到这样的分类目的。请给出一种特征选择方法,并给出计算过程 和结果。(10 分)
x6=(5, 3)T 。请完成如下任务: (1)、写出线性支持向量机需要求解的原问题和对偶问题(不要求进行求解);(10 分) (2)、当软间隔惩罚参数 C 取值很大时,定性地画出所得到的分类决策面,并解释原因;
(提示:先将 6 个样本点在答题纸上画出,然后画出分类决策面)(3 分) (3)、当软间隔惩罚参数 C 取值很小时,定性地画出所得到的分类决策面,并解释原因。
科目名称:模式识别
第2页 共2页
中国科学院自动化研究所
2018 年招收攻读博士学位研究生入学统一考试试卷 科目名称:模式识别
考生须知:
1. 本试卷满分为 100 分,全部考试时间总计 180 分钟。 2. 所有答案必须写在答题纸上,写在试题纸上或草稿纸上一律无效。
1. (10 分 ). 对 于 c 类 分 类 问 题 , 假 定 各 类 条 件 概 率 密 度 函 数 均 为 多 元 正 态 分 布 p(x | i ) ~ N(μi , Σi ), i 1, 2, , c ,其中,xRd 表示数据的特征向量,i 和i 分别为第 i 类的均值向量和协方差矩阵,i 代表第 i 个类别。在最小错误率贝叶斯决策的框架下,请完
2015年中国科学院自动研究所考博真题算法设计与分析

3/4
6. 约定多边形的顶点按逆时针序列表示,即 P={v0, v1, …, vn-1} 表示一个多边形 有 n 条边:v0v1, v1v2, …, vn-1vn。其中,v0=vn。如果 vi 和 vj 是多边形上不相邻的 两个顶点,则线段 vivj 称为该多边形的一条弦。下面图 5 中的(a)和(b)是一个凸 7 边形的两种不同的三角剖分(各弦互不相交) 。在一个有 n 个顶点的凸多边 形的三角剖分中,恰好有 n-3 条弦和 n-2 个三角形。 给定一凸边形 P={v0, v1, …, vn-1}以及定义在由凸边形的边和弦组成的三角 形上的权值函数 w。请设计算法:确定该凸边形的一个三角剖分,使得该三角 剖分中所有三角形上权值之和为最小,并给出三条边权值之和最小的三角形。 (本题满分 1二叉树,请给出按后序周游该树的结点序列,并画出该二叉树 的中序穿线二叉树存储表示。 (本小题满分 7 分)
1/4
(5) 以下算法实现从二叉排序树中删除结点,并重新连接它的左右子树。请在 4 个空缺处填上适当的内容,使该算法完整。请把答案写在答卷纸上,注 明空缺处的编号和其对应的内容。另外,下面的图 3 为一二叉排序树,请 画出删除结点 P 之后的情况。 Status Delete(BiTree &p) { if (!p -> rchild) { q = p; p = p-> lchild; } else if(!p -> lchild) { q = p; p = p-> rchild; } else{ q = p; s = p -> lchild; while (s -> rchild) { p -> data = s-> data; if (q != p) ③ else ④ delete s; } return TRUE; // Delete
2012-2013年中国科学院大学考研试题 计算机原理

中国科学院研究生院2012年招收攻读硕士学位研究生入学统一考试试题科目名称:计算机原理考生须知:1.本试卷满分为150分,全部考试时间总计180分钟。
2.所有答案必须写在答题纸上,写在试题纸上或草稿纸上一律无效。
一、填空题(每空2分,共36分)1.计算机系统是一个由________和_________组成的复杂的自动化设备。
2.按总线的逻辑结构来说,总线可分为_____________和____________。
3.所谓定点格式,即_____________________________。
原理上讲,小数点位置固定在哪一位都可以,但是通常将数据表示成_________或__________。
4.__________系统不仅是硬件设计的依据,而且是软件设计的基础,是衡量计算机性能的一个重要因素。
5.规格化的浮点数是指________________________,使用IEEE754表示0.15625时,编码为________________,编码为(41360000)16的浮点数其十进制数值为__________。
6.若按层次顺序给二叉树各结点从0开始编号,则含n个结点的完全二叉树中叶结点的最小编号是_________。
7.后缀表达式3 2 * 4 – 5 6 3 / * + 的值为_______,表达式c*(b+2)+(2-a)/3对应的后缀表达式为__________________。
8.n个顶点的连通图至少有_________条边。
9.用链式存储结构实现二叉树,每个结点除数据域外还包含指向左右子结点的链接指针,在这种存储结构下,n个结点的二叉树共有______个指针域,其中_______个指针域存放了地址,而_______个指针域存放的是空指针。
二、判断下列说法的正误,并纠正其中错误的说法(每小题3分,共18分)1.在有向图中,所有结点的出度之和等于入度之和。
2.从一个小根堆中查找具有给定键值的元素,在最坏情况下需要lg n次比较操作。
2017-2018年中国科学院自动化研究所考博试题 模式识别

(u)
1, 0,
| u | 1/ 2 otherwise
。现有
n
个样本
xi,
i=1,…,n,
采用宽度为 hn 的窗函数,请写出概率密度函数 p(x)的 Parzen 窗估计 pn(x);(6 分) (2) 给定一维空间中的三个样本点{1,0,2},请写出概率密度函数 p(x)的最近邻(1-NN)
7. (12 分) 设有 n 个 d 维空间的训练样本,这些样本一共来自于 c 个类别。假定要设计一 个多层前向神经网络,将该网络训练之后可用于对新样本进行分类。请描述你所设计的 网络结构,给出训练该网络的主要计算步骤;从网络结构和网络训练的角度指出哪些因 素会对分类性能造成影响。
8. (10 分) 请从监督学习(学习过程中利用样本的类别标签)和无监督学习(学习过程 中不利用样本的类别标签)的角度,对如下方法进行归类:Parzen 窗概率密度估计方法、 K-近邻分类器、感知器准则方法、主成分分析方法、决策树方法、支持向量机方法、C 均值聚类方法、ISODATA 方法、罗杰斯特回归方法、分级聚类方法、核主成分分析方 法、LLE 方法、Adaboost 方法、自组织映射方法、Isomap 方法、Fisher 判别分析方法、 谱聚类方法、Recurrent Neural Network 方法、受限玻尔滋曼机方法、卷积神经网络方法。
科目名称:模式识别
第2页 共2页
中国科学院自动化研究所
2018 年招收攻读博士学位研究生入学统一考试试卷 科目名称:模式识别
考生须知:
1. 本试卷满分为 100 分,全部考试时间总计 180 分钟。 2. 所有答案必须写在答题纸上,写在试题纸上或草稿纸上一律无效。
北京中国科学院大学2013年考研计算机软件基础真题

(北京)中国科学院大学2013年考研计算机软件基础真题中国科学院大学2013 年招收攻读硕士学位研究生入学统一考试试题科目名称:计算机软件基础考生须知:1.本试卷满分为 150 分,全部考试时间总计 180 分钟。
2.所有答案必须写在答题纸上,写在试题纸上或草稿纸上一律无效。
第一部分:数据结构(共 70 分)一、单选题(每题 2 分,共 20 分)1. 下列关于数据的逻辑结构的叙述中,不正确的是【】。
(A) 数据的逻辑结构是数据间关系的描述(B) 线性表是典型的线性结构(C) 数据的逻辑结构分为线性结构和非线性结构(D) 数据的逻辑结构不仅反映数据间的逻辑关系,而且包含其在计算机中的存储方式2. 下列关于数据运算的叙述中,不正确的是【】。
(A) 数据运算是数据结构的一个重要方面(B) 数据运算的具体实现是在数据的逻辑结构上进行(C) 检索是一种常用的运算(D) 插入是一种常用的运算3. 在包含1000个元素的线性表中实现如下各运算,所需执行时间最长的是【】。
(A) 线性表按顺序方式存储,删除线性表的第 900 个结点(B) 线性表按链式方式存储,删除指针 P 所指向的结点(C) 线性表按顺序方式存储,在线性表的第 100 个结点后面插入一个新结点(D) 线性表按链式方式存储,在线性表的第 100 个结点后面插入一个新结点4. 设某散列表的当前状态如下:0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18该散列表的负载因子约为【】。
(A) 0.37 (B) 0.42 (C) 0.58 (D) 0.735. 设有关键码序列(Q,G,M,Z,A,N,B,P,X,H,Y,S,T,L,K,E),采用堆排序法进行排序,经过初试建堆后关键码值 A 在序列中的序号是【】。
(A) 1 (B) 4 (C) 8 (D) 126. 栈和队列的共同特点是【】。
(A) 只允许在端点处插入和删除元素 (B) 都是先进后出(C) 都是先进先出 (D) 没有共同点7. 用链接方式存储的队列,在进行插入运算时【】。
算法设计与分析复习题目及答案

分治法1、二分搜索算法是利用(?分治策略)实现的算法。
9. 实现循环赛日程表利用的算法是(分治策略)27、Strassen矩阵乘法是利用(分治策略?)实现的算法。
34.实现合并排序利用的算法是(分治策略)。
实现大整数的乘法是利用的算法(?分治策略)。
17.实现棋盘覆盖算法利用的算法是(分治法)。
29、使用分治法求解不需要满足的条件是(子问题必须是一样的)。
不可以使用分治法求解的是(0/1背包问题)。
动态规划下列不是动态规划算法基本步骤的是(构造最优解)下列是动态规划算法基本要素的是(子问题重叠性质)。
下列算法中通常以自底向上的方式求解最优解的是(动态规划法?)备忘录方法是那种算法的变形。
(动态规划法)最长公共子序列算法利用的算法是(?动态规划法)。
矩阵连乘问题的算法可由(动态规划算法B)设计实现。
实现最大子段和利用的算法是(??动态规划法?? )。
贪心算法能解决的问题:单源最短路径问题,最小花费生成树问题,背包问题,活动安排问题,不能解决的问题:N皇后问题,0/1背包问题是贪心算法的基本要素的是(贪心选择性质和最优子结构性质)。
回溯法回溯法解旅行售货员问题时的解空间树是(排列树)。
剪枝函数是回溯法中为避免无效搜索采取的策略回溯法的效率不依赖于下列哪些因素(确定解空间的时间)分支限界法最大效益优先是(?分支界限法)的一搜索方式。
分支限界法解最大团问题时,活结点表的组织形式是(?最大堆)。
分支限界法解旅行售货员问题时,活结点表的组织形式是(最小堆)优先队列式分支限界法选取扩展结点的原则是(结点的优先级)在对问题的解空间树进行搜索的方法中,一个活结点最多有一次机会成为活结点的是( 分支限界法).从活结点表中选择下一个扩展结点的不同方式将导致不同的分支限界法,以下除( 栈式分支限界法)之外都是最常见的方式.(1)队列式(FIFO)分支限界法:按照队列先进先出(FIFO)原则选取下一个节点为扩展节点。
(2)优先队列式分支限界法:按照优先队列中规定的优先级选取优先级最高的节点成为当前扩展节点。
2013年中国科学院自动化研究所考博真题 数学

1 1 1 汽车赶来迟到的可能性分别为 、 、 。若此人已迟到,请判断他最有可能是 4 3 12
怎么来的。
6. (10 分) 设两个相互独立的随机变量 X 和 Y 均服从正态分布 N (1,0.5) ,若随机
变量 Z X aY 2 满足条件 Var (Z ) EZ 2 ,求 a 的值。 7. (10 分) 设 ( X , Y ) 联合分布密度为
中国科学院自动化研究所 2013 年招收攻读博士学位研究生入学统一考试试卷 科目名称:数 学
考生须知:
1. 本试卷满分为 100 分,全部考试时间总计 180 分钟。 2. 所有答案必须写在答题纸上,写在试题纸上或草稿纸上一律无效。
1. 已知
0 2 A 1 1 1 1 e 2t 0 2t 1 , b t ( ) e 0 3 x , ( 0) 1 1 0
其中, i 1 。
2 i 0 2
i
1 0 2 2 2 i 2 1 1 3 i 2 1 0 i 2
2
5. (10 分) 设某人从外地赶来参加紧急会议,他乘火车、轮船、汽车或者飞机
来的概率分别为
3 1 1 2 、 、 及 。他若乘飞机来,不会迟到;而乘火车、轮船、 10 5 10 5
科目名称:数 学
第2页
共2页
试求未知参数 , 的极大似然估计。 9. (10 分) 某种元件的寿命(以小时计)服从正态分布 N ( , 2 ) , , 2 均未知, 现测得 16 只元件的寿命的均值为 X =241.5, 样本方差 s 2 =98.7259, 问是否有理 由认为元件的平均寿命大于 225(小时) 。 ( 0.05, t0.05 (15) 1.7531 )
算法设计与分析王晓东

习题2-1 求下列函数的渐进表达式:3n^2+10n; n^2/10+2n; 21+1/n; logn^3; 10 log3^n 。
解答:3n^2+10n=O(n^2),n^2/10+2^n=O(2^n),21+1/n=O(1),logn^3=O(logn),10log3^n=O(n).习题2-3 照渐进阶从低到高的顺序排列以下表达式:n!,4n^2,logn,3^n,20n,2,n^2/3。
解答:照渐进阶从高到低的顺序为:n!、3^n、4n^2 、20n、n^2/3、logn、2习题2-4(1)假设某算法在输入规模为n时的计算时间为T(n)=3*2^n。
在某台计算机上实现并完成该算法的时间为t秒。
现有另外一台计算机,其运行速度为第一台计算机的64倍,那么在这台新机器上用同一算法在t秒内能解输入规模为多大的问题?(2)若上述算法的计算时间改进为T(n)=n^2,其余条件不变,则在新机器上用t秒时间能解输入规模多大的问题?(3)若上述算法的计算时间进一步改进为,其余条件不变,那么在新机器上用t秒时间能解输入规模多大的问题?解答:(1)设能解输入规模为n1的问题,则t=3*2^n=3*2^n/64,解得n1=n+6(2)n1^2=64n^2得到n1=8n(3)由于T(n)=常数,因此算法可解任意规模的问题。
习题2-5 XYZ公司宣称他们最新研制的微处理器运行速度为其竞争对手ABC公司同类产品的100倍。
对于计算复杂性分别为n,n^2,n^3和n!的各算法,若用ABC公司的计算机能在1小时内能解输入规模为n的问题,那么用XYZ公司的计算机在1小时内分别能解输入规模为多大的问题?解答:n'=100nn'^2=100n^2得到n'=10nn'^3=100n^3得到n'=4.64nn'!=100n!得到n'<n+log100=n+6.64习题2-6对于下列各组函数f(n)和g(n),确定f(n)=O(g(n))或f(n)=Ω(g(n))或f(n)=θ(g(n)),并简述理由。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2/2
中国科学院自动化研究所 2013 年招收攻读博士学位研究生入学考试题
考试科目: 算法设计与分析
(共 2 页,6 个大题,满分 100 分,时间为 3 个小时) 说明:设计算法可以用类程序语言描述。 1. 完成下列各题 (本题包括 6 个小题,满分 30 分) : (1) 简述下面程序段的功能: Status algo1(Stack S, int e) { Stack T; int d; InitStack(T); while (! StackEmpty(S)) { pop (S, d); if (d != e) push(T, d); } while (! StackEmpty(T)) { pop (T, d); push (S, d); } } (2) 简述下列函数的功能: void algo2(SString &Sub, SString S, int pos, int len) { if (pos < 1 || pos > S[0] || len < 0 || len > S[0] – pos +1) return ERROR; Sub[1 .. len] = S[pos .. pos + len - 1]; Sub[0] = len; return OK; }
B
A
C: 问结点 A 和 E 的度分别为多少?该树的度为多少? 请画出 3 个结点的树的所有形态。
E
图1
1/2
(4) 有如图 2 所示的图 G,请给出 G 的强连通分量。
1 6 2 3
5
4
图2 (5) 假设有二维数组 A6×8,每个元素用相邻的 6 个字节存储,存储器按字节 编址。已知 A 的起始存储位置(基地址)为 1000,请计算: (a) 数组 A 的存储容量; (b) 数组 A 的最后一个元素 a57 的第一个字节的地址; (c) 按列存储时,元素 a47 的第一个字节的地址。 (6) 有如下关键字序列:(45, 24, 53, 12, 37, 93)。请画出其二叉排序树。假设 6 个记录的查找概率相等,均为 1/6,分析该二叉排序树的平均查找长度。 2. 设一顺序表 va 中的元素非递减有序。请设计一个算法将 x 插入到顺序表的适 当位置上,以保持该表的有序性。 (本题满分 10 分) 3. 算术四则运算的基本规则是:先乘除,后加减;从左到右;先括号内,后括 号外。请设计一个算法,接受键盘输入的任意一个四则运算表达式,给出其 运算结果。 (本题满分 15 分) 4. 请编写算法实现串的替换操作 Replace(&S, T, V),即用串 V 置换串 S 中所有 与 T 相同的子串后,构成一个新串。 (本题满分 15 分) 5. 请写出折半查找算法,然后将其改写成递归算法。 (本题满分 15 分) 6. 给定一个无向图 G (V , E) ,如果 U V ,且对任意的 u, v U 有 (u, v) E , 则称 U 是 G 的一个完全子图。G 的完全子图 U 是 G 的一个团,当且仅当 U 不包含在 G 的更大的完全子图中。 G 的最大团是指 G 中所含顶点数最多的团。 请设计一个算法求解最大团问题。 (本题满分 15 分)