中山大学数据科学与计算机学院移动信息工程专业-人工智能

中山大学数据科学与计算机学院

移动信息工程专业-人工智能

本科生实验报告

（2017-2018学年秋季学期）

教学班级15M2专业（方向）互联网

学号15352218姓名林燕娜

一、实验题目

利用BP神经网络实现回归

二、实验内容

1.算法原理

BP神经网络：

在之前，我们学到的几种算法里面，很多种都是线性不可分的。可比说PLA，而BP神经网络，通过隐藏层的设计，使得达到多元可分的情况。

神经网络分为两个过程，一个是正向传递过程，一个是反向传递过程。

正向传递过程：经过一定的计算，可以得到最后的预测结果。

反向传递过程：根据预测到的最终结果与实际结果的误差，反作用于输入层的系数W1和隐藏层的系数W2，进行一定的更新。

对于返向传递过程：

在本次实验中，利用的是matlab工具，鉴于之前ta课上说的利用for循环和直接用矩阵运算的时间成本差距非常大。所以自行进行了公式的推导，将最后的矩阵运算更新W公式算了出来。

假设：

->原来训练集的标签的train_label（矩阵大小是K*1)

->输入层的数据为train(矩阵大小K*M，其中K是样本数量，M是特征属性个数)

->隐藏层的节点高数为N

->输入层到隐藏层的系数矩阵W1（矩阵大小为M*N）

->隐藏层的输入是1*_W train input hidden =（矩阵大小是K*N）->隐藏层的输出是)11./(11___input hidden input

hidden e e output hidden --+=+=

（矩阵大小

是K*N）。

->隐藏层到输出层的系数矩阵为W2（矩阵大小是N*1）

->预测出来的是2*___W output hidden label predict y =(矩阵大小是K*1）则，误差为：2).^__(2

label train predict y E -=

；则对于隐藏层的系数W2求偏导：

)__(*)'_(2

__2label train predict y output hidden W predict

y predict y E W E -=????=??这样子的话，求出来的倒数是所有样本加起来的倒数，则W2的更新公式就是：

K label train predict y output hidden W W E

W W /)__(*)'_(*22

22--=??-=ηη

而对于输入层的系数W1，求偏导：

train

output hidden output hidden W label train predict y W input

hidden input hidden output hidden output hidden predict y predict y E W E *)_1(*_*2*)__(1

______1--=????????=

??而考虑到矩阵运算存在着维度上的问题，其导数在矩阵运算中应该为：

)]}_1(*._[*).'2(*)__{(*)'(1

output hidden output hidden W label train predict y train W E

--=??同样，算出来的导数是基于所有样本的导数和，则W1的更新公式为：

K W E

W W /1

11??-=η

。因为W1公式比较复杂，可以一步步的思考，每一步代表什么意义。

)]_1(*._[output hidden output hidden -是一个K*N 的矩阵，其ij 元素代表的是：第

i 个样本的第j 个隐藏层节点的输出值和1-输出值相乘。

)'2(*)__(W label train predict y -是一个K*N 的矩阵，其ij 元素代表的是：第i 个

样本的第j 个隐藏层节点对样本i 的预测误差造成的影响，W2对应的j 元素就是其权重。

)]}_1(*._[*).'2(*)__{(output hidden output hidden W label train predict y --是

一个K*N的矩阵，其ij元素代表的是：第i个样本的第j个隐藏层节点输入的对最终误差的影响。

则最后与train的相乘，是一个M*N的矩阵，其ij元素代表的是：所有样本的对Wij 的导数的一个求和。

2.伪代码/流程图

3.关键代码（带注释）

动态更新W：

->迭代loop次

->前向传输：

->根据当前的W1，算出每个隐藏节点的输入，然后再利用激活函数，算出每个隐藏层节点的输出。

->根据W2算出最终的结果。

->后向传输：

->根据算出的最终结果，对W2和W1求导，然后用梯度下降法的公式更新W1和W2。

4.创新点&优化（如果有）

数据预处理：

在本次实验中，可以看到原始数据是比较杂乱的，很多并没有实际的参考价值。所以进行了数据的预处理。

将instant 的id、年份year、日期、weekday 等无用或者重复信息忽视掉。对season、weather、hr 等属性进行一个onehot 处理。具体：

对于season，一共有四个季度，用三个属性就可以代表着四个季度；

对于weather，用一个属性来代表，1、2代表天气好，3、4代表天气不好；对于hr，分为上班时间和下班时间；最终整体属性的数据都在0—1之间。

自己推导E 对W 的公式，以一个矩阵运算代替for 完成更新：

鉴于之前ta 课上说的matlab 利用for 循环和直接用矩阵运算的时间成本差距非常大。所以并没有选择一个个样本进行运算，而是一次性计算所有的样本，利用矩阵运算达到佳和的效果。

具体原理见实验原理。

将sigmoid 函数换成tanh 函数：

简单的在计算隐藏层的输出的是有，将公式换成对应的tanh 的公式，在最后反向传播的时候，将)

_1(*___output hidden output hidden input

hidden output

hidden -=??换成：

)_tanh(1__output hidden input

hidden output

hidden -=??就可以了。

三、实验结果及分析

1.实验结果展示示例（可图可表可文字，尽量可视化）

数据集的分法：

利用随机数给每个样本生成一个0-1之间的数字，根据随机数排序，取出最后的20%作为验证集，前面的80%作为训练集。

结果展示：

用sigmoid函数，迭代1000次的结果:

（左图的蓝色线为训练集的loss曲线，红色为验证集合的loss曲线）

（右图的蓝色线为预测结果，红色为原来的真实结果。）

用tanh激活函数，迭代1000次结果：

小数据集验证

循环次数1，三个输入节点，2个隐藏节点，1个输入节点，激活函数为sigmoid，学习率等于1。

训练集和测试集如下：

x1x2x3lable

00.70.310

0.80.20.1?

取输入层的系数为：??????????=3231011W ,隐藏层系数为：????

??????=2402W 则，输入层的输入：[][]

38.13231013.07.05.01*_=????

?????==W train input hidden 输入层的输出：[]

9526.0858.0)1/(.0.1__=+=-input

hidden e

output hidden 增加一个偏置，则[]

9526.0858.011_=output hidden 则最后预测为：y_predict =5.3377.

W1的更新：

[][][]????

?????=??????????-??????????=??

???

?????=--???

??????=?? 3.12632.6817 3.29482.5907 0.21052.13620.1263-0.6817-0.2948-1.5907-0.2105-1.1362-*132310110.1263-0.6817-0.2948-1.5907-0.2105-1.1362-)))9526.0858.01(*.9526.0858.0(*.24*)105.3377((*0.30.70.51

W W E 同理。可得到，W2：

????

??????=??????????-??????????= 6.44284.662810)-5.3372(*0.95260.8581*12402W 则根据W1，W2，可以判断测试集为：16.94.程序跑出的结果：

验证完毕，结果正确。

2.评测指标展示即分析（如果实验题目有特殊要求，否则使用准确率）

Loss 函数：

蓝色线为训练集的loss 曲线，红色为验证集合的loss 曲线。从图中可以看出，随着迭代次数的增加，loss 会逐渐下降。这是因为随着迭代次数的增加，输入层的系数和输出层的系数不断的更新，划分的曲线（BP 神经网络就是一堆线去将一个空间进行划分）也越来越拟合我们的数据，所以loss 整体呈现一个下降的趋势。

四、思考题

尝试说明下其他激活函数的优缺点。

ReLU 函数：

该激活函数的公式是：),0max()(x x f =.而其导数的计算公式为：

?<>=0

1)('x x x f

优点：

1）正向传播时，计算简单、速度快；

2）梯度不饱和，在反向传播过程中，就不会出现梯度大于1或者小于1的累乘，导致梯度消失或者梯度爆炸。

3）收敛速度相对于sigmoid、tanh函数更快。

缺点：

当步长过大、输入为负数的时候，导数会变成0，这回引起该节点之后都不会更新。这样子，也就是RELU的噪声鲁棒性非常差。稍微有一个噪声，就可能导致一些点坏死。

有什么方法可以实现传递过程中不激活所有节点？

1）可以经过一些数据的预处理，筛选掉一些属性、特征，就可以不用激活这些节点。

2）给每个节点设置一个阈值，如果值没有达到阈值，就设置该节点的value=0，就能达到不激活这个节点的目的。

梯度消失和梯度爆炸是什么？可以怎么解决？

梯度消失（gradient vanishing）:

在本次实验过程中，我们用到的是sigmoid、tanh函数作为激活函数。两个函数都能将负无穷到正无穷映射到0/-1到1之间的函数，并且其导数分别是：f′(x)=f(x)(1?f(x))和1-tanh(x)^2，都是小于1的数字。在反向传播的过程中会对函数链式求偏导然后相乘。如果隐藏层次过多，乘的次数过多，出现了0的情况，导致比较前面的隐藏层无法更新。这就是梯度消失。

解决方法：

因为这是因为sigmoid、tanh函数的特性导致的，所以解决方法就是换一种激活函数，可比说ReLU激活函数的函数范围0到正无穷，并且，其梯度要么0要么1，不会随着x的增大或减小消失。

梯度爆炸(gradient explosion):

同样的，如果是激活函数大于1，然后层次过多，多次相乘累积可能就太大，使得最后的梯度爆炸了。

解决方法：

1）设置梯度剪切阈值，一旦梯度超过那个值，就限制其大小，就设置为阈值。

2）也可以和梯度消失一样，换一个ReLU激活函数。

探索大数据和人工智能最全试题

探索大数据和人工智能最全试题 1、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。 A首席数据官 B.首席科学家 C.首席执行官 D.首席架构师 2、整个MapReduce的过程大致分为Map、Shuffle、Combine、()? A. Reduce B.Hash C. Clean D. Loading 3、在Spak的软件栈中,用于交互式查询的是 A. SparkSQL B.Mllib C.GraphX D. Spark Streaming 4、在数据量一定的情况下, MapReduce是一个线性可扩展模型,请问服务器数量与处( )理时间是什么关系?

A数量越多处理时间越长 B.数量越多处理时间越短 C.数量越小处理时间越短 D.没什么关系 5、下列选项中,不是kafka适合的应用场景是? A.日志收集 B.消息系统 C.业务系统 D.流式处理 6、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是 A.结构化数据 B.非结构化数据 C.半结构化数据 D.全结构化数据 7、下列选项中,不是人工智能的算法中的学习方法的是? A.重复学习 B.深度学习 C.迁移学习

D.对抗学习 8、自然语言处理难点目前有四大类,下列选项中不是其中之一的是 A.机器性能 B.语言歧义性 C.知识依赖 D.语境 9、传統的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。请问标签为离散的类型,称为分类,标签为连续的类型,称为什么? A.给定标签 B.离散 C.分类 D.回归 10、中国移动自主研发、发布的首个人工智能平台叫做() A.九天 B. OneNET C.移娃 D.大云

大数据和人工智能在国内就业前景分析

伴随着大数据时代的到来，人工智能技术的火热，很多人开始了对大数据、人工智能技术的研究。 2018 年1 月教育部印发的《普通gao中课程方案和语文等学科课程标准》新加入了数据结构、人工智能、开源硬件设计等AI 相关的课程。这意味着职场新人和准备找工作的同学们，为了在今后十年内不被淘汰，你们要补课了，从初中开始。但时光一去不复返，对于已经升入大学，但还没有接触到大数据、人工智能技术的小伙伴又该怎么办呢？面对诱人的就业前景，正在向你招手的大好机遇，怎么能不心动？怎么能不想踏入这两大行业？据数据统计分析，大数据人工智能尖端人才远远不能满足需求。行业风口的人工智能，在中国人才缺口将超过500 万人，而中国人工智能人才数量目前只有5 万（数据来自工信部教育考试中心）。并且目前岗位溢价相当严重，2017 年人工智能在互联网岗位薪酬中位列第三，月薪20.1k，如果按照普遍的16 月薪酬计算，那么人工智能在2017 年一年的薪酬就是2.01*16=32.16 万。那么再来看一组2018 的薪酬数据：

所以如果你对自己的专业/工作不满意，现在正是进入人工智能ling域学习就业/转业的绝佳时机。在面对众多的数学知识和编程知识里，自学会让大家耗费大量的时间金钱。因此，课工场成都基地大数据培训教育学院2018 重磅推出大数据人工智能课程，采用“T”字形的思维，以大数据的深度为主，以机器学习、云计算等作为宽度，相辅相成。成就无数大学生进入大数据人工智能ling域的梦想。此外课工场成都基地大数据课程定期组织与一线名企的工程师进行面对面的就企业当下的项目讨论与研发，进而验证所学技术的正确方向。从宏观上讲述了大数据的特点，商业应用，发展和职业前景。然后对主流数据技术和生态圈进行了介绍，了解其他和大数据技术之间关系，然后对不同类型的大数据的分析和处理系统，解决方案和行业案例进行剖析和讲解。以北京的中关村、西二旗等IT 公司密集的公司为技术背景，数据来源于一线互联网公司的源数据，有一定的商业价值，并严格把控实际项目的前瞻性，如：Spark 的版本迭代，机器学习中的算法革新。学员实战项目贯穿整个教学环节，潜移默化的培养学生放眼全局，排查技术难点，既能独立思考，又能组织团队开发。希望能帮到大家。

中山大学管理学试卷B及答案大家看看吧

2007-2008学年期末考试题专业班级：课程名称：管理学概论试卷类型：B卷一、单项选择题（本大题共20分，每小题2分） 1.人员配备的工作包括 A.制定工作规范，选配、培训组织成员 B.确定人员需用量、选配、培训组织成员 C.确定人员结构、选配、培训组织成员 D.确定人员需用量、选配、考核、晋升组织成员 2.所谓授权，是指 A.在组织设计时，规定下属管理岗位必要的职责与权限 B.在组织调整时，规定下属管理岗位必要的职责与权限 C.领导者将部分处理问题的权委派给某些下属 D.委托代理关系 3.按控制的时机分类，可把控制方法分为 A.预先控制、持续控制、现场控制 B.预先控制、持续控制、结果控制 C.预先控制、现场控制、结果控制 D.持续控制、现场控制、结果控制 4.霍桑试验表明 A.非正式组织对组织目标的达成是有害的 B.非正式组织对组织目标的达成是有益的

C.企业应采取一切措施来取缔非正式组织 D.企业应该正视非正式组织的存在 5.（）面对未能可能呈现的多种状态，决策者虽无法事先确定究竟呈现何种状态，但可判断各种状态出现的概率。 A.确定型决策法 B.风险型决策法 C.非确定型决策法 D.追踪决策法 6.菲德勒权变理论认为，如果一个工作只能用一种方式来完成，这件工作就叫做 A.单一任务结构 B.标准任务结构 C.高任务结构 D.低任务结构 7.中层管理者比低层管理者更多地依靠 A.正式权力与沟通技巧 B.个人权力与技术技能 C.人际关系技能与技术技能 D.沟通技能与人际关系技能 8.初级群体对成员行为的影响力比非初级群体的影响力 A.大 B.小

C.视具体条件而定 D.无法确定 9.管理者进行业绩评价的方法，除了绝对标准和相对标准外，还有 A.手段标准 B.进度标准 C.目标 D.以上都是 10.（）是管理发展的一种新趋势 A.从强调直觉到重视理性 B.从小公司到集团化(从分散到集中) C.从软管理到硬管理 D.从外延式管理到内涵式管理二、多项选择题（本大题共15分，每小题3分） 1.美国学者波特认为，除了现有厂商和潜在竞争者外，还有一些因素影响到竞争结构，比如 A.替代品生产者 B.零售网络 C.用户 D.供应商 E.政府政策 2.网络图的构成要素包括 A.工序

人工智能就是数据分析吗

人工智能就是数据分析吗关于人工智能究竟是什么，以及人工智能的学科应该如何分类，似乎存在一些混淆。人工智能是分析学的一种形式，还是一门与分析学不同的全新学科?我坚信人工智能与预测分析和数据科学的关系比任何其他学科都更为密切甚至有人可能会认为人工智能是下一代的预测分析。此外，人工智能经常被用于需要将分析过程付诸实施的情况。因此，在这个意义上，人工智能也常常推动规定性、可操作性分析的发展。如果说人工智能不是一种分析方式，那将是一个错误。人工智能与预测分析的关系让我们回顾一些帮助定义预测分析的基本事实，然后看看人工智能如何很好地适应这些界限。在它的核心，预测分析当然是预测某种东西的。谁会买?某些设备会坏吗?哪种价格能使利润较大化?这些问题中的每一个都可以通过以下熟悉的工作流来解决：首先，我们确定一个希望预测和收集关于该度量或状态的历史信息的度量或状态。例如，确定数百万名顾客中哪些人对过去的营销活动作出了反应。接下来，我们收集可能与预测我们的目标相关的更多数据。例如，每个客户的过去的支出，人口概况，等等。然后，我们通过一个或多个算法传递数据，这些算法试图在目标和附加数据之间找到关系。通过该过程，创建一个模型，如果向其输入新数据，就会产生预测。如果顾客有这份资料，她将有何反应?如果我们在这一点上定价，我们将会有多大的利润? 人工智能过程中遵循的目标和步骤是相同的。让我们看两个例子。以图像识别为例。首先，我们识别了一堆猫的照片。然后，我们拿了一堆非猫的照片。我们通过对图像的深度学习算法来学习准确地预测图像是否是一只猫。当得到一个新的图像

时，模型将以图像是猫的概率来回答。听起来很像预测分析，不是吗? 现在让我们考虑自然语言处理(NLP)。我们收集了各种各样的陈述，这些陈述都包含了我们关心的特定含义。我们还收集了广泛的其他发言。我们对数据运行NLP过程，试图找出如何分辨什么是重要的，以及如何分辨被询问的内容。当我们向过程中输入新的文本行时，它将以概率的方式确定语句的意义是什么。NLP过程将为各种可能的解释分配概率，并将其发回(想想沃森扮演的危险)。这听起来也很像预测。人工智能与嵌入式工业化分析的关系正如我在“分析革命”中所写的，当今的一个主要趋势是将预测分析嵌入到业务流程中，以便在业务决策时以自动化、嵌入式、规定性的方式使用模型。例如，当一个人浏览一个网页时，模型被用来预测下一页上应该出现什么提议。一旦这一进程到位，就不存在人为干预。这一过程提供报价，直到被告知停止为止。今天许多人工智能的应用也需要工业化。例如，当一张图片被发布在社交媒体上时，我们会立即对其进行分析，以确定该图像中的是谁。当我向Siri或Alexa发表声明时，它试图确定我说了什么，什么是较好的答案。虽然这可以说是预测分析的一个更高级的应用程序，进入了嵌入式的、规定性的、自动化的过程，它仍然非常符合预测分析的使用方式。如何在你的组织中核算人工智能看看你的分析和数据科学组织为你驱动人工智能。这就是已经熟悉争论数据的团队做出预测，将这些预测推到业务流程中，并跟踪结果。人工智能所需的思维方式和基本技能集与分析和数据科学团队中的人非常一致。甚至没有其他团队接近。把责任交给最有能力的人。鉴于人工智能的重要性不断上升，它必须包括在您的分析战略，以使该战略是可信和完整的。请注意，这并不意味着您的策略必须包括短期内部署人工智能。在追求人工智能之前，你可能还有其他事情要做。然而，即使人工智能还不是一个优先事项，这一事实至少应该在

计算机与数学的关系

数学与计算机的联系曹干（安徽大学数学科学学院）摘要：数学与计算机在生活及学术等各个领域联系较多，在此文中，我谨以数学与计算机的逻辑关系和在学科上的应用联系作为分析线路，具体解析计算机与数学的联系。关键字：逻辑关系、学科联系一、数学与计算机的逻辑关系想要学好计算机却是跟数学分不开的，数学与计算机是紧密相连的。没有数学功底，是很难在计算机这个行业里有所作为的。单纯依靠计算机做一些简单的应用开发，比如图片处理、小系统的开发，这还不是很大的问题，但是要完成更深层的开发，比如：系统集成、动画制作如3D游戏等，还是不行的，这要用到更复杂的数学知识，没有数学理论作为基础是很难完成这些工作的。数学知识也需要经过长期的积累，形成一定的理论后才能在这方面有所作为的。比较有名的谷歌搜索，这些搜索无不用到高深的复杂的算法，而这些都是以数学为基础的。所以说数学是计算机的基础，数学家未尽是计算机专家，而计算机专家却一定是数学家。这两者之间的关系也让我有时忙得手忙脚乱，但知道它们的关系后，却又让我以此来助彼，两者互相结合起来，使我的专业更见长了。对于数学的教学，还是有点感受的，下面收集起来说一下，以此共勉。数学不是一门简单的学科，它是一门基础学科，任何一门学科都用到它，所以不能对它轻视。从教学中看出学生的基础是好还是差的，中学数学的要求不是很高而且深度也不是怎样，所以要求学生能学好数学，只将基础打好，打扎实了，才能发展数学，也才能学好数学。所以教学中，我常教学生要养成勤练勤，习期养成习惯，这样才能打好基础，而且要他们务必要虚心、认真，这样才能走得更远。这也是从计算机与数学的关系得出的一点体会吧。二、数学与计算机的学科交融计算机科学和数学的关系有点奇怪。二三十年以前，计算机科学基本上还是数学的一个分支。而现在，计算机科学拥有广泛的研究领域和众多的研究人员，在很多方面反过来推动数学发展，从某种意义上可以说是孩子长得比妈妈还高了。但不管怎么样，这个孩子身上始终流着母亲的血液。这血液是the mathematical underpinning of computer science(计算机科学的数学基础)-- 也就是理论计算机科学。现代计算机科学和数学的另一个交叉是计算数学/数值分析/科学计算，传统上不包含在理论计算机科学以内。最常和理论计算机科学放在一起的一个词是什么？答：离散数学。这两者的关系是如此密切，以至于它们在不少场合下成为同义词。传统上，数学是以分析为中心的。数学系的同学要学习三四个学期的数学分析，然后是复变，实变，泛函等等。实变和泛函被很多人认为是现代数学的入门。在物理，化学，工程上应用的，也以分析为主。随着计算机科学的出现，一些以前不太受到重视的数学分支突然重要起来。人们发现，这些分支处理的数学对象与传统的分析有明显的区别：分析研究的对象是连续的，因而微分，积分成为基本的运算；而这些分支研究的对象是离散的，因而很少有机会进行此类的计算。人们从而称这些分支为“离散数学”。“离散数学”的名字越来越响亮，最后导致以分析为中心的传统数学分支被相对称为“连续数学”。离散数学经过几十年发展，基本上稳定下来。一般认为，离散数学包含以下学科：1) 集合论，数理逻辑与元数学。这是整个数学的基础，也是计算机科学的基础。2) 图论，算法图论；组合数学，组合算法。计算机科学，尤其是理论计算机科学的核心是算法，而大量的算法建立在图和组合的基础上。 3) 抽象代数，代数是无所不在的，本来在数学中就非常重要。在计算机科学中，人们惊讶地发现代数

XX研究生的计算机工程专业和计算机科学专业有啥区别

XX研究生的计算机工程专业和计算机科学专业有啥区别去美国留学的研究生在选择计算机相关专业时，会遇到计算机工程和计算机科学专业，这两类专业看起来区别不大，但是课程专业内容和研究方向还是有些质的差异，那么这两类专业的不同点在哪里呢?跟着出guo来看看吧!欢迎阅读。 1. CS是研究机器自动计算本身的性质、规律和问题的一门科学。更注重理论研究(自动计算的性质、规律、运算等)。世界上第一个计算机科学系是由美国的普渡大学在1962年设立，第一个计算机学院于1980年在美国的东北大学设立。计算机科学领域的最高荣誉是ACM设立的图灵奖，被誉为是计算机科学的诺贝尔奖。 2. CE是研究计算机系统及其应用技术的一门科学。涉及电气工程和计算机科学领域，从设计的计算机处理器，个人电脑、服务器和超级计算机到使用计算机这个工具来解决一些应用上的问题，如程控机床、车辆监控、工业和家电监控系统等，更注重系统应用(计算机系统及其应用)。 1. CS有些偏软，侧重以计算机技术为基础解决问题，编程一般是重中之重，三门数学(高等数学、线性代数、离散数学)是基础之重; CS研究的课题大致是：计算机程序能做什么和不能做什么(可计算性); 如何使程序更高效的执行特定任务(算法和复杂性理论); 程序如何存取不同类型的数据(数据结构和数据库);

程序如何显得更智能(人工智能); 人类如何与程序沟通(人机互动和人机界面)。 2. CE有些偏硬与网络、通讯更紧密些; CE研究的课题大致是：网络——关于分布式计算环境的设计和实施，从局域网到万维网; 多媒体计算——将文本，语音，音乐，静止图像，视频及其他的数据混合成一个连贯的数据流，并对其进行有效的管理、编解码和显示; VLSI系统——研究微小型化电子设备(非常大规模集成电路)的工具菜单，属性和设计方法; 可靠的计算和先进的架构——探究如何将容错内置入硬件和软件，以及并行计算的方法，光计算和测试; 其他方向：显示工程，图像和语音处理，模式识别，机器人，传感器和计算机感知。简单的说：CS主要注重理论研究，CE主要注重系统应用。 1 Massachusetts Institute of Technology 2 Carnegie Mellon University 2 Stanford University 2 University of California—Berkeley 5 University of Illinois—Urbana-Champaign 6 Georgia Institute of Technology

2018年中山大学831运筹学与管理信息系统考研真题

2018年中山大学831运筹学与管理信息系统考研真题以下为2018年中山大学831运筹学与管理信息系统考研真题，每年真题的重复率是很高的，考生准备的真题年份越多，备考就会越全面，鸿儒中大考研网有提供831运筹学与管理信息系统的复习笔记，备考题库，模拟卷等一系列的复习资料，考生结合资料一起复习会更有效率，最后预祝所有报考中大的考生圆梦! Ⅰ运筹学部分（75分）一、考虑以下线性规划问题（共30分）。 MaximizeZ=2x1＋7x2＋4x3 subjectto x1＋2x2＋x3≤10 3x1＋3x2＋2x3≤10 and x1≥0，x2≥0，x3≥0 a）应用图解法找出最大Z值（20分） b）现在可为其中一种资源增加一个可用单位，应该选择增加资源1或还是资源2？（10分）

二、以下非线性规划问题找出最优解（共30分）。 a）Max0≤x≤5Z=2x3-15x2+36x b）Min0≤x≤5Z=2x3-15x2+36x 三、列出线性规划模型，并找出最优解。（15分） S饭店每月的广告预算是100000元，现在饭店希望确定在报纸和电子媒体上各应该投入多少广告费。管理层已经确定，每种媒体的广告费用都至少要占总预算的10%，而且投入在电子媒体上最少是报纸的5倍。市场顾问己经建立起一个用来衡量广告影响力的指数0-100，影响力的指数越低表示媒体影响力越大。如果报纸的影响力指数是50，而电子媒体的影响力指数是20oS饭店应该如何分配预算才能使影响力最大？列出线性规划模型，并找出最优解。 Ⅱ管理信息系统部分（75分）一、选择题（20题，每题1分，共20分） 1.数据库管理系统通过以下__________方式解决数据冗余以及不一致。 A）参照完整性约束；B）将程序与数据分开；

【爱考宝典】2020年武汉工程大学计算机科学与工程学院简介、分数线、专业目录汇总

简介：计算机科学与工程学院成立于1997年，目前承担本科生教学和研究生培养任务。现有教职工96人，是一支朝气蓬勃、团结奋进的教师队伍。本科专业：开设有计算机科学与技术、网络工程、软件工程、物联网工程、数字媒体技术、智能科学与技术等6个本科专业。其中，软件工程专业为教育部“卓越工程师教育培养计划”，智能科学与技术专业为“湖北省普通高等学校战略新兴（支柱）产业人才培训计划项目”。本科生规模1600余人。研究生专业：学院现有计算机科学与技术、控制科学与工程（湖北省重点特色学科）、软件工程三个一级学科硕士点，计算机技术专业硕士点和软件工程专业学位硕士点。研究生规模100余人。专任教师队伍：现有79人。其中，教授10人、副教授35人；具有博士学位教师31人、具有硕士学位教师46人。拥有全国优秀教育工作者、国务院政府特殊津贴获得者、湖北省有突出贡献的中青年专家、湖北省政府特殊津贴获得者、教育部新世纪优秀人才、湖北省新世纪高层次人才工程人选、“楚天学子”特聘教授、武汉工程大学教学名师和师德标兵。计算机学院拥有完善的实验设备和先进的科研仪器，除满足教学和科研需要外，还为学生课外科技活动和学科竞赛提供条件。学院高度重视人才培养工作，为每位学生配备专业的学业导师，培养的学生综合素质高、专业能力强，深受用人单位的好评，就业质量始终保持在较高的水准，签约率每年都超过95%，始终名列学校前列，体现在：一是就业城市好，每年在北上广深一线城市就业的人数稳定在35%以上，其他毕业生也大多集中在省会城市和沿海大城市就业；二是就业单位强，就业单位主要集中在外企、上市企业、科研院所、政府机关和IT企业，其中包括：微软、宝洁、中国移动、中国网通、工商银行、华为、联想、百度、腾讯、金山、浪潮等。三是薪酬待遇高，根据麦克斯进行的毕业生就业情况调查显示，我院毕业生平均薪资水平位居全校第一。学院狠抓考研升学，考研率逐年上升，2016年超过24%，2017年达到27%，一直位居省属高校前列。考取国内外知名高校包括：中国科学院、中国科

探索大数据和人工智能-97分

以下不是大数据特征的是？ A.数据体量大 B.数据种类多 C.价值密度高 D.处理速度快以下不是非结构化数据的项是？ A.图片 B.音频 C.数据库二维表数据 D.视频大数据的多样性使得数据被分为三种数据结构，那么以下不是三种数据结构之一的是？ A.结构化数据 B.非结构化数据 C.半结构化数据 D.全结构化数据电信行业的网络管理和优化包含了两部分的优化，下列选项中不在这两项优化之内的是？ A.基础设施建设的优化 B.网络速度的优化 C.并发性的优化 D.网络运营管理及优化以下哪些属于大数据在电信行业的应用？ A.网络管理和优化 B.数据商业化 C.客户关系管理 D.企业运营管理语音识别产品体系有四部分，下列哪项不是体系之一？ A.语音合成 B.语音播放 C.语音识别 D.语义理解以下哪种学习方法不属于人工智能算法？ A.迁移学习

B.对抗学习 C.强化学习 D.自由学习人工智能通过输入的图片，解析出图片的内容，这种技术叫什么？ A.图片识别 B.语音识别 C.自动驾驶 D.消费金融以下用到语音识别技术的应用包括： A.苹果手机Siri B.微信 C.百度地图 D.word 下列选项属于人工智能的基本概念有： A.机器学习 B.深度学习 C.BP神经网络 D.卷积神经网络 Spark是在哪一年开源的？ A.1980 B.2010 C.1990 D.2000 下列选项中，哪项是分布式文件存储系统？ A.HDFS B.Flume C.Kafka D.Zookeeper MPP是指？ A.大规模并行处理系统 B.受限的分布式计算模型

C.集群计算资源管理框架

中山大学数据科学与计算机学院计算机技术考研复试面试真题及答案总结

中山大学数据科学与计算机学院考研复试面试真题及答案总结 1. 双极三极管和MOS的特性:双极管是电流控制电流器件MOS是电压控制电流 1）普通的由基极、发射极、集电极组成的三极管是双极性三极管 2）场效应管是单极性三极管，它们是由栅极、源极、漏极组成。对于三极管的功率怎么算： 1）对于某种三极管，它有其极限使用数据，其中：最大耗散功率，就是它的极限数据，可以查它的资料可以知道。 2）在电路中，该管在工作时所承受的最大电流和最大电压的乘积就是该管的实际耗散功率，所以在选择三极管时这个值就不能大于管子的最大耗散功率。 2. 数学模型有哪些：按数学方法，几何、微分方程、图论、规划论、马氏链模型 3. FPGA的理解，优缺点： Field-Programmable Gate Array，即现场可编程门阵列，它是作为专用集成电路（ASIC）领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。设计周期短，灵活。适合用于小批量系统，提高系统的可靠性和集成度。 4. 奈奎斯特频率的理解：

离散信号系统采样频率的一半，采样定理指出，只要离散系统的奈奎斯特频率高于采样信号的最高频率或带宽，就可以避免混叠现象。 5. 诺尔曼结构的特点是什么？答：（1）采用存储程序方式（2）存储器是按地址访问的线性编址的一维结构，每个单元的位数是固定的（3）指令由操作码和地址码组成的（4）通过执行指令直接发出控制信号控制计算机的操作（5）机器以运算器为中心，输入输出设备与存储器间的数据传送都通过运算器（6）数据以二进制为表示 6. 堆栈和指令寄存器的区别 7. DPSK如何消除相位模糊：用相邻码元的相位差表示基带信号.DPSK——差分移相键控，利用调制信号前后码元之间载波相对相位的变化来传递信息。 8. AWGN信道：加性高斯白噪声信道，最基本的噪声与干扰模型，加性噪声：叠加在信号上的一种噪声，通常记为n(t)，而且无论有无信号，噪声n(t)都是始终存在的。因此通常称它为加性噪声或者加性干扰。白噪声：噪声的功率谱密度在所有的频率上均为一常数，则称这样的噪声为白噪声。如果白噪声取值的概率分布服从高斯分布，则称这样的噪声为高斯白噪声。 9. 匹配滤波器的特征：抽样时刻的输出信噪比最大 10. 编码分为哪两大类，有什么区别。答：信源编码和信道编码

美国最牛气的50所计算机科学与工程学院排名

美国最牛气的50所计算机科学与工程学院排名美国有很多知名的科技公司，例如：Facebook、Google, Apple, Raytheon等等，这些公司每年都会招聘大量的业界精英，这些毕业生基本都是计算机科学和工程学院毕业的学生，那么这些学生都来自于哪些大学呢?Business insider对美国计算机科学与工程学院做了排名，小编列举了美国最好的50个大学，想要学计算机科学与工程专业的同学们可以做个参考。 1. Massachusetts Institute of Technology 麻省理工学院 2. California Institute of Technology 加利福尼亚理工学院 3. Stanford University 斯坦福大学 4. Carnegie Mellon University 卡内基梅隆大学 5. Georgia Tech 佐治亚理工学院 6. University of California at Berkeley 加州大学伯克利分校 7. Princeton University 普林斯顿大学 8. Cornell University 康奈尔大学 9. Harvard University 哈佛大学 10. Duke University 杜克大学 11. University of Michigan at Ann Arbor 密歇根安娜堡分校 12. Rensselaer Polytechnic Institute 伦斯勒理工大学 13. Johns Hopkins University 约翰·霍普金斯大学 14. Columbia University 哥伦比亚大学 15. Yale University 耶鲁大学

数理与信息工程学院计算机科学与技术专业

数理与信息工程学院计算机科学与技术专业（师范）本科教学计划一、培养目标和基本规格（一）培养目标本专业主要培养德、智、体、美全面发展，具备计算机科学与技术学科所需的自然科学、人文社会科学和教育教学理论素养，具备计算机科学与技术领域坚实的理论基础、工程实践能力与创新精神，知识、能力、素质协调发展，能胜任基础教育改革发展需要的计算机教育工作、开展教学实践研究，能在计算机相关的信息教育领域从事课堂教学和教学系统的设计开发，能从事计算机科学与技术研究、计算机应用系统设计与开发工作，具有较强竞争力的复合型高级工程技术人才，以及与计算机科学与技术相关的管理人才。（二）基本规格要求学生通过本专业的四年学习，达到教育部规定的基础扎实、知识面宽、能力强、素质高的专门人才的规格： 1．知识方面，本专业学生应具有良好的外语、人文、社会科学、科学的世界观与方法论等高等教育基本知识；具有扎实的数学、物理等自然学科基础理论知识；具备数字电路技术、数字逻辑及计算机组成原理等计算机硬件技术基础；具备高级语言程序设计、面向对象程序设计、数据结构、数据库系统、操作系统、软件工程等软件技术基础；初步具有本专业综合应用知识的技能。 2．能力方面，具有良好的教学组织能力和从事计算机教学及教学研究的能力；具有获取计算机科学与技术新知识的能力；具有较熟练地分析、设计和开发计算机应用系统的能力；具有计算机及相关领域问题分析和解决的能力；具有与他人合作共事、协同工作以及一定程度的组织管理能力；具有良好的英语阅读、写作与会话能力。 3．素质方面，具备良好的人文社会科学和教师职业素养；具有较高的法律意识和道德修养，熟悉教育法规；具有良好的社会责任感和职业道德；具有严谨的科学态度和学风；具有工程素养和信息素养；具有创新和创业精神。二、学制学制4年，在校学习年限3-6年。

大数据,数据分析和人工智能方向就业前景

大数据，数据分析和人工智能方向就业前景大数据和人工智能是两个联系非常紧密的专业，人工智能必须有大数据的支撑，因为人工智能需要数据建模、分析，再加上机器学习的东西才能做好。那么什么是大数据呢？顾名思义大量的数据。其实大数据并不仅仅是因为大，才称之为大数据，它还有很多纬度，也就是数据的多样性，再加上大量。数据有很多层次，所以在筛选分析数据的时候，需要很多的算法、数据结构的设计。这一块儿需要很深的技术基础知识，如果你做这个做得很好的话，说明你的计算机相关的知识是很棒的，所以找工作没有任何问题，如果这一块儿只是合格的话，能做的工作像软件方面的，或者是数据分析方面的，或者是算法设计方面都可以找到很好的工作。像人工智能发展的话，相对比较偏向应用这方面，数据是基础，人工智能只是个表象，人工智能还和物联网关联非常紧密，比如说现在有些小的物件，如智能手表，可以做很多手机上能做的事情，添加了很多计算的功能，然后以此为基础电视上也可以做很多东西，吸尘器也可以做很多东西。现在比较好的人工智能产品是一个称之为i robot的扫地机器人，在市场上是非常火热的，它可以自己启动，人不在家的时候打扫卫生，这就避免了它工作时的噪音问题，这就属于人工智能领域，在家庭里面的一个很好的应用。类似产品的开发需要大量的专业人才，如果你是人工智能专业的话，就有很多的就业机会，人工智能这一块儿的发展可以说未来十年甚至20年甚至更长时间都是一个热门的发展。这里面涉及的东西非常多，比如说我们现在用的比较多的刷脸，就是通过摄像头来捕捉你的、

脸，还有指纹输入、身份的信息捕捉等相关的技术，如果有大量数据的话，人工智能的分析可以很快速，比如辨认你是什么人、做哪个行业的等这些相关的信息可以帮你计算啊的，再比如说你的兴趣爱好，你将来的发展规划，可能会给你大体估算出来。你将来要做些什么？这都是人工智能领域。给人类提供了一些帮助，人工智能方面有很多个分支，以上说的都是一些小分支。大的分支像自动驾驶，一个汽车作为一个机器人在大街上出现，可以自主上路，你只需要在手机上按一个按钮，点一辆车让它过来接你。这是非常方便的一种生活状态。以上就是大数据和人工智能的联系，希望帮到你。

天津大学计算机科学与技术学院

天津大学计算机科学与技术学院 2018年硕士研究生复试实验考试确认单一、实验考试考场规则及时间安排 1、考试时间：2018年3月17日（星期六）上午10:20-11:50（90分钟）; 2、10:15到考试地点（47楼第七机房），10:30后不得入场； 3、携带身份证、准考证、资格审查合格证明，出示证件入场； 4、入场后通知用户名和密码； 5、10:20到11:50，上机实践考试；考试期间不得离开考场； 6、考试期间只能携带笔和白纸，不能携带任何电子设备和通讯工具。开考后如发现违反此规定，则视为考试作弊； 7、考试过程中除了能够访问指定的考试系统页面和使用指定的DEV C++或VC++外，不准使用其他软件，也不准访问其他页面，否则视为考试作弊。二、实验考试系统说明 1、实验考试系统主页：现场通知 2、当考试开始后，进入主页面下，点击相应考试； 3、进入考试页面，输入账号密码后，进入系统。考试开始后可以看到考试题目，点击题目名称后看题； 4、在本机编写程序。程序只能保存在D盘，保存在其他位置会丢失数据。编写并调试后，可点击考试页面上方“submit”，或点击相应题目页面上方“submit”；进入提交代码页面； 5、进入提交代码页面后，输入用户名、密码、题号；选择使用语言；并将自己编写的源程序粘贴到“source code”中，最后点击“submit”按钮； 6、提交程序后，点击“status”，查看提交结果，在Judge Status列中查看得分。

附件1：实验考试编程环境说明 1、程序可以采用DEV C++或VC++作为编译器。评测系统所使用编译器为GCC/G++ 4.5.0，某些在VC6.0中可以编译通过的写法实际上并不符合标准，此时提交到在线测评系统时可能会得到Compile Error。推荐使用DevCpp开发环境。编程时应该采用标准ANSI C/C++语法，不要使用VC的一些不标准的写法。 2、如果写C语言程序，一定要保存为扩展名为.c再编译，不要保存扩展名.cpp再编译。不要使用只能在C++中才能使用的语法，如：用//表示注释，使用struct mystruct时简写为mystruct等。 3、如果使用C++，在源程序中的开始处，使用文件包含命令的写法如下： #include using namespace std; 4、在main()函数前必须使用int返回类型，最后返回0，不要以void作为返回类型。否则可能得到Runtime Error。样例： int main() { //your code block return 0; } 5、避免使用一些可能是保留字的单词做变量名，如count，建议应成mycount或count1之类。 6、当程序需要处理多组数据时，不必把结果全部存储起来在最后一起输出，读入一组数据，计算完成后直接输出这组数据的结果即可（见最后样例题目及程序） 7、较大的数组不宜开在局部变量里，以免栈空间溢出造成Runtime Error 错误样例： int main() { int a[1000000]; …… } 正确写法： int a[1000000]; int main() { …… } 8、数组大小最好以略大于题目给出的最大的范围为宜，以便处理一些边界情况。尤其用char数组存放字符串时，应注意给字符串结尾的’\0’留出位置。 9、应注意局部变量、数组的初始化。题目中一般有多组测试样例，在处理每组数据前注意

宁夏师范学院数学与计算机科学学院师资队伍信息

数学与计算机科学学院师资队伍信息 2013-10-19 李星，男，汉族， 1964 年生，博士（德国），宁夏大学教授 , 曾任宁夏大学副校长，现任宁夏师范学院院长；上海交通大学兼职教授、博士生导师，《中国数学文摘》副主编，宁夏大学学报（自然科学版）主编（中文核心期刊），第十届全国政协委员，第五届、第六届中国科协委员，第九届全国青联委员，第八届、第九届中国数学会理事，第七届宁夏青联副主席，第五届、第六届宁夏回族自治区科协副主席；第七届、第八届宁夏政协委员；第十届宁夏人大代表；首届宁夏高级专家联合会副会长；中国数学会副理事长；宁夏数学会理事长；宁夏力学会理事长；宁夏回族自治区重点学科“应用数学”专业的学科带头人； 211 重点学科“数学力学及工程技术科学计算”的学科带头人。入选教育部“高层次创造性人才计划”获青年教师奖，首届国家“百千万人才工程” 一、二层次人选 , 中央直接联系专家。

马应虎，男，回族，1958年7月出生，宁夏海原县人，中共党员。1982年1月毕业于宁夏大学数学系，理学学士，2000年评聘为教授，曾任固原师专数学系副主任、主任、教务处处长、校长助理，2005年8月任宁夏师范学院党委委员、副院长，现任宁夏大学副校长。教育部“曾宪梓教育基金会高等师范院校教师奖”三等奖获得者；“数学与应用数学”区级教学团队负责人；“数学与应用数学”区级特色专业负责人；宁夏师范学院“基础数学”校级重点学科学科带头人；区级精品课程《高等代数》的主要完成人，主要担任“高等代数”、“近世代数”等课程的教学工作。2007年主持完成区级教改项目“普通高校兼办高职教育人才培养模式创新研究”；2008年主持完成区级教改项目“宁夏高校专业建设发展趋势研究”；2009年主持完成区社科项目“教育公平与优质教育资源配置”，参与完成2个省部级教学科研项目，主持完成3项校级教学科研项目。近五年来发表《发挥师范教育在教师教育中的主体作用》等研究论文8篇；出版《近世代数基础》等专著4部，主持完成的”近世代数教学改革研究“获2011学年度校级优秀教学成果一等奖；2010年研究报告《西北地区中小学教师流动问题研究》获第四届全国教育科学研究优秀成果三等奖（主要完成人）；2010年研究报告《宁南山区农村小学教师流动与教育公平研究》获宁夏首届优秀教育研究成果一等奖(主要完成人)；2010年著作《高等职业教育的改革与发展》获宁夏首届优秀教育研究成果二等奖。

计算机科学与技术学院

计算机科学与技术学院系统软件开发实践报告姓名：王冬升容易偏重

目录 1借助Flex进行词法分析 (2) 1.1实验内容 (2) 1.2实验要求 (2) 1.3程序代码 (2) 1.4实验结果 (4) 2借助Flex/Bison进行语法分析 (5) 2.1实验内容 (5) 2.2实验要求 (5) 8参考文献…………………………………………………………………… 1借助Flex进行词法分析 1.1实验内容给定C语言的一个子集，具体内容如下： 1.下面是语言的关键字：elseifswitchforintfloatreturnvoidwhile所有的关键字都是保留字，并且必须是小写。

2.下面是专用符号： +-*/<<=>>===!==;,()[]{}/**/ 3.其他标记是标识符（ID）和数字（NU），通过下列正则表达式定义： ID=letterletter* NUM=digitdigit* letter=a|..|z|A|..|Z digit=0|..|9 注：小写和大写字母是有区别的。 4.空格由空白、换行符和制表符组成。空格通常被忽略，除了它必须分开ID、NUM关键字。 (即注 digit[0-9] id{letter}+ number{digit}+ enter[\n] spchar("{"|"}"|"["|"]"|"("|")"|";"|"="|","|"+"|"-"|"*"|"/"|"<"|"<="|">"|">="| "=="|"!=")

comment\/\*(\*[^/]|[^*])*\*\/ kwd(else|if|switch|for|int|float|return|void|while) %% {ws}{} {comment}{} {enter}{lineno++;} {kwd}{fprintf(yyout,"%d行\tkeywod\t%s\n",lineno,yytext);} usingnamespacestd; intmain(){ inta; intd=123456; floatb=123.45; inte=9;

计算机与科学技术简历

篇一 xxx 男21岁广东人学历：大专工作年限：xx 期望薪资：面议工作地点：广州-花都-新华求职意向：网页设计/制作|其他计算机职位沟通能力强执行能力强学习能力强诚信正直责任心强沉稳内敛阳光开朗教育经历至今在校广东省高新技术技工学校计算机网络应用专业技能 Word：熟练经验：4年 CSS+DIV：熟练经验：2年 JavaS cript：一般经验：1年 MySQL：熟练经验：2年 PHP：熟练经验：1年证书奖项证书名称：计算机初级证书颁发时间：2015年9月颁发机构：教育部考试中心自我描述本人有PSPHPDWFLASHJAVES CRIPT数据库等计算机网络应用专业的基础为人诚恳，吃苦耐劳，乐观积极，适应能力强;具有良好的团队合作精神；希望能在工作过程中不断充实自我，完善自我；一直相信着车到山前必有路,船到桥头自然直。不管什么样的苦难，只要经过自己的不断努力总会克服它并顺利跨过去的。篇二个人概况姓名:***性别:男出生年月:19xx-02-09健康状况:良好毕业院校:哈尔滨工业大学专业:信息安全籍贯：山东省潍坊市寿光(市)电子邮件:.com 求职目标计算机类：研发测试销售英语技能 ?通过CET4和CET6，良好的听说读写能力，能阅读技术类文档资料。实践经历 ?大学期间积极参与项目开发，曾用开发过小型进销存管理系统(VB+SQL)，学生选课系统(VisualC+++SQL)，积累了丰富的项目开发经验； 20xx年加入**大学微软创新俱乐部，担任网络小组负责人，小组核心技术人员，参与学校各院系的网站制作，培养了团队协作能力，小组盈利5000多元; 20xx年暑假，参加了去**集团的社会实践，并担任社会实践团(10人)团长，全程负责团队的各项工作，通过和公司人员的交流与学习中，对IT行业的工作有了更深入的了解;

2017年面向大数据的人工智能技术综述报告

面向大数据的人工智能技术综述报告【摘要】本文通过分析人工智能技术当前的主流分类及所采用的核心技术，对其现状进行梳理，据此总结出目前所存在的问题及难点，并在上述研究和分析的基础上，探讨在大数据快速发展的背景下，人工智能技术的发展趋势和关键技术领域，就面向大数据的人工智能技术未来发展的相互关系和潜力进行一些初步探讨，提出可以利用大数据完善人工智能技术的建议。【关键词】面向大数据；人工智能；发展趋势引言 2016年正好是人工智能诞生60周年，它从科学成果逐渐转化为商业应用成果，并在人们的生活中逐渐起到越来越重要的作用。近年来，人工智能技术日益融入金融、科研等各个领域，随之而来的是大量的新型信息数据和资料的产生。当人工智能遇上大数据，究竟会引爆怎样一种改变世界的力量？是更大的数据让人工智能凸显出独立性，还是更强的算法成就了机器的自我学习？对于进入机器学习的时代，应用需求已经超越了原来普通的编程和数据库所能提供的解决范畴，面对空前庞大的数据量，通过人工智能技术将可能提供智能化的处理服务解决方案。面对大量的数据，如何进行整合处理，将大数据用于实时分析并对未来预测，使当下获取到的数据信息能进行有利于现有行为的分析预测，转化为有利的资源，俨然成为新的思潮。１.研究背景 1.1 大数据和人工智能的概念什么是大数据？是技术领域发展趋势的一个概括，这一趋势打开了理解世界和制定决策的新办法之门。根据技术研究机构IDC的预计，大量新数据无时不刻不在涌现，它们以每年50%的速度在增长，或者说每两年就要翻一番多。并不仅仅是数据的洪流越来越大，而且全新的支流也会越来越多。比方说，现在全球就有无数的数字传感器依附在工业设备、汽车、电表和板条箱上。它们能够测定方位、运动、振动、温度、湿度、甚至大气中的化学变化，并可以通信。将这些通

浅析数学在计算机科学及应用中的应用

图1 为两相开关建立模型的有穷自动机 3.4 离散数学与编译原理编译程序是计算机学科中比较高深的专业课，是计算机的一个十分复杂的系统程序。一个典型的编译程序而论，一般都含有八个部分：词法分析程序，语法分析程序，语义分析程序，中间代码生成程序，代码优化程序，目标代码生成程序，错误检查和处理程序，各种信息表格的管理程序。离散数学里的计算模型章节里就讲了三种类型的计算模型：文法、有限状态机和图灵机。具知识有语言和文法，带输出的有限状态机，不带输出的有限状态机，语言的识别，图灵机等。短语结构文法根据产生式类型来分类：0型文法，1 型文法，2型文法，3 型文法。以上这些在离散数学里讲述到的知识点在编译原理的词法分析及语法分析中都会用到。由于自然语言都极为复杂，对一个自然语言，看起来不大可能说出它的所有语法规则，因此，将一个语言自动翻译成另一个语言的研究，引出形式语言的概念。与自然语言不同，形式语言是由一组意义明确的语法规则定义的，语法规则不仅对于语言学和自然语言的研究十分重要，而且对于程序设计语言的研究也很重要。形式语言的句子是用语法来描述的。在程序设计语言的应用中，经常出现两类问题：（1）怎么能够确定一组单词是否组合成了形式语言的一个有效句子？（2）怎么才能产生形式语言的一个有效句子。在考虑这两类问题时，文法的使用十分有益。离散数学里定义了短语结构文法。G=（V,T,S,P）由下列四部分组成：词汇表V，由V 的所有终结符组成的V的子集合T,V的初始符S，和产生式集合P。集合V-T , 记为N，N中的元素称为非终结符。P中的每个产生式的左边必须至少包含一个非终结符。编译原理中的词法分析运用了不确定的有穷自动机，确定的有穷自动机，从正规表达式到NFA。在语法分析中运用了上下文无关文法，非上下文无关文法，LL(1)文法，LR 文法。这些表达式与文法都在离散数学中有相关的描述。因此，离散数学也是编译原理的前期基础课程。 3.5 离散数学与人工智能人工智能是以让机器完成那些如果由人来做则需要智能的事情的科学。虽然人工智