关于信息熵应用的讨论
信息熵在图像处理中的应用 毕业论文

摘要信息论是人们在长期通信实践活动中,由通信技术与概率论、随机过程、数理统计等学科相结合而逐步发展起来的一门新兴交叉学科。
而熵是信息论中事件出现概率的不确定性的量度,能有效反映事件包含的信息。
随着科学技术,特别是信息技术的迅猛发展,信息理论在通信领域中发挥了越来越重要的作用,由于信息理论解决问题的思路和方法独特、新颖和有效,信息论已渗透到其他科学领域。
随着计算机技术和数学理论的不断发展,人工智能、神经网络、遗传算法、模糊理论的不断完善,信息理论的应用越来越广泛。
在图像处理研究中,信息熵也越来越受到关注。
为了寻找快速有效的图像处理方法,信息理论越来越多地渗透到图像处理技术中。
本文通过进一步探讨概论率中熵的概念,分析其在图像处理中的应用,通过概念的分析理解,详细讨论其在图像处理的各个方面:如图像分割、图像配准、人脸识别,特征检测等的应用。
本文介绍了信息熵在图像处理中的应用,总结了一些基于熵的基本概念,互信息的定义。
并给出了信息熵在图像处理特别是图像分割和图像配准中的应用,最后实现了信息熵在图像配准中的方法。
关键词:信息熵,互信息,图像分割,图像配准AbstractInformation theory is a new interdisciplinary subject developed in people long-term communication practice, combining with communication technology, theory of probability, stochastic processes, and mathematical statistics. Entropy is a measure of the uncertainty the probability of the occurrence of the event in the information theory, it can effectively reflect the information event contains. With the development of science and technology, especially the rapid development of information technology, information theory has played a more and more important role in the communication field, because the ideas and methods to solve the problem of information theory is unique, novel and effective, information theory has penetrated into other areas of science. With the development of computer technology and mathematical theory, continuous improvement of artificial intelligence, neural network, genetic algorithm, fuzzy theory, there are more and more extensive applications of information theory. In the research of image processing, the information entropy has attracted more and more attention. In order to find the fast and effective image processing method, information theory is used more and more frequently in the image processing technology. In this paper, through the further discussion on concept of entropy, analyzes its application in image processing, such as image segmentation, image registration, face recognition, feature detection etc.This paper introduces the application of information entropy in image processing, summarizes some basic concepts based on the definition of entropy, mutual information. And the information entropy of image processing especially for image segmentation and image registration. Finally realize the information entropy in image registration.Keywords:I nformation entropy, Mutual information, Image segmentation,Image registration目录摘要 .......................................................................................................................... .. (1)ABSTRACT (2)目录 (3)1 引言 (5)1.1信息熵的概念 (5)1.2信息熵的基本性质及证明 (6)1.2.1 单峰性 (6)1.2.2 对称性 (7)1.2.3 渐化性 (7)1.2.4 展开性 (7)1.2.5 确定性 (8)2基于熵的互信息理论 (9)2.1 互信息的概述 (9)2.2 互信息的定义 (9)2.3 熵与互信息的关系 (9)3 信息熵在图像分割中的应用 (11)3.1图像分割的基本概念 (11)3.1.1图像分割的研究现状 (11)3.1.2 图像分割的方法 (11)3.2 基于改进粒子群优化的模糊熵煤尘图像分割 (12)3.2.1 基本粒子群算法 (12)3.2.2 改进粒子群优化算法 (13)3.2.3 Morlet变异 (13)3.2.4改建粒子群优化的图像分割方法 (14)3.2.5 实验结果及分析 (16)3.3 一种新信息熵的定义及其在图像分割中的应用 (19)3.3.1香农熵的概念及性质 (19)3.3.2一种信息熵的定义及证明 (19)3.3.3信息熵计算复杂性分析 (21)3.3.4二维信息熵阈值法 (22)3.3.5二维信息熵阈值法的复杂性分析 (24)3.3.6 结论及分析 (25)4 信息熵在图像配准中的应用 (27)4.1图像配准的基本概述 (27)4.2基于互信息的图像配准 (27)4.3P OWELL算法 (28)4.4变换 (28)4.4.1平移变换 (29)4.4.2旋转变换 (30)4.5基于互信息的图像配准的设计与实现 (31)4.5.1总体设计思路和图像配准实现 (31)4.5.2直方图 (33)4.5.3联合直方图 (33)4.5.4灰度级差值技术 (34)4.4.5优化搜索办法级结论 (35)5 结语 (37)致谢 (38)参考文献 (39)1 引言1.1. 信息熵的概念1948年,美国科学家香农(C .E .Shannon)发表了一篇著名的论文《通信的数学理论》。
熵原理的应用

熵原理的应用熵原理简介熵原理是热力学中的一个重要概念,它描述了系统内部的无序程度。
在自然界中,熵只会增加,表示一种趋向于无序的趋势。
然而,熵原理不仅在热力学中有应用,它同时也有广泛的应用于其他领域。
信息论中的熵信息论是熵原理的重要应用领域之一。
在信息论中,熵被用来描述信息的不确定性。
熵越高,信息中的不确定性越大。
通过熵原理,我们可以量化信息的不确定性,从而更好地理解和处理信息。
以下是信息论中熵的一些重要应用:•数据压缩:熵原理指导了数据压缩算法的设计。
压缩算法通过减少数据中的冗余信息来实现数据压缩。
压缩后的数据可以更高效地存储和传输。
•加密算法:熵原理也在加密算法中有应用。
加密算法通过增加数据中的随机性和不确定性来保护数据的安全性。
熵原理提供了对加密算法强度的评估标准,以保证加密算法的安全性。
计算机科学中的熵除了信息论,熵原理也在计算机科学中有广泛的应用。
计算机科学中的熵主要用来描述算法和数据的复杂性。
以下是计算机科学中熵的一些应用:•排序算法:熵原理告诉我们,对于乱序的数据,排序算法需要更多的操作来进行排序。
因此,熵原理可以帮助我们评估排序算法的效率和性能。
•压缩算法:与数据压缩类似,熵原理也在计算机科学中的压缩算法中有应用。
压缩算法通过消除重复的数据来减小存储和传输的开销。
生态学中的熵熵原理也被应用于生态学领域。
生态学中的熵将用于衡量生态系统的多样性和稳定性。
以下是生态学中熵的一些应用:•物种多样性评估:生态学家可以使用熵原理来衡量生态系统中的物种多样性。
通过熵的计算,我们可以了解各个物种在生态系统中的分布情况,从而更好地保护和管理生态系统。
•群落稳定性评估:熵原理也被用于评估生态系统的稳定性。
熵越低,表示生态系统中各个群落之间的分布越均匀,生态系统越稳定。
总结熵原理的应用远不止以上列举的几个领域。
从熵原理中我们可以看到,无论是在热力学、信息论、计算机科学还是生态学中,熵原理都发挥着重要的作用。
信源熵的原理及应用

信源熵的原理及应用信源熵是信息理论中的重要概念,用于描述一个随机变量包含的信息量的度量。
在信息理论中,熵被定义为信源中每个符号所携带的平均信息量的期望值。
熵的原理可以通过以下步骤来理解:1. 假设一个离散概率信源,它产生n个符号{s1, s2, ..., sn}。
每个符号都有对应的概率{p1, p2, ..., pn}。
2. 每个符号si携带的信息量可以用-log(pi)来度量,其中pi是符号si出现的概率。
3. 信源熵H可以定义为每个符号携带信息量的期望值,即H = -Σ(pi * log(pi)),其中Σ表示对所有符号求和。
熵的应用广泛,下面是几个常见的应用:1.数据压缩:信源熵的性质使之成为数据压缩技术的基础。
压缩算法通过移除冗余信息来减少数据的存储和传输成本。
压缩算法的思路就是将频率较高的符号用较短的编码表示,将频率较低的符号用较长的编码表示,以减小整体的编码长度。
2.信息编码:熵可以衡量信息的不确定性。
在通信系统中,编码器使用熵的概念来将消息转换成可传输的信号。
常用的编码方案包括霍夫曼编码、香农-费诺编码和算术编码等。
3.最优传输速率:信源熵对于最优传输速率具有重要意义。
在理想的通信信道中,传输速率应该等于信源熵,以达到最高的传输效率。
当传输速率高于信源熵时,会出现信息丢失或传输错误。
4.信息隐藏:信源熵的概念也可以应用于信息隐藏领域。
信息隐藏是指将附加信息嵌入到覆盖载体中,使得这些信息对于一般观察者不可察觉。
利用信源熵的概念,可以构建一些隐蔽的嵌入方案,将秘密信息嵌入到原始图像或音频中。
总之,信源熵在信息理论中起着重要的作用,它是衡量信息量的基本度量方式,并且对数据压缩、通信编码、传输速率等方面具有广泛的应用。
通过对信源熵的研究,我们可以更好地理解信息的特性和效率,并且能够应用于真实世界中的各种通信系统和数据处理任务中。
基于信息熵的数据挖掘技术在网络安全中的应用研究

基于信息熵的数据挖掘技术在网络安全中的应用研究随着信息技术的发展,网络安全成为了一个越来越重要的领域。
在信息时代,几乎所有的机构、团体和个人都依赖于网络,因此网络安全问题尤其需要关注和研究。
数据挖掘技术是一种有效的技术手段,在网络安全领域的应用也越来越广泛。
信息熵是数据挖掘技术中的重要知识点,它可以帮助我们发现和解决网络安全中的问题。
信息熵是信息科学的基本概念,它用来表示一组数据的不确定性。
在一个群体中,如果每个人都具有相同的思想、价值观和目标,那么我们就可以不用考虑他们的个性特点,因为每个人的行为都是可以预见的。
但是在网络世界中,每个人都有自己的思想、价值观和目标,我们无法预测他们的行为。
因此,在网络安全领域,我们需要使用信息熵来分析网络节点的不确定性。
在数据挖掘技术中,信息熵被广泛地应用于网络安全领域。
通过信息熵的分析,我们可以发现网络中的异常行为。
比如,在网络安全领域,我们经常会遇到DDoS攻击的问题。
DDoS攻击是指攻击者通过多台电脑或者服务器向一个目标网络发送恶意流量,以达到消耗目标网络带宽、资源的目的。
如果我们能够通过信息熵来识别每个节点的正常流量大小和不确定性,那么就可以发现网络中发生了哪些不正常的变化。
除了DDoS攻击,信息熵在其他网络安全领域也起着非常重要的作用。
比如,在入侵检测系统中,我们可以利用信息熵来识别恶意行为。
入侵者通常会针对某些特定的网络节点发起攻击,因此这些节点的信息熵会比其他节点高。
如果我们能够在网络节点中识别出信息熵的变化,就可以发现入侵者的位置和恶意行为。
另外,信息熵还可以在快速反应系统中发挥作用。
在网络安全领域中,快速反应是非常重要的。
如果我们能够快速地发现网络安全问题,就能够防止网络攻击造成的严重影响。
在快速反应系统中,我们可以利用信息熵分析网络异常行为,并及时采取措施来保护数据和网络安全。
综上所述,信息熵在网络安全领域中发挥着极其重要的作用。
通过信息熵的分析,我们可以发现网络中的异常行为,并及时采取措施来保护网络安全。
论教育信息处理中的信息熵方法

论教育信息处理中的信息熵方法我折腾了好久论教育信息处理中的信息熵方法,总算找到点门道。
刚开始接触这个的时候,我真是一头雾水,完全不知道从哪下手。
我就先去看了一堆基础的信息熵概念,什么信息不确定性之类的。
我当时就想,这和教育信息处理咋联系到一块呢?我先试着从简单的教育信息分析入手。
比如说学生的成绩数据,我就把它当成是一种简单的信息源。
我按照信息熵的公式去计算成绩分布可能产生的信息量。
最开始我总是把公式里那些概率值算错。
就好比你数家里有几个苹果,数着数着就忘了数到哪了,特别懊恼。
后来我就小心翼翼的,一步一步来,先把每个成绩区间的人数统计好,然后计算出每个区间的概率,再代入公式算信息熵。
这个过程让我意识到,在处理教育信息的时候,数据的准确性太重要了。
如果最开始的数据统计都错了,那算出的信息熵就完全没意义。
然后我又尝试在教育决策过程中使用信息熵方法。
就像老师决定给学生上什么样难度的课程,如果有之前类似学生群体的学习反应的数据,这些数据也就是教育信息。
可以用信息熵来衡量这个决策的不确定性。
我当时错认为信息熵越高越好,还沿着这个错误方向做了不少分析,发现结果根本不符合实际教育情况。
后来我才明白,信息熵高代表着不确定性高,在教育决策里,我们其实是想降低不确定性的,应该追求较低的信息熵值。
我还试过在教学设计里运用信息熵。
比如教学内容有多种表达形式的时候,文字、图片、视频等等。
我把学生对不同形式的吸收效果当作一种信息的变化。
如何安排这些教学内容形式才能让学生更好地吸收知识,信息熵就能给出一些参考。
不确定的地方我觉得还是有的。
像一些跨文化或者特殊教育领域,信息熵方法可能要做一些调整,但具体怎么调整,我现在还不太清楚。
所以在这里我只能说如果遇到这样的情况,要谨慎地根据实际情况重新审视信息熵的计算要素等。
总之,在教育信息处理里运用信息熵方法,最重要的就是准确理解信息熵的概念,小心处理数据,而且要明确在不同教育场景中的目标。
信息论中的熵和互信息

信息论中的熵和互信息当我们听到“熵”这个词时,很可能会想到物理学中的热力学概念。
但是,熵不仅仅在热力学中有用,它在信息理论中也扮演着重要角色。
在信息理论中,熵是一种度量信息不确定性的指标。
具体来说,熵可以表示随机变量中的平均信息量。
举一个简单的例子,如果我们有一个硬币,它可能是正面朝上或反面朝上。
那么这个硬币的熵就是1个比特,因为只需要1个比特的信息量就能完全确定硬币的正反面结果。
那么,为什么熵这个概念在信息理论中如此重要呢?其实,熵与信息压缩有关。
在信息传输过程中,我们往往需要将大量的信息通过有限的通道传递。
但是,我们同时也需要确保传输的信息尽可能不损失。
而熵这个指标可以帮助我们衡量信息的不确定性及压缩效率。
除了熵之外,互信息也是信息论中一个重要的概念。
互信息可以用来评估两个变量之间的相关性或者关联度。
具体来说,互信息可以计算某个变量给我们带来了多少额外的信息。
在实际应用中,互信息可以被用来进行数据挖掘、信息检索等方面的工作。
不难看出,熵和互信息这两个概念之间有着重要的联系。
在信息论中,熵和互信息是相互独立并且互补的概念。
通过分析这两个指标,我们可以更好地理解信息的本质及信息传输的技术原理。
在现代信息社会中,熵和互信息这两个概念已经被广泛应用到各个领域。
无论是计算机科学、工程、物理学还是生物信息学,这两个概念都发挥着关键作用。
同时,我们也可以预见,在未来的信息时代中,熵和互信息这两个概念将会继续发挥着重要的作用。
总之,熵和互信息是信息论中非常基础的概念。
它们既相互独立,又互相联系。
了解这两个概念的含义以及其在实际应用中的作用,可以帮助我们更好地理解信息传递的机制以及信息检索的方法。
信息论在网络安全中的应用研究

信息论在网络安全中的应用研究引言随着信息技术的迅速发展和互联网的广泛应用,网络安全问题成为了现代社会中重要的议题之一。
在这个信息爆炸的时代,如何保护个人隐私、企业机密以及国家安全,成为重要的挑战。
信息论作为一种研究信息传输和存储的数学理论,可以为网络安全提供一种新的思路和方法。
本文将探讨信息论在网络安全中的应用研究。
一、信息论的基本原理1.1 信息熵的概念信息熵是信息论中的重要概念,用于度量信息的不确定性。
在网络安全中,我们常常需要通过加密技术保护信息的机密性。
信息熵可以帮助我们评估一个加密算法的强度,从而选择合适的加密方案。
信息熵越高,说明信息的不确定性越大,也就是说加密算法越强大。
1.2 信道容量的计算信道容量是用来衡量一个信道传输信息的极限速率。
在网络安全中,我们需要确保信息的传输过程是可靠的,而信道容量则能帮助我们选择合适的通信协议和网络架构,以提高信息传输的效率和安全性。
二、信息论在网络加密中的应用2.1 密码学中的信息论应用信息论被广泛应用于密码学中的密钥管理和密码破解。
通过使用信息熵评估密钥的复杂度,可以提高密码的强度。
同时,信息论也为密码破解提供了理论基础,通过分析密码破译的复杂度,可以评估密码算法的可靠性。
2.2 信息隐藏技术信息隐藏是一种利用信息论原理隐藏消息的技术。
在网络安全中,我们常常需要隐藏敏感信息,以保护个人隐私。
信息隐藏技术可以实现将隐藏的信息嵌入到其他无关信息中,使得外界难以察觉,提供了一种有效的隐蔽通信手段。
三、信息论在网络安全评估中的应用3.1 安全性评估指标的定义在网络安全中,我们需要评估系统的安全性以确定潜在的安全威胁和漏洞。
信息论为网络安全评估提供了一种数学工具,可以通过定义安全性评估指标,对系统进行全面的安全性评估。
3.2 隐私保护的风险分析隐私泄露已成为网络安全中的重要挑战之一。
信息论提供了一种风险分析方法,可以评估隐私泄露的概率和后果。
通过信息论的分析,我们可以对隐私保护措施进行优化和改进。
多目标风险评估中信息熵的应用

多目标风险评估中信息熵的应用本文介绍了工程风险在当今社会工程建筑领域的重要性,将信息熵的风险评估方法运用于多目标风险评估中,优化工程风险管理的手段,风险的预测与控制需要从定性和定量两方面来诠释,全文从一个量化的角度详细介绍了在多个目标控制下的风险方案的选择,希望以此机会推广信息熵的运用,加大对工程风险的关注。
关键词:工程风险管理信息熵多目标风险当今工程项目的竞争越发激烈,技术含量日趋提高,规模趋于大型化和复杂化,对其风险掌握的精度要求也越来越高。
对风险的考虑也从原来的单一目标到现在的多目标,许多实际行业例如金融投资、房地产投资和供应链中采购与库存管理的风险管理问题大多是如此情形。
多目标的风险可以让风险更趋于合理性和准确性,同时体现了现在对风险控制要求的提高。
从中国风险分析多年的进程来看,常用的方法有:第一层次分析法是将一个复杂的风险问题分解成若干个组成因素形成层次分明的分析结构,由粗到细,最后通过计算再反向逆推得出两两比较后的风险值,在风险分析的道路上向前迈了一大步,但是针对现在不断革新的时代,单一的目标分析已经逐渐满足不了现状,所以它的优势也在逐渐消失。
第二模糊数学法适合解决那些难于用数字辨析的因素,但是其局限性比较大。
第三蒙特卡罗法要求确定的变量有明确的变化范围和概率分布,条件比较苛刻。
基于以上的一些基本的分析方法,结合目前多目标风险的盛行,本文将介绍一种更方便、清晰的方法—信息熵。
信息熵简介1948年美国工程师申(shannon)肯定的回答了信息的不确定测度是可以用熵来解释的,因此成功引入了信息熵的概念,解决了对信息的量化度量的问题,且在信息预测中得到了广泛的应用。
在当今一个信息爆炸的时代,如何很好的利用信息并加以筛选是应当考虑的问题。
就如风险评估中,风险的变化是由于信息的不确定性引起的,时下的多目标风险对信息的处理要求也有所提高。
信息熵描述的是信息不确定的一种程度,因此信息熵越大说明该事件不确定性越大,掌握的信息量不足,在控制方面就需要引起重视。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关于信息熵应用的讨论
1 引言
信息的多少该如何度量?信息论之父香农在1948年发表的论文提出了“信息熵”的概念,用其来描述信息的不确定度。
一般情况下,如果一段信息,它的出现概率很高的时候,就表示它传播的范围很广,也可以认为是被引用的程度更高,所以我们可以这样认为,从信息的传播角度来看,信息熵表征了信息的价值,这样就方便我们对信息的价值高低进行有效的衡量。
其计算公式可表示如下:
(X)()l b ()X
H P x P x =-∑
其中,x 表示随机变量,随机变量的集合用X 表示,()P x 表示输出概率函数。
2 信息熵在社会领域的应用
信息熵理论的应用非常广泛,涉及到我们生活的方方面面。
前段时间的琅琊榜以及正播出的芈月传这种精品剧受到了大众的追捧,同样在收视率上表现抢眼。
而收视率统计数据作为电视台评价自己的节目,确定各频道和时段广告价格及广告客户选择媒体、频道、时段和节目的重要依据。
如果只是对节目播出后进行调查分析显然已经无法满足电视台和广告商的期望。
对于电视台方面来说,节目的播出前收视预测能帮助实现节目的精细化制作并获取期望的效果;对于广告商收视预测则明显能减小投资风险。
我们知道信息熵是对不确定性的度量,显然其很可能在此处发挥作用。
我们可以对一个节目分为多个属性,如艺术水平、题材流行程度、编导人气、受众文化程度、受众经济情况、受众性别、受众年龄等等,再然后加上一个已获得的收视率属性,对属性进行等级或者分数记录。
选取样本数据并分别统计,然后计算给定样本集的收视率熵,从而得到样本的平均信息量,再分别计算每个属性的熵,计算信息增益值,从结果中就很容易知道哪个属性在其中具有最高信息增益,即信息熵最小的属性。
这个属性作为最先决策的考虑,然后在此基础上再计算其他的信息熵最小属性,作为第二决策考虑,依次类推,生成决策树。
基于信息熵的预测收视率模型已有研究成果,
并且证明预测效果很好,比较适合用于影响因素多,样本数据库大的电视节目的收视率分析[1]。
对于电视台和广告商,信息熵有巨大的利用价值,那对于为整个娱乐产业操碎了心的广电总局,信息熵是否也有其参考价值呢?假如把观众与电视频道作为一个相对封闭的互动系统,那么观众对频道选择的趋同或者多样就是这个封闭系统非常重要的一个表明系统复杂性的特征。
这个系统中观众观看电视频道的复杂度可以用信息量来度量,观众对频道收视选择越一致,对系统状态进行确认所需要的信息量越小;反之,观众收视选择越分散,则对系统状态进行确认所需要的信息量越大。
这个信息量的大小可以通过计算信息熵获得。
以观众对不同频道的收视率转换为收视概率并计算信息熵。
通过观察信息熵的趋势来评判这个系统的无序性。
根据此处所定义的信息熵,广电总局可以比较简单明了的了解全国电视频道的整体有序、无序状态,从而采取适当的宏观调控措施。
除此之外,信息熵在其他领域也受到了研究者的亲睐。
如在学生评教结果分析,教育信息处理,电子数据取证,图书分类决策,煤炭企业经济效益评价等等研究中,信息熵都能发挥重要作用。
3 信息熵在科学领域的应用
结合信息熵的性质,它的应用非常广泛,即使在我所研方向模拟电路设计中它也发挥着不可忽视的作用。
在电子电子工艺愈来愈追求高度集成的过程中,维护的难度也相应提高,当一个系统出现故障的时候,进行有效且较为精准的故障诊断及其重要。
尤其对于模拟电路,限于其复杂、非线性、易产生误差、容差等特性,故障诊断无疑成为了困扰着集成电路工业发展的一个“瓶颈”。
而将信息熵应用于模拟电路故障诊断可以取得不错的效果,成为研究热点。
其理论主要应用在对故障电路特征的提取中。
其中,长春理工大学的王庆元就用香农熵对电路故障状态的不确定性进行描述,将测量前后电路的熵值变化量作为电路故障状态的诊断信息量,并以诊断信息量为依据,采用粒子群优化算法来进行电路故障状态的最佳特征子集的选取[2]。
结果表明利用该方法所获得的特征子集携带电路故障信息最多,可以充分反映电路的各类故障状态,进行有效的故障隔离。
在故障特征提取的过程中,我们的目的是找到一个相同容量下能够含有最大的利于进行
故障分类的信息的特征集合,即含有最大诊断信息量的特征集合。
一个特征集合的诊断信息量可以定义为在该特征集合上对电路进行测量前后的电路状态的不确定性的变化[4]。
所以我们要引用信息熵的概念来计算出这个电路在测量前和测量后电路故障状态的不确定性,即要计算出测点的先验熵以及后验熵。
特征集合的诊断信息量反映了其所携带诊断信息量的多少,可以作为选择最优特征集合(即特征提取)的重要依据。
事实上,在特征提取中,我们需要做的就是要找到I(X)(先验熵减去后验熵)的最优解,就可在全体特征集合中寻找到具有最大诊断信息量的最优特征子集。
他所用到的基于信息熵的特征提取方法在其他研究中也有很大的应用价值。
如,文献[3]燕山大学的谢平、周志丰在掌纹的特征提取中,将小波图像分析与信息熵理论相结进行特征提取,结果证明好于传统方法。
中北大学潘铭志针对小口径火炮高速自动机的在线监测与故障诊断,建立了基于信息熵小波能量熵、小波奇异谱熵、小波时间熵,实现对信号的多层次特征提取。
西南交通大学的筱玲、何正友、钱清泉在超高压输电线路的故障诊断中应用了信息熵理论进行特征提取,并在后续的诊断中验证了它的有效性和准确度。
王振海利用基于图像NMI 不变特征结合信息熵理论进行图像的特征提取,提出了一种基于内容的图像检索方法,经验证该方法具有较好的实用性。
特征选择是基于具有最小冗余性(特征间的互信息量最小)和最大相关性(特征与类别关联度最大),那么是否可以用于视频图像的压缩算法中降低冗余度以提高传输效率呢?在信息通信尤其无线通信领域,应用信息熵理论的特征提取是不是能够有效提高滤波器的滤波性能?因为噪声与传送信息的信号可以近似的认为是不相关,即互信息量很小,所以我们也许可以在信息发送端提取出一个关于信息的特征,然后在接收端应用此特征模型来滤除噪声。
另外,对于多频传输的信道,我们要设置一个滤波器滤出一个特定频率的信号,那么利用由发送端得到的特征模型以及基于最大相关性和最小互信息量的原理就可以滤出频率相关性最大的那个信号。
在加密解密领域,信息熵有没有可利用的价值?
同时,信息熵是系统整体性的一种度量,在混沌时间序列的分析中起着重要作用。
混沌时间序列的判定、分析与预测都是在重构相空间中进行的因此相空间重构是分析混沌动力学系统的第一步。
华南理工大学的张春涛在文献[5]中提出
了一种基于信息熵模型的相空间重构方法。
利用信息熵优化重构参数,使建立在重构相空间上预测模型能获得更多的信息量,从而使得系统内部运动规律更容易显现。
这种方法相对于传统的方法有优良的保持原动力系统整体的特性的优势。
在信息安全领域,我们常常受到木马程度的困扰,而用传统的协议分析手段无法进行有效检测。
用信息熵统计的会话分布规律并布局在网络端口处,通过判断端口数据是否服从已确定的正态分布实现检测木马程序[6]。
这种方法的检测效果很好,且在网络环境中有良好的实时性。
由此我们也可以想到,在图像、视频、文字的加密置乱中,信息熵也可以用来有效检测效果从而评估算法的优劣。
还有很多学者研究了信息熵在基因调控网络构建,农业技术扩散,工程造价风险分析,泥沙研究,建筑工程管理等等具体问题中的应用,并取得了一定的研究成果。
4 总结
通过上面这些基于信息熵的应用,我们可以发现,在系统性、整体性、随机性的问题上,信息熵有着广泛的应用价值。
在包括生命科学在内的自然科学乃至社会科学的各个领域,存在着大量的不同层次、不同类别的随机事件的集合,而每一种集合都对应有相应的不确定性(或称为无序性、混乱度、无规律性等等),所有这些不确定性都可使用信息熵这个统一的概念来描述,从而使该随机事件集合的某种规律性描述实现定量化。
因此,可以把信息熵引申应用到对事物集合中一些相互对立性质的量度,判断事物集合中的有序与无序、确定性与随机性、组织性与散漫性、规则性与杂乱性、简并性与多样性,并对其相互对立的概念进行量度。
虽然信息熵的应用不断的拓宽,但在个体的、少数的特性研究中,信息熵显然意义并不大,当然也没有这个必要。
信息无所不在,无序是世界的本质特征,我相信结合两者的信息熵的价值无可估量,远远不止于现有的研究成果。
这需要更多的人学习了解信息熵,利用这个有效的工具去研究解决自己学科中的问题。
参考文献
[1] 徐娟娟,刘同明.基于决策树的电视节目收视率预测模型[J].软件时空.2007,9.
[2] 王庆元.模拟电路故障中基于信息熵的特征提取方法.长春理工大学硕士论文.2012,6.
[3] 谢平,周忐丰.基于小波变换和信息熵的掌纹特征提取方法[J].计算机系统应用.2008,2.
[4] L Xu,P Yan,T Chang. Best First Strategy for Feature Selection[A].Proc of 9th Int'l Conf on Pattern Recognition[C].
[5] 张春涛,马千里,彭宏. 基于信息熵优化相空间重构参数的混沌时间序列预测[J].物理学报.2010,59(11):7623-7630.
[6] 陈利,张利,班晓芳,梁杰. 基于信息熵的加密会话检测方法[J].计算机科学.2015,42(1):142-143.。