关于熵函数法中的几个问题
熵理论中熵及熵权计算式的不足与修正

张近乐 , 任
杰 : 熵理论中 熵及熵权计算式的不足与修正
1 与 X 2 相近, 权重相近, 从而缓和了熵值权重 y 1, 即 X 的跳跃现象, 说明 X 越大, 对跳跃现象的修正效果
式后 , 既可解决前述特殊情况下出现的问题, 又将其 对熵权的影响控制在了合理的范围之内 ( 可使其微 变在小数点后 2 位或之后 ) 。 证明 : 传统的熵权计算式出现 / 熵值十分相近 , 熵权存在较大误差0 这种情况的原因在于 : 当 H i y 1 时, 由式 Xi = 1- Hi mi= 1
j= 1
E ac
n
, 且/ 假
三、 熵权计算公式的不足与修正
传统的熵权计算公式为 [ 2] 194 1- Hi 1- H i Xi = m = m E (1 - H i) m - E H i
i= 1 i= 1
ij
定0 : 当 acij = 0, P ij = 0 时 , P ij ln P ij = 0, 这是因为 , 当 P ij = 0 时 , ln P ij 在数学上无意义。 本文对概率计算公式给予了修正, 即: 将 P ij 重新 定义为 P ij = acij + 10
一、 引
言
度 , 也可以用熵值来判断某个指标的离散程度。 100 多年来 , 由于熵概念的泛化 , 经过诸多学者 的不懈钻研和应用, 熵不仅在自然科学中得到广泛 应用, 而且在社会科学和管理科学领域的研究中得 到越来越多的应用, 熵已被许多学者认为是自然科 学与社会科学的交叉点
[ 1] 42- 43
i
m
1, 0 [ Xi [ 1, ( i = 1, 2, 3, ,, m) 。
本文中 , 为了既保证对上述熵权跳跃现象的微 小修正 , 同时又不影响风险值的宏观结果以及对风 险的分 析与 比较 , 取 C = m- 1 , m = 10, 即 : X = 1 (1 - H i)。 之所以 m 取值为 10 , 是因为在实际 10 iE = 1 应用中 , 指标过多、 过少都不利或不便于对系统 ( 或 对象) 进行判断与评估( 指标较少时 , 无法准确反映 系统的判断属性, 而指标过多时 , 会使系统的判断属 性过于复杂) , 现实中通常 m = 3 ~ 10。 而取 C = m 及 m > 10, 会使计算在未改变修正精度的情况 下变得较为复杂。
热力学中的常见问题

热力学中的常见问题热力学是研究能量转化和能量传递的科学,它在我们日常生活和工业生产中都扮演着重要的角色。
然而,热力学在理论和实践中都存在一些常见问题。
本文将介绍一些热力学中的常见问题,并探讨解决这些问题的方法。
一、熵的概念热力学第二定律中提到了熵的概念,它是系统无序程度的量度。
然而,许多人对熵的概念感到困惑。
他们不理解熵的物理意义以及如何计算熵的变化。
解决这个问题的方法是理解熵的定义和计算方法。
熵的定义是熵变等于系统的热力学温度除以系统的热力学温度的增量。
熵的计算方法可以通过统计物理学的方法来进行。
通过学习统计物理学的知识,我们可以更好地理解和计算熵的变化。
二、热力学循环效率热力学循环效率是衡量热力学循环能量转化效率的指标,如卡诺循环效率。
然而,实际情况下,热力学循环的效率往往低于理论值,这是一个常见的问题。
提高热力学循环效率的方法可以通过改进热力学循环的工作流程来实现。
例如,减小能量损失,降低热机部件的摩擦和热漏,提高燃烧效率等。
此外,利用先进的材料和技术也可以提高热力学循环的效率。
三、湍流流动的热力学模型湍流是流体力学中的一个复杂问题,它涉及到非线性方程和大量的计算。
在热力学中,湍流流动的热力学模型也是一个常见的问题。
解决湍流流动的热力学模型问题可以通过数值模拟和实验研究相结合的方法。
使用数值模拟方法可以建立湍流流动的数学模型,并进行计算和分析。
实验研究可以获得实际湍流流动的数据,用于验证和修正数值模拟模型。
四、热力学平衡与非平衡态热力学平衡是热力学中的基本概念,但是如何判断系统是否处于平衡态仍然是一个常见的问题。
判断系统是否处于平衡态可以通过热力学平衡的条件来进行。
热力学平衡的条件包括熵的最大化和能量的最小化。
通过观察系统的熵变和能量变化,我们可以判断系统是否处于平衡态。
总结:热力学中存在一些常见问题,包括熵的概念、热力学循环效率、湍流流动的热力学模型以及热力学平衡与非平衡态的判断。
通过理解熵的定义和计算方法、改进热力学循环的工作流程、使用数值模拟和实验研究相结合的方法以及观察系统的熵变和能量变化等方法,我们可以解决这些问题,深入理解热力学的基本概念和应用。
一维均熵流方程组cauchy问题

一维均熵流方程组cauchy问题一维均熵流方程组Cauchy问题是数学物理领域最为重要的主题之一,是研究偏微分方程系数随空间变化情况下变量的分布规律和变化趋势的一种重要问题,也是数值分析理论和实际应用中重要的内容。
一维均熵流方程组Cauchy问题是单变量在满足一维均熵流方程组的情况下的一种特殊的Cauchy问题。
它的主要特点是,变量的空间变化以及方程组中的系数随着空间位置而变化,因此它具有更加复杂的边界条件和更高精度的要求。
首先,讨论一维均熵流方程组Cauchy问题必须解决的一系列基本问题:变量的定义域、方程组的健全性和完备性、变量的边界条件、变量的叠加关系以及方程组的对称性等。
变量的定义域指的是这一系列变量的取值范围,在一维均熵流方程组Cauchy问题中,至少有两个变量,分别是均熵变量u和空间变量x,这两个变量的取值范围是有限的,也可能是无限的。
方程组的健全性和完备性在一维均熵流方程组Cauchy问题中也是必不可少的,一般来说,只有当方程组可以满足一定的精度要求,满足一定的初始或边界条件时,才能称之为健全的、完备的。
此外,一维均熵流方程组Cauchy问题的另一个关键问题是,变量的叠加关系,也就是说,两个变量之间的关系是怎样的?双变量时,使用曲线或面积讨论变量之间的叠加关系,并且可以在曲面或平面图上进行可视化讨论。
最后,方程组的对称性是指这些方程组是否具有对称性,即它们可以在一定范围内互换变量x和u,具有可推导性,并且不会引起任何错误。
在理解了一维均熵流方程组Cauchy问题的定义域、健全性以及叠加关系、对称性之后,接下来是解决这一问题的数值方法。
首先,这一问题的数值解法可以分成三类,一是直接求解法,二是迭代求解法,三是积分求解法。
其中,直接求解法可以有效地解决非线性问题,而迭代求解法则可以更有效率地求解有边界条件的线性问题,积分求解法则可以对一些有边界条件的等式或不等式进行数值求解,以获得模拟结果。
谱熵的计算方法 概述及解释说明

谱熵的计算方法概述及解释说明1. 引言1.1 概述谱熵是一种用于衡量信号复杂性和不确定性的数学工具。
它基于信号的频谱分布来计算信号的信息熵,可以提供对信号统计特征的重要洞察。
谱熵广泛应用于各个领域,包括信号处理、数据压缩和图像识别等。
1.2 文章结构本文将全面介绍谱熵的计算方法以及其应用场景,并对计算方法进行优缺点分析。
文章内容主要包括以下几个方面:首先,在第2节中详细阐述了谱熵的定义与原理。
通过解释其数学模型和核心思想,我们可以更好地理解谱熵的含义和作用。
其次,在第3节中探讨了在不同领域中谱熵的应用场景。
我们将重点关注信号处理、数据压缩和图像识别领域,并列举一些典型案例来说明谱熵在这些领域中的实际应用价值。
接着,在第4节中对谱熵计算方法进行了深入分析,并评估其优缺点。
我们将探讨谱熵作为信息度量工具时所具备的优势以及在实际应用中可能存在的限制。
最后,在第5节中,我们对本文进行总结,并展望了谱熵未来的发展方向及其应用前景。
通过回顾现有研究成果和对未来趋势的探索,可以为相关领域的科学家和工程师提供启示和参考。
1.3 目的本文的目的是为读者介绍谱熵的计算方法,并深入探讨其在不同领域中的应用。
通过阅读本文,读者将了解到谱熵作为一种重要的信息度量方法,其在信号处理、数据压缩和图像识别等领域中的实际价值。
此外,我们还将分析谱熵计算方法的优缺点,以期能够全面评估其适用性和局限性。
最终,我们希望通过本文对谱熵进行全面概述,从而促进相关领域的进一步研究和应用发展。
2. 谱熵的计算方法:2.1 定义与原理:谱熵是一种衡量信号复杂性的指标,用于描述信号频谱的均匀分布程度。
在信号处理领域,谱熵常被用来度量信号的信息丰富程度和预测能力。
其计算方法基于信息论中的熵概念,通过对信号频谱进行统计分析得出。
2.2 基本概念解释:在计算谱熵之前,首先需要了解几个基本概念:- 频谱:频率域上表示信号各频率成分强度的函数。
- 幅度谱:描述信号不同频率成分幅度大小的函数。
热学中熵概念的引入与讨论

本科毕业论文论文题目:热学中熵概念的引入与讨论学生姓名:王瑨学号:200600910090专业:物理学指导教师:李健学院:物理与电子科学学院2010年5月20日毕业论文(设计)内容介绍论文(设计)题目热学中熵概念的引入与讨论选题时间2010-1-10 完成时间2010-5-20 论文(设计)字数9000关键词熵,熵增加原理,热力学第二定律论文(设计)题目的来源、理论和实践意义:题目来源:基础研究。
理论意义:熵是物理学中的一个基本概念,是用来描述和研究自然界中广泛存在的运动形式转化的不可逆性的一个极其重要的概念。
从1846年克劳修斯在热力学中引入熵的概念到如今已经有160多年的历史,但是在它提出160多年的期间,如何理解熵的含义及本质,如何计算不同情况下熵的大小等方面仍有许多课题需要深入研究。
实践意义:随着物理学的发展,人们对熵的认识更加深入了,也更加拓宽了。
而今它已经成为各门科学技术甚至是某些社会科学的重要概念,它渗透在自然过程和人类生活的各个方面,蕴含了极其丰富的内容。
论文(设计)的主要内容及创新点:主要内容:论文比较具体的介绍了熵的由来、意义和用途。
从熵的概念、熵的深化和熵的泛化等方面介绍了熵,其中熵的概念包含对熵概念由来的阐述和对熵概念的辨析;熵的深化包括对熵增加意义的解释、熵是系统状态概率的量度的解释以及熵的无序量度的深化;熵的泛化介绍了熵在现实生活各个方面的应用及推广。
创新点:通过对熵概念的深入介绍,对熵进行了深化和泛化的介绍,说明了熵在实际中的意义。
附:论文(设计)本人签名:2010年5月20日目录一、引言 (1)二、熵的概念 (2)2.1熵概念的引入 (2)2.2 熵概念的建立 (2)2.3 熵增加原理 (3)2.4 熵概念的发展 (3)三、熵的深化 (5)3.1 熵增加意味着能的贬值 (5)3.2 熵是系统状态概率的度量 (6)3.3 熵是无序度的度量 (7)四、熵的泛化 (8)4.1 熵与信息论 (8)4.2熵与耗散理论 (9)4.3熵与气象学 (9)4.4熵与宇宙学 (9)4.5熵与生命科学 (10)五、熵的总结 (10)参考文献: (11)热学中熵概念的引入与讨论王瑨(山东师范大学物理与电子科学学院,济南,250014)摘要:熵是一个重要的物理概念。
关于熵的理解上的几个问题

义 , 因在 于? T 的物理意义并不 像 W绝 那 么明确 , 就使我们在熵 的学 习中产生一定 的困难 。 原 。 热 这
』
2 2 内能是热运 动和分 子势能之 和 , . 我们 可 以通 过从微 观 角度分 析做功 和热传 递过 程 , 为容 易理解 内 能的 较 微观本质 。例如 气体汽缸 中膨胀 , 分子碰 撞 活塞反 弹 回来 速度 变小 , 内能转化 为动能 。两物 体 接触 , 子 间碰 分
3 一般不能直接应用热力学第二定律 的普遍表述进行研究
热力学 第二定律 的普遍表述为 5 一s ≥ ? 2 。 : , 中不等式表示 一切 与热现象 有关 的实际上宏 观过 孚 其
程 是单向发展 的 , 即一切与热现象 有关的实际宏 观过 程都是朝熵 变大于热温 比积分 的方向发展 。 但是我们 一般不直接 应用热力学第二定 律的普遍 表述进行研究 , 因在于在 不可逆过 程 中, 原 系统所经历 的
Jn
T ; 内能是根 据 绝 热 过 程 的 功 只 与 过 程 的始 末 状 态有 关 与 过 程 的 路 径 无 关 的性 质 定 义 的 , — 一
』 Biblioteka 热 ¨。 由于功是 能量转化 的量 度 , 么 一 很 自然地被看作 能量 的变化 , 么 U就是 能量 , 那 那 是系 统的 内能 , 与 内能相 比较 , 我们 可 以模仿 内能的定义给 出熵 的定义 , 却不能像 内能那 样从宏 观定义式 上 可直接 给 出其物 理意
维普资讯
第2 6卷
第 1 期
《 新疆 师 范大 学 学 报 》 自然 科 学 版 ) (
J u n l f ij n o ma U ies y o r a o ni g N r l nv ri X a t
熵的讨论
再看类似重粒子下沉,脏水澄清的情况下的熵。只要假设重粒子在最下层即
可。实际上,还有此1重粒子伴随1个水分子同时在最下层的情况,我们暂且不考
虑。 我们将知道,即使只考虑一个重粒子在最下层的情况时, 这种情形的分布
可能性,也要比重粒子在最上层的情况,可能性或几率要大的多。
重粒子(2a)在最下层即1m处的不同能量分布形式下的微观态(粒子系统总能
的混乱程度;而是指粒子在一定外场势能分布条件下,在粗格化的“相空间 ”
--包括所有粒子的位置维度和动量维度的数学空间--中的分布的混乱程度。简单
地说,粒子在相空间中对称(或混乱)与否,不是只看粒子的位置分布,而且还要看
粒子的动量、能量分布状态。一个简单的例子是:一些在同一水平面上的空气分子,
形式的影响,包括势能。
熵在历史上有两种定义,一种是克劳修斯的热力学宏观定义,一种是波耳兹
曼的微观定义。这两种定义是协调的,没有矛盾。微观定义可以为宏观定义提供
几率解释。
我们先从宏观热力学上看脏水澄清系统的变化。脏水自然澄清时,比重大的
泥沙会下沉,这导致系统的重心下移。系统的总势能是这样计算的:系统重心的
引力与熵——澄清被一些民科弄混乱了的熵概念
作者:abada
常见民科和哲学家乃至某些科普书上说,熵,就是混乱程度的量度,一个系统越对称,就越混乱,
熵就越大。这无疑给了众多的不求甚解者以艺术般的幻想,以至于跨学科地误用
和错用熵概念的现象泛滥。
有个问题,即是很多物理学专业的学生,也常搞错。这个问题就是:一盆脏
有朝上和朝下的两种可能。于是,相空间(位置和动量空间)中, 总微观态数目, 比单纯考虑能量分布形式的微观态数目要多。计算方法是: 每1个能量分布态,
关于不可逆过程熵变的计算规律的探讨
关于不可逆过程熵变的计算规律的探讨1.1熵概念的引入1.1.1 “熵”的定义1854年克劳修斯[2]在《论热的动力理论的第二原理的另一形式》 论文中根据热力学第 定律和理想气体的状态方程得出: 他指出:对于可逆循环过程:〔空=0可逆dT对于不可逆循环过程:-dQ :: 0不可逆dT其中dQ 是系统从热力学温度为T 的热源中所吸收的热量[3]1865年在《关于热的动力理论的主要公式的各种应用上的方便的形式》一文中克劳 修斯提出了熵的概念[4]。
关于可逆过程,克劳修斯指出:“如果物体从任意一个初态开始 连续地经过任意的一系列状态又回到初态时,积分=0 dT那么积分号里的表示式 血 必定是一个量的全微分,这个量只与物体当时所处的状态有 dT关而与物体到达这个状态所经过的过程无关。
如果用 S 表示这个量,则可以规定:ds 二血”克劳修斯把他引入的这一新的函数 S 称为系统的熵,表示系统的‘转变含量 dT(transformation content)',以表示对热的转化程度的测度 ⑸。
由于S 是一个态函数,所以 dS 沿任意可逆过程的积分等于 S 的末态B 与初态A 之值的差,即:L S 二 S B - S A dQA 可逆T即对于任意一个过程总满足:=S 二 S B - S A其中,等号对应于可逆过程,不等号对应于不可逆过程。
在一切孤立系统中,物质与 外界的热交换不存在,即 dQ=O ,故有:在循环过程中发生的所有转化的等效值是积分dQ4—dT 如果是对于不可逆循环过程, 则可证明: j-S = S B - S A BfA 不可逆 dQs_o这就是著名的熵增加原理,也是热力学第二定律的定量的数学表达式,该式表明:对 于一个孤立系统而言,可逆过程则熵值不变,不可逆过程则熵要增加。
它的实质是阐明了 热力学系统的不可逆性,如热传递的不可逆性或功热转换的不可逆性等。
由此可见,熵是 热力学系统自发变化的一个宏观描述量。
关于《热学》中熵的探讨
关于《热学》中熵的探讨熵是《热学》中的重要概念,随着学科的相互交叉与渗透,熵概念已远超出物理学范畴,有重要的研究意义。
本文介绍熵知识并指出常见的克劳修斯熵、玻尔兹曼熵、信息熵及它们间的联系等。
样卷调查分析找出学生学习《热学》中熵时所遇的知识惑点和学习困难并提出相应的改善方法。
通过本文研究可为学生提供一个学习和研究熵问题的思路,使学生对熵的理解深化、对熵的了解视觉变宽广,并提高学生对熵问题的分析解决能力。
标签:热学熵克劳修斯熵玻尔兹曼熵信息熵一、引言熵概念在近百年前就被引入,物理学家如克劳修斯、玻尔兹曼等对熵理论的发展都曾有突出贡献[1]。
近些年来,熵的研究从物理学到化学、生物学......,还扩展到通信理论和社会经济领域等。
而今,熵依然是研究界的热点正日益渗透到科学技术和日常生活的许多领域。
国外主要有信息熵,生物熵,社会熵及相变熵[2] 研究等。
熵概念较抽象,很多学生理解起来困难、吃力。
本文通过样卷调查分析找出学生学习《热学》中熵时所遇的知识惑点和学习困难并提出相应的改善方法。
目前,对于《热学》中熵的讨论及熵在教与学方面的分析较缺乏,且《热学》教材中对熵知识的介绍有内容局限,因此本文的分析研究,无论是对于熵的知识深化和教学促动都有重要意义。
二、《热学》中熵的探讨1.熵的介绍宏观上讲,熵用来度量系统内不可逆过程中初、末两态差异,体现热力学过程进行的自发方向(熵增加原理);微观上说,熵本质是分子热运动混乱性的量度,系统混乱度越大,熵就越大,对于一个平衡态系统,其熵值最大;从玻耳兹曼熵的角度,熵是衡量系统的无序程度,若系统越无序其熵值越大;科学技术上,熵表征系统功能紊乱的程度。
2.常见的几种熵2.1克劳休斯熵熵概念是克劳休斯于1854年首先提出的[3],1865年克劳修斯据可逆卡诺循环用完全宏观的方法导出克劳休斯熵。
①由卡诺循环[4] 知:Q1为系统从高温热源所吸热,Q2为向低温热源所放热,Q1与Q2均为代数量,对于可逆卡诺循环,热温比Q/T代数和等于零。
高中物理热力学熵问题解析
高中物理热力学熵问题解析热力学熵问题在高中物理学习中是一个重要的考点,也是学生们普遍感到困惑的难点之一。
本文将通过具体的题目举例,分析熵的概念和计算方法,帮助高中学生更好地理解和解决熵相关的问题。
一、熵的概念和计算方法熵是热力学中一个重要的物理量,代表了系统的无序程度。
熵的计算方法可以通过以下公式得到:ΔS = Q/T其中,ΔS表示系统的熵变,Q表示系统吸收的热量,T表示系统的温度。
熵变的单位是焦耳/开尔文(J/K)。
例如,有一个系统吸收了100焦耳的热量,温度为300开尔文,那么系统的熵变可以计算为:ΔS = 100 J / 300 K = 0.33 J/K二、熵的应用举例1. 熵的增加与热传导假设有一个金属棒,一端放在火焰中受热,另一端放在冷水中冷却。
当金属棒从火焰一端传导热量到冷水一端时,系统的熵会发生变化。
根据熵的计算公式,可以得知热量的传导会导致系统的熵增加。
这个例子可以帮助学生理解熵与热传导的关系,以及熵增加的原因。
同时,还可以引导学生思考其他与熵增加相关的现象,如热传导导致的能量损失等。
2. 熵的增加与过程的不可逆性在自然界中,很多过程都是不可逆的,而熵的增加与过程的不可逆性有着密切的关系。
例如,一个气体从高压区域流向低压区域,系统的熵会增加。
这是因为气体分子从高压区域向低压区域运动是不可逆的,导致系统的无序程度增加。
通过这个例子,可以帮助学生理解熵与过程的不可逆性之间的联系。
同时,还可以引导学生思考其他与不可逆过程相关的现象,如摩擦、热传导等。
三、解题技巧和注意事项在解决熵相关的问题时,有一些常用的解题技巧和注意事项可以帮助学生提高解题效率和准确性。
1. 确定系统和周围的界限在计算熵变时,首先需要明确系统和周围的界限。
系统是指我们要研究的物体或物质,周围是指与系统发生能量交换的其他物体或物质。
明确界限有助于准确计算系统的热量和温度。
2. 注意热量的正负在计算熵变时,需要注意热量的正负。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
( 6)
( 7) , m ), 在计算中, 需要不断对这组
原文作者注意到, 直到最近, 还有一些人声称在使用上述两个光滑函数时, 遇到了所谓的指数计算 溢出 问题; 同时, 还有人 (如文 [ 3] ) 专门就这一问题进行研究, 但所给出的计算公式却过于繁复。其 实, 只要做适当变换即可完全避免这个问题, 本文给出了克服溢出应该使用的变换, 细心的读者不难发现, 是 p ( x )和 p ( x, u )中含有的对数运算, 才使这种等价变换成为可能。
关于函数 p ( x, u ), 文 [ 5] 给出了一个与文 [ 2] 完全一样的光滑函数, 并将其称为 调节 熵函数, 而其
中所含的参数 u 被称为调节因子。这种叫法模糊了这组参数作为原问题拉格朗日乘子的既定含义, 容易 使读者产生误解。其实早在 70年代就由 B ertsekas[ 6] 利用近似思想给出了这个光滑函数, 并进而发展了增 广 L agrangian函数法 [ 7] 。他是在乘子法的基础上并引进近似方法导出这个函数的, 但其推导过程远不如 文 [ 2] 的熵正则化方法来得简洁明了。由于他的推导完全基于乘子法的思想, 所以对函数表达式里所含的 参数 u, 自然地享有了拉格朗日乘子的地位。近年, 有的文献 [ 8] 声称, 只要令该函数所含乘子 u 的所有分 量为 1, 则 p ( x, u )就化为了函数 p (x ), 从而把后者说成前者的一个特殊情况。首先, 作为拉格朗日乘子 的这组参数 u, 并非是主观上可以随意赋值的权系数。更重要的是, 由于这种认识掩盖了函数 p ( x, u )所 固有的深刻内涵, 对二者使用上造成不利影响。如文 [ 5], 该文前后矛盾, 开始时放弃了参数 u 作为拉格 朗日乘子的地位, 后来又以大片篇幅分析了引进这组乘子对减少病态带来的好处。
( 16)
ul exp[ pgl ( x ) ]
l= 1
ul exp[ p ( gl ( x ) - ) ]
l= 1
上面两个公式分别和公式 ( 4)与 ( 6)等价, 因为减掉大数产生的附加项恰好是分子和分母的公因数, 所以
上述处理在避免计算溢出的同时根本不会对计算结果产生任何影响。
2 函数 p (x )与 p ( x, u)的对比分析
m
, i= 1, 2,
ul exp[ pgl ( x ) ]
l= 1
将其代入 ( 2)式消去 , 而导出另一个光滑函数
m
p ( x,
u) =
1 p
ln
i= 1
ui exp( pgi ( x ) )
该函数与凝聚函数 p ( x )比较, 多出来一组额外的参数 ui ( i= 1, 2,
参数进行修正。
,m
下的优化问题 (D )
m axx ) -
1m p i= 1
i In i
( 2)
收稿日期: 2008-08- 02 基金项目: 国家自然科学基金资助项目 ( 10572031) 作者简介: 张丽丽 ( 1982-) , 女, 博士研究生; 李兴斯 ( 1942-) , 男, 教授, 博士生导师
第 3期
张丽丽, 等: 关于熵函数法中的几个问题
75
m
式中
Rm
0, i= 1 i = 1
( 3)
可以得到对偶变量 为
i(x ) =
exp[ pgi ( x ) ]
m
, i = 1, 2,
,m
( 4)
exp[ pgl ( x ) ]
l= 1
将其代入 ( 2)式消去 , 即得到了被称为 凝聚函数 的光滑函数
摘 要: 本文就熵函数法中的几个问题进行了讨论。首先, 就该方法中涉及的指数计算溢出问题, 给出了可 以完
全避免计算机溢出的等 价变换。接着就两个光滑函数 p ( x ) 与 p ( x, u )的不 同特点进行 了详细分 析, 并指 出了 不正确使用可能陷入的 计算误区, 藉以纠正文献中将二者混为一谈的错误。
( 12)
这样, 再大的参数 p 也不会造成溢出了。在迭代过程的每一步, 都需利用上述变换, 来避免函数值计算中
的计算机溢出问题。
函数 p (x )和 p ( x, u )的梯度 p ( x )和 p ( x, u )分别为
m
p (x) =
i ( x ) gi ( x )
i= 1
( 13)
m
p (x, u) =
0 引言
极大极小问题特别是极大值形式的函数, 是各类数值分析和优化问题中经常遇到的一种特殊的不可 微函数。文 [ 1] 针对有限极大极小问题 (P )
m in ( x )
m ax
1 im
{
gi
(
x
)
}
( 1)
利用最大熵原理的思想, 在问题 (P )的拉格朗日函数上引进 Shannon的信息熵函数作为正则项, 通过解如
)]
( 9)
对于在指数中减去的大数 , 可取
m ax
1 im
{g
i
(
x
)
}
( 10)
其中 x 代表变量 x 的当前值。而实际应用中, 为便于计算, 一般取
=
m ax
1 im
{
gi
(x
)
}。
通过上述变换, 所有的指数均会满足
gi ( x ) - 0, i= 1, 2, , m
( 11)
从而有
exp[ p ( gi (x ) - ) ] 1, i= 1, 2, , m
i ( x, u ) gi ( x )
i= 1
( 14)
式中的 i ( x )和 i ( x, u )分别由公式 ( 4)与 ( 6)给出, 在梯度的计算里涉及到了指数计算, 但为防止溢出,
同样可在指数中减掉一个由公式建议的大数 , 从而得到如下等价的计算公式
i(x) =
exp[ pgi ( x ) ]
不等式问题中, 常用它作为光滑化函数, 其中的参数 p 起着光滑化参数或连续化参数的作用。
在文 [ 2] 里, 作者用 Kullback-L eibler的相对熵 (也称为叉熵 ) 函数代替 ( 2) 式里的 Shannon熵函数, 解
得对偶变量 为
i (x, u) =
ui exp[ pgi ( x ) ]
Abstract: Som e argum ents about the en trop ic m e thod are g iven in th is paper. F irst ly, an equ iva lent transfo rm at ion to avo id the overflow of exponen tial ca lculat ion in the entrop ic m ethod is g iven. T hen a detailed ana lysis of the d ifferences betw een the tw o sm oothing funct ions p ( x ) and p (x, u) is presented, in order to avo id the confusion betw een these tw o funct ions. Based on the analysis the potent ial m istakes that are caused by the m isuses are proposed. K ey words: operations research; m in im ax problem; entropic regularization m ethod, no-differentiab le opt im izat ion
76
运 筹与 管理
2009年第 18卷
p(x) =
1 ln m
p
i= 1
exp( pgi ( x ) ) =
+
1 p
ln
m i= 1
exp[ p (gi ( x ) -
)]
( 8)
p ( x,
u) =
1 p
ln
m i= 1
ui exp(pgi (x ) ) =
+
1 p
ln
m i= 1
ui exp[ p ( gi (x ) -
p
( 4) 凸性: 若所有的问题函数 gi ( x ), i= 1, 2,
, m, 都是凸函数, 则 p ( x )也是凸函数。
由于函数 p ( x )具有的上述性质, 特别是由这些性质显示出的该函数在整个 R n 空间内一致逼近极大 值函数 ( x )的性质, 使其在各类优化问题的数值求解中获得了广泛应用, 尤其最近几年, 在解互补和变分
关键词: 运筹学; 极大极小问题; 熵正则化方法; 不可微优化
中图分类号: O 174
文章标识码: A
文章编号: 1007-3221( 2009) 03-0074-04
Som e N otes on the EntropicM ethod
ZHANG L -i li1, 2, ZHANG Pe-i a i3, L I X ing-si1, 2 ( 1. D epartm ent of A pp lied M athem atics, Dalian Un iversity of T echnology, Dalian 116023, China; 2. S ta te K ey Laboratory of S tructural Analy sis for Industrial Equipm en t, Departm ent of Engineering M echanics, Dalian University of T echnology, Dalian 116023, China; 3. Departm ent of M athem atics, Inf orm ation T echnical College, J inan University, Guangzhou 510632, China )