区间型数据排序方法及其比较

合集下载

带概率分布区间数的比较及其应用

带概率分布区间数的比较及其应用

对 于 同一 个 区 间数 A — E , , 果 某 2 决 策 方 案 的综 合 评 价 值 在 A上 的 随机 分 布 函数 不 同 , 么有 理 由认 为 这 2 a ]如 个 那 个
方 案 也 不 等价 .
例 1 设 2 决 策 方 案 A与 B的 综 合 评 价 值 都 在 区 间E ,O 取值 , 中方 案 A在 [ ,o 上 服从 “ 尾 ” 正 态 分布 个 o l]上 其 O 1] 截 的
序关 系来 对 区 间 数 进 行排 序 ; 有 一 类是 在假 定 区 间 数 的综 合 评 价 值 在 区 间 上 服 从 均 匀 分 布 随 机 取 值 的前 提 下 来 比 较 区 还 间数 的大 小 . 3 方 法 应 用 起 来 比较 简 便 , 也 因 其 “ 便 ”而 丢 失 了许 多 可用 的决 策 信 息 , 能 会 导 致 决 策 环 境 失 真 , 这 类 但 简 可 影 响决 策 后 果 的 准 确 性 .l L 事实 上, 在实 际 的决 策 问题 中 , 间数 的综 合 评 价 值 在 区间 上 往 往 不 是 服 从均 匀分 布 , 是 服 从 正 态 分 布 、 指 数 分 布 、 区 而 负 爱 尔 朗 分 布 等非 均 匀 分 布 , 因此 有 必 要 要 求 信 息 收 集 者 进 一 步 提 供各 区 间 数 的综 合 评 价 值 在 该 区 间上 的概 率 分 布 情 况 .
在 决 策 分 析 过 程 中 , 以认 为 每 个 区 间数 A — V ,]都 是 一 个 随 机 区 间 , 决 策 方 案 的综 合 评 价 值 是 客 观 存 在 于 区 间 可 an 而
[ ,]内 的定 值 . nn
目前 对 于 区 间数 的 比较 方 法 大 致 有 以下 3类 : 类 是 以 区 间 数 的 中 间 值 的排 序 来 代 替 区 间数 的 排 序 ; 类 是 应 用 模 糊 一 一

数据排序的方法

数据排序的方法

数据排序的方法
1. 冒泡排序:通过多次遍历数组,依次比较相邻的两个元素并交换位置,将最大(或最小)的元素逐渐冒泡至数组的一端。

2. 插入排序:将数组分为已排序和未排序两部分,依次将未排序部分的元素插入到
已排序部分的合适位置,使得已排序部分一直保持有序。

3. 选择排序:每次从未排序部分选出最大(或最小)的元素,放到已排序部分的末尾,直到未排序部分为空。

4. 归并排序:将数组分为若干个小部分,对每个小部分进行排序,然后再合并这些
有序小部分,直至整个数组有序。

5. 快速排序:通过选择一个基准元素,将数组分为小于基准和大于基准的两部分,
然后递归对这两部分进行排序。

6. 堆排序:将数组看作是一个完全二叉树,通过调整树的结构使得每个节点的值都
大于等于其子节点(大顶堆)或小于等于其子节点(小顶堆),然后逐个取出根节点得到
排序结果。

7. 希尔排序:对数组进行间隔分组,对每个分组进行插入排序,然后逐渐缩小间隔
直至1,最终进行一次插入排序。

8. 计数排序:统计数组中每个元素出现的次数,然后根据元素值的顺序将元素依次
放入结果数组。

9. 桶排序:将数组划分为若干个桶,根据元素的大小把元素放入相应的桶中,然后
再对每个桶中的元素进行排序,最后将所有桶中的元素依次放入结果数组。

10. 基数排序:按照元素的每一位进行排序,从低位到高位逐步稳定。

这些排序方法有各自的优缺点,适用于不同的数据特点和应用场景。

在实际应用中需
要根据具体情况选择合适的排序方法。

数字的顺序比较和排序数字

数字的顺序比较和排序数字

数字的顺序比较和排序数字在我们的日常生活中,数字无处不在。

无论是购物、工作、学习还是娱乐,我们都需要对数字进行比较和排序。

了解如何进行数字的顺序比较和排序是非常重要的,因为它有助于我们更好地组织和管理数据。

本文将介绍数字的顺序比较和排序的方法。

一、顺序比较数字顺序比较数字是指根据数字的大小进行比较,判断它们的先后顺序。

比较数字的方法有以下几种:1. 使用不等式进行比较:最常见的方法是使用大于(>)、小于(<)、大于等于(≥)和小于等于(≤)等符号进行比较。

例如,如果有两个数字a和b,我们可以通过比较a和b的大小来确定它们的顺序关系。

如果a大于b,则a排在b的后面;如果a小于b,则a排在b的前面。

2. 使用计数方法进行比较:另一种比较数字的方法是使用计数方法,将数字转化为计数单位,然后根据计数单位的大小进行比较。

例如,如果有两个数字a和b,我们可以将它们转化为相应的计数单位,如百、千或万,然后比较它们的大小。

例如,如果a表示100,b表示1000,那么b排在a的后面。

3. 使用排序算法进行比较:如果有多个数字需要比较,我们可以使用排序算法将它们按照一定的规则进行排序。

常见的排序算法有冒泡排序、插入排序、选择排序和快速排序等。

这些排序算法会根据定义的排序规则对数字进行比较和交换,最终将数字按照顺序排列。

二、排序数字排序数字是指将一组数字按照一定的规则进行排列,以便更好地组织和管理数据。

常见的排序方法有以下几种:1. 冒泡排序:冒泡排序是一种简单而常用的排序方法。

它通过重复比较相邻的两个数字,并根据定义的排序规则交换它们的位置,从而逐渐将最大(或最小)的数字“冒泡”到序列的末尾(或开头)。

冒泡排序的时间复杂度为O(n^2),其中n为待排序数字的个数。

2. 插入排序:插入排序是一种适用于小型数据集的排序方法。

它通过将数字逐个插入到已经排好序的序列中,从而逐步构建有序序列。

插入排序的时间复杂度为O(n^2)。

区间数的几何平均排序函数及其应用

区间数的几何平均排序函数及其应用
第 2 卷 第 6 6 期
2 1 年 1 月 01 1
内蒙古民族大学学报( 自然科学版 )
J un lo n e n oi ies y fr Nain lis o r a fI n rMo gl Unv ri o t aie a t o t
V0 .6 No6 1 2 . NO .O V2 1 1
性质 21 设 Va 6∈, R ) , . , ( + 则
( ) jA ∈ [ , ], 1若 0 1 使得 ( )= ( ) 且0 a :b b 则 0 6 Ⅱ b , / 一 / 一, = ;
( _㈩1- ) 州 : 2 G (+ , A{ ) ^ nl 且 。 .
() 1U+b= [ 一 一口 +b ] ;2a U +b , ()b: [ — 一a ;3ab: [一 b , b ] ; U b, b ] () / U / U / 一 ()a= [。 , ; 4k 一 o] () = [a ) ( . 5 (一 ,U )]
0≤ A 0 7 6 时 , ^ 。 .5 有G ( )s ^ 6 ; G ( ) 当A =0 7 6 时 , 口 .5 G ( )=G ( ) . ^b
注 : 1若Ⅱ ( ) 一=b =0 , <b 规定 a b 一 且口 , <; ( ) a 06 0 规 定 a b 2 若 = ,> , 一 <; ( ) 。= ,> , 3 若 一0b 0 规定 当Ⅱ 时 ,< ; Ⅱ> 一 s b a b 当 时 ,> . ab
如果U 一=b 且 口 一 =b 则称 a 6 , 与 相等 , 记为 a b =.
基金项 目: 内蒙古 自 然科学基金资助项 目(0 0 S 19 21M 01 ) 作者简介 : 赵慧冬 , 内蒙古 民族大学数学学 院在读硕士研究生

将数组内给定范围排序的方法

将数组内给定范围排序的方法

将数组内给定范围排序的方法
当你需要对数组中一定范围内的数据进行排序时,以下是一些常见的方法:
1. 冒泡排序法:比较数组中相邻元素的大小,将较大或较小的元素交换位置,重复进行直到排序完成。

可以通过设置循环范围来实现对指定范围内的数据进行排序。

2. 快速排序法:将数组分为两个子序列,一个小于基准值,一个大于基准值,分别对子序列进行递归排序。

同样可以通过设置递归范围来实现对指定范围内的数据进行排序。

3. 插入排序法:将未排序的元素插入已排序的部分中,依次比较并移动元素位置,找到插入位置。

可以通过设置遍历范围来实现对指定范围内的数据进行排序。

4. 选择排序法:从未排序的数据中找到最小或最大的元素,放到已排序的末尾,重复进行直到排序完成。

同样可以通过设置遍历范围来实现对指定范围内的数据进行排序。

无论使用哪种方法,对指定范围内的数据进行排序都需要确定排序的起始点和结束点,以及排序的方向(升序或降序)。

在实现排序算法时,还需要考虑到数组越界等问题,以确保程序的健壮性和正确性。

- 1 -。

数字的大小比较及排序方法

数字的大小比较及排序方法

数字的大小比较及排序方法在数学和计算机领域,比较和排序是常见的操作。

当我们面对一系列数字时,我们需要进行比较以确定数字的大小关系,然后可能需要将它们按照一定的顺序进行排序。

本文将探讨数字的大小比较方法以及常用的排序算法。

一、数字的大小比较方法在进行数字比较时,我们可以使用以下几种方法:1. 直接比较法:直接比较数字的大小是最简单直接的方法。

例如,当我们比较两个数字a和b时,我们可以使用如下表达式:a >b :表示a大于ba <b :表示a小于ba =b :表示a等于b2. 绝对值比较法:有时我们不仅需要比较数字的大小关系,还需要考虑数字的正负情况。

此时,我们可以使用绝对值进行比较。

例如,当我们比较两个数字a和b的大小时,我们可以比较它们的绝对值 |a| 和 |b|,并按照绝对值的大小关系得出结果。

3. 比较符号法:除了使用比较运算符进行比较外,我们还可以使用比较符号进行数字的大小比较。

常用的比较符号包括“>”(大于)、“<”(小于)、“=”(等于)、“≥”(大于等于)和“≤”(小于等于)。

二、数字的排序方法当我们有一系列数字需要排序时,我们可以使用下列排序算法:1. 冒泡排序法:冒泡排序法是最简单的排序算法之一。

它通过反复比较相邻两个数字的大小,并根据需要交换它们的位置,直到所有数字按照指定的顺序排列。

冒泡排序法的时间复杂度为O(n^2)。

2. 插入排序法:插入排序法通过将数字逐个插入到已排好序的数字序列中,完成排序。

插入排序法的时间复杂度为O(n^2),但在实际应用中经常比其他排序算法更快。

3. 快速排序法:快速排序法是一种分治排序算法。

它通过选择一个枢纽元素,将序列划分为左右两个子序列,并对子序列进行递归排序,最终完成整个序列的排序。

快速排序法的时间复杂度为O(nlogn),但在极端情况下可能达到O(n^2)。

4. 归并排序法:归并排序法也是一种分治排序算法。

它将序列递归地划分为较小的子序列,然后将子序列合并为一个有序序列,直到整个序列有序。

数据表的比较与排序

数据表的比较与排序

数据表的比较与排序数据表的比较和排序是数据分析和处理过程中常见的操作。

通过对数据表中的不同字段进行比较和排序,我们可以得到有关数据的重要见解,并使数据更易于理解和使用。

本文将介绍数据表的比较和排序方法,并探讨其在实际应用中的重要性和效果。

一、数据表的比较方法在数据表的比较过程中,我们通常关注不同字段之间的比较。

以下是几种常见的数据表比较方法:1. 数值比较:对于包含数值类型字段的数据表,我们可以通过对这些字段进行大小比较来得到有关数据的排序和相关信息。

例如,我们可以比较销售额字段,以了解不同产品之间的销售情况。

2. 字符串比较:对于包含字符串类型字段的数据表,我们可以使用字符串比较方法来对字段进行排序和筛选。

例如,我们可以比较产品名称字段,以便按字母顺序对产品进行排序。

3. 日期比较:对于包含日期类型字段的数据表,我们可以通过比较日期字段来了解时间上的先后顺序和趋势。

例如,我们可以比较订单日期字段,以便按照时间顺序对订单进行排序。

4. 多字段比较:在某些情况下,我们需要同时对多个字段进行比较以得到更准确的排序和筛选结果。

比如,我们可以比较销售额和销售数量字段,以了解产品的销售状况,并找出销售额最高的产品。

二、数据表的排序方法数据表的排序是指按照某个字段的规则对数据进行排列的过程。

以下是几种常见的数据表排序方法:1. 升序排序:按照字段的大小或者字母顺序从小到大排列数据。

升序排序可以帮助我们找到最小值或者最早的日期。

例如,我们可以按照销售额字段进行升序排序,以找到销售额最低的产品。

2. 降序排序:按照字段的大小或者字母顺序从大到小排列数据。

降序排序可以帮助我们找到最大值或者最晚的日期。

例如,我们可以按照销售额字段进行降序排序,以找到销售额最高的产品。

3. 多字段排序:在某些情况下,我们需要根据多个字段的规则对数据进行排序。

例如,我们可以先按照销售额字段进行降序排序,然后再按照销售数量字段进行降序排序,以找到销售额和销售数量同时很高的产品。

一种区间数多属性决策方法在经济评价中的应用

一种区间数多属性决策方法在经济评价中的应用

一种区间数多属性决策方法在经济评价中的应用屈文阁【摘要】研究了区间数多属性决策问题,利用区间数运算法则获得加权规范化矩阵.基于投影对TOPSIS法进行改进,通过各方案与理想解的相对贴近度进行方案排序或择优.并将方法应用于经济评价中,提高了决策的准确性和效率.结果表明:算例验证了该方法的可行性和有效性且具有操作简便和易于上机实现的特点.【期刊名称】《甘肃科学学报》【年(卷),期】2013(025)004【总页数】4页(P152-155)【关键词】区间数多属性决策;TOPSIS法;相对贴近度;排序【作者】屈文阁【作者单位】陕西理工学院人事处,陕西汉中723000【正文语种】中文【中图分类】C934由于客观事物的复杂性、不确定性以及人们认识的模糊性,人们所给出的决策信息由于估计不精确而以区间的形式出现.于是,决策信息为区间数的多属性决策问题的求解便成为当今决策界所研究的热点[1-20].目前,有关属性权重信息确知[1-6]或未知[7-13]的区间数多属性决策已取得了丰富的成果.关于属性权重部分确知且属性值为区间数的多属性决策问题研究也取得了一定的进展[2,14-20],分别提出了可能度法[2]、投影法[2]、线性规划法[2,14]、TOPSIS法[15-16]、相对隶属度法[17]、关联度法[18]、信息算子集结法[19-21]等.以下针对区间数多属性决策问题,利用区间数乘法法则获得加权规范化矩阵.基于向量投影概念对TOPSIS法进行改进,由各方案与理想解的投影定义了相对贴近度,并以此进行方案排序或择优,提出了基于投影的相对贴近度法.与相对隶属度法比较可知该方法具有操作简单、易于运算的特点.并将方法应用于经济评价中验证方法的可行性和有效性.1 预备知识定义1 设,则称˜a为一个区间数.特别地,当时,˜a退化为一实数[2].定义2 设区间数,则称为区间数与的距离[10].区间数多属性决策问题的基本模型可以描述为:设为方案集,}为属性集为权重向量,其中.记.对于方案xj,按第i个属性si进行测量得到xj关于si的属性值为区间数从而构成属性决策矩阵.最常见的属性类型一般分为效益型和成本型[2].2 基于投影的相对贴近度法步骤1 确定规范化决策矩阵.一般而言,不同的评价属性往往具有不同的物理量纲和量纲单位,为了消除不同量纲和量纲单位带来的不可公度性,决策之前应将属性进行无量纲和规范化处理.为此,根据评价属性的类型,利用文献[2]属性规范化公式将˜A转为规范化决策矩阵其中步骤2 计算加权规范化决策矩阵.由区间数的乘积运算法则[2],可得加权规范化决策矩阵,其中:步骤3 确定正负理想解.定义3 设称为理想解(最优方案),为负理想解(最劣方案)[15-17].步骤4 计算方案xj(j∈N)与正理想解和负理想解的投影为步骤5 计算各方案的相对贴近度:步骤6 方案排序.由向量投影定义易知,由于越大,方案xj越接近理想解,而越小,方案xj越远离负理想解,故方案的优劣的排序即为λj,j∈N由大到小的排序.3 与相对隶属度法的比较若在上述方法中的步骤3之后进行下列步骤,则是基于模糊数学的相对隶属度法[17].步骤4 计算方案xj与理想解和负理想解的欧氏距离:步骤5 计算各方案的相对隶属度μj.由于理想解和负理想解事实上不一定存在.为此,方案的择优就是在方案集X中选取使其尽可能地接近正理想解,同时尽可能地远离负理想解.设方案xj相对于正理想解的相对隶属度为λj(0≤λj≤1),则方案xj与负理想解的相对隶属度为1-λj.从而方案的优劣的排序即为λj由大到小的排序.因此,可建立如下列二次规划模型:令得步骤6 方案排序.根据μj(j=1,2,…,n)的大小,对相应的方案进行排序择优,μj取值越大,方案越优.由上述步骤看到,相对贴近度法仅仅计算各方案的加权属性值在正负理想解的投影便易得到方案排序.而相对隶属度法不但要计算各方案与正负理想解的距离,而且还要计较为复杂的隶属度使得运算量较大.同时相对贴近度法具有更好的几何意义. 基于上述讨论,下面通过某银行投资决策问题说明方法的有效性.4 实例分析2009年西安市某商业银行拟定了4个投资方案xj(j=1,2,3,4),评价方案的主要指标为:投资额(s1);期望净现值(s2);风险盈利值(s3);风险损失值(s4).显然,s2 与s3 为效益型属性,s1 与s4 为成本型属性.各方案的属性值及属性权重˜ωi(i=1,2,3,4)信息列于表1.表1 原始决策矩阵˜A和权重信息万元si˜ωix1x2x3x4 s1 [0.25,0.45] [5,7] [10,11] [5,6] [9,11]s2 [0.12,0.15] [4,5] [6,7] [4,5] [5,6]s3 [0.24,0.35] [4,6] [5,6] [3,4] [5,7]s4 [0.18,0.36] [0.4,0.6] [1.5,2] [0.4,0.7] [1.3,1.5]确定最佳投资方案:步骤1 根据规范化公式[2]由表1可得到规范化决策矩阵˜R为步骤2 由公式(1)得加权的规范化决策矩阵为步骤3 由公式(2)、(3)得正理想解和负理想解为步骤4 利用公式(4)~(6)可计算解得相对贴近度为从而银行的投资方案排序为x1>x3>x4>x2,即最佳方案为x1.5 结语针对区间数多属性决策问题,提出了一种基于相对贴近度的决策方法并应用于经济评价中.该方法主要包括两部分内容:一方面,利用区间数的运算法则,避免了属性权重确定,减少了决策信息的损失,从而提高了决策的准确性.另一方面,对传统基于欧式距离或城市街区距离的TOPSIS法进行拓展,利用相对贴近度对方案排序,从而避免了区间数的比较,同时相对于基于可能度[2]、相对隶属度[17]、关联度[18]、信息算子集结的排序法,减少了运算,提高了决策的效率.【相关文献】[1]Hwang C L,Yoon K.Multiple Attribute Decision Making[M].Berlin:Spring-Verlag,1981.[2]徐泽水.不确定多属性决策方法及应用[M].北京:华大学出版社,2004.[3]熊文涛,刘三阳,史加荣.不确定性多属性决策的一种新方法[J].系统工程与电子技术,2005,27(5):841-843.[4]许叶军,达庆利.一种不确定型 OWGA算子及其在决策中的应用[J].系统工程与电子技术,2005,27(6):1 038-1 040.[5]徐泽水.拓展的C-OWA算子及其在不确定多属性决策中的应用[J].系统工程理论与实践,2005,25(11):7-13.[6]万树平.区间型多属性决策的夹角度量法[J].计算机工程与应用,2009,45(26):204-205.[7]许叶军,达庆利.不确定型多属性决策的权系数确定及其应用[J].系统工程理论方法应用,2005,15(5):434-436.[8]姚升保,岳超源.基于综合赋权的风险型多属性决策方法[J].系统工程与电子技术,2005,27(12):2 047-2 050.[9]周文坤.一种不确定型多属性决策的组合方法[J].系统工程,2006,24(2):96-100.[10]周宏安,刘三阳.基于二次规划与相对优势度的不确定多属性决策法[J].系统工程与电子技术,2007,29(4):559-562.[11]刘培德,关忠良.属性权重未知的连续风险型多属性决策研究[J].系统工程与电子技术,2009,31(9):2 133-2 136.[12]刘健,刘思峰,周献中,等.基于相似关系的多属性决策问题研究[J].系统工程与电子技术,2011,33(6):1 069-1 072.[13]刘健,刘思峰,周献中,等.多属性决策决问题的满意度与赋权研究[J].中国管理科学,2011,19(6):126-132.[14]刘健,刘思峰,吴顺祥.基于优势关系的多属性决策对象排序研究[J].控制与决策,2012,27(6):632-635.[15]Bryson N,Mobolurin A.An Action Learning Evaluation for Multiple Criteria Decision Making Problems[J].European Journal of Operational Research,1996,96(3):379-386.[16]张吉军,刘家才.区间数多指标决策问题的的决策方法研究[J].预测,2002,21(1):73-75.[17]樊治平,尤天惠,张尧.属性权重信息不完全的区间数多属性决策方法[J].东北大学学报:自然科学版,2005,26(8):798-800.[18]刘华文,姚炳学.区间数多指标决策的相对隶属度法[J].系统工程与电子技术,2004,26(8):1 060-1 064.[19]卫贵武.权重信息不完全的区间数多属性决策 GRA方法[J].系统工程与电子技术,2006,28(12):1 834-1 836.[20]王坚强,任剑.基于 WC-OWA算子的随机多准则决策方法[J].控制与决策,2007,22(12):1 429-1 432.[21]周宏安,刘三阳,房向荣.基于拓展C-OWGA算子的区间数多属性群决策方法[J].西北大学学报:自然科学版,2007,26(8):798-800.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

区间型数据排序方法及其比较
徐欣 信息系统工程重点实验室,南京 210007
张桂林 信息系统工程重点实验室,南京 210007
摘要:本文针对排序任务,总结了几种比较常用的区间型数据排序方法,并对其进行了比较和归纳。

优先排序法、左边界和右边界排序法可以看作区间中心和区间长度排序法的特殊情况。

1、背景介绍
由于客观事物的复杂性和不确定性,以及人类认识的模糊性,目标类型的特征指标测量不到精确的数值。

在许多实际应用中 [1,2],数据点(数据对象)是被粗略描绘的,而不再局限于传统的数据结构,如连续型、离散型(枚举型)和序数型。

区间型数据就是其中一类更为复杂的表达某种不确定性的变量结构。

在符号数据分析(symbolic data analysis )中,变量就可以是区间型的。

比如,其变量可以是用信任区间所表示。

采集微阵列数据的时候,由于实验条件有很多的干扰因素,相同的实验通常有一些重复数据。

这就使得我们可以用包含相关重复数据的最小超矩阵(hyper-rectangle )来描述。

再如,我们可以用最低和最高温度组成的区间来表示某一天的温度。

在数学上,这些不确定区间可以表示为一个名义数据矩阵(nominal data matrix )和一个同样大小的表示相应标准化误差和界限的矩阵来表示。

这就是所谓的数据的区间型矩阵模型(interval matrix model )。

2、常用区间型数据的排序方法
在实践应用中,如基于区间型数据来构建决策树构建[2],区间型解释变量必须首先进行排序,不然难以运用,如运用KS 准则和Gini 准则构建决策树。

目前,区间型数据的排序方法并不存在一个确定的规范和标准。

关于区间型数据的定义以及表示的有关方法如下。

假设Ω是所有样本的集合,w 是Ω中的样本。

我们把变量Ω∈∀=w w Y ],,[)(βα称为一个区间型变量,其中α和β是两个实数,并且βα≤。

也就是说,每个样本在Y 变量上是一个实数的闭合区间。

我们可以用
)](),([x r x l x =来表示这样的一个区间,
其中l 表示左边界,r 表示右边界,并且)()(x r x l ≤。

区间型数据的排序方法主要有下面几种。

(1) 优先排序法
区间型数据的比较具有反自反性和传递性。

假设有两个区间)](),([x r x l x =和)](),([y r y l y =,若x=y 则意味着)()(y l x l =,并且)()(y r x r =。

一些学者认为,当且仅当)()(y l x r <的时候,x<y (x 在y 的前面);同理,当且仅当)()(x l y r <的时候,x>y (x 在y 的后面)。

对于有相交部分的区间x 和y ,文献[3]提出了“优先”(preference )概念。

该文作者定义了三种二元关系:P (严格优先,strict preference )、Q (弱优先,weak preference )和I (无
优先,indifference)。

对于一个有限的区间型数据集合A,文献[3]定义了对A内的元素x和y进行优先比较的必要和充分条件:如果一个区间x完全在另一区间y的右侧,即
l
(x
y
r ,我们说x获得严格优先P;如果区间x完全被包含在区间y之内,我们说x )
)
(
获得无优先I;如果区间x在区间y的右边,但是x和y的交集不为空,我们称x获得弱优先Q。

图1给出了区间型比较中,x<y,或者说x相对y获得严格优先的一个例子。

这里,x和y分别表示一个时间区间变量,而区间x在区间y开始之前就已经结束了。

图 1 区间型数据比较x<y
(2)左边界和右边界排序法
对于没有相交部分的区间型元素,根据文献[3]和其他文献中提出的上述原则,我们能够严格确定区间型集合A内所有元素之间的顺序。

然而,如果集合A的元素之间存在相交关系,我们则不能对集合A中的元素严格确定一个顺序。

因为这个原因,文献[2]并没有完全赞同以上介绍的区间型数据比较方法。

文献[2]给出了一个严格确定区间型数据集合A内所有元素顺序的方法。

运用该方法的排序准则具备反自反性和传递性。

具体包括两个方案,根据左边界排序和根据右边界排序。

a.根据左边界排序
如果区间x和y的左边界的位置是不相同的,则x和y的先后顺序取决于它们左边界的位置;如果区间x和y的左边界的位置相同,则x和y的先后顺序取决于它们右边界的位置。

表达式xIy表示区间x“几乎”在区间y的前面,也就是说,区间x中至少有一个数值是小于等于区间y中的任何数值的。

b.根据右边界排序
如果区间x和y的右边界的位置是不相同的,则x和y的先后顺序取决于它们右边界的位置;如果区间x和y的右边界的位置相同,则x和y的先后顺序取决于它们左边界的位置。

表达式xSy表示区间x“几乎”在区间y的后面,也就是说,区间x中至少有一个数值是大于等于区间y中的任何数值的。

图 2 xIy并且xSy的例子
图2的例子中,区间y被完全包含在区间x的内部,根据关系I,区间x“几乎”在区间y的前面,即xIy;根据关系S,区间x“几乎”在区间y的后面,即xSy。

一般来说,如果区间x“几乎”在区间y的前面,则我们也可能得出‘区间y“几乎”在区间x的后面’的结论。

I和S的关系主要取决于这些区间是否互相包含。

使用者应该根据数据的特点和实际用途,来确定所使用区间型数据排序方法。

(3) 区间中心和区间长度排序法
最简单的区间型数据的比较方法是根据区间的中心值(期望值)和区间长度进行排序。

每个区间的中心值(期望值)和区间长度计算如公式2)()(x r x l center +=

1)和)()(_x l x r length span -= (2)所示: 2
)()(x r x l center += (1) )()(_x l x r length span -= (2)
例如,区间型数据可以根据区间中心值的大小进行排序;如果中心值相同,则可以根据区间长度推算左右边界值,进而应用方法(1)和(2)判断。

3、总结
以上三种方法中,我们认为区间中心和区间长度排序法是最直观和系统的。

理由是,由区间的中心值和区间长度,我们可以推断出区间的左边界值、右边界值,进而可以判断区间之间的严格优先、弱优先和无优先关系,并运用左边界和右边界排序法判断。

优先排序法、左边界和右边界排序法可以看作区间中心和区间长度排序法的特殊情况。

1 Robust Classification with Interval Data ,Laurent El Ghaoui ,Gert R.G. Lanckriet and Georges Natsoulis ,Report ,UCB/CSD-03-1279,2003。

2 Cherif Mballo and Edwin Diday, Decision trees on interval valued variables, the Electronic Journal of Symbolic Data Analysis, Vol. 3, 2005。

3 TSOUKIAS, A.,THE, N. A.,Numerical representation of PQI interval orders ,LAMSADE Universite Paris Dauphine ,2001,184, 1-27。

相关文档
最新文档