模式识别中的特征提取研究
机械振动信号的特征提取与模式识别

机械振动信号的特征提取与模式识别机械振动信号在工业领域中具有重要的应用价值,可以用于故障预警、健康监测和故障诊断等方面。
而要对这些振动信号进行有效的分析和处理,就需要进行特征提取和模式识别。
本文将探讨机械振动信号的特征提取方法以及模式识别技术。
一、机械振动信号的特征提取机械振动信号的特征提取是将信号转换为可量化的特征,并且使这些特征能够准确地描述信号的振动性质。
常用的特征提取方法有时域分析、频域分析和时频域分析。
时域分析通过对振动信号在时间上的变化进行分析,获取信号的时间统计特性。
常用的时域特征包括均值、方差、峰值、峭度等。
这些特征能够反映信号的整体趋势以及统计分布情况。
频域分析将振动信号转换到频域进行分析,可以得到信号的频谱特性。
常用的频域特征包括功率谱密度、频率峰值等。
这些特征能够反映信号在不同频率上的能量分布情况。
时频域分析结合了时域和频域的分析方法,在时域和频域上对信号进行分析。
常用的时频域特征包括小波包能量谱、瞬时频率等。
这些特征能够反映信号在时间和频率上的变化情况。
二、机械振动信号的模式识别机械振动信号的模式识别是为了从信号中提取有用的信息,判断信号所对应的状态或故障类型。
常用的模式识别技术包括支持向量机、人工神经网络和隐马尔可夫模型等。
支持向量机是一种有效的分类方法,通过将低维的数据映射到高维空间,找到一个最优的超平面来进行分类。
支持向量机在机械振动信号的模式识别中具有良好的应用效果。
人工神经网络是一种仿生学算法,通过模拟神经系统的运行方式来进行模式识别和分类。
人工神经网络在机械振动信号的模式识别中能够学习和提取信号的特征,并进行准确的分类和识别。
隐马尔可夫模型是一种用于序列分析的统计模型,通过对振动信号的时序特性进行建模和分析。
隐马尔可夫模型在机械振动信号的模式识别中可以对信号的状态进行有效的识别和预测。
三、机械振动信号的特征提取与模式识别的应用机械振动信号的特征提取和模式识别在工业领域中具有广泛的应用。
人工智能中的模式识别与特征提取

人工智能中的模式识别与特征提取人工智能技术的快速发展,使得模式识别与特征提取成为研究领域中备受关注的话题。
模式识别作为人工智能的一个重要分支,其主要任务是通过对数据进行分析和处理,从中发现其中隐藏的、有意义的信息。
特征提取则是指从原始数据中提取出对于识别、分类和理解的有用信息。
这两个技术相辅相成,在人工智能领域中具有广泛的应用前景。
模式识别与特征提取在人工智能领域中扮演着至关重要的角色。
通过分析大量的数据,计算机系统可以从中学习并建立模型,进而识别数据中的规律和特征。
在图像识别、语音识别、自然语言处理等领域,模式识别与特征提取技术被广泛应用。
例如,在人脸识别领域,通过提取人脸特征的关键点信息,可以实现准确的人脸识别和验证。
在医学影像分析领域,通过对影像数据进行特征提取和模式识别,可以帮助医生快速、准确地诊断疾病。
模式识别与特征提取的研究内容涵盖了多个领域,包括机器学习、模式识别、数据挖掘等。
在机器学习领域,模式识别与特征提取是构建模型的关键步骤,通过对数据进行预处理和特征提取,可以提高机器学习算法的性能和准确度。
在模式识别领域,研究者通过对数据进行分类、聚类等分析,揭示数据中的规律和信息。
在数据挖掘领域,模式识别与特征提取被广泛应用于发现数据中的模式、趋势和关联规则,帮助企业做出智能决策。
在模式识别与特征提取的研究中,有许多不同的方法和技术可以应用。
传统的方法包括主成分分析、线性判别分析、支持向量机等,这些方法在一定程度上可以解决一些简单的模式识别和特征提取问题。
然而,随着人工智能技术的不断发展,越来越多的深度学习方法被引入到模式识别与特征提取中,如卷积神经网络、循环神经网络等。
这些深度学习方法通过多层次的神经网络结构,可以学习复杂的数据特征和模式,取得了较好的效果。
在人工智能中,模式识别与特征提取的研究也面临着一些挑战和问题。
首先,面对大规模的数据和复杂的特征,传统的模式识别与特征提取方法往往效果不佳,需要更加复杂和深入的技术来解决。
模式识别中的特征提取算法评估比较

模式识别中的特征提取算法评估比较特征提取是模式识别中的重要步骤,它帮助将原始数据转化为更具代表性的特征向量,以便于后续的模式识别与分类任务。
目前已经涌现出了很多种特征提取算法,因此对这些算法进行评估和比较是非常有必要的。
本文将介绍模式识别中常用的特征提取算法,并对它们的性能进行评估和比较。
在模式识别中,特征提取算法可以大致分为两类:基于统计的方法和基于模型的方法。
基于统计的方法主要利用数据的统计特性来提取特征,而基于模型的方法则侧重于建立数学模型来描述数据的特征。
下面将分别介绍这两类方法中的一些常用算法。
基于统计的特征提取算法包括主成分分析(PCA)、线性判别分析(LDA)以及局部二值模式(LBP)等。
PCA 是一种常用的线性降维技术,它通过找到原始数据中的主要方向来提取特征。
LDA则是一种在分类任务中常用的特征提取方法,它通过最大化类间散布矩阵与最小化类内散布矩阵之比来提取最具判别性的特征。
LBP算法则主要应用于纹理特征提取,它通过统计局部区域中像素之间的灰度差异来表示图像的纹理。
基于模型的特征提取算法包括小波变换、自编码器以及生成对抗网络(GAN)等。
小波变换是一种多尺度分析方法,它将信号分解成不同尺度的频率成分,从而提取出信号的时间和频率特征。
自编码器是一种无监督学习模型,它通过输入数据自身来进行特征提取,并通过重构误差来优化模型参数。
GAN是一种生成模型,它通过生成与真实样本相似的样本来提取特征,并利用判别器网络进行优化。
针对这些特征提取算法,可以从以下几个方面进行评估和比较:特征表达能力、计算效率、鲁棒性以及应用范围。
首先,特征表达能力是评估一个特征提取算法的重要指标。
好的特征应该能够充分表达数据的特征信息,从而有利于后续的模式识别与分类任务。
可以通过比较不同算法提取的特征在分类任务中的性能表现来评估其特征表达能力。
其次,计算效率也是一个重要的评估指标。
在实际应用中,计算效率直接关系到算法的实用性。
《模式识别》实验报告K-L变换特征提取

《模式识别》实验报告K-L变换特征提取基于K-L 变换的iris 数据分类⼀、实验原理K-L 变换是⼀种基于⽬标统计特性的最佳正交变换。
它具有⼀些优良的性质:即变换后产⽣的新的分量正交或者不相关;以部分新的分量表⽰原⽮量均⽅误差最⼩;变换后的⽮量更趋确定,能量更集中。
这⼀⽅法的⽬的是寻找任意统计分布的数据集合之主要分量的⼦集。
设n 维⽮量12,,,Tn x x x =x ,其均值⽮量E=µx ,协⽅差阵()T x E=--C x u)(x u ,此协⽅差阵为对称正定阵,则经过正交分解克表⽰为x =TC U ΛU ,其中12,,,[]n diag λλλ=Λ,12,,,n u u u =U 为对应特征值的特征向量组成的变换阵,且满⾜1T-=UU。
变换阵TU 为旋转矩阵,再此变换阵下x 变换为()T -=x u y U ,在新的正交基空间中,相应的协⽅差阵12[,,,]xn diag λλλ==x U C U C。
通过略去对应于若⼲较⼩特征值的特征向量来给y 降维然后进⾏处理。
通常情况下特征值幅度差别很⼤,忽略⼀些较⼩的值并不会引起⼤的误差。
对经过K-L 变换后的特征向量按最⼩错误率bayes 决策和BP 神经⽹络⽅法进⾏分类。
⼆、实验步骤(1)计算样本向量的均值E =µx 和协⽅差阵()T xE ??=--C x u)(x u5.8433 3.0573 3.7580 1.1993??=µ,0.68570.0424 1.27430.51630.04240.189980.32970.12161.27430.3297 3.1163 1.29560.51630.12161.29560.5810x----=--C (2)计算协⽅差阵xC 的特征值和特征向量,则4.2282 , 0.24267 , 0.07821 , 0.023835[]diag =Λ-0.3614 -0.6566 0.5820 0.3155 0.0845 -0.7302 -0.5979 -0.3197 -0.8567 0.1734 -0.0762 -0.4798 -0.3583 0.0755 -0.5458 0.7537??=U从上⾯的计算可以看到协⽅差阵特征值0.023835和0.07821相对于0.24267和4.2282很⼩,并经计算个特征值对误差影响所占⽐重分别为92.462%、5.3066%、1.7103%和0.52122%,因此可以去掉k=1~2个最⼩的特征值,得到新的变换阵12,,,newn k u u u -=U。
视频流处理中的内容识别和提取研究

视频流处理中的内容识别和提取研究随着互联网和移动设备的流行,视频流已经成为了人们获取信息和娱乐的主要渠道之一。
然而,视觉信息的处理和识别一直是计算机领域的一个难点问题。
随着计算机视觉和深度学习技术的不断发展,视频流处理中的内容识别和提取也获得了长足的进展。
一、视频流处理中的内容识别技术内容识别是指通过计算机视觉和机器学习的方法,对视频流中的内容进行自动识别和分类。
这些内容包括人物、场景、物体、语音等等。
一般来说,内容识别技术可以分为两个阶段:特征提取和模式识别。
特征提取是指通过对视频流进行图像处理和分析,提取出其中的关键特征。
这些特征可以包括色彩、纹理、形状、运动等等。
在接下来的模式识别阶段,这些特征会被输入到分类器中,来进行分类和识别。
目前,常用的特征提取方法包括手工设计的特征和基于深度学习的特征。
手工设计的特征通常基于图像的颜色、纹理和形状等视觉特征,然后结合传统的机器学习算法进行分类。
而基于深度学习的特征则采用神经网络来自动地学习图像特征,并通过几层网络来提取更高层次的语义特征。
二、视频流处理中的内容提取技术内容提取是指通过内容识别技术,从视频流中提取出有用的信息。
这些信息可以包括关键帧、文本、语音、人脸等等。
通过内容提取技术,我们可以把一段视频转化为含有各种元素的数据文件。
这些数据文件可以被用于搜索、分类、分析和编辑视频流。
目前,视频流中的内容提取技术主要包括图像检索、文本识别、语音识别和人脸识别等。
图像检索可用于从给定的视频流中检索出与给定图像相似的图像。
文本识别可用于识别视频流中的屏幕文本,并提供OCR效果。
语音识别可用于从视频流中提取出相应的语音信息。
人脸识别可用于从视频流中识别出特定人物的面部特征,并实现类似身份验证的作用。
三、视频流处理中的应用场景视频流处理中的内容识别和提取技术已经被广泛应用于各个领域。
其中一些应用场景包括:1. 视频搜索和推荐。
通过自动化的视频流处理和内容提取技术,可以实现更加准确和高效的视频搜索和推荐服务。
特征提取的方法有哪些

特征提取的方法有哪些特征提取是指从原始数据中提取出对所研究问题有用的信息,通常用于数据分析、模式识别、机器学习等领域。
特征提取的好坏直接影响着数据分析和模型训练的效果,因此选择合适的特征提取方法非常重要。
下面将介绍几种常见的特征提取方法。
1. 直方图特征提取方法。
直方图特征提取是一种简单而有效的方法,它将数据按照一定的区间进行划分,然后统计每个区间内的数据点个数或者频率。
直方图特征提取适用于连续型数据,例如图像、音频等。
通过直方图特征提取,可以将原始数据转化为直方图特征向量,从而方便后续的数据分析和模式识别。
2. 主成分分析(PCA)特征提取方法。
主成分分析是一种常用的降维技术,它通过线性变换将原始数据映射到一个新的坐标系中,使得映射后的数据具有最大的方差。
在主成分分析中,新坐标系的基向量即为原始数据的主成分,可以将原始数据映射到主成分上,从而实现数据的降维和特征提取。
3. 小波变换特征提取方法。
小波变换是一种时频分析方法,它可以将信号分解为不同尺度和频率的小波系数。
小波变换特征提取可以提取信号的局部特征,适用于处理非平稳信号和非线性信号。
通过小波变换特征提取,可以获取信号的时频信息,从而实现对信号的特征提取和分析。
4. 自编码器特征提取方法。
自编码器是一种无监督学习的神经网络模型,它可以通过学习数据的内在表示来实现特征提取。
自编码器特征提取可以将原始数据映射到一个低维的隐含空间中,从而实现数据的特征提取和降维。
自编码器特征提取适用于图像、文本、音频等多种类型的数据,是一种非常灵活和有效的特征提取方法。
5. 卷积神经网络(CNN)特征提取方法。
卷积神经网络是一种深度学习模型,它可以通过卷积层和池化层来提取数据的特征。
卷积神经网络特征提取适用于图像、视频等数据的特征提取,它可以学习到数据的局部特征和全局特征,从而实现对数据的高效特征提取和表示。
总结。
特征提取是数据分析和模式识别中非常重要的一步,选择合适的特征提取方法可以提高数据分析和模型训练的效果。
模式识别的研究现状与发展趋势

模式识别的研究现状与发展趋势模式识别是一种利用计算机技术来识别和分类模式或数据的研究领域。
它广泛应用于许多领域,如图像处理、语音识别、自然语言处理等。
在过去几十年中,模式识别经历了快速发展,并取得了许多重要的研究成果。
同时,模式识别领域面临着一些挑战,需要进一步的研究和发展。
目前,模式识别的研究主要集中在以下几个方面:1.特征提取与选择:特征提取是模式识别的关键步骤之一、目前,有许多不同的特征提取方法,如主成分分析(PCA)、线性判别分析(LDA)等。
此外,还有一些新的特征选择方法被提出,如稀疏编码、深度学习等。
研究人员正在努力提高特征提取和选择的效果,以提高模式识别的性能和准确性。
2.分类算法:分类算法是模式识别的核心部分。
目前,有许多不同的分类算法可供选择,如支持向量机(SVM)、神经网络、k近邻算法等。
研究人员正在研究新的分类算法,以提高模式识别的效果。
3.多模态模式识别:多模态模式识别是指利用多种类型的信息(如图像、语音、文本等)进行模式识别的研究。
多模态模式识别在人脸识别、情感分析等领域有广泛应用。
目前,研究人员正在探索更有效的多模态模式识别方法,以提高准确性和鲁棒性。
4.深度学习:深度学习是一种基于神经网络的模式识别方法,近年来取得了很大的突破。
深度学习可以自动从数据中提取特征,并具有极强的表征能力。
它在图像处理、语音识别等领域取得了很好的效果。
未来,深度学习有望在更多应用领域得到广泛应用。
未来,模式识别的发展趋势主要体现在以下几个方面:1.多模态与跨模态模式识别:随着信息技术的发展,多模态数据的应用越来越普遍。
未来的模式识别趋势将更加注重多模态数据的处理和利用,以更全面地理解所研究问题。
2.深度学习的进一步应用:深度学习在模式识别中有着广泛应用的潜力。
未来,研究人员将会进一步探索和发展深度学习的新算法和方法,以提高模式识别的性能。
3.跨学科研究的持续发展:模式识别涉及多个学科领域,如计算机科学、数学、统计学等。
模式识别7-特征选择和提取

了识别对象的某些特征,简单地删去某些特征可能会
丢失较多的有用信息。
• 如果将原来的特征做正交变换,获得的每个数据都是
原来n个数据的线性组合,然后从新的数据中选出少
数几个,使其尽可能多地反映各类模式之间的差异,
而这些特征间又尽可能相互独立,则比单纯的选择方
➢遗传算法
单独最优特征组合
特征
选择
计算各特征单独使用时的可分性判据J并加
以排队,取前d个作为选择结果
不一定是最优结果
当可分性判据对各特征具有(广义)可加性,
该方法可以选出一组最优的特征来,例:
➢各类具有正态分布
➢各特征统计独立
➢可分性判据基于Mahalanobis距离
d
J ij ( x1 , x2 ,..., xd ) J ij ( xk ) J D (x) (μi μ j )T 1(μi μ j )
k 1
顺序前进法
特征
选择
自下而上搜索方法。
每次从未入选的特征中选择一个特征,使得
它与已入选的特征组合在一起时所得的J值
为最大,直至特征数增加到d为止。
该方法考虑了所选特征与已入选特征之间的
相关性。
顺序后退法
特征
选择
该方法根据特征子集的分类表现来选择特征
搜索特征子集:从全体特征开始,每次剔除
➢ 当特征独立时有可加性:
k 1
➢ 单调性:
J ij ( x1 , x2 ,..., xd ) J ij ( x1 , x2 ,..., xd , xd 1 )
常见类别可分离性判据:基于距离、概率分布、熵
函数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
换后的数据矩阵 Y 即:
显然, Y 是 n 行 d 列的矩阵, yij 表示在变换后的特征空间中 第 j 个特征变量在第 i 个样本实例上的值。Yj 代表在变换后的 特征空间中第 j 个特征向量, 也就是变换后的第 j 主成分。Si 代 表在变换后的特征空间中第 i 个实例向量。还可以看出, 变换前 数据矩阵的大小为 n×p, 变换后的数据矩阵大小为 n×d, 又因为 d≤p, 所以在相同的样本实例的情况下, 变换后的数据矩阵的 特征维数小于等于变换前的数据矩阵的特征维数。
( 1.南昌大学; 2. 江西师范大学) 曾庆鹏 1 吴水秀 2 王明文 2
ZENG QINGP ENG WU S HUIXIU WANG MINGWEN
摘要:特征提取是模式识别中的关键技术之一, 本文提出了一种基于改进 ReliefF 算法的主成分特征提取方法, 通过该方法
进行主特征特征提取可以有效降维, 大大减轻了后续的分类器的工作量, 同时也有助于提高分类器的分类精度。
通讯地址: ( 330031 江西省南昌市红谷滩新区学府大道 999 号
南昌大学信息工程学院计算机系) 曾庆鹏
(收稿日期:2007.10.03)(修稿日期:2007.12.05)
由表可以看出, 变换后的第一主成分贡献率达到 28.625%,
书讯
《变频器与软启动器应用 200 例》 110 元 / 本(免邮资)汇至
Proceedings of Electrotehnical and Computer Science Conference (ERK98).:137- 140.
[5]陈德钊, 多元数据处理[M], 化学工业出版社, 北京:1984.4 作者简介:曾庆鹏( 1974- ) , 男, 江西吉水人, 讲师, 硕士, 研究方 向:网络与信息安全; 吴水秀( 1975- ) , 女, 江西南丰人, 讲师, 硕 士, 研究方向:信息系统; 王明文( 1965- ) , 男, 江西南康人, 教授, 博士, 研究方向:信息检索, 文本分类。 Biogr aphy:Zeng Qing- peng(1974- ), male,han, Jiangxi Province, NanChang University, Master degree, Major in computer application, Research area: network and information security. Wu Shui- xiu(1975- ), female, han, Jiangxi Province, Jiangxi Normal
指:在限制条件
和
下寻找 ai, 使
得
达到最大。
- 220 - 360元 / 年 邮局订阅号:82-946
《现场总线技术应用 200 例》
您的论文得到两院院士关注
模式识别
3 基于主成分分析的特征提取
基于前面介绍的原理, 下面给出基于主成分分析的特征提 取方法的具体过程。
第一步:去除无关特征变量。利用 ReliefF 算法去掉原始特 征中那些与分类不相关的特征。经过第一步处理后得到的数据 矩阵为式( 4) :
2004.05:845- 889. [3]徐正光 闫恒川 张利欣, 独立成分分析在表情识别中的应用
[J], 微计算机信息, 2006.VOL.22.NO.6- 2:287- 289 [4]Robnik Sikonjia. Speeding up Relief algorithm with k- d tree.
Machine Learning:Proceedings of International Conference (ICML92).:249- 256.
[2]Jennifer G.pY. and Carla E.Brodley. Feature Selection for unsupervised learning. Journal of Machine learning Research [J].
(3)
可以得到:
显然我们希望 Y1 是 X1, X2,…, Xp 的所有线性函数中方差
最大的, 此处限制 a1 为单位向量, 即有
, 这样可以使得
达到最大, 此时就称 Y1 为第一主成分。如果第
一主成分所包含的信息还不够多, 不足以代表原始的 p 个变量,
就要考虑使用 Y2 、Y3 、Y4 等, 一般来说, X 的第 i 主成分
( 4)
其中, Xn×p 表示一个 n 行 p 列的一个矩阵。代表 n 个样本实 例, 并且每个样本实例是 p 维的。xij 表示第 j 人特征变量在第 i 个样本实例上的观测值, Xj 代表第 j 个特征变量的观测向量, Ii 代表第 i 个样本实例的观测向量。
第二步:数据规一化处理。将矩阵 Xn×p 转换为矩阵 Zn×p, 变换 公式为式( 5) :
NanChang 330031,China)Zeng Qingpeng (College of Computer Infor mation and Engineer ing , J iangxi
Nor mal Univer sity , NanChang 330027,China)Wu Shuixiu Wang Mingwen
技 术 创 新
University, Master degree, Major in computer application, Research area: information system. Wang Ming- wen (1965- ),
male,han, Jiangxi Province, Jiangxi Normal University, Doctor degree, Major in computer application, Research area:information
降维成 10 个主成分, 大大减轻了后续的分类器的工作量, 同时
也有助于提高分类器的分类精度。
本文作者创新点在于利用改进的 ReliefF 算法进行主成分
特征提取并取得较好的实验效果, 该算法可用于模式识别领域。
参考文献
[1]Kira,k. and A.Rendell. A Practical approach to feature selection.
模式识别
文章编号:1008- 0570(2008)01- 1- 0220- 02
中文核心期刊 《微计算机信息》(测控自动化)2008 年第 24 卷第 1-1 期
模式识别中的特征提取研究
Re s e a rch o n Fe a tu re S e le ctio n in Pa tte rn Ma tch in g
《现场总线技术应用 200 例》 110 元 / 本(免邮资)汇至
地址:北京海淀区皂君庙 14 号院鑫雅苑 6 号楼 601 室 微计算机信息杂志收 邮编:100081
电话:010-62132436 010-62192616(T/F )
《P LC 技术应用 200 例》
Retrieval, text classify .
(330031 江西 南昌 南昌大学信息工程学院) 曾庆鹏
(330027 江西 南昌 江西师范大学计算机信息工程学院)
吴水秀 王明文
(School of Infor mation Engineer ing , NanChang Univer sity,
;
end; 其中 diff(A,I1,I2)函数计算属性 A 与实例 I1 和 I2 的区分度, 其初始值定义如式( 1) :
(1) 迭代计算如式( 2) :
(2)
2 主成分选择
设 X1,X2,…,Xp 为 p 个随机变量, 记 X=(X1,X2,…,Xp)T, 令 Σ为 X 的协方差矩阵, 进行式( 3) 的线性变换:
(5)
其中, xj 代表矩阵 Xn×p 中第 j 列 ( 第 j 个特征变量) 的均
值,
代表矩阵 Xn×p 中第 j 个特征的标准差。
第三步: 进行主成分变换。先计算矩阵 Zn×p 的协方差矩阵
∑, 然后计算协方差矩阵∑的特征值和特征向量, 特征值从大
到小依次为
。相应的特征向量为
。接
着选择出合适数量的特征向量并构成变换矩阵 U, 最终得到变
1 ReliefF 算法及其实现
ReliefF 算法的主要思想是: 根据属性值在区分相互靠近的 样本实例的能力上来对属性的质量进行评价, 首先随机地从训 练数据中选择一个样本实例 R, 然后在训练数据中找出和样本 实例 R 在同一类中的 k 个最近邻的样本实例, 把这 k 个样本实 例称作 Nhits, 然后在训练数据中分别找出和样本实例 R 不在 同一个类中的 k 个最近邻的样本实例, 把这些 k 个样本实例称 作 Nmisses, 每个属性 A 的权重的更新依赖于随机选择的样本 实例 R、和 R 在同一类吕的 k 个近邻 NHits 以及和 R 不在同一 类中的若干个 k 个近邻 Nmisses, 在属性权重的更新公式中所有 的 NHits 和 NMisses 的贡献是经过平均的。改进后的 ReliefF 算 法如下:
set all weights W[A]:=0.0; for i:=1 to m do begin randomly select an instance Ri; find k nearest hits Hj;