基于属性特性算法的商品推荐系统模型
推荐系统起手式-几种简单推荐模型(基于内容的推荐)

推荐系统起⼿式-⼏种简单推荐模型(基于内容的推荐)⼀.基于内容的推荐所谓基于内容信息的推荐系统,其实就是⽤特征(Feature)来表⽰⽤户、物品以及⽤户和物品的交互,从⽽能够把推荐问题转换成为监督学习任务。
把推荐系统完全定义为监督学习任务,需要有这么⼏个步骤。
第⼀,就是我们已经提到的,需要把所有⽤户、物品的各种信号⽤特征来表⽰。
这⾥⾯往往牵涉⾮常复杂和繁琐的特征⼯程,也就是看如何能够把不同的信息通过特征表达出来。
第⼆,就是每⼀个监督任务都需要⾯临的问题,如何构造⼀个⽬标函数,来描述当前的场景。
可以说,这是最难的⼀个部分,也是和基于流⾏度和基于相似度的推荐系统的最⼤区别。
⼆.⽤户特征信息⽤户向量化后的结果,就是 User Profile,俗称“⽤户画像”。
对于⽤户来说,最基础、最⾸要的肯定是⽤户的基本特性,包括性别、年龄、地理位置。
这三⼤信息其实可以涵盖⽤户特性⼯程中⾮常⼤的⼀块内容。
这⾥不仅是最基本的这三个特性的值,还有围绕这三个特性发展出来的三⼤种类的特性。
⽐如,不同性别在⽂章点击率上的差异,不同年龄层在商品购买上的差异,不同地理位置对不同影视作品的喜好等,这些都是根据这三个特性发展出来的更多的特性。
然后,我们可以为⽤户进⾏画像(Profiling)。
有显式的⽤户画像,⽐如⽤户⾃⼰定义的喜好,或者⽤户⾃⼰认为不愿意看到的物品或者类别。
但是在⼤多数情况下,⽤户都不会为我们提供那么精准的回馈信息,甚⾄完全不会有任何直接的反馈。
在这样的情况下,绝⼤多数的⽤户画像⼯作,其实是通过⽤户的“隐反馈”(Implicit Feedback),来对⽤户的喜好进⾏建模。
关于如何进⾏⽤户画像,我们今天就不在这⾥展开了。
针对⽤户画像我们还需要强调⼏点,⾸先每个维度的名称都是可理解的。
其次是维度的数量特征⼯程⾃由决定的。
假如是根据⽤户的阅读历史挖掘阅读兴趣标签,那么我们⽆法提前知道⽤户有哪些标签,也就不能确定⽤户画像有哪些维度,所以第⼆点也不是必须的。
基于大数据分析的商品推荐系统模型研究

基于大数据分析的商品推荐系统模型研究随着互联网技术的不断发展,电子商务已成为消费者购物的主要方式之一。
在众多的电商平台中,商品推荐系统是为消费者提供有针对性、高品质的购物体验的关键技术之一。
商品推荐系统可以通过分析用户的购物历史、浏览记录、想要购买的商品等行为数据,实现对商品的个性化推荐。
其实现离不开大数据技术的支持。
因此,本文将围绕大数据分析技术,探讨商品推荐系统模型的研究。
一、商品推荐系统的发展历程随着互联网的迅速发展,商品推荐系统经历了从简单协同过滤推荐到基于内容的过渡,再到更加精细化和个性化的混合推荐。
协同过滤推荐是通过分析消费者历史行为数据来推荐他们可能感兴趣的商品,但存在“寒冬效应”等问题。
基于内容的推荐系统是以物品的属性、关键词和类别信息为基础,对物品进行推荐,但不考虑购买物品的历史行为数据,容易出现推荐结果过于单一的问题。
近年来,混合推荐模型逐渐得到了广泛应用,它将协同过滤和基于内容的模型结合,通过机器学习和深度学习等方法来提高推荐的准确性。
二、大数据分析技术在商品推荐系统中的应用商品推荐系统需要大量的数据支持才能发挥其功能,而大数据技术的应用可以使得消费者的行为数据得以被更好地收集和分析。
大数据技术的应用包括了Hadoop、Hive、Spark等技术,可以对消费者行为数据进行数据挖掘、机器学习等分析。
使用这些技术可以将海量、分散的数据集进行高效地处理和分析,得出更准确、有针对性的推荐结果。
三、基于混合模型的商品推荐系统的构建混合模型是一种机器学习技术,其主要思想是将不同的推荐模型组合起来,以提高推荐结果的准确性。
基于混合模型的商品推荐系统可以将不同的模型结合在一起,比如基于图像相似度的模型、基于用户购买历史的模型、基于用户的兴趣爱好的模型等,以得出更加精准的推荐结果。
此方法的优点是能够结合多种推荐方法,在不同的场景下实现更好的推荐效果。
例如,用户购买历史的模型适合于推荐用户喜好的商品,而基于用户的兴趣爱好的模型适合于推荐用户从未体验过的新商品。
推荐系统中基于内容的推荐算法研究

推荐系统中基于内容的推荐算法研究随着互联网的快速发展,信息量越来越大,人们也越来越需要推荐系统来帮助他们发现感兴趣的内容。
推荐系统逐渐成为行业中的重要技术,用户通过它可以获得个性化的体验,企业通过它可以提高用户留存率和销售额。
在不同的推荐系统中,基于内容的推荐算法一直扮演着重要的角色。
本文将介绍基于内容的推荐算法的原理、适用范围、实现方法和发展情况。
一、基于内容的推荐算法原理基于内容的推荐算法是利用物品的属性或特征,从物品的角度出发,找到与用户历史喜好相似的物品进行推荐。
其基本思路是将用户的历史行为进行分析,得出用户的兴趣特征,然后通过类似的特征来推荐物品。
在基于内容的推荐算法中,我们需要首先对物品进行特征抽取和表示,通常采用向量空间模型来实现。
其次,需要计算用户历史喜好和物品特征之间的相似度。
最后,根据相似度进行物品推荐。
二、基于内容的推荐算法适用范围基于内容的推荐算法适用于物品的特征比较明显、容易提取的场景,如音乐、图书、电影等场景。
例如,对于音乐推荐系统,我们可以以歌曲的流派、演唱者、歌词等为特征,建立歌曲的特征空间,然后根据用户历史听歌记录和各个歌曲的特征相似度,进行个性化的推荐。
基于内容的推荐算法的另一个优点是可以解决推荐系统中的“冷启动”问题,即在没有用户行为数据的情况下,也可以根据物品的特征进行推荐。
三、基于内容的推荐算法实现方法在实现基于内容的推荐算法时,需要考虑以下几个方面:1. 物品特征的抽取和表示:选择哪些特征作为物品的特征,如何表示这些特征,是基于结构化数据还是非结构化数据进行推荐等。
2. 相似度计算方法:不同的相似度计算方法会对推荐结果产生不同的影响,需要根据具体场景来选择相似度计算方法。
3. 推荐结果的排序:根据用户的兴趣程度进行排序,将用户最可能感兴趣的物品放在前面。
实现基于内容的推荐算法需要涉及到机器学习、自然语言处理、向量空间模型等多种技术。
开发者可以根据具体场景选择合适的技术。
属性层次模型及其应用电子教案

确定层次结构
层次结构定义
层次结构是指将属性集按照一定的逻辑关系进行分层,形成一个层次化的结构。分层依据可以是属性 的相关性、因果关系、重要性等。
层次类型
常见的层次类型包括目标层、条件层和指标层。目标层是最高层,表示解决问题的最终目标;条件层 是中间层,表示实现目标所需的条件或准则;指标层是最低层,表示衡量条件或准则的具体指标。
层次性
属性层次模型具有清晰的层次结构,可以清晰地表示对象之间的层次 关系。
属性关联
属性层次模型中的节点表示属性,节点之间的边表示属性之间的关系, 有助于发现属性之间的关联。
可扩展性
随着数据量的增加,属性层次模型可以灵活地扩展,以适应更复杂的 数据结构。
属性层次模型的基本结构
节点
节点表示一个属性或对象,每个节点都有唯一的 标识符。
属性层次模型及其应用 电子教案
目录
Contents
• 属性层次模型概述 • 属性层次模型的构建 • 属性层次模型的应用 • 属性层次模型的优势与局限性 • 案例分析
01 属性层次模型概述
定义与特点
定义
属性层次模型是一种数据结构,用于表示对象之间的层次关系。它以 属性的形式描述对象,并根据属性之间的关系构建层次结构。
图像处理
通过属性层次模型对图像进行特征提取和分 类,实现图像的识别、分类和检索。
04 属性层次模型的优势与局限性
优势
可解释性强
属性层次模型能够清晰地表达数据之间的层次关系,使得结果易 于理解和解释。
灵活性高
模型可以根据实际需求调整层次结构,适应性强。
处理复杂数据
能够处理具有复杂属性的数据,并对其进行有效的层次化分类。
数据分类与聚类
基于属性特性算法的商品推荐系统模型

基于属性特性算法的商品推荐系统模型作者:邱京伟来源:《中国信息化》2018年第06期推荐系统是根据用户的兴趣爱好推荐符合用户兴趣的对象,也称为个性化推荐系统。
商品推荐系统依据收集到的顾客的信息和交易记录等有关数据,查找具有某些特性的顾客与他们购买的商品间存在的关联规则,大致确定顾客喜欢的商品的种类范围,向客户推荐与客户购买的商品存在一定关联的其他商品,既为客户购买商品提供了方便,又可提高网站的销售量。
近年来,随着人民生活水平的提高和网络购物的发展,各购物网站中商品的数量和种类都大大增加,为了方便顾客在海量的商品中尽快寻找到所需要的商品,可靠高效的商品推荐系统必不可少。
在粗糙集相关理论中,知识被定义为对论域的划分模式,知识具有颗粒性,称为信息粒度或知识粒度,简称粒度。
由于每个粒度都带有一定的属性,这使粒度间存在相互包含的关系,而粒度存在的关联规则在其包含粒度中也同样存在,例如,当存在所有男人都喜欢篮球的时候,就可以推导出中国男人都喜欢篮球。
依据粒度间属性的特性编写的算法称为属性特性算法,该算法通过组织相关包含数组等方法,避免在某个粒度的包含粒度上挖掘相同的粒关联规则,达到节省时间,提高挖掘效率的目的。
将属性特性算法应用到商品推荐系统中,其优点有:一般顾客在超市购物时,往往不会只购买一种商品,这种现象在网络购物平台也同样存在。
但是,现有推荐系统大多根据顾客搜索的关键字提供同一类型的商品。
由于单个顾客面对不同商家的同一类商品时往往只会选择其中一家的商品,这样对购物网站的交易量提高幅度有限。
属性特性算法基于粒计算,关注的重点是带有相同属性的粒度间存在的关联规则,因此不限制推荐商品的种类,其挖掘结果涉及多种商品,这样在给顾客更多选择的同时,有利于提高购物网站的交易数量和交易额。
传统算法虽然可以较准确地推测出某位客户感兴趣的商品,但是在大数据背景下,当数据的规模增大后,传统算法所需的时间消耗随之增加,这大大影响了系统的运行速度。
基于产品属性及用户偏好的个性化产品推荐方法

基于产品属性及用户偏好的个性化产品推荐方法鲁辉;张太华;何二宝;徐卫平【摘要】The collaborative filtering algorithm is the most widely used in the personalized recommen-dation system,and the similarity calculation is the core of the collaborative filtering algorithm. In view of the deficiency of the traditional similarity measurement methods in the difference between the user preferences for a single product and a kind of product,a similarity calculation method based on user’ s interest and hobby is proposed. According to the user’s interest and hobby,this method will be dis-tinguishing the user preferences for a single product and a kind of product. Then,the similarity be-tween different users of similar products is calculated by the weighted method. Finally,the algorithm is tested by the MovieLens data sets,and the test results show that the calculation quality of the proposed is obviously improved.%个性化推荐系统中应用得最广泛的是协同过滤算法,而相似度的计算是协同过滤算法的核心。
电子商务平台中基于多维度推荐算法的商品推荐研究

电子商务平台中基于多维度推荐算法的商品推荐研究随着网络技术的快速发展和人们生活方式的变化,电子商务成为了当代经济社会发展的新型驱动力。
而作为电商核心的商品推荐系统,其至关重要的作用日益凸显。
传统的商品推荐方法往往存在局限性,比如基于用户历史记录等单一或少量维度的推荐方式过于简单,推荐效果欠佳的问题。
而基于多维度推荐算法的方法则能更好地提高推荐系统的推荐准确率和效果。
因此,对于电商平台的运营商和研究学者来说,基于多维度推荐算法的商品推荐研究和应用具有较高的研究和应用价值。
一、多维度推荐算法的特征传统的商品推荐算法往往仅仅基于单一维度的数据进行推荐。
比如,通过用户的历史数据分析,来预测用户在未来的消费行为。
但这种方法存在以下几个问题:1. 局限性:基于单一维度的推荐方法,不仅过于单一,而且过于简单。
由此导致的笼统和不准确的推荐结果,不能有效地提高推荐的效率,也未能真正满足消费者的需求。
2. 复杂性:随着技术和数据源的增加,以及对推荐结果精度的要求提高,推荐系统所处理数据的维度和规模会大大增加。
传统的单一维度推荐算法无法应对如此庞大而又高维的各种数据,推荐引擎的处理和算法复杂度会越来越高,效率严重下降。
针对以上问题,基于多维度的商品推荐算法应运而生。
多维度推荐算法是利用多个不同的数据源和维度进行综合分析和评估,从而实现更为准确的推荐。
这些维度来源有:用户个人信息、用户历史交易数据、商品特征数据等等。
每一个维度都包含着一部分用户特征,在推荐时,它们会被综合应用,以此来达到更精确和完善的推荐结果。
多维度推荐算法的特征体现在以下几个方面:1. 信息来源多样性:多维度推荐算法可以处理多种不同的数据源,从而提高数据分析的准确性。
数据源涵盖了交易历史、商品特征、用户行为、个人偏好等。
每个维度都可以提供不同的信息。
2. 推荐结果的精确度和准确性:通过综合各种维度的数据源来进行推荐,能大大提高分析的准确性和精确度。
不同维度的信息对于推荐结果的独立性和互补性都有所贡献,从而使得推荐结果更为准确。
基于商品属性的电子商务推荐系统研究

基于商品属性的电子商务推荐系统研究基于商品属性的电子商务推荐系统研究随着互联网的快速发展和商品种类的不断增加,人们在购物时往往会遇到信息过载的问题。
为了有效地解决这一问题,电子商务推荐系统应运而生。
电子商务推荐系统通过挖掘用户历史行为数据和商品属性信息,为用户推荐符合其兴趣和需求的商品,提高用户的购物体验和满意度,并增加电商平台的销售额。
商品属性是指商品的一些特性和描述,包括品牌、型号、材质、尺寸、颜色等。
商品属性对用户的购物决策起着重要作用。
基于商品属性的电子商务推荐系统,即通过分析商品属性信息,为用户推荐符合其需求的商品。
首先,基于商品属性的推荐系统需要建立一个商品属性库。
商品属性库包括了各个商品的属性信息,如品牌、型号、价格、尺寸、颜色等。
通过对商品属性的整理和归类,可以有效地提高系统的推荐效果。
同时,为了提高系统的推荐准确性,还可以引入用户评价和反馈数据,对商品的属性进行动态更新和调整。
其次,基于商品属性的推荐系统需要对用户的兴趣和需求进行建模。
为了准确地捕捉用户的兴趣,可以通过分析用户的历史购物数据和浏览行为,构建用户的兴趣模型。
另外,还可以引入用户的背景信息和社交网络数据,提供更加个性化和准确的推荐结果。
基于商品属性和用户兴趣的模型,可以使用多种推荐算法进行商品推荐。
常见的推荐算法包括基于内容的推荐算法、协同过滤算法、深度学习算法等。
基于内容的推荐算法通过分析商品的属性信息,为用户推荐具有相似属性的商品。
协同过滤算法则基于用户的历史行为数据,找到与其兴趣相似的其他用户,为其推荐这些用户喜欢的商品。
深度学习算法则结合了商品属性和用户行为数据,通过神经网络等技术进行深层次的推荐分析。
最后,基于商品属性的推荐系统需要进行实验和评估。
既然是一个研究性的文章,那么我们应当对该系统进行实证研究,通过对比实验和用户调查等方法,来评估系统的推荐准确性和用户满意度,以及系统在提升销售额方面的效果。
综上所述,基于商品属性的电子商务推荐系统是一个重要的研究领域。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
文|邱京伟
推荐系统是根据用户的兴趣爱好推荐符合用户兴趣的对象,也称为个性化推荐系统。
商品推荐系统依据收集到的顾客的信息和交易记录等有关数据,查找具有某些特性的顾客与他们购买的商品间存在的关联规则,大致确定顾客喜欢的商品的种类范围,向客户推荐与客户购买的商品存在一定关联的其他商品,既为客户购买商品提供了方便,又可提高网站的销售量。
近年来,随着人民生活水平的提高和网络购物的发展,各购物网站中商品的数量和种类都大大增加,为了方便顾客在海量的商品中尽快寻找到所需要的商品,可靠高效的商品推荐系统必不可少。
在粗糙集相关理论中,知识被定义为对论域的划分模式,知识具有颗粒性,称为信息粒度或知识粒度,简称粒度。
由于每个粒度都带有一定的属性,这使粒度间存在相互包含的关系,而粒度存在的关联规则在其包含粒度中也同样存在,例如,当存在所有男人都喜欢篮球的时候,就可以推导出中国男人都喜欢篮球。
依据粒度间属性的特性编写的算法称为属性特性算法,该算法通过组织相关包含数组等方法,避免在某个粒度的包含粒度上挖掘相同的粒关联规则,达到节省时间,提高挖掘效率的目的。
将属性特性算法应用到商品推荐系统中,其优点有:
一般顾客在超市购物时,往往不会只购买一种商品,这种现象在网络购物平台也同样存在。
但是,现有推荐系统大多根据顾客搜索的关键字提供同一类型的商品。
由于单个顾客面对不同商家的同一类商品时往往只会选择其中一家的商品,这样对购物网站的交易量提高幅度有限。
属性特性算法基于粒计算,关注的重点是带有相同属性的粒度间存在的关联规则,因此不限制推荐商品的种类,其挖掘结果涉及多种商品,这样在给顾客更多选择的同时,有利于提高购物网站的交易数量和交易额。
传统算法虽然可以较准确地推测出某位客户感兴趣的商品,但是在大数据背景下,当数据的规模增大后,传统算法所需的时间消耗随之增加,这大大影响了系统的运行速度。
属性特性算法利用某粒度存在的关联规则在其包含粒度中同样存在的特性,通过减少判断关联规则的次数的方法,提高每次比较中输出关联规则的数量,从而减少系统在运行中的时间消耗。
在有关数据集的实验表明,在同等要求下,属性特性算法可以有效提高挖掘效率,有利于在数据量增加的情况下,降低系统反应时间,提升系统性能。
一、属性特性算法基本原理
在实际应用中,往往根据具体要求将信息按照所含属性的多少划分为不同的粒度,这使各个粒度间由于所含属性的多少而相互包含,例如粒度<种类:酒>就包含<种类:酒>∧<颜色:红>等粒度。
源覆盖度、目标覆盖度、源置信度和目标置信度是衡量粒关联规则强度的4个度量标准。
在粒计算中,每个大小不一的粒度都带有一定数量的属性和属性值,这些属性和属性值使部分粒度存在着一定的包含关系。
当源覆盖度为100%,而目标覆盖度也为100%的时候,称为完全匹配。
在完全匹配的情况下,一个粒度与其他粒度间存在的所有关联规则,在它的所有的包含项中同样存在,例如,当100%的美国人(粒度<国籍:美国>)喜欢100%的白色商品(粒度<颜色:白>)的时候,可以得出100%的美国已婚人士(粒度<婚姻:已婚>∧<国籍:美国>)喜欢100%的白色美国产商品(粒度<颜色:白>∧<产地:美国>。
利用粒度属性的特性设计属性特性算法,将粒度的包含项放入该粒度的包含数组中,当挖掘到粒度A和粒度B建存在粒关联规则时,采用遍历的方法直接输出粒度A 的包含粒度粒度与粒度B的包含粒度间存在同样的粒关联规则,这样就节省了在其包含粒度上判断是否存在粒关联规则的时间,提高了挖掘的时间效率,具体做法如下:
56
信息化研究
为每个粒度开辟有关包含数组,该粒度为该数组的第1个元素;
在属性比自身不多1的粒度中为每个粒度查找其包含粒度,并放入其包含数组中,形成该粒度的初步包含数组;
从粒度的初步包含数组第2个元素(第1个子粒度)开始,查找其初步包含数组里的粒度,把它们放入父粒度的包含数组中,形成完全包含数组,其过程如图2所示;
图1 组织完全包含数组图
按要求两个数据集中的粒度相互比较,如果存在关联规则,则输出两个粒度完全包含数组中的所有关联规则。
图2 关联规则判断输出流程图
算法流程图如图2所示,当发现两个粒度间存在粒关联规则时,属性特性算法一次可以输出多条粒关联规则,与一般采用的逐个比较的方法相比,可以节省在某粒度的包含粒度上挖掘粒关联规则的时间,提高了挖掘效率。
二、属性特性算法的应用
本设计基于特点相似的人感兴趣的商品范围也相似的理念,将粒计算的思想和属性特性算法应用到商品推荐系统里,在把数据库中的用户信息和商品信息根据包含属
买情况,结合粒度相关设定的源置信度和目标置信度等相关要素,利用属性特性算法查找相关粒度间的粒关联规则,快速从海量数据中挖掘出顾客特点与所购买商品间的联系,指导系统向特定顾客推荐特定范围的商品。
三、商品推荐系统模型设计
基于属性特征的粒关联规则挖掘算法的商品推荐系统以网上购物平台数据库为基础,主要围绕对数据的处理和分析展开设计。
本商品推荐系统的全部功能模块图如图3所示
图3 商品推荐系统的功能模块图
(一)数据模型及数据库设计
本商品推荐系统的系统的数据库由顾客信息表、商品信息表和购买情况表3张表构成,顾客信息表主要负责记录网站注册的会员相关信息,如年龄、籍贯和爱好等,商品信息表记录网站上出售的商品的种类、颜色、价格等信息,购买情况表的数据主要记录近一段时间内顾客在该网站上购买商品的记录。
(二)主要模块设计
本系统负责数据处理的主要功能模块有:数据导入模块、粒度化处理模块、关联规则挖掘模块和数据导出模
块。
数据导入模块主要负责将数据库里的3个数据表进行识别后加载到系统中。
在这个过程中。
数据导入模块不但要读取数据表中的有关信息并对其进行转化,还要将有关数据项转化为一定数据类型且带有一定数值的数据。
粒度化处理模块主要涉及顾客信息表和商品信息
表,它根据各个数据自身所含属性的多少按一定顺序把它们分解为一定大小的粒度,然后对所得粒度进行一定的清洗,去除重复的数据后,完成对重要信息进行必要的统计并设置相关标志位等操作。
57
信息化研究
在关联规则挖掘模块中,整理好的粒度按照属性特征算法有关步骤,首先为各粒度组织完全包含数组,再在比较中通过公式挖掘出存在的粒关联规则,通过遍历有关粒度的保护数组输出相关的粒度,并设置相关标志位,将结果记录到系统中。
数据导出模块通过对照当用户属性和关联规则挖掘模块所得出的粒关联规则,选出带有与当前顾客所涉及粒度相同的那些粒关联规则,依此列出顾客可能感兴趣的商品的目录。
(三)其他模块设计
为完善相关功能,系统加入用户识别和数据分析两个模块。
用户识别模块通过输入的用户名和密码,分辨用户是系统管理员还是顾客,从而引导不同用户进入不同页面进行相关操作。
数据分析模块的作用是统计查询的次数和符合要求的客户、商品数量等具有一定商业价值的相关数据,对商品受关注程度等信息进行反馈。
四、模型应用分析
商品推荐系统的数据流程如图4所示。
当系统启动后,管理人员通过系统管理员界面,可以读取有关数据的查询统计结果,还可以设置需要导入的数据表位置,修改覆盖率等参数。
图4 系统数据流向图
数据表由数据导入模块进行加工,数据导入模块将客户信息表、商品信息表的数据进行编码,使之能被系统识别和处理,同时将购买情况表的数据转化为布尔型数
作者单位:宁德师范学院信息与机电工程学院
据,方便下一步的数据挖掘。
从数据导入模块得到数据后,粒度化处理模块根据顾客信息表和商品信息表数据自身所含属性的多少,按元组和属性种类由少到多的顺序,把表中的信息划分为大小不同的粒度,同时计算粒度总个数。
由于在已经得到的数据中,不仅存在着许多重复的粒度,同时也缺少了如支持度等重要信息,所以要进行近一步的整理。
在这个过程中,粒度化处理模块不仅要去除一定的冗余,还要计算每个粒度出现的频率并算出每个粒度的置信度,然后根据设置的置信度度对粒度进行筛选。
最后,对只要数据设置有关计数位,为导出有关统计表格做准备。
关联规则挖掘模块在接收处理好的粒度的基础上,根据设定的条件(如源置信度和目标置信度)和有关统计结果(如粒度总个数),为各个粒度组织包含数组和所需标志位数组,然后利用有关公式挖掘各个粒度的包含项,放入该粒度的包含数组中。
在挖掘顾客有关粒度与商品有关粒度间的粒关联规则过程中,当发现两个粒度存在关联
规则的时候,按照属性特征算法有关步骤,输出两个粒度及其包含粒度间的相同粒关联规则。
当顾客登录购物网站时,数据导出模块将当前顾客所含相关粒度调出,与挖掘结果进行对比,选择那些带有与顾客相同粒度的粒关联规则,经过数据清洗后得到推荐结果,显示在相关页面上。
数据分析模块在这一过程中,收集有关数据,如近一段时间内各个粒度被推荐的次数、各商品被推荐的次数等,为有关人员下一阶段的商业活动提供必要的依据。
五、结束语
商品推荐系统不仅为顾客购物提供方便,也是电子购物网站提高销售量和销售额的重要手段之一。
本文将粒计算的思想和属性特性算法引入到商品推荐系统设计中,通过分析顾客信息粒度与商品信息粒度间的粒关联规则来推荐有关商品,同时利用粒度属性间的特性减少时间消
耗,在扩展推荐商品种类的同时,也提高了数据挖掘速度,不仅为客户购买商品提供了便利,还有利于提升网站
的销售量。
58
信息化研究。