拆解“猜你喜欢”系统功能分析
猜你喜欢 原理

猜你喜欢原理
猜你喜欢是一种基于用户兴趣和行为数据的推荐系统。
其原理是通过分析用户的浏览历史、点击行为、购买记录等个人数据,从中挖掘出用户的偏好和喜好,然后根据这些数据将用户未曾接触过的相关内容推荐给他们。
这种推荐系统利用数据挖掘和机器学习算法来建立用户画像和兴趣模型,从而能够精准地预测用户可能感兴趣的内容。
为了实现准确的推荐,猜你喜欢系统使用一些常见的算法模型,例如协同过滤、内容过滤和深度学习等。
协同过滤算法是根据用户的历史行为和与其他用户的相似性来推荐内容,即“找到
和你兴趣相投的朋友,看看他们都喜欢什么”。
内容过滤算法
则是根据用户的历史兴趣和行为,通过匹配内容和用户的兴趣标签等信息来进行推荐。
而深度学习算法则是通过神经网络的训练和学习,根据用户的数据模式和特征进行个性化推荐。
猜你喜欢系统的优点在于可以根据每个用户的不同喜好进行个性化推荐,提供丰富多样的内容选择。
这种系统可以提高用户的浏览体验,节省用户的时间和精力,同时也可以帮助网站和电商平台提高用户的黏性和转化率。
然而,猜你喜欢系统也存在一些挑战,例如数据隐私和安全问题,以及如何避免陷入“过滤气泡”等现象。
综上所述,猜你喜欢是基于用户个性化数据的推荐系统,通过分析用户的行为和兴趣,利用不同的算法模型来做出个性化推荐,提供用户感兴趣的内容,以提高用户体验和平台的价值。
猜你喜欢

“猜你喜欢”的数据原理
在一些交易性网站里,通过用户的浏览或购买记录,网站就会在“猜你喜欢”一栏里推荐其他相似的商品,并且还比较靠谱,这实际上是一类名为“推荐算法”的程序,这种算法是基于数据原理建立的。
如今,大部分的推荐系统都依靠一种“物物关联”的算法,此算法计算的是两本书、两部电影或两个其他东西之间的距离,依据的是给它们打过分的用户的相似度。
喜欢鲁迅书的人很可能会给莫言的作品打高分,因此鲁迅和莫言的书就共处一个邻集。
一对物品之间的距离可能是根据成百上千万的用户的评分计算得出,在一段时间里往往保持相对稳定,因此推荐系统可以预先计算距离,并更快的生成推荐结果。
豆瓣就是根据这种程序制作的“猜你喜欢”这一应用程序,例如,如果十个喜欢张艺谋电影的人里,有八个同时喜欢陈凯歌的作品,那当第十一个用户在网站上给《满城尽带黄金甲》打上8分的高分时,他就很有可能得到《无极》作为推荐。
个性化推荐系统分析

个性化推荐系统分析在当今信息爆炸的时代,我们每天都面临着大量的信息和选择,而个性化推荐系统则成为了为我们解决选择困难的利器。
本文将分析个性化推荐系统的原理、应用和挑战。
一、个性化推荐系统的原理个性化推荐系统是基于用户行为和兴趣的数据,利用算法和模型来预测用户可能感兴趣的商品、内容或服务。
其主要原理包括:数据收集、特征提取、模型训练和推荐。
1. 数据收集个性化推荐系统需要收集用户的行为数据,如点击记录、购买记录、搜索记录等,以了解用户的兴趣和个性化需求。
同时也需要收集商品、内容或服务的特征信息,如标签、类别、评分等。
2. 特征提取从收集到的数据中,个性化推荐系统需要提取有用的特征信息,如用户的性别、年龄、地理位置等个人信息,以及商品的价格、品牌、发布时间等商品信息。
这些特征将用于建立用户和商品的关联性模型。
3. 模型训练个性化推荐系统利用机器学习和数据挖掘的技术,构建用户和商品之间的关联性模型。
常用的模型包括协同过滤、内容推荐、深度学习等。
模型的训练依赖于大量的历史数据和算法的优化,以预测用户的兴趣和行为。
4. 推荐通过建立好的模型,个性化推荐系统可以根据用户的兴趣和行为,为其推荐可能感兴趣的商品、内容或服务。
推荐的方式可以是基于相似用户的推荐、基于用户兴趣的推荐、基于内容的推荐等。
二、个性化推荐系统的应用个性化推荐系统在各个领域都有广泛的应用,以下是一些常见的应用场景:1. 电子商务个性化推荐系统可以根据用户的购买历史、点击记录等,为用户推荐可能感兴趣的商品,并提高购物的体验和效率。
著名的电商平台如亚马逊和京东都采用了个性化推荐系统来提升销售额和用户满意度。
2. 社交媒体个性化推荐系统可以根据用户的好友列表、关注记录等,为用户推荐可能感兴趣的人脉和内容,增加用户的社交活跃度和沉浸度。
例如,Facebook和Instagram可以根据用户的兴趣和行为,为其推荐相关的帖子和用户。
3. 在线视频个性化推荐系统可以根据用户的观看历史、喜好和评分等,为用户推荐可能感兴趣的视频内容,提高用户的观看体验和留存率。
系统功能分析

系统功能分析
系统功能分析是对系统进行全面、深入地分析,明确系统的功能和性能,为系统的设计和实现提供依据。
首先,系统功能分析需要明确系统的目标和范围。
这包括系统所要解决的问题、系统的应用领域和用户需求等。
通过与用户、领域专家等进行沟通,明确系统的功能需求。
其次,系统功能分析需要识别系统的主要功能模块。
根据系统的目标和范围,将系统划分为不同的模块,每个模块承担一定的功能。
通过模块间的交互,实现系统的整体功能。
然后,系统功能分析需要对每个功能模块进行详细分析。
对于每个功能模块,需要明确其输入、输出、处理逻辑和与其他模块的关系。
同时,对于复杂的功能模块,还需要进一步分解为子模块,层层细化功能。
接下来,系统功能分析需要识别系统的性能要求。
包括系统的响应时间、处理能力、并发性等。
通过性能要求分析,可以对系统的硬件和软件需求进行评估和规划,确保系统能够满足用户的需求。
最后,系统功能分析还需要评估系统的可行性。
通过对系统的功能、性能和成本进行综合考虑,评估系统的可行性和可靠性。
同时,还需要考虑系统的可维护性和扩展性,以便未来对系统进行升级和修改。
综上所述,系统功能分析是一个全面、深入的过程,它包括明确系统的目标和范围、识别系统的主要功能模块、分析每个功能模块的详细功能、确定系统的性能要求和评估系统的可行性。
通过系统功能分析,可以为系统的设计和实现提供有效的依据,确保系统能够满足用户的需求。
系统功能模块分析word版

1.系统功能模块设计:1.系统设置(1)包括密码修改,用于修改当前用户的密码(2)数据库备份和恢复包括数据库的备份和日志文件的备份,可以随时将数据备份到硬盘或优盘保存,以免以后系统出现故障,可以借助这些备份文件进行恢复。
当数据丢失或出现其他故障后,可以从备份文件恢复数据。
(3)权限管理用于设置服务员或是管理员,根据权限不同,所拥有的操作权限不同。
(4)退出退出该酒店住宿及消费管理信息系统。
2.预订管理预订管理包括对预订单的录入、修改、删除操作以及取消预订操作。
当加载预订单管理页面时,将数据库中的数据显示在datagrid控件中,可以根据不同查询条件查询需要的预订单。
3.入住管理入住管理包括对入住单的录入、修改、删除操作。
当加载入住管理页面时,将数据库中的数据显示在datagrid控件中,可以根据不同查询条件查询客户的入住单。
4.房态管理由于客户预订客房和入住时,要查看房间的当前状态,该功能用于显示当前酒店中所有房间的状态,并保持即使更新。
功能算法:1)设置房态图,画一个16X4的表格,显示房态图;2)设置一个更改房态信息的按钮更新房态信息。
5.消费管理账单查询:可以根据输入的身份证号或账单编号查询客户的消费情况以及删除废弃的账单。
删除功能算法如下:1)根据文本框中的条件,点击“删除”,删除对应条件的记录信息;2)使用if语句进行判断删除条件是否为空;3)通过调用Connection()函数连接数据库,创建cmd命令,执行sql语句,删除数据表中对应的记录;4)返回表中所受影响的行数,提示“删除成功”并将所删除以后内容填充到主界面的DataGrid控件中;5)当程序执行期间发生错误,显示该错误,最后释放资源对象cmd。
6.收银管理退房结算:客户退房消费结算。
计算实收款的算法:1)录入应收款、退房房号以及退房人的身份证号;2)通过调用Connection()函数连接数据库,创建cmd命令,执行sql语句,根据身份证号对应到数据库中的记录;3)本系统设定好了三种用户:普通用户不打折、一般会员9.5折、VIP用户9折,点击“计算”按钮,生成实收款,并将对应的客房房态更新为“空房”,更新到数据库的数据表中。
游戏系统拆解总结

游戏系统拆解总结摘要游戏系统拆解是一种分析游戏的方法,通过逐个分解游戏中的各个系统,深入了解游戏的各个方面,从而为游戏的设计和开发提供指导。
本文对游戏系统拆解进行了总结和分析,探讨了其作用和方法,并举例说明了几个常见的游戏系统拆解案例。
引言游戏系统拆解是指对游戏的各个系统进行逐个拆解,将复杂的游戏系统分解为更小、更容易理解和掌握的部分。
通过这种分析方法,我们可以更深入地了解游戏的运作机制、设计原则和游戏体验。
游戏系统拆解可以帮助游戏设计师和开发团队更好地进行游戏的设计和开发工作,提高游戏的品质和用户体验。
作用游戏系统拆解的主要作用包括以下几个方面:1. 理解游戏机制通过对游戏系统的拆解,可以深入了解游戏的各个机制。
例如,可以分析游戏的角色系统、任务系统、装备系统等,找出它们之间的关联和作用,进而理解游戏中的核心机制。
这有助于游戏设计师更好地掌握游戏的规则,设计出更有趣、更合理的游戏玩法。
2. 优化游戏体验通过对游戏系统拆解的分析,可以找出游戏中存在的问题和不足之处。
例如,可以发现某个系统的设计逻辑不清晰,或者某个系统的操作流程过于繁琐。
在此基础上,可以提出改进方案,优化游戏的流程和操作,提高游戏的体验和可玩性。
3. 拓展游戏玩法通过对游戏系统的拆解,可以发现游戏中潜在的玩法和扩展空间。
例如,在拆解角色系统时,可以发现可以设计更多的角色技能和玩家角色的发展路径。
这些发现可以为游戏的扩展和更新提供创意和灵感,增加游戏的内容和可玩性。
4. 优化游戏平衡游戏系统拆解可以帮助分析游戏的平衡性,找出游戏中的问题和不平衡之处。
例如,可以分析游戏的经济系统,看看是否存在物品价格过高或者玩家获取收益过低的情况。
在此基础上,可以通过调整游戏参数或者改进游戏机制来优化游戏的平衡性,提高游戏的挑战性和可持续性。
方法游戏系统拆解的方法可以根据具体的游戏进行调整,但一般包括以下几个步骤:1. 确定游戏系统首先需要确定游戏中的各个系统,例如角色系统、装备系统、任务系统等。
个性化推荐系统根据用户喜好推送相关产品

个性化推荐系统根据用户喜好推送相关产品个性化推荐系统是基于用户兴趣和偏好,通过分析用户的历史行为数据和个人资料信息,提供符合用户需求的推荐内容。
这种推荐方式在电子商务和社交媒体平台中得到广泛应用,通过为用户定制个性化的推荐,不仅能够提升用户体验和满意度,还能够提高用户参与度和平台的转化率。
本文将介绍个性化推荐系统的原理和应用,并探讨其带来的益处和挑战。
一、个性化推荐系统的原理个性化推荐系统的原理主要基于以下几个方面:1. 用户行为数据分析:个性化推荐系统通过收集和分析用户的浏览历史、购买记录、点击行为等数据,了解用户的兴趣爱好和消费习惯。
2. 内容特征提取:推荐系统对商品、新闻等内容进行标签化或者向量化,通过计算内容之间的相似度,为用户推荐具有相似特征的内容。
3. 用户相似度计算:个性化推荐系统通过计算用户之间的相似度,找到与用户兴趣相似的其他用户,利用这些相似用户的喜好为用户推荐内容。
4. 推荐算法选择:个性化推荐系统根据用户的特点和推荐场景选择合适的推荐算法,如基于内容的推荐、协同过滤推荐等。
二、个性化推荐系统的应用个性化推荐系统在各个领域都有广泛应用,以下是几个常见的应用场景:1. 电子商务平台:个性化推荐系统在电子商务平台中,根据用户的购买历史和浏览记录,为用户推荐符合其兴趣和需求的商品,提高用户购买的转化率和平台的销售额。
2. 社交媒体平台:个性化推荐系统在社交媒体平台中,根据用户的朋友圈、点赞、评论等行为,为用户推荐符合其兴趣的文章、视频等内容,提高用户的参与度和平台的活跃度。
3. 新闻门户网站:个性化推荐系统在新闻门户网站中,根据用户的阅读历史和兴趣标签,为用户推荐与其兴趣相关的新闻资讯,提高用户的阅读体验和平台的粘性。
4. 在线音乐平台:个性化推荐系统在在线音乐平台中,根据用户的收听历史和音乐标签,为用户推荐符合其音乐口味的歌曲和歌单,提高用户的用户忠诚度和平台的用户活跃度。
三、个性化推荐系统带来的益处和挑战个性化推荐系统的应用带来了许多益处,包括:1. 提升用户体验:通过为用户提供个性化的推荐内容,使用户更容易找到感兴趣的产品或服务,提升用户的满意度和忠诚度。
功能分解法 百科

功能分解法百科功能分解法是一种常用的系统分析与设计工具,它通过将一个复杂的系统或问题分解为多个小的功能模块,便于理解和处理。
本文将从功能分解法的定义、原理、应用和优势几个方面进行阐述。
功能分解法,顾名思义,就是将一个复杂的系统或问题按照其功能进行分解和组合的方法。
它将整个系统分解为若干个功能模块,每个功能模块实现一个特定的功能,模块之间相互独立但又具有关联性。
通过对各个功能模块进行分析和设计,最终可以构建出一个完整的系统。
功能分解法的原理主要基于以下几点:首先,将复杂的系统进行分解可以降低问题的复杂度,使之更易于理解和处理。
其次,通过将系统分解为多个功能模块,可以实现模块化设计与开发,提高开发的灵活性和效率。
最后,功能模块之间的关联性使得系统的整体性能可以得到保证,同时也方便了对系统各个部分的维护和升级。
功能分解法在实际应用中有着广泛的用途。
首先,它可以用于软件开发中的需求分析和系统设计。
通过将整个软件系统分解为多个功能模块,可以更好地理解和分配开发任务,提高开发效率和质量。
其次,它也可以应用于项目管理中的任务分解和组织,将复杂的项目任务分解为多个可管理的小任务,方便项目进度的控制和协调。
此外,功能分解法还可以用于业务流程优化、系统维护和故障排查等方面。
功能分解法具有以下几个优势:首先,通过将系统分解为多个小的功能模块,可以使问题变得更具体和具体化,有助于更好地理解和解决。
其次,功能分解法使得系统的各个部分相互独立,可以并行开发和测试,提高开发效率。
此外,功能分解法也便于系统的维护和升级,当一个功能模块发生变化时,只需关注该模块而不会影响整个系统。
最后,功能分解法能够保证系统的整体性能,通过对功能模块之间的关联性进行控制,确保系统外部和内部的一致性和稳定性。
总结起来,功能分解法是一种常用的系统分析与设计工具,通过将复杂的系统或问题分解为多个小的功能模块,便于理解、设计和处理。
它具有多种应用场景,包括软件开发、项目管理和业务优化等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
许多年来,推荐系统的开发者试过用各种各样的方法来采集和解析所有这些数据。
最近这段时间,多数人都选择使用被称为个性化协同推荐(Personalized Collaborative Recommender)的算法。
这也是亚马逊、Netflix、Facebook 的好友推荐,以及一家英国流行音乐网站 Last.fm 的核心算法。
说它 “个性化”,是因为这种算法会追踪用户的每一个行为(如浏览过的页面、订单记录和商品评分),以此进行推荐;它们可不是瞎猫碰上死耗子——全凭运气。
说它 “协同”,则是因为这种算法会根据许多其他的顾客也购买了这些商品或者对其显示出好感,而将两样物品视为彼此关联,它不是通过分析商品特征或者关键词来进行判断的。
不同类型的个性化协同推荐系统最晚从 1992 年开始便已经出现。
除了 GroupLens 计划,另一项早期的推荐系统是 MIT 的 Ringo,它会根据用户的音乐播放列表从而给用户推荐其他他们有可能会喜欢的音乐。
User-User 算法:计算用户之间的相似度GroupLens 和 Ringo 都使用了一种简单的协同算法,被称为 “用户关联”(user-user)的算法。
这种类型的算法会计算一对用户之间的 “距离”,根据的是他们对同一物品打分的相似程度。
举例来说,如果吉姆和简都给《电子世界争霸战》(Tron)这部电影打了 5 分,那么他们之间的距离就是 0。
如果吉姆给它的续集《创:战纪》(Tron: Legacy )这部电影打了 5 分,而简只打了 3 分,那么他们之间的距离就变大了。
按照这样的计算得出来品味相对 “靠近” 的用户,我们把他们称之为共有一个 “邻集”(neighborhood)。
但是,这种用户关联的策略效果并不是很好。
首先,形成有意义的邻集很难:很多用户两两之间只有很少几个共同评分,有的就完全没有;而仅有的那几个都打了分的项目呢,往往是票房大片,基本上人人都喜欢的那种。
再来,由于用户之间的距离可以变得很快,算法必须当场就进行大部分的计算;而这可能会比一个在网站上这儿点点那儿戳戳的人下一个动作发出之前需要更久的时间。
Item-Item 算法:计算物品之间的关联因此,大部分的推荐系统如今都依靠一种“物-物关联”(item-item)的算法,这种算法计算的是两本书、两部电影或者两个其他什么东西之间的距离,依据的是给它们打过分的用户的相似度。
喜欢 Tom Clancy 书的人很可能会给 Clive Cussler 的作品打高分,因此 Clancy 和 Cussler 的书就共处一个邻集。
一对物品之间的距离可能是根据成百上千万的用户的评分计算得出,在一段时间里往往保持相对稳定,因此推荐系统可以预先计算距离,并更快的生成推荐结果。
亚马逊和 Netflix 都曾公开表示过他们使用的是物-物关联算法的变种,但对细节都绝口不提。
用户关联算法和物-物关联算法都有的一个问题,是用户评分的不一致性。
当给他们机会再评一次分时,用户往往会对同一件物品给出不同的得分。
品味在变、心情在变,印象也在变。
MIT 在上世纪 90 年代进行的一项研究表明,在最初打分一年以后,用户的评分会发生平均 1 分(满分 7 分)的变动。
研究人员们也在一直在尝试不同的方法在模型中纳入这一变量;比如说,如果用户给某个商品了打一个分,但这个评分与推荐算法所了解的关于这个人和这个商品的所有其他信息不相符,有的推荐算法就会邀请用户再次对这个商品进行评价。
降维算法:把事物特征一般化不过,用户关联算法和物-物关联算法还存在一个比一致性更大的问题:它们太死了。
就是说,它们能发现都喜欢同一样东西的人,但却忽略了爱好非常相似的潜在用户组合。
比如说你喜欢莫奈的睡莲。
那么,在这个法国印象派大师画的 250 幅睡莲中,你最喜欢哪一幅?在一群喜欢莫奈的人当中,完全可能每个人喜欢的睡莲都不相同,而基本的算法就有可能识别不出这些人都有着共同的爱好。
大约十年前,研究者们想出了一个办法,通过一个叫降维(Dimensionality Reduction)的过程,把事物更一般化的表现出来。
这种方法在计算量上比用户关联和物-物关联算法要密集得多,因此也就没有那么快的得到采用。
但随着计算机变更快更便宜,降维算法也逐步取得了一些进展。
为了弄清降维算法是怎么工作的,我们来看看你爱吃的东西,以及如何把它跟其他一百万人爱吃的东西做比较。
你可以把这些信息用一个巨型矩阵表示出来,每一条竖线代表一样食物,每个人爱吃什么东西就自然形成了一行。
在你的这一行上面或许会显示你给了烤牛排 5 颗星、红烧小排 4 星半、烤鸡翅 2 颗星、冻豆腐卷 1 颗星、奶酪烤蘑菇 5 颗星、盐水毛豆 4 颗星,等等。
然而,使用这个矩阵的推荐算法并不关心你给哪种食物评了多少颗星。
它想要了解的是你一般而言的喜好,这样它可以将这个信息应用到更丰富多样的食物上。
比如说,基于你上面给出的信息,算法可能会认为你喜欢牛肉、咸的东西和烤制菜品,不喜欢鸡肉和任何油炸的东西,不喜欢也不讨厌蔬菜,依此类推。
你爱吃的食物所拥有的特点或者说维度,它的数量和符合你要求的食物的数量比起来要小得多——至多可能 50 或 100。
通过查对这些维度,推荐算法可以迅速决定你是否会喜欢一种新的食物(比方说盐焗排骨),方法就是把这种食物的各项维度(咸的、牛肉做的、不是鸡肉、不是炒的、不是蔬菜、不是烤的)同你的资料进行比对。
这种更为一般性的呈现使得推荐算法能准确的发现有着相似但不同喜好的用户。
而且,它大幅压缩了矩阵的规模,使算法变得更加高效。
这是一个很酷的解决方案。
不过,你爱吃的食物的维度该上哪儿去找呢?肯定不是去问厨师。
推荐系统会使用一种称为奇异值分解的数学方法来计算维度。
这种方法涉及到把最初的一个巨型矩阵分解为两个 “口味矩阵”——其中一个包含了所有的用户和 100 项口味维度,另一个则包含了所有的食物和 100 项口味维度——再加上第三个矩阵,当乘以前面两个矩阵中的任意一个时,会得到最初的那个矩阵(※此处已更改)。
不像上面例子中说的那样,计算用的维度既不是描述性的,也一点儿都不直观;它们是纯抽象的值。
这并没有什么,只要这些值最终生成准确的推荐结果就行了。
这种方法的主要缺点是,创建矩阵所需要的时间会随着客户和产品数量的增多而飞速增长——创建一个拥有 2.5 亿名客户和 1000 万种产品的矩阵,需要花上创建一个 25 万名客户和 1 万种产品的矩阵 10 亿倍那么多的时间。
而且这一过程还需要经常重复。
一旦收到新的评分,矩阵就已经过时;在像亚马逊这样的公司,每一秒钟都会收到新的评论。
幸运的是,就算略微过时,矩阵仍然能以一个挺不错的水平运作。
研究人员们也已经在设计新的算法,为奇异值分解提供可用的近似值并显著缩短计算时间。
讲完了推荐算法是如何“猜你喜欢”的,现在,你对于每回上网购物时在线零售商是如何打量你,并努力把你的喜好和其他人的相匹配有了一个基本的概念。
推荐系统还有另外两大特点,也对你最终看到的推荐结果有着显著的影响:第一,在弄清楚你和其他购物者的相似度有多高之前,推荐系统必须先弄明白你真正喜欢什么;第二,推荐系统依照一组商业规则运行,以确保推荐结果既让你觉得有用,也使商家有利可图。
推荐算法是如何赢得你的信任,又让商家有钱可赚的? 采集你的上网数据举个例子,来看亚马逊的艺术品商店,上次我们去看的时候那里有 900 多万册印刷品和海报在降价促销。
亚马逊的艺术品商店有这样几个方法来评估你的喜好。
它会让你在 1 到 5 颗星的等级上给某一件艺术作品打分,它也会记录下你把哪些画点击放大了来看、哪些画你反反复复看了好多次,你把哪些放进了心愿单,还有你最终实际下单买了什么。
它还会追踪在你浏览过的每一个页面上都显示了哪些画作。
在线零售商会使用你在其网站行进的路径(你浏览过的页面和点击商品的链接) 来向你推荐相关联的商品。
此外,它还把你的购买记录和打分信息结合起来,建立一个你长期购买偏好的档案。
像亚马逊这样的公司会收集大量此类有关客户的数据。
在你登录期间,你在它网站上的几乎每一个动作都会被记下来,留作将来使用。
多亏有了浏览器 cookie,连匿名购物者的上网记录商家也能维持,最终这些数据将在匿名购物者创建账户或者登陆时,链接到顾客的个人资料。
这种爆炸式的数据采集并非为在线商家所独有,沃尔玛便以其对现金收据数据的深入挖掘而著称于业界。
但是,网上商店处在一个更有利的位置去查看和记录,不止是消费者买了些什么,还包括你曾考虑过、浏览过和决定不买哪些商品。
在全世界大部分地区,所有这类活动都是任人监视和记录的;只有在欧洲,数据隐私法在一定程度上限制了这种操作。
当然,不论法律如何,顾客发现自己的数据被人滥用后,都会产生强烈的抵触情绪。
早在 2000 年 9月,亚马逊吃过一次苦头:有一部分顾客发现他们收到的报价更高,因为网站将他们识别为老顾客,而不是匿名进入或是从某个比价网站转接进来的顾客。
亚马逊声称这只是一项随机的价格测试,其呈现出来的结果与老顾客身份之间的关联纯属巧合。
话是这样说,它还是叫停了这项操作。
在商业规则下运行加在推荐算法之上的种种商业规则,旨在防止算法给出愚蠢的推荐,并帮助在线零售商在不失去你信任的前提下实现营业额的最大化。
最起码,推荐系统应该避免人们说的超市悖论(Supermarket Paradox)。
例如,差不多每个去超市的人都喜欢吃香蕉,也经常会买一些。
那么,推荐系统该不该向每一位顾客都推荐香蕉呢?答案是否定的——这样做既帮不上顾客,也提高不了香蕉的销量。
所以,智能的超市推荐系统始终会包括有一条规则,明确地将香蕉排除在推荐结果之外。
这个例子可能听起来没什么,但在我们早期经手的一个项目中,我们的推荐系统就曾经向几乎每一个到访我们网站的人推荐披头士的《白色专辑》(White Album)。
从统计学的意义上讲,这是个很棒的推荐:顾客此前都没有从这个电子商务网点购买过这张专辑,而大多数顾客对《白色专辑》的评价都很高。
尽管如此,这个推荐仍然是无效的——任何一个对《白色专辑》感兴趣的人都已经有了一张了。
当然,大部分的推荐规则都是更加微妙的。
比如说,当约翰在 9 月份在 Netflix 索动作影片时,结果中不会出现《复仇者联盟》(T he Avengers),因为这部大片在当时还没有租借版,这样的推荐结果不会让 Netflix 有钱赚。
因此,约翰被导向了《钢铁侠 2》(Iron Man 2),这部片已经可以用流媒体播放了。
其他的规则还包括禁止推荐为招徕顾客而亏本销售的商品(loss leader);反过来,鼓励推荐滞销品。
在经营Net Perceptions期间,我们就曾与一位客户合作,他利用推荐系统来识别库存积压商品的潜在客户,取得了相当大的成功。