什么是个性化搜索
中搜把个性化做到极致

中搜把个性化做到极致作者:暂无来源:《计算机世界》 2013年第15期2013 年,中搜将全面进军移动端,而个性化服务将成为其最重要的关注点。
本报记者李响“搜索在PC 端和移动端的展现形式,以及用户对于不同终端的需求和体验完全不同,因此,移动搜索应用必须具备三个特点:个性化体验、及时的主动提示服务,以及信息互动和分享平台。
”中搜总裁陈沛说。
4 月23 日,中搜召开2013 年移动战略新闻发布会,并发布了5 款移动互联网产品——中搜搜悦、中搜第三代搜索移动版、中搜应用宝典、中搜V 商,以及中搜移动船票。
据中搜高级副总裁陈波介绍,2013 年,中搜将全面进军移动端,具体来说,将分为三个步骤。
首先,中搜会把此前在搜索方面的优势转向移动端,充分适应移动端的所有特点和优势,以中搜第三代搜索移动版等产品和服务,为用户提供全新的移动搜索体验;其次,中搜将布局中小企业专属移动应用,与客户和合作伙伴共同探索移动互联网的巨大市场空间;最后,中搜还将发布自主的移动应用平台,而这也将是中搜移动云平台的前奏。
“未来的移动搜索不再是简单地被动等待提供信息,它将变成一个服务,更主动地给你提供信息。
比如,你喜欢体育的话,对重大的体育赛事,它就会提前提醒你及时关注。
”陈沛表示。
在他看来,个性化体验将是未来移动搜索最重要的属性。
正是基于这个理解,中搜决定把中搜搜悦作为移动战略中的重点产品,而该产品最大的特色之一就是个性化新闻订阅功能,并且能够作为一款搜索引擎,主动为用户提供信息推送。
据介绍,目前搜悦已经把个性化的定制做出了多种相互交叉的方式。
首先,用户可以通过搜悦,像搜索引擎一样,搜索关键词并订阅下来,今后关于这个关键词的所有信息,用户可以迅速调阅并接受信息推送。
同时,搜悦支持各种信息类别的订阅,中搜对关键词进行了不同维度、不同体系的分类,给予用户充分的选择自由。
此外,用户可以按新闻源进行分类,可以只选择某几类报纸或某几个杂志。
陈沛认为,这三种定制方式已经囊括了人类现在所理解的定制模式。
个性化桌面元搜索引擎系统的研究与设计

0 引 言
搜索 引擎 ( t er
供个性 化 网络搜 索服务 。而雅虎推出个性化 搜索服
务 目的是 使 注册 用 户 可 以用 自己喜欢 的 方式 搜 索 想 要 的信 息 ,并 对 搜索 结 果提 供更 好 的 管理 和 共
元 搜索 引擎 的成 员 引擎数 量 的增 加 , 回的不 相关 返
结果 也 随着增 加 , 而导 致搜索 精度 的下 降 。个 性 从 化 元搜 索正是解 决此 问题 的最佳 途径 , 正是 系统 也 研究 的主要 内容 。元搜索 引擎可 以从三方 面来实现 个性 化搜索 : 用户描述 信息的成 员引擎调度 。元搜索 引擎的
大大降低 。
2 个 性化 桌面 元搜 索 引擎 研 究
21 个性化元搜 索的方 法 .
1 相 关 背 景
个性 化 搜 索 引擎 是 解 决 目前 搜 索 引擎 检 索 出
来 的信息量过 于庞杂这 一问题 的方 案之一 。而基于
元搜索 引擎 可 以提高 搜索 的覆盖 率 , 是 随着 但
收 稿 日期 : 0 8 0 — 1 2 0 - 6 2
基 金项 目: 四 省科 技 厅 2 0 江 0 6年 科技 攻 关项 目( 科 发 计 字[0 615号 ) 赣 20 18 作 者简 介 : 黄传 连 (97 )男 , 17 一 , 江西 吉 安 县人 , 师 , 讲 主要 从 事数 据 挖掘 、 网络 安全 、 B数 据库 等 研 究 工作 WE
个性化桌面元搜索引擎 系统的研究与设计
黄 传 连 , 登 立 , 国景 卜 黄
( 冈 山大 学 信 息 科学 与传 媒学 院 ,江 西 井 吉安 3 30 ) 4 0 9
[ 要】 摘 介绍 了一 个 基于 桌 面 的个性 化 元搜 索 引擎 的研 究策 略 和实 现技 术 。 个 性化 策 略 的描述 和系 统框 架 的设 从
几种常用的Internet个性化信息检索技术的探讨

动有余的过滤不足己经造成 r 一些负面的影
3智能 代理 包括四 方面的 关键技 术 : 器 响 ,有待 尽快 发 展更 先进 的 人工 智能 技 术予 . 机
主解 ,l 苎决 cce、容术on 访 解。络 息 掘 eM 意 翟 生 索解目 技(hr 内技( e、问以决网 信 挖 cb 溅术 孳决 『 { 艺 荆眦 蓑 M iy 苎 眦 术an) 阶 A 安 ct … ‘ : nt ) w 一 y。
≯ 豢- 信检 息 索个 化Ae挖 推 陡 gt 掘 送 n 机器 技术:机器 指各 人工 领 是 种在 智能
域 中 开发 的 、支 持各 种程 度 智能 的 引擎 。这 些 引擎 包括有 :各种 形式的 推理 引擎 、学 习 引 擎 用 户创建 修 改规 和知识 的 工具 、验证 U 规 则 集 的工具 和 用于 开 发代 理之 间 代 理和 用 户 之 间进行 协 商和 协作 所需 策 略的 工具
海捞针 ,虽然 G o l等优 秀搜索 引擎提供 了 o ge
大 量 的信 息资 源 ,但 仍需 根据 检索 到 的地 址 信 息 ,按 照页 面屏 幕的 提 示 向下追 踪 。特 别
提 供 了有效 的 工具 。 数据 挖 掘的 成功 使研 究 人 员将 数据 挖 掘技 术 用于 因特 网 ,但是 由于
、 、
网 息 源 数 掘。 据 络信 挖掘 于 据挖 数
挖 掘就 是指 从 夫量 数 据( 如数 据 库) 中提 取抽 象 的 、潜 在的 有 用信 息的 过程 ,它是数 据 库
中 知识 发现 KDD 的核 心 ,为大量数据 的利 用
网上信 息极 度 膨胀 导致 查 找信 息 i 如 大 尤
。
它 w w w上 的 数据 不同 于传统 数据 ,故 产生 了 士 来说 ,难 以 迅速 、准 确 地获 得 有价 值的 网 们 提 供 了智 能代 理所 需 的推 理能 力和 学 习能 个新 的研究 方向一 网络 信息挖 掘。 上信 息 资源 因此 用 户迫 切希 望 找到 一种 能 够 力 网络信 息挖 掘 ,Xg  ̄ g w e b 在 信息 海洋 中 自动 获取 实 用 、准确 、精 炼 的 内容 技 术 指 机 器 用 于推 理 和 学 习 的数 的 数据 挖掘 ,是从 大量 数据 中抽取 处先 前未 信息的 工具 。 据 但 它 不 定就 是知 识 ,它主 要包 括 属于 知 的 、完整 的 、可 信的 、新 颖 的 、有效 的信 智能 代理A 。 t g 检索技术 结 构化 知识 的 规 则 语法 ,大量 非结 构 化的 息 的高 级处 理过 程 。 它是在 已知数 据样 本的 智 能代 理 又称 智能 体 ,它是 在 用 户没 有 通 用 知识和 结 构 化的 数据 内容 作为 代理 系 基 础上 ,通 过 归纳 学 习 、机 器学 习、统 计分 明确 具 体要 求的 情况 下 ,根 据 用 户需 要 ,代 统 能 够 内 核访 问 的 系 统 数 据 也 存 在 于 核 心 析等 方 法得 到数 据 对象 间的 内在 特性 据此 替 用 户进行 各种 复 杂的 工作 ,如信 息查 询 、 中 它提供 代 理 系统 工作 所需 要 的各 种 知识 采 用信 息过 滤技 术 在 网络 中提取 用 户感 兴趣 筛选 及 管理 ,并 能推 测 用 户的 意 图 , 自主制 和 数 据 同时 机 器 也 可 以 直 接 对 其进 行 更 的信 息或 者 更高 层 次的 知识 和规 律 来做 关键 定 、调 整和 执行 工作 计 划 。它使 用 自动 获 得 新 的决 策 。网 络信 息 挖掘 其实 就是 对 文档 的内 的领 域模型 ( we 知 识 、信息处 理 、与用 户 : 如 b 访问技 术 : 访问 是指 代理 与周 围环境 进 容 、要利 用 资源 的 使用 以及 资源 之 间的 关系 兴趣相 关的 信 , e5 、领域 组织 结构 )  ̄N 、用 户 行 交互 代 理 与周 围环 境 的交 互 可以 分为 代 进 行分析 。 模型 ( 如用 户背景 、兴 趣 、行为 、风格 ) 知识 理 应用 之 间的 交互 与 代理 和用 户 的交 互 代 网络信 息挖掘 分为w e b日志挖掘 、w e b 进行信 息搜 集 、索 引、过滤 ( 包括兴 趣过 滤和 理 应用 之 间的 交互 又可 分 为对 本地 环境 与 远 内容挖 掘 w e 结 构挖掘 。具体而 言 ,w e b b 不 良信 息过 滤) ,并 自动 地将 用 户感兴趣 的 、 程环境 的访 问 日志挖 掘是 通 过 分 析 w e 服 务 器 的 日志 文 b 对用 户 有用 的信 息提 交 给用 户 。智 能 代理具 。 安 全机 制是 为 了实 现 于外界 的 安全 访 问 件 对用 户访 问w e 是 服务 器方 留下的 访问 b 有 了不断 学 习 、适应 信 息和 用 户兴趣 动 态变 而 设置 外 界是 代 理的 交互 对 象 ,应 包括 所 记 录 进行 挖 掘 ,从 中可 以得 出用 户 的访 问模 化的能 力,从而提供 个性化 的服 务。 需 要的 原始 信 息源 用 户、代 理所 属 的应 用 式 和 访 问兴趣 ,丈站 点 管理 员提 供 各种利 于 1 、智能代 理A e t g n 意义 系统 其他代理 系统等 。 W e 站点 改进或 可以 带 来经济 效益 的信 息。 b 从用 户 的角 度来 看 ,采 用智 能代 理 技术 = 智能A e t g n主要功能 在 个性 让 服 务模 型 中 可以 利用 日志 挖掘 来 的应 用 服务 系统 在不 间 断地 为他 们 工作 ,用 用于信 IJ 息 服 务的 0 g n 主要 日l, J 智 能A e t j 完 ・nl , , 户的 访 问习惯 ,进 行 个性 化分 析 J ・ J J n 6 — ‘ H H I x . …L L t 视 I I l ’^ 1 l L u J 川 监 几 ,用 ,H W — I/ J J { L J L l J 户只在必要 时才需要 参与 。 成 以 下功 能 : 导航 ,即 告 诉 用 户所 需 要 的 资 处 理 。W e 内容挖 掘包括w e 文 本挖掘 和多 b b 从应 用 的角 度来 看 ,智 能代 理就 是 能 自 源在哪 里 ; 解惑 ,即根据( W b 包括tx 、h ml e t t 等) 动执 行用 户委 托 的任 务 的计 算实 体 ,它 有着 于特 定主题 的问题 ;过滤 ,即按 照用 户指定 的 挖 掘 的 目的 是 对 页 面 信 息进 行聚 类 、 分 类 极其广泛的 应用 。 条件 从流 向 用户 的大 量信 息 中 筛选符 合 条 和 关联 分析 ,以及利 用w e 文 档进 行趋势 预 b 从 技 术的 角度 来 看 ,智 能代 理是 以 各种 件的信 息 并 以不 同级 别 ( 文 、详细摘 要 、 测 、分析 等 ; 全 多媒体信 息挖掘 是对 多媒体文档 技 术 为基 础 ,集 合 了许 多实 用的 应用 特性 , 简单 摘 要 标题 ) 现 给 用 户 ; 理 , 即为 用 ( 呈 整 包括 图像 、声音 、图片等媒 体类型) 的挖 掘。 从而能 自 动执 行用 户委托的任 务 。 户把 已经下 载的资 源进行 分门 别类的 组织 ;发 w e 结 构挖掘是 对 we 页 面超链 接关 系、文 b b 2 、智 能 代理 有两 个 主要技 术 特征 : 智能 现 即从 大 量的 公 共原 始数 据 中筛 选和 提炼 档 内部结 构 、文 档u 1 r种的 目录路径 结构 的挖 f ( tlgne和代理 能力( gn y・  ̄I e iec) n l A ec ) 有价 值 的信 息 向 有关 用 户发布 。这些 都是 掘 。 智能性 指应 用 系统 使 用 推理 、学 习 和其 使信 息服 务 走 向个性 化 主动 服务 不 可缺 少的 四 信息推送 技术 他 技 术来分 析 解释 它 已接 触过 的 或刚 提 交给 功能 目前 在此 方面 己经有 了一 些 能够 使用 I 、推 送方式 它的 各种信 息 和知 识 的能 力 。代 理能 力指 一 的 系统 但 智能 化的 程 度还远 远 不 够 ,且主 频 道式 推送 :频道 式 网络 播送 技 术是 目
个性化推荐的方法

个性化推荐的方法
个性化推荐是基于用户个人兴趣和行为,通过算法等技术手段来推荐用户感兴趣的内容或产品。
以下是一些常用的个性化推荐方法:
1. 协同过滤推荐:基于用户历史行为和其他用户行为相似性,寻找相似兴趣的用户,推荐他们喜欢的内容或产品。
2. 基于内容的推荐:利用文本建模技术,分析用户历史行为和内容特征,推荐和用户兴趣相关的内容。
3. 深度学习推荐:利用深度神经网络实现特征的自动提取和表达,从而更精准地预测用户的兴趣和需求。
4. 组合推荐:将多种推荐方法组合使用,综合考虑用户和产品的多个特征,推荐更符合用户需求的内容或产品。
5. 实时推荐:基于实时数据分析和用户行为,动态地对用户进行推荐,提升推荐的实时性和效果。
总之,个性化推荐方法需要根据不同的应用场景和数据特点进行选择和优化,才能更好地实现用户个性化需求的满足。
个性化元搜索引擎技术研究

互 联 网 的迅 速 发 展 形 成 了一 个 全 球 范 围 内 的
维普资讯
电 子 科 技 20 0 8午 第 1期 ( 总第 20期 ) 2
个 性 化 元搜 索 引擎 技 术 研 究
许天 亮,王义峰 , 曾 平
( 西安 电子科技 大学 计算机 外部设备研究 所 ,陕西 西 安 70 7 ) 10 1
摘
要
搜 索引擎是一个 集多种技术 于一体 的综合性 系统 。元搜 索 引擎作 为 下一 代功 能更 强 大、更 具智能
关键词
元搜 索引擎;个性化服务 ;用 户兴趣模型
T 33 P9 文献标识码 A 文章编号 :10 7 2 (0 8 O — 5 0 07— 80 20 ) 1 0 6— 4
中图分类号
Re e r h o Pe s na e a S a c s a c n r o lM t e r h Eng ne Te hn l g i c oo y
Xu Tin in a la g, W a g Yie g, Ze g Pi g n fn n n
(ntueo o ue e p eas Is tt fC mp trP r h rl,Xiin U ies y i i da nv ri ,Xi n7 0 7 ,C ia t 1 0 1 hn ) a
点,使人们 面 临着信 息过 载 和资 源迷 向的问题 ,
过量的信息等 于没有 信息。如何从 海量 的信息 中 高效全 面地获取所需 知识及最新信息 ,如何提高 网络的主动信息 服务能力 ,满足用 户不 同的个性 化需求是人们急待解 决 的问题。如何开展个性化
基于信息过滤系统的个性化搜索引擎的设计

个 h b y可 以用 向量表 示为 : ob h b y=(l ( d ; p d ) (cu t, d ) ob f g ; 仅, ) ( ,1 ; f n a o , d)
fon 指 此 h b y所接 受过 的反馈 数 ; a 记 在 一 定 周期 cu t ob l fg 标
相 同输 入 的情 况 下 , 出适合 当前用 户需求 的结果 . 输
1 2 检 索结 果 的去重处 理 l』 . 2
是 否具有 对 结果 的去重 功能 ( 个 网站 最 多 只能有 一 页 出现 在 排 名靠 前 的搜 索 结果 中 ) 一 ?是 否 能 够删除 重复 的链 接 以保证 在搜 索结 果 中用 户可 以有更 多更好 的选择 机会 ?能 否将用 户 的检索 结果 组织
到不 同的文件 夹 中 ( n r enl h 可 以对 不 同的检索结 果提供 各种 备选 的文 件夹名 供用 户选 择 ) 如 ot r g t h i ? 1 3 检 索结 果的 排序 . 检 索结果 的排序依据 是什 么? 是否依命 中相关 度排 列检 索结果 ?是 否提 供将 日期最 新 的排在 前面
具来帮助用户方便 高效地搜 索所需要的信息. 本文从这个需要 出发 , 设计 了基 于信息过滤 系统的个性化搜
索 引擎.
关键 词 : 性 化 ; 索 ; 户 个 检 用 中 图分 类 号 :P 9 .4 T 3 3 0 文 献 标 识码 : A 文章 篇 号 :0 82 4 (0 8 0 -040 10 - 1 2 0 )60 5 -3 4
收 稿 日期 :0 8— 6— 3 20 0 0
作者简介 : 光(9 9一)女 , 杨 17 , 辽宁盘锦人 , 山师范学院教 育科学与技术学院讲师 鞍
excite的用法
excite的用法Excite是一个能够提供个性化的网络搜索服务的搜索引擎。
它使用先进的技术和算法来提供高质量的搜索结果,并根据用户的搜索历史和偏好进行个性化的推荐。
以下是关于Excite的相关参考内容。
1. Excite的特点和功能Excite是一个综合性的搜索引擎,提供了以下特点和功能:- 高质量的搜索结果:Excite使用先进的搜索算法和技术来提供高质量的搜索结果。
它能够快速准确地找到与用户搜索关键词相关的网页、文件、图片、视频等内容。
- 基于用户偏好的推荐:Excite能够根据用户的搜索历史和偏好进行个性化推荐。
它会记住用户喜欢的网页、主题和内容类型,并在用户进行搜索时提供相应的推荐结果。
- 多种搜索方式:Excite支持多种搜索方式,包括文本搜索、图像搜索、新闻搜索、视频搜索等。
用户可以根据自己的需求选择适合的搜索方式。
- 智能搜索建议:Excite会根据用户输入的关键词提供智能搜索建议,帮助用户更快地找到想要的内容。
这些搜索建议是根据用户的搜索历史和热门搜索词汇生成的。
- 深度链接分析:Excite能够对搜索结果中的链接进行深度分析,找出相关度较高的链接,并将其显示在搜索结果页面上。
这样用户可以更方便地找到与自己搜索词相关的内容。
2. 如何使用Excite进行搜索使用Excite进行搜索非常简单,只需按照以下步骤进行:- 打开Excite的官方网站或下载Excite移动应用程序。
- 在搜索栏中输入要搜索的关键词或短语,然后点击搜索按钮进行搜索。
- 浏览搜索结果页面,可以通过点击链接来访问相关的网页、文件、图片、视频等内容。
- 针对需要进行个性化推荐的用户,Excite会在搜索结果页面上提供相应的个性化推荐列表。
- 根据需要,可以在搜索栏中输入新的关键词继续搜索,或者选择其他搜索方式进行搜索(如图像搜索、新闻搜索等)。
3. Excite在个人和商业领域的应用Excite的个性化搜索和推荐功能可以在个人和商业领域中发挥重要作用。
什么是个性化服务
什么是个性化服务
个性化服务是指根据客户的特定需求,为客户提供独特和专门的增值
服务,以解决客户的特定问题。
个性化服务的目的是为客户提供更容易交互、更方便使用的服务平台;为客户提供更方便使用的服务;为客户提供
更多的帮助,使客户得到更多的满意。
个性化服务的核心是要深入了解客户的需求,然后针对不同的客户,
给他们提供特定的服务。
这种服务可以是产品的设计方案,有助于客户节
省开发时间和成本或者有助于他们提高质量;服务可以是为客户定制的市
场营销策略,增强客户的竞争力;服务可以是客户调度监控的工具,提升
客户运行系统的效率;服务可以是客户的定制培训,帮助客户增强安全性,以及让客户更快速地学习新技术。
个性化服务的优势在于它可以更加精准地满足客户的特定要求。
它可
以提高客户的客户体验(CX),提高客户的成功率,缩短客户的交付周期,降低客户的成本,并增强客户之间的合作感。
它不仅可以帮助企业获得更
多的线下销售,还可以为企业改善技术服务、支持模式和软件升级,从而
帮助企业在市场上树立起一个坚实的声誉。
此外,个性化服务还可以通过实时分析客户使用情况的数据来帮助企
业进行预测。
基于Agent的门户网站个性化搜索的研究
一曩 国攮塞 萎匮 . 直
搜索 投羹; 获得 妁 3, 0 O 祭 嘣僳 雌 大 2 0, 0 董 2 0
图 1 G ol oge中以“ 搜索引擎” 为关键宇的返回结果
实际上 , 同的用户 在性别 、 龄 、 业 、 历 层次 、 不 年 职 学
兴趣爱好 等方面都不尽 相 同 , 以 同一 个关 键词 对他 们 所 的含义往往不一样 , 而通过 相 同关键 词所 获得 的检 索结 果 也无 法 反 映 出用 户 的 真 正 需 求 。一 个 商 人 在 检 索 “ C 的时候 , 脑海里 的 V V” 他 C只是 V nueC p a( etr ail 风险 t 投 资) 医生 检 索 “ C ; V ”的时 候考 虑 的往 往 是 V t n C i mi a ( 他命 c ; I 维 ) 而 T行业技 术人 员所关 心的 V C是高 级语 言开发 工具 。用 户输 入关键 词 的时候 , 所表 达 的需 要 他 往往是 明确 的 , 但是 目前 的搜索 引擎 只是 简单 的将所 有 结果返 回。当用 户看 到数量庞大的与 自己需 要无关 的网 页, 心情一定轻松不起来 。此时 , 用户需要 花费 巨大 的力 气 才能 在其中挑 选出 自己所需 的内容 。 为此 , 为满足不 同兴趣 和 背景 的用户 提供 需要 的搜 索服务应运而生 。也 就是说 , 索 引擎不 能一 味地 仅仅 搜 从关键 词中提供返 回结果 , 而要 根据 用户 的使 用行 为 、 习 惯、 爱好和特点 , 向用户提供满足其个性 化需求 的一 种信 息服务 , 这就是个性化搜索 。 二 门户 网站个性化搜 索的需求
司, 门户 网站技 术先进 、 号召力强 、 资源丰富 , 成为 网络 中 的支 柱 , 与广大 网民的生活息息相关 , 也一直 为业 内人 士 所密 切关注 。 与传统搜索引擎 相 比 , 门户 网站个 性化 搜索 具有 自 己独特的优势 。首先 , 在全球金融危机 的影响下 , 不少 中 小 型 I 企业 和网站 纷纷 倒 闭, 门户 网站 实力 雄 厚 , , I ’ 而 运 营较 为稳定 , 充当个性化搜索 的领 头羊 。其 次 。 能 不管 在 网络迅猛 发展的阶段 , 还是在互联 网的寒 冬 , 门户 网站 的 用户数 量都 比较稳 定 , 利于开 展个 性化 搜索 。如果用 有 户数 量不大 , 者用 户群不稳定 , 或 是不利于开 展个性化 搜 索 的。再 次 , 门户网站不但技术力量强 大 , 且 自身就 具 而 备 了海量 信息 , 中大部分是动态 网页 , 其 而检 索动态 网页 直 是传统搜索 引擎 的难题 。因此 , 门户 网站 的站 内个 性化搜 索 , 具有无 可 比拟的优势 。 三 基于 A et 术的门户网站个性化搜 索系统 gn 技 1 .个性 化搜 索 的主 流技 术。个性 化 搜索 需要 涉 及 的领 域 比较多 , 自然语 言 、 工智能 、 据挖 掘等 。不 如 人 数 同的研究 人员对个性 化搜 索从 不 同的方 向进行 了研 究 , 其 中也 产生了很多技术 , 目前 主要有 O t oy技术 、 no g l 元搜 索 引擎技术和 A et gn 技术 。 O to ( no g 存在论 , ly 本体论 ) 建立 在语 言学基 础上 , 用 于帮 助搜 索引擎识 别用 户表 达 的意思 。但 是 , 户 的表 用 达能力 和方式 千差 万 别 , 兼之 语 言学 界对 “ 词 多义 ” 一 、 “ 同形异义 ” 等问题也没有很好 的解 决方案 , 得 O t[ 使 no — o gr 以真正识别用户真正 表达的意思 。 ) 难 元 搜索引擎根据客户端 的软件跟踪用户 的行为获取 用户 的兴 趣 , 同时调用 多个搜索引擎 为之服务 , 并 将过 滤 后 的信息 返 回给用 户 。但 是 , 知名 的搜 索 引擎也并 不愿 意被程 序员调用 , 以免增加 自己搜索 服务 器 的负担 。因 此, 这种完全依赖他 人的办法可靠性不 高。 A e t智 能代理 ) 人工 智能领 域 和 网络技术 相结 gn( 是 合 的产 物。从 2 0世 纪 6 0年代 起 , 传统 的人工 智能 技术 开始致力 于对 知识表达 、 智能推理 、 器学习 等领域 的研 机 究, 这些研究成果在 计算 机软 件 中的应 用使 得软 件有 了 定 程度上的主动性 , 在 自主判 断 和行 为选择 上有 了 并 定 的智能性 。美 国麻省 理工 大学 较早 地实 现 了 A et gn 技术 , 此后逐 渐应 用 到了各 个领 域。A et 有 自主性 、 gn 具 社会 性 、 主动性 、 习性 、 学 智能性等独特 的优点 , 对于万 维 网这种信息量 巨大 而结 构杂 乱无 章的 网络 环境 , 该技 术 成 为处理万维 网信息 的有效途径。 综合分析可 知 , 应采 用 A et 术 构建 门户 网站 个 gn 技 性化 搜索系统 。 2 基 于 A et . gn 的门户 网站个性 化搜索 系统。为 了在 门户 网站 中建立使 用简便 、 检索质 量较 高 的个性 化搜 索
Web数据挖掘与个性化搜索引擎综述
数据挖掘的发展 现状、 发展趋势以及将 来可能的研究方向, 并简单介绍 了个性化搜 索引 擎的一些情 况, 最后论述 了 we b 数据挖掘在个性化搜 索引擎 中的应 用。 关键词 : e 数据挖掘 ; Wb 个性化 ; 索引擎 搜
中图分类号 :P 9 T 33 文献标识码 : A
,
1 W e 据 挖 掘 综 述 b数
1 1 We . b数 据挖 掘的概 念和 分类
图 1 We 数 据 挖 掘 分 类 b
We b数据 挖掘是 数据 挖掘技 术 与 We 结合 的 b相
we 内容挖掘是从文档内容或其描述 中抽取有 b 趣知识的一种过程 , 是一种基于网页 内容元素对象的 We b挖掘 。这 些 元 素 对 象 既 有 文 本 和 超 文 本 数 据 , 也有图形、 图像等多媒体数据 ; 既有来 自于数据库 的 结构化数据 , 也有用 H M T L或 X L标记 的半结构化 M 数 据 和无结 构 的 自由文本 。 We 结构挖掘是从 网页的超级链接中发现其结 b
0 引 言
We b已成为人们获取信息的一个重要途径 , 随 着 we b信息 的 日益增长 , 人们不得不花费大量的时 间去搜索浏览 自己需要 的信息。搜索引擎已成为人 们最普遍使用 的信息检索 的工具 。该工具涉及到信 息检索、 数据库 、 数据挖掘 、 人工智能、 分布式处理、 自 然语言处理等多个领域的理论和技术 , 因而具有综合 性和挑战性。但是 , 前大多数的搜索引擎提供 的服 目 务还不能令用户满意, 尤其是个性化的查询请求。因 此, 个性化搜索引擎成为当前的一个重要研究课题。
维普资讯
20 年第 8 07 期
文章编号 :0627 (0 7 0 -040 10 -4 5 2 0 ) 8 4 -4 0
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
金雀淘宝SEO搜索优化什么是个性化搜索个性化搜索,顾名思义,就是在搜索过程中融入个性化元素。
一方面从用户角度来讲,每个人的喜好不一样,体现在网购行为上,就是各人的偏好不一样。
这种偏好可以反映在很多方面,有价格偏好、类目偏好、地域偏好、使用偏好、品质偏好等等。
尤其是不同的购买能力会导致用户对不同客单价或者品牌的偏好。
恰好淘宝有能力对这些偏好做一定的挖掘,然后按照不同维度把用户做进一步的细分。
另一方面,从搜索的角度来讲,平台有两件事情可以做:首先挖掘用户的需求,然后明确他们的消费指向,包括对消费者的各种偏好信息杂糅后得出的一个划分;其次是对商品的分类,比如一件商品它的档次是高端还是低端,品牌定位于什么年龄层等,平台可以通过数据的采集,把商品按照各种维度进行分类。
这两件事情做好后,当客户进入到淘宝购物时,平台就能够把他们跟商品做一个相关连线。
如果该消费者是我们俗称的“屌丝型”客户,平时喜欢买打折商品,价格倾向偏低,那么搜索给他呈现的结果页面就会偏向低价位的产品。
如果观察到一个消费者年龄在30+,消费能力比较强,并且注重对品牌的追求,那么平台方在其搜索的相关页面中,就会把符合他消费习惯的产品尽量往前排。
我们可以通过一个例子来串联这两者的关系:如果系统检测到某个消费者对新品的关注度比较高,淘宝就会相应地为他呈现更多当下流行的产品。
那么应该如何定义新品呢?商品一般可以分为两类,标类和非标类。
标类的更新不会很快,比如3C产品,基本有明确的上市时间,定义新品比较容易;而非标类只有品牌会有新品一说,比如一些服装品牌等。
所以对于非标品的新品抓取工作就显得相对困难,无论是从技术手段还是卖家方来说,很难做到绝对准确,但这将是一个逐渐完善的过程。
目前一淘的挖掘有效率大概能达到80%,也就是说平台方所认为的新品中,有80%以上确实是新品。
通过这种针对性的搜索结果展示,转化率会比正常情况下高一些。
在这个例子中,其实就体现出了个性化搜索的两个方面,即用户的划分和商品的划分,以及两者之间的对应关系。
要做到这种有效的相关性,一方面需要和类目合作,另一方面也需要商家在上架时,对商品有更加精准的描述。
而搜索方自己也会做深入的挖掘。
而对于卖家来说,个性化搜索有助于提高流量的价值。
原本消费者进入到淘宝页面后,搜索相同关键词的结果展示页面是相同的。
这种情况下,一方面消费者不能很快找到自己真正需要的产品,另一方面对于商家的展示也是一种流量的浪费。
而如果换成个性化搜索,就形成了千人千面的搜索结果展示,那么客户可以看到更多与自己的预期相符合的产品,店铺也有了更多的展示机会,也就是说提高了流量的价值。
这对于店铺风格比较明确的店铺来说,可能不用花很多的成本去做推广,就能吸引到质量较高的目标客户,无论是对商家还是买家,都节省了时间成本。
所以个性化搜索,最重要的目的就是根据不同人群以往的购买偏好,为客户提供与之类似的商品,用更加精准的定位,契合度更高的搜索结果,来提高产品的点击率以及店铺的转化率。
个性化搜索,虽然听起来很美,但是在实际操作过程中会有很多问题。
首先,在做客户区分的时候就会遇到很多困难。
用户意图的识别会是一个非常纠结的过程。
先不说用户本身根据年龄、性别、地域、收入等各种维度产生的差异,而且目前淘宝上还存在很多两人以上共用一个账号的情况,比如男女朋友,比如父母子女。
这种情况导致他们的购买行为有时候在系统看来是“矛盾”的。
如果系统识别你是女性,可是你却购买了男性的夹克,这时候系统就“傻眼”了。
个性化搜索能做到的是,当默认你为女性时,你搜索“牛仔裤”,结果显示的大量产品为女性的牛仔裤,除非你键入的是“牛仔裤男”,那么系统就知道你是要为男性购买商品,它会遵照你的意愿来展示商品。
所以对于平台方来说,它需要考虑的因素很多,如果搜索结果太死板了,反而会造成用户的反感。
因为并不是所有买家都有明确的用户行为,大多数的购买行为可能是比较随机的。
如果能识别出20%到30%的用户意图,在鬼脚七看来就可以算是一个初步目标的达成了。
其次,对于商品的分类也是一个浩大的工程。
究竟要怎么定义一件商品它是物廉价美还是档次比较高?一件衣服是适合办公时间穿着还是周末时间穿着?对一件产品的定位,还要考虑它的使用场景。
目前针对这些不同维度的定位,将会采取商家和平台方双方合作的方式来完成。
所以说,个性化搜索是一个交互的过程,在融入个性化元素的过程中,淘宝也希望有更多的买家参与进来。
如果有高忠诚度的客户愿意描述自己的消费习惯,愿意帮助平台方优化搜索的规则,那是最好的方式。
用户的参与度越高,那么个性化的实现程度也会更好。
比如大家玩微博,每个人看到的页面都是不一样的,你的页面上展现的都是你定制的内容,看到的信息都是你所希望看到的。
个性化搜索也一样,也是希望通过买卖双方以及和平台方的联动,最终实现一种高效率的信息获得结果,让消费者拥有更好的购物体验。
目前的测试阶段,对于商家来说,感受可能并不大。
鬼脚七认为,至少到今年年底,60%的流量不会有很大的变化,针对剩下的流量,店铺可以充分展现自己的个性化。
但是这种个性化因素还是要考虑产品本身以及服务的质量,要把现在的资源和客户的偏好更好地结合起来。
只有当客户有很明确的消费行为时,个性化搜索才能够真正地发挥作用。
这时候,卖家的产品定位越明确,那么效果肯定就越好。
虽然商家很难根据个性化搜索的具体规则来提升自己的流量,但是店铺可以根据自己的定位以及商品的特性,来吸引到对自己有更高购买意向的消费者。
比如一个消费倾向比较明显的用户,他总是固定选择几家店铺的服装,这些服装的风格、价格也都比较接近,那么在他再次搜索时,平台就会把相同风格的产品展现给他。
所以说个性化搜索对于风格明确的店铺来说,会是一个很好的扩充流量的渠道。
目前我国网购人数已超过2亿,对于搜索规则的变化,鬼脚七表示一定会采取小心谨慎的态度。
但是个性化搜索的趋势不会改变,要在不影响用户体验的前提下,达到平台方想要的结果,这对于整个搜索团队来讲,不仅仅只是今年的一个项目,更是一个需要长期坚持下去的奋斗目标。
弱化好评率对搜索的影响除了个性化搜索,好评率的解绑也是近期淘宝论坛上的热门话题。
好评率与搜索之间,同样有着千丝万缕的关系。
从卖家的角度来讲,简单归纳过去的好评率,有三方面影响:一是买家在浏览购物时,好评率作为一项直观的数据,很大程度上会影响到店铺的转化率;二是卖家如果要上淘宝的一些推广活动,比如淘金币、直通车、聚划算等,好评率是一项必不可少的指标,这对卖家的影响是比较大的;第三就是搜索方面,在原本的搜索排序中,好评率作为一项重要的参考指标,对于买家关键词搜索的呈现页面具有一定的影响。
规则也需要与时俱进,如果现有的规则已经不符合当下的大环境,变成了“有利可钻”的暗箱,并且滋养出了一些黑色产业,那么如果要让整个淘宝生态健康地发展,对这些有漏洞的规则进行升级是不可避免的。
这次之所以拿好评率来开刀,也正是因为大量的职业差评师已经严重损害了中小卖家的利益。
淘宝方在做的事,一方面是保护中小卖家,另一方面也是肃清整个淘宝的大环境。
任何一条规则都是为了让市场更加完善,这才是有价值的规则,如果这条规则可以成为敲诈勒索的帮凶,就势必要被淘汰。
而如果有为数不少的人反受制于规则,那么这项规则肯定是有失偏颇的。
其实早从6月份开始,在淘宝宝贝搜索以及店铺搜索中,“好评率”这一指标已经不再影响搜索结果。
6月27日开始,好评率也不再作为金牌卖家入驻的指标。
这样做最大的目的,就是让商家更关注交易过程本身,而不是仅为了获得一个评价结果。
用一句佛家箴言来描述这种变化:“因上努力,果上随缘。
”就是说商家只要做了能够做的,至于结果如何,不要一味强求。
当我们做一件事情时,起心动念是很重要的。
换到淘宝上来也一样,卖家要为买家服务,但是如果碰到刻意刁难的消费者,导致商家的服务已经偏离了正常轨道的时候,就没必要为了得到一个好评而委曲求全。
当然,卖家与好评之间的解绑,并不是说平台不再考虑好评率,而是要让规则更加完善,更好地去为买卖双方服务。
完善的意思是,平台方会综合地考虑,如果商家销售几百件产品,大部分都是中差评,那么可能产品或者服务确实存在问题。
但是如果卖家总共就卖出了十来笔,也受到了比较集中的差评,平台就会考虑是不是恶意差评。
目前淘宝也开通了绿色通道,商家在遇到可疑交易时,可以进行举报。
另外,在搜索页面会有其他功能,比如好店推荐,主要是推荐一些回头客较多、反复购买率比较高、黄钻买家特别喜欢的店铺。
而买家的使用偏好也对搜索结果有很大的影响,比如有些消费者很喜欢“按销量排序”。
平台在弱化好评率的同时,希望商家更加注重自身的升级,既然好评率不再成为搜索排序的一项参考值,那么什么是排序的重要参考呢?平台方的答案是会更加关注整体的效果,比如产品的退款率、发货速度、详情页的描述情况、旺旺响应速度。
平台方在排序时,就会把所有综合的因素考虑进去,把这些商品推荐给用户。
同时也希望在转到详情页面时,商家可以有更好的方式来留住客户。
还有一个是相关性的问题,比如用户搜索“休闲裤男士白色”,如果商家的裤子确实是白色的,但是没有在属性中标注,那么这次搜索行为,商家的产品可能就不会出现在搜索结果中了。
所以商家要尽可能努力做到关键词的优化,要具体到类别名、品牌名、属性、风格等各方面。
这就是关键词的优化。
结语:总体来说,个性化对于搜索结果页的呈现肯定会有一定影响,但并不是你看到了和别人不同的页面,就一定是受到了个性化因素的影响。
整个搜索的排序,牵扯到的因素有很多,搜索的优化也在不断地进行中。
但是万变不离其宗的是,商家得先做好自己的事,明确自己的定位,把自己的市场做深做细,那么无论搜索的规则怎么变化,都将会是受益者。
转载自卖家网。