基于人工神经网络的个性化检索模型
《基于语言模型的个性化信息检索的方法与实现》范文

《基于语言模型的个性化信息检索的方法与实现》篇一一、引言随着互联网的迅猛发展,信息量呈现爆炸式增长,如何从海量的信息中快速、准确地检索出用户所需的信息成为了一个亟待解决的问题。
传统的信息检索方法往往依赖于关键词匹配,难以满足用户的个性化需求。
近年来,基于语言模型的个性化信息检索方法逐渐成为研究热点。
本文将介绍基于语言模型的个性化信息检索的方法与实现。
二、方法概述基于语言模型的个性化信息检索方法主要利用自然语言处理技术,构建语言模型,对用户的查询进行理解与分析,从而返回更符合用户意图的检索结果。
该方法主要包括以下几个步骤:1. 数据预处理:对原始文本数据进行清洗、分词、去除停用词等操作,为构建语言模型做好准备。
2. 语言模型构建:采用深度学习等技术,构建语言模型。
常用的语言模型包括词向量模型、RNN模型、Transformer模型等。
3. 用户查询理解:将用户输入的查询语句进行分词、词性标注等操作,理解用户意图。
4. 检索策略制定:根据用户查询及语言模型输出,制定相应的检索策略,如基于关键词的检索、基于语义的检索等。
5. 结果排序与输出:对检索结果进行排序,并根据用户需求输出相应的结果。
三、具体实现1. 数据预处理数据预处理是构建语言模型的基础。
首先,需要对原始文本数据进行清洗,去除无关信息、重复数据等。
然后,进行分词操作,将文本切分成一个个词语。
此外,还需要进行停用词去除、词性标注等操作,为后续步骤做好准备。
2. 语言模型构建语言模型构建是整个方法的核心。
可以采用词向量模型、RNN模型、Transformer模型等。
其中,词向量模型可以将词语转化为向量,从而在向量空间中进行语义相似度计算。
RNN模型可以捕捉序列信息,适用于处理自然语言等序列数据。
Transformer 模型则具有更好的并行计算能力,可以处理更长的序列数据。
在实际应用中,可以根据需求选择合适的模型。
3. 用户查询理解用户查询理解是连接用户与系统的重要环节。
基于深度学习的智能信息检索与推荐系统设计

基于深度学习的智能信息检索与推荐系统设计智能信息检索与推荐系统是一种通过运用深度学习技术来获取、处理和推荐用户所需信息的系统。
它借助于大数据和人工智能技术,充分挖掘和利用海量数据,提高信息检索和推荐的准确性和智能化程度。
本文将针对基于深度学习的智能信息检索与推荐系统的设计进行探讨。
1. 智能信息检索系统设计智能信息检索系统是为了满足用户多样化的信息需求而设计的。
传统的检索系统通常基于关键词匹配,但这种方法根据用户输入的关键词搜索相关的信息,容易受到词汇表达的限制,结果可能不够准确。
基于深度学习的智能信息检索系统可以通过利用大量的训练数据来获取更准确的搜索结果。
首先,智能信息检索系统需要进行数据的预处理。
这包括数据清洗、分词、词性标注、命名实体识别等操作,以便将原始数据转化为机器可理解的形式,并提取出有用的特征。
可以使用一些开源的自然语言处理工具,如NLTK、StanfordNLP等,来进行这些操作。
接下来,需要利用深度学习技术构建信息检索模型。
常用的模型包括文本分类模型、文本匹配模型和文本生成模型。
基于卷积神经网络(CNN)和循环神经网络(RNN)的模型在智能信息检索中得到了广泛应用。
针对不同的任务,可以选择合适的模型,并通过大规模的训练数据对模型进行训练。
另外,可由于性能问题,可以考虑使用预训练的模型、特征选择和降维等技术来提高系统的效率。
最后,需要设计用户界面,以便用户能够方便地进行信息检索。
用户界面的设计应简洁明了,提供直观的搜索输入框和搜索结果展示区域。
同时,可以考虑加入一些个性化推荐的功能,如搜索历史记录、兴趣标签等,以提升用户体验。
2. 智能推荐系统设计智能推荐系统是为了满足用户个性化的需求而设计的。
在传统的推荐系统中,通常基于协同过滤或基于内容的方法来进行推荐。
然而,这些方法往往忽略了用户的兴趣偏好和行为习惯。
基于深度学习的智能推荐系统可以通过对用户历史行为数据进行建模,从而更有效地挖掘用户的潜在兴趣。
基于人工智能的智能科学搜索引擎研究

基于人工智能的智能科学搜索引擎研究智能科学搜索引擎是基于人工智能技术的一种创新型搜索引擎,它能够根据用户的需求准确地检索并提供相关的科学研究文献、学术论文、科技资讯、专利申请等信息。
本文将围绕基于人工智能的智能科学搜索引擎展开深入研究。
一、智能科学搜索引擎的发展背景与意义科学研究是推动社会进步和创新的重要驱动力。
然而,由于科学研究领域的快速发展和信息爆炸式增长,科学家们往往面临海量的文献和信息,以至于很难找到与自己研究方向相关的有效资源。
传统的搜索引擎往往无法满足科学家对准确、全面、高质量文献的需求。
因此,基于人工智能的智能科学搜索引擎的出现,弥补了这一研究领域的空白。
智能科学搜索引擎利用人工智能技术,通过自动学习和分析用户的搜索行为和需求,为科学家提供高质量、个性化的搜索结果。
它可以通过实体识别、关系识别、主题分类和推荐等方法,准确理解用户的意图并提供定制化的搜索结果。
智能科学搜索引擎的出现,使科学家能够更高效地获取到与其研究方向相关的研究文献,从而提高科研的质量和效率。
二、智能科学搜索引擎的关键技术和实现方法智能科学搜索引擎的实现离不开以下关键技术:1. 自然语言处理:智能科学搜索引擎借助自然语言处理技术,对用户的搜索意图进行语义分析和理解。
通过识别用户输入的关键词、短语或问题,智能搜索引擎可以更好地理解用户的需求并提供有针对性的搜索结果。
2. 信息检索:智能科学搜索引擎采用先进的信息检索技术,结合用户的搜索行为和历史数据进行数据挖掘和分析,从而提供更准确、高质量的搜索结果。
3. 机器学习:智能科学搜索引擎通过机器学习算法,学习用户的搜索行为和偏好,并根据这些数据来优化搜索结果的排序和相关性。
通过持续地迭代和学习,智能搜索引擎能够不断提升搜索的质量和效率。
实现智能科学搜索引擎可以采用以下方法:1. 文本分析和语义理解:通过分析文本的语义和关系,可以更好地理解文献、学术论文的内容和主题。
可以利用自然语言处理技术,将文本分成词、短语,并进行语义分析和推理,从而提取出文献的关键信息。
智能推荐系统的个性化算法

智能推荐系统的个性化算法智能推荐系统是一种基于用户行为和兴趣的信息过滤技术,通过分析用户的历史行为数据和个人特征,为其提供个性化的推荐服务。
而个性化算法是智能推荐系统中最核心的部分,它决定了推荐系统的准确性和用户体验。
一、个性化算法的发展背景随着互联网的快速发展,人们所面临的信息爆炸问题也日益突出。
传统的信息检索技术已经无法满足用户个性化的需求。
因此,个性化推荐系统应运而生,为用户提供了更加针对性的信息服务。
二、个性化算法的基本原理个性化算法主要基于用户行为和兴趣的分析。
它通过对用户的历史点击、浏览、收藏等行为进行挖掘,建立用户的兴趣模型。
同时,还可以考虑用户的个人属性信息,如年龄、性别、地域等,从而更加准确地推荐内容。
三、个性化算法的常用模型1. 协同过滤算法:协同过滤算法是个性化推荐系统中最经典的算法之一。
它通过分析用户行为和兴趣,找到与当前用户兴趣相似的用户群体,然后推荐这些用户感兴趣的内容给当前用户。
2. 内容过滤算法:内容过滤算法是根据内容的特征和用户的兴趣之间的匹配程度进行推荐。
这种算法主要是基于内容的相似性原理,推荐与用户过去喜欢的内容相似的内容给用户。
3. 混合推荐算法:混合推荐算法是将多个不同的推荐算法结合在一起,综合考虑不同算法的优势,从而提供更加准确和个性化的推荐服务。
常见的混合推荐算法有基于规则的混合推荐算法和基于模型的混合推荐算法等。
四、个性化算法的应用领域个性化推荐算法在多个领域得到了广泛的应用。
在电商领域,个性化推荐可以帮助用户发现更多的感兴趣的商品,提高用户的购物体验和购买转化率。
在新闻媒体领域,个性化推荐可以根据用户的阅读习惯,为其推荐感兴趣的新闻报道,增加用户对新闻媒体的粘性。
五、个性化算法的挑战和未来发展方向个性化推荐系统面临着数据稀疏性、冷启动、隐私保护等挑战。
为了提高个性化推荐的效果和用户体验,未来的发展方向主要是从以下几个方面进行突破:1. 挖掘更加细粒度的用户行为轨迹,提高用户兴趣的准确性;2. 结合社交网络信息,利用用户在社交网络中的行为和关系信息进行推荐;3. 基于深度学习的个性化推荐算法,利用深度神经网络挖掘更加复杂的用户兴趣模型。
基于人工智能的档案信息检索技术研究

基于人工智能的档案信息检索技术研究摘要:本文旨在研究基于人工智能的档案信息检索技术。
通过对档案信息检索的现状和问题进行分析,介绍了人工智能在档案信息检索中的应用和价值,探讨了人工智能技术在提高检索效率和准确性方面的作用,并提出了相关改进和优化措施。
关键词:基于人工智能;档案信息检索;技术优化引言随着数字化时代的到来,档案信息的数量呈现爆炸式增长,传统的人工检索方式已经无法满足快速、精确地提取所需信息的需求。
人工智能技术的发展为档案信息检索带来了新的机遇和挑战。
本文旨在研究基于人工智能的档案信息检索技术,探索其在提高检索效率和准确性方面的应用和价值。
一、档案信息检索中存在的问题与挑战(一)信息过载随着信息技术的发展,档案中的信息量呈指数级增长。
传统的人工处理和手工标引方式无法应对大规模、高维度的档案信息,并且容易受到主观因素的影响。
档案管理员和用户都很难从这些海量信息中快速获取到所需的信息,存在信息过载的问题。
(二)检索效率与准确性传统的档案信息检索方式依赖于手工处理和手动分类,这使得检索的效率和准确性受到限制。
人工处理的速度慢、容易出错,并且难以处理复杂的检索需求。
传统方式往往无法满足用户对更高效和准确的档案信息检索的需求。
(三)个性化需求难以满足传统的档案信息检索方式缺乏对个体用户的个性化需求的理解和响应。
由于档案信息的固化性和静态性,很难根据用户的个性化偏好和搜索历史提供定制化的检索结果。
这导致用户的满意度和使用体验较低。
二、人工智能在档案信息检索技术中的应用与价值(一)自然语言处理技术在档案信息检索中的应用1.文本分类与语义理解利用自然语言处理技术,可以对档案中的文本进行分类,以便更好地组织和管理档案信息。
通过训练机器学习模型,可以将文本分为不同的类别,如文件类型、主题等。
这有助于提高档案馆和档案管理员的工作效率,使他们能够快速找到所需的信息。
另外,语义理解技术可以帮助机器更好地理解文本内容,包括识别语句结构、提取实体、理解语义关系等。
深度学习在推荐系统中的最新研究进展

深度学习在推荐系统中的最新研究进展随着互联网的不断发展和用户数据的迅速增长,推荐系统在电子商务、社交媒体和信息检索等领域起着愈发重要的作用。
传统的推荐算法往往依赖于人工定义的特征和规则,但是这种方式面临着特征工程复杂、信息损失和难以应对大规模数据的挑战。
而近年来,深度学习在推荐系统中的应用逐渐引起了广泛的关注,取得了令人瞩目的研究进展。
一、深度学习在推荐系统中的优势深度学习的主要优势在于其对非线性关系的建模能力和端到端的学习方式。
相比于传统的推荐算法,深度学习可以自动学习用户和物品的表示,从而更好地挖掘数据中的潜在信息。
此外,深度学习还可以通过堆叠多个隐藏层来获取更高阶的特征表示,进一步提升推荐系统的性能。
二、基于深度学习的推荐模型在深度学习中,研究人员提出了许多基于神经网络的推荐模型。
其中,最典型的模型包括基于多层感知机(MLP)的协同过滤模型、基于自动编码器(AutoEncoder)的协同过滤模型和基于循环神经网络(RNN)的序列化推荐模型等。
1. MLP模型:这是传统的协同过滤模型与多层感知机相结合的一种模型。
它通过将用户和物品的表示映射到隐空间,利用多个隐藏层进行特征的组合和交叉,从而预测用户对物品的评分或者进行排序。
2. AutoEncoder模型:该模型通过编码和解码两个过程,将用户和物品转换到隐空间中。
通过最小化重构误差,模型学习到了用户和物品的表示,并通过计算用户和物品的相似度来进行推荐。
3. RNN模型:这是一种序列化推荐模型,适用于时间序列类型的推荐任务,比如视频推荐、音乐推荐等。
该模型通过循环神经网络捕捉用户行为的序列信息,并利用这些信息预测用户的下一个行为。
三、深度学习在推荐系统中的应用深度学习在推荐系统中有着广泛的应用。
其中,最典型的应用是基于内容的推荐和基于协同过滤的推荐。
1. 基于内容的推荐:深度学习可以通过学习用户和物品的表示,从而挖掘潜在的语义信息和兴趣标签。
通过将用户的兴趣和物品的特征进行匹配,可以为用户推荐与其兴趣相符的物品。
人工智能领域神经网络模型的构建和训练方面50个课题名称

人工智能领域神经网络模型的构建和训练方面50个课题名称1. 基于深度学习的图像分类算法研究与优化2. 使用循环神经网络的语音识别系统设计与优化3. 基于深度强化学习的自动驾驶系统开发4. 使用卷积神经网络进行目标检测与跟踪5. 基于深度学习的自然语言处理算法研究与应用6. 使用生成对抗网络进行图像生成与编辑7. 基于深度学习的医学图像分析与诊断系统设计8. 使用递归神经网络进行时序数据预测与建模9. 基于深度学习的推荐系统优化与个性化推荐10. 使用深度学习进行情感分析与情绪识别11. 基于深度学习的视频内容理解与分析算法研究12. 使用自注意力机制的机器翻译模型设计与优化13. 基于深度学习的大规模图像搜索与匹配系统开发14. 使用注意力机制的问答系统研究与开发15. 基于深度学习的异常检测与故障诊断模型构建16. 使用卷积神经网络进行医学影像分割与分析17. 基于深度学习的股票价格预测与量化交易模型设计18. 使用循环神经网络进行文本生成与创作19. 基于深度学习的人脸识别与表情分析技术研究20. 使用生成对抗网络进行图像风格迁移与协同设计21. 基于深度学习的音乐生成与合成技术研究22. 使用自注意力机制的文本摘要与推荐系统开发23. 基于深度学习的智能助手系统设计与优化24. 使用卷积神经网络进行文本分类与情感分析25. 基于深度学习的航空器性能优化与控制系统设计26. 使用递归神经网络进行自然语言理解与对话系统开发27. 基于深度学习的音频信号处理与音乐合成技术研究28. 使用生成对抗网络进行视频生成与增强现实应用29. 基于深度学习的虚拟人物角色生成与动画技术研究30. 使用卷积神经网络进行医学图像恶性肿瘤预测31. 基于深度学习的机器人视觉感知与导航系统设计32. 使用循环神经网络进行人体动作识别与运动分析33. 基于深度学习的图像超分辨率重建与细节提取操34. 使用自注意力机制的多媒体信息检索与推荐研究35. 基于深度学习的人脸表情生成与变换技术研究36. 使用卷积神经网络进行工业缺陷检测与质量控制37. 基于深度学习的图像语义分割与场景理解技术研究38. 使用循环神经网络进行音乐生成与和谐编排39. 基于深度学习的自然语言处理技术在智能客服中的应用40. 使用生成对抗网络进行图像修复与增强41. 基于深度学习的情感识别与用户行为预测模型设计42. 使用卷积神经网络进行人体姿态估计与运动捕捉43. 基于深度学习的视觉注意力模型研究与应用44. 使用递归神经网络进行药物发现与分子设计45. 基于深度学习的金融风险预测与投资决策模型构建46. 使用自注意力机制的自然语言推理与问答技术研究47. 基于深度学习的视频人脸识别与跟踪系统开发48. 使用卷积神经网络进行遥感图像解析与地物分类49. 基于深度学习的大规模社交媒体数据分析与挖掘50. 使用生成对抗网络进行语音合成与语音转换技术研究。
自然语言处理在信息检索中的应用

自然语言处理在信息检索中的应用在当今数字化时代,信息呈爆炸式增长,如何从海量的数据中快速、准确地获取所需的信息成为了一项关键任务。
自然语言处理(Natural Language Processing,简称 NLP)作为人工智能的一个重要分支,在信息检索领域发挥着日益重要的作用。
信息检索的目的是帮助用户在大量的文本数据中找到与他们需求相关的内容。
然而,传统的信息检索方法往往基于关键词匹配,这种方式存在诸多局限性。
例如,用户可能难以准确地选择关键词来表达他们的需求,或者关键词可能无法涵盖文本的语义内涵。
而自然语言处理技术能够理解和处理人类自然语言,从而更有效地满足用户的信息检索需求。
自然语言处理在信息检索中的一个重要应用是文本分类。
通过对大量文本的学习和分析,NLP 模型可以自动将文本分类到不同的类别中。
例如,在新闻网站上,可以将新闻分为政治、经济、体育、娱乐等类别。
这使得用户在检索时能够更快速地定位到感兴趣的类别,提高了检索效率。
信息抽取也是自然语言处理在信息检索中的关键应用之一。
它能够从文本中提取出关键的信息,如人名、地名、时间、事件等。
当用户进行检索时,系统可以直接展示这些关键信息,而无需用户在整篇文本中查找。
例如,在搜索引擎中输入“_____在 2023 年的演讲”,系统可以通过信息抽取技术快速找到相关人物在 2023 年的演讲内容,并将关键信息呈现给用户。
语义理解是自然语言处理的核心能力之一,在信息检索中同样具有重要意义。
NLP 模型能够理解用户输入的自然语言查询的语义,而不仅仅是表面的词汇。
比如,用户输入“我想要一部屏幕大、电池续航能力强的手机”,系统能够理解用户的真正需求是寻找具有大屏幕和长续航特点的手机,而不是仅仅包含这些关键词的文本。
问答系统是自然语言处理在信息检索中的直观应用。
用户可以以自然语言的形式提出问题,系统通过对问题的理解和对知识库的搜索,给出准确的答案。
这种交互方式更加自然和便捷,使用户能够更直接地获取所需的信息。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3 检索模型核心算法
3. 1 BP 神经网络核心算法
本检索模型是以 BP 神经网络为基础构建的,BP 神经网络通常由输入层,若干隐含层和输出层组成[9],
经实验证明,多层神经元并不会使结果更优化,反而增
加了计算的复杂度,因此采用标准三层结构,假设输入
单元个数为 q,一层隐含层中神经元的个数选为 n,获
60 ·LIBRARY AND INFORMATION SERVICE·
>>
第 55 卷 第 2 期 2011 年 1 月
即固定权值。同时通过检索词找到检索词特征模型与 用户特征模型矩阵中的对应元素相乘作为神经网络的 输入,经过神经网络计算获得“输出 2 ”,即可变权值。 两项结果经过一定的加权处理,得出最终的智能化检 索结果。图 2 中虚线部分为检索系统的计算部分。
人工神经网络是由大量简单元件相互连接而成的 复杂网络[6],具有高度的非线性,是能够进行复杂的逻 辑操作和非线性关系实现的系统[7]。BP 神经网络算 法是目前应用最多的神经网络,能学习和存储大量输 入—输出模式映 射 关 系,而 无 需 事 先 了 解 描 述 这 种 映 射关系的数学方程。只要能提供足够多的学习样本模 式供 BP 神经网络进行学习训练,它便能完成由 n 维输 入空间到 m 维输出空间的非线性映射[8]。
j
( 5)dPj 表示对第 p Nhomakorabea个输入模式输出单元 j 的期望输
出。
根据 E 对权值 w 进行修正:
wji ( t + 1) = wji ( t) + ηδPj oPi
( 6)
权值修正是在误差反向传播过程中逐层完成的。
由输出层修正各输出单元的连接权值,再由上式计算
相连隐含层单元的误差量,并修正隐含层单元连接权
在个性化检索模型中,用户特征模型,也叫用户模 型,包括人口统计学的信息也包括某一特定用户的兴 趣和偏好。用户模型按时间可分为长期模式和短期模 式。长期模式表示一定时期内相对稳定的用户兴趣, 主要记录了用户的基本特征,如性别、年龄等。短期模 式用来记录用户最近的、快速变化的兴趣,主要记录用 户的兴趣偏好[4]。用户模型的结构可结合 folksonomy ( 公众分类法) 分类方案建立,之后转化成可计算的数 字形式,以一维数组来表示,可用前面若干个元素记录 用户长期特征,后面若干个元素记录用户的短期特征, 数组的每一个元素为 0 到 1 的浮点值( 不包括 0 与 1) , 可写作: C[c1 ,c2 ,c3 ……cq ]。例如: c1 代表性别,当 c1 无限接近 1 时说明用户为男性,当 c1 无限接近 0 时说 明用户为女性。如果 c1 = 0. 2,说明用户有 20% 的可 能性是男性,80% 的可能性是女性。
2. 2 个性化检索模型构建 神经网络完成自学习训练后,便成为具有智能的
网络系统,可 以 为 检 索 提 供 个 性 化 结 果 。根 据 设 计 思 想,可建构个性化检索模型如图 2 所示:
图 2 个性化检索模型 图 2 中,输入值为“用户特征”与“检索词”两项, 其中检索词输入直接以传统搜索方式获得“输出 1”,
取 n 的公式为:
n = q2 2
( 1)
作用函数为非线性的 Sigmoid 型函数,其表达式为:
f( x)
=
1
1 + e-x
( 2)
训练样本集包括 m 个样本模式( xP,yP ) 。对第 p 个训练样本 P = ( 1,2,…m) ,单元 j 的输入综合记为
aPj ,输出记为 oPj ,则有:
n
>>
第 55 卷 第 2 期 2011 年 1 月
基于人工神经网络的个性化检索模型
徐恺英1 王 硕1,2 张 射3 常 改1
1 吉林大学管理学院 长春 130022 2 吉林工程技术师范学院职业教育学院 3 海军大连舰艇学院 大连 116018
长春 130052
〔摘要〕针对网络信息检索需求的日益提高,利用人工神经网络算法构建一种个性化智能检索模型,使搜索引擎 能为用户提供个性化检索服务,并通过仿真实验验证该模型的可行性和有效性。实验结果表明,该模型可有效提 高搜索的准确率。 〔关键词〕个性化检索 人工神经网络 用户特征 〔分类号〕G354. 2 TP391. 3
∑ apj =
wji opj
( 3)
i =0
opj = f( apj )
=
1
1 + e -apj
( 4)
应用公式( 4) 获得神经网络的计算结果,即检索
模型中的“输出 2”,要实现神经网络的自学习,则需要
进一步的误差计算。对每个输入模式 p,网络输出与
期望输出误差为:
∑ ∑ E =
Ep =
p
1 2
( dpj - opj ) 2
图 1 BP 神经元网络结构 当用户以某一检索词进行检索时,系统将该用户 特征模型与该检索词特征模型各对应元素相乘,作为 神经网络的输入值( 见图 1) ,输出值即为某一被检索 页面的可变权值。将其与传统算法得出的固定权值以 一定的计算方式加权,得出最终权值,作为检索的排序 依据,不同用户因其用户特征模型不同,即使使用相同 的检索词,仍得到不同的检索结果,实现具有智能特征 的个性化检索。
收稿日期: 2010 - 08 - 06 修回日期: 2010 - 09 - 29 本文起止页码: 59 - 63,102 本文责任编辑: 王传清
59
<< 情报研究
户参与,提 供 个 性 化 检 索 结 果,系 统 实 现 起 来 较 难。 Ahu Sieg 指出有效的个性化信息访问包括两个重要问 题: 准确地识别用户的背景和以匹配特定背景的方式 组织信息[4]。
检索词特征模型是为了体现检索需要与用户特征
的对应关系而设定的,每一检索词都有其特征模型,也 以一维数组表示,元素的个数、形式与用户特征模型相 同,可写做: K[k1 ,k2 ,k3 ……kq ]。每一元素代表的意 义与用户特征模型一一对应,例如: 当 c1 代表性别时, k1 也代表性别,k1 越接近 1,代表性别对该检索词的影 响越大。如图 1 所示:
〔Abstract〕In this paper,a new method of personalized retrieval based on algorithm of ANN( Artificial Neural Network) is established to meet the growing demand for search. The method which can make search engines more intelligent and more personalized tries to provide the best search results. And the applicability and efficiency of the model are tested in some level. The result showes that it can improve search results effectively. 〔Keywords〕personalized retrieval artificial neural network user feature
对于检索的结果,可判断其是否有效,如判定某项 结果有效,便可将检索结果反向输入进行神经网络的 自学习,修正各层神经元的权值,使神经网络的智能化 程度随着系统的使用不断提高。
其中,用户模型数据主要有两种获得途径: ①直接 通过技术手段获得,无需注册便可获得的信息; ②无法 直接获得的信息,需要用户注册或采用客户端插件实现 的数据收集。用户特征的主要信息参数有: 用户的 IP、 浏览器信息、用户来源信息、检索方式、常用关键词等。 检索词特征模型则以 0. 5 为初始化值。随着用户对系 统的不断使用随时搜集和调整用户模型与检索词特征 模型信息,当判定检索结果有效时,便可根据本次所搜 集的信息调整用户特征模型以及检索词特征模型各元 素值,实现 用 户 特 征 模 型 与 检 索 词 特 征 模 型 的 动 态 调 整。因所建立的数据模型为有限个元素构成的一维数 组,数组元素均为 0 到 1 的浮点值,即使对数据长期积 累,也只是数值的修改,数据量本身并不发生变化,可在 不牺牲数据库存储量的情况下,大大提高检索效率。
有人提出构建个人兴趣模型,记录用户检索的历 史信息数据集,并 以 此 为 基 础,结 合 用 户 新 的 提 问,推 理出最能代表用户意图的类别,把该类别作为检索时 的背景信息指 导 检 索 工 具 的 搜 索[5],但 却 面 临 着 信 息 量庞大,运行一段时间后,系统无法承受的问 题。另 外,对历史信息有效性的认定,也存在一定的困难。
本文采用误差反向传播算法,即 BP 神经网络算法 构建个性化智能检索模型,其思想是建立用户特征模 型与检索词特征模型,作为输入信号,由神经网络为被 链接页面计算出针对用户个人的可变排序权值,并将 这种可变的权值与传统检索应用的固定权值相结合, 得到一个新的排序权值,从而呈现给用户独一无二的、 符合其需求的检索结果,但不会产生庞大的数据量,在 有限数据不断调整的情况下,实现个性化检索。 2. 1 设计思想
ANN-based Personalized Retrieval Method Xu Kaiying1 Wang Shuo1,2 Zhang She3 Chang Gai1
1 Management School of Jilin University,Changchun 130022 2 Vocational Education School of Jilin Teachers’Institute of Engineering & Technology,Changchun 130052 3 Dalian College of Naval Ships,Dalian 116018