基于全文检索的XML存储查询系统

合集下载

基于XML技术的搜索系统的设计与实现

基于XML技术的搜索系统的设计与实现
信 息 技 术
N e w T 2 0 1 3 N O . 1 0( 下
基于 XML技术 的搜 索系统 的设 计与实现
李 猛 甘新 玲 李 永 ( 滨州学院计 算机科 学技 术 系,山 东 滨州 2 5 6 6 0 3)
摘 要 :为 了实现局 域 网 中服 务 器资 源的 深度 共享 与有 效检 索 , 主要 介绍 了基 于 X ML 技 术 的搜 索 系统 的设 计与 实现过 程 。 系统 实现 了文本 、音 频 、视 频 、 图片 资源 的共 享 ,测试 表 明用 户可 以通过 一 台主机 即 可访 问位 于局 域 网 中不 同服 务 器上
用了 “ 平 等 服 务 器 ” 的设 计 概 念 。 即 局 域 网 内 的所 有 主 机 均 为服 务器 ,并 且 每 台 服 务 器 均 运 行 维 护 一个 服务 器列 表 。 当 有 新 的 服 务 器 开启 或关 闭 时 ,其 他 服 务 器 会 收 到 相 应 的 注 册 或 注销 的指 令 , 以此 来 维 护 服 务 器 列 表 。 每 台服 务 器 上 的 资 源 被 索 引 到 We b 容 器 根 目 录 下 的
字段名称 i d t i t l e k e v w o r d s 字段意义 资源编号 资源标题 资源关键字
索 1 设 计思 想
u r l
资源所在地址
局 域 网 内有 多 台 服务 器 ,各 服 务 器 之 间通 过 R M I 技 术 进 行 通 信 。本 系 统 突 破 了传 统 的 “ 主从 服 务 器 ” 的设 计 ,采 3 系统 模块 设计 3 . 1 服 务器 注册 / 注 销模 块 服务 器 的 注 册 / 注 销 模 块 用 以解 决 局域 网内 的各个 服 务 器之 间 的识 别 问题 , 使各 服 务器 进 行维 护 本机 的服务 器 列表 。 每 台服务 器运 行用 于通 信 的 S o c k e t 程序 , 当局域网内有新 的服务器启动或关闭时 会 通 过 组 播 技 术 向其 他 主机 发 送 注 册 或 注 销 请 求 ,收 到此 请 求 的服 务 器 会 将 其 I P地 址 在本 机 的服 务 器 列表 中进 行 添 加 或 移 除 ,这 样 就 达 到 了服 务 器 注 册 与 注 销 的功 能 。 3 . 2资源 的维 护模 块 服 务 器 管 理 员 登 录 系 统 后 ,均 可 以在 后 台进 行 共 享 资 源 的 发 布 。管 理 员 只 需 要 将 所 要 共享 的 资源 放 在 服 务 器 的 r e s o u r c e s目录 下 ,并 在 后 台 的管 理 系 统 中填写资源的相关 信息 即可实现对发布 信 息资 源 的维护 。 3 . 3 X ML 解 析 处理 模块 采用 d o m 4 j 技术 来 实 现对 X M L文 件 的解 析 处 理 ,大 大 提 高 了解 析 效 率 和 搜

XML与全文检索在CMS数据归档中的应用

XML与全文检索在CMS数据归档中的应用
以方便地 检索 、 使用 、 分析 和共 享企 业信息 显得 尤为 重 要 。 于以上 因素 , 基 必须 制定 出一套 合理有 效 的存储 方 式 和检索 策略来 完 成整个 过程 。 X ML E tn il Mak pL n u g ) ( x e sbe r u a g a e 称之 为可 扩 展 性语 言 , 有标 准 性 、 放性 、 活性 、 具 开 灵 易读 性 , 和平
Ta lNa e F l Di l < r c r Or l l i = ” 2 4 > b e m Or i e r> e o d Fi d e 13”
下: 用户 输 入查询语句一 对查 询语句 进行词法 分析 、 语 法 分析 , 及语 言处 理一 搜索索 引 , 到符合语 法树 的文 得 档 一 根据 得 到 的文档 和查 询语 句 的相关 性 , 结果 进 对
非 结 构 化 数 据
文件 目录 文 件
⑤X ML访 问层 次性 。 对 X 针 ML文 档元 素可属性
设 置访 问级 别 , 以对不 同 的用 户展现不 同的视图 , 可 用
文 本 节 点 的父 节点
文本 节点
文 件 内 容
户 只 能看 到被授 权 的那 部分 内容 。
1 2 L cn . u e e文本 检 索技术 2 2 映 射方 法 的限 制规则 及 X . ML数据 导 出
X ML 与 全 文 检 索在 C S数 据 归 档 中 的 应 用 M
文 章 编 号 :0 35 5 (0 20 —0 00 10 -8 0 2 1 )10 7— 3
X ML与全 文检 索在 C MS数 据 归档 中的应 用
王 军 , 兴 忠 张
002) 3 04 ( 原理工大学计算机科学与技术学院 , 原 太 太

基于XML的P2P网络资源检索系统

基于XML的P2P网络资源检索系统
Abs t r a c t : By c o mbi n i n g t h e a d v nt a a g e s o f P2 P n e t wo r k t e c h no l o g y a nd XN见 t e c no h l o g y i n mi ni n g t h e he t e r o g e n e o u s d a a d t i s t r i b u t e d o n t he we b ,t hi s pa p e r b u i l t a n e fi c i e n t P2 P n e wo t r k r e s o u r c e s r e t r i e v a l S ys t e m.An d i t wa s i mp l e me n t e d wi h t t h e o p e n s o u r c e t o o l ki t Lu c e n e . Th e c o r e f un c t i o n o f hi t s s y s t e m i s s re t t c h e d o n nd a r o i d pl a t f o r m o f he t mo b i l e c l i e n t . Th e d e s i g n nd a s o l ut i o n o f hi t s s y s t e m h a s i t s s i g ni ic f nt a r e f e r e n c e t o s o l v e t h e i n f o m a r t i o n s h a r i n g o f h e t e r o - g e n e o u s r e s o rc u e s o n t he we b.

XML文献数据库检索系统的建立与实现

XML文献数据库检索系统的建立与实现

XML文献数据库检索系统的建立与实现
刘红
【期刊名称】《情报学报》
【年(卷),期】2003(022)004
【摘要】本文主要论述如何建立和为什么要建立一个完全基于XML的文献数据库检索系统,并就XML数据库的一些相关问题作了简单讨论.
【总页数】6页(P439-444)
【作者】刘红
【作者单位】南京政治学院上海分院,上海200433
【正文语种】中文
【中图分类】G35
【相关文献】
1.节水农业文献数据库主题检索系统的建立 [J], 刘喜;梁金萍;郭杰光;曹力萌;马丽萍
2.节水农业文献数据库分类检索系统的建立:节水农业文献资源… [J], 刘喜;梁金萍
3.地方文献数据库检索系统建立之设想 [J], 曹志梅;渠芳
4.信息检索系统在建立"中文地质文献数据库"中的应用 [J], 李永球
5.一个用Foxpro实现的中西文文献数据库自动生成与检索系统 [J], 刘有才
因版权原因,仅展示原文概要,查看原文内容请购买。

基于XML数据模型的Web数据库查询系统

基于XML数据模型的Web数据库查询系统

基于XML数据模型的Web数据库查询系统
陈玉哲;代术成;庄成三
【期刊名称】《计算机应用》
【年(卷),期】2002(022)003
【摘要】文中提出用XML作为统一的数据模型的Web数据库的概念和体系结构,设计并实现了基于XML的Web数据库上的查询,提出并实现了用Web索引机制实现快速、高效的Web查询.
【总页数】3页(P41-43)
【作者】陈玉哲;代术成;庄成三
【作者单位】四川大学,计算机系,四川,成都,610065;四川大学,计算机系,四川,成都,610065;四川大学,计算机系,四川,成都,610065
【正文语种】中文
【中图分类】TP311.132
【相关文献】
1.基于XML的异构数据库查询与更新集成系统探讨 [J], 李岩榕;林锋;林晓东
2.基于XML技术的虚拟数据库查询系统 [J], 谭汉松;胡春华
3.基于XML的石油勘探数据库查询应用系统的实现 [J], 薛任;徐斌;张喆;张新雷;乔银梅
4.基于XML的Web数据模型 [J], 秦杰;赵淑梅;杨树强;窦文华
5.基于XML数据模型及面向Web数据挖掘技术 [J], 陈一明
因版权原因,仅展示原文概要,查看原文内容请购买。

基于纯XML数据库Natix系统存储技术研究的开题报告

基于纯XML数据库Natix系统存储技术研究的开题报告

基于纯XML数据库Natix系统存储技术研究的开题报告一、课题背景随着互联网技术的飞速发展,数据量的增长和数据处理的速度要求越来越高,数据库系统的要求也随之变化。

传统的关系型数据库系统往往面临着结构缺陷(Schema Rigid)、冗余数据(Redundancy)、难以处理半结构化数据(Semi-structured Data)等问题。

近年来,XML作为一种广泛应用于Web技术中的数据交换格式,已经成为一种备受关注的数据表示和交换形式。

XML具有自描述性和通用性强、易于扩展等优点,越来越多的数据和应用程序采用XML格式进行存储和交换。

在这种趋势下,基于XML的数据库系统成为了研究的热点。

本课题旨在基于纯XML数据库Natix系统存储技术进行研究,实现高效稳定的XML数据存储和查询功能,提高数据管理的效率和质量。

二、研究内容1. Natix系统的介绍和基本原理。

Natix是一个纯XML数据库系统,采用DOM树存储结构,支持XQuery查询语言。

本研究将分析Natix系统的架构、存储方式、查询引擎、索引机制等方面的实现原理。

2. Natix存储技术的研究和优化。

本研究将深入分析Natix系统的存储结构、索引机制和查询引擎等方面的机制和性能问题,探索在提高查询效率和处理大规模数据的过程中如何优化存储技术。

3. XPath和XQuery查询语言的优化。

XPath和XQuery作为XML数据库的标准查询语言,可支持复杂的查询操作,但随着数据量的增加,查询效率也会受到影响。

本研究将分析XPath和XQuery的查询机制,并探索优化其查询效率的方法。

4. 数据库索引优化。

索引是提高数据库查询效率的关键,本研究将分析索引的类型、建立方式、查询优化的方法,探索提高索引查询效率的技术。

三、研究意义基于XML的数据库系统具有很强的表达和扩展能力,可以适应不同的应用场景和需要,因此得到了广泛的应用和发展。

本课题将通过对Natix系统的研究和优化,提高XML数据存储和查询效率,深入探索XML 数据库的存储和查询原理,增进对XML数据库系统的认识。

XML数据查询与信息检索系统@

XML数据查询与信息检索系统@

XML数据查询与信息检索系统参考文献[1] Bachman C, William S.A General purpose programming systems for Random access memories. In Proceeding of the Fall Joint Computer Conference, AFIPS, 26, 1964.[2] Bachman C. The programming as a Navigator, CACM. 1973.[3] Bachman C. The data structure set Model. In proceedings of the ACMSOGMOD 1974.[4] Codd E.F. A data base sublanguage founded on the relational calculus. In proceedings of ACM SIGFIDET workshop on data description. 1971.[5] Codd E.F. Relational completeness of data base sublanguage in data base systems. Courant Computer Science Symposia Series. V ol.6.1972[6] Codd E.F. Further Normalization of the data base relational Model. In data base systems, Prentice-Hal, 1972.[7] Codd E.F. Recent Investigations in Relational Database Systems. In proceedings of the IFIP Congress, 1974.[8] Y. Papakonstantious, H.Gracia-Molina and J.Widom. Object exchange across heterogeneous information sources. In IEEE ICDE, 1995.[9] P. Buneman. Tutorial: Semistructured data. In PODS, 1997[10]Arenas, Marcelo and Libkin, Leonid. A normal form for XML documents. Proceedings of the 21st ACM SIGMOD-SIGACT-SIGART Symposium on Principles of Database Systems (PODS 2002), P85-96, 2002.[11] C.- C. Kanne and G. Moerkotte, Efficient Storage of XML Data, Proc. Of the international Conf on Data Engineering , 2000.[12] Deutsch, A., Fernandez, M., and Suciu, D. Storing semistructured data in relations. In Proceedings of the Workshop on Query Processing for Semistructured Data and Non-Standard Data Formats 1999b.[13] S. lu, Y. Sun, M. Atay, and F. FOTOUHI. A new inlining algorithm for mapping XML DTDs to relational schemas. In Proc. of the 1st International Workshop on XML Schema and Data Management, Chicago, Illinois, USA, October 2003.[14] W. Fan and L. Libkin. On XML integrity constrains in the presence of DTDS. In Proc. ACM PODS, 2001.[15] P. Buneman, S. Davidson, W. Fan, C. Hara and W. Tan. Reasoning about keys for XML.In DBPL’01 2001.[16] R. Goldman, J. McHugh, and J. Widom. From semistructured data to XML: Migrating the Lore data and query language. In Proc.of the WebDB workshop, Philadelphia, 1999.[17] J. McHugh, S. Abiteboul, R. Goldman, D. Quass, and J. Widom. Lore: A database management system for semistructured data. Technical report, Stanford University Database Group, February 1997.[18] Serge Abiteboul, Dallan Quass, Jason McHugh, Jennifer Widom, and Janet L. Weiner. The lore language for semistructured data. In Journal of Digital Libraries, volume 1:1, 1997[19] J. Shanmugasundaram, K. Tufte, C. Zhang, G. He, D. J. Dewitt, and J. F. Naughton. Relational database for querying XML documents: Limitations and opportunities. In The VLDB Journal, pages 302-304, 1999.[20] A. Deutsch, M. Fernandez, and D. Suciu. Storing semistructured data with STORED .In Proceeding of the Workshop on Query Processing for Semistructured Data and Non-Standard DataFormats, pages 431-442, 1999.[21] D. Florescu and D. Kossman. A performance evaluation of alternative mapping schemes for storing xml data in a relational database. In Proc. of the VLDB, 1999[22] F. Tian, D. DeWitt, J. Chen, and C. Zhang. The design and performance evaluation of alternative XML storage strategies. In ACM Sigmod Record, 31 (1), March 2002.[23] Dongwon Lee, Murali Mani, Wesley. W. Chu. Effective Schema Conversions between XML and Relational Models. In Workshop on Knowledge Transformations for the Semantic Web Lyon, France, July 2002[24] Millist W. V incent, Jixue Liu Completeness and Decidability Properties for Functional Dependencies in XML, /abs/cs/0301017[25] Murali Mani, Dongwon Lee: XML to Relational Conversion Using Theory of Regular Tree Grammars. In Proc. of the VLDB 2002[26] Meike Klettke, Holger Meyer.XML and Object Relational Database Systems-Enhancing Structural Mapping Based On Statistics. In Int. Workshop on the Web and Database(WebDB), Dallas, May 2000.[27] Marcelo Arenas, Leonid Libkin. An Information Theoretic Approach to Normal Forms for Relational and XML Data. In ACM PODS June 2003[28] Klemens Borm, Karl Aberer, Erich J. Neuhoold and Xiaoya yang. Structured document storage and refined declarative and navigational access mechanisms in HyperStorM. In VLDB Touenal 6(4):296-311, 1997.[29] Yi Chen, Susan Davidson, Carmen Hara, and Y ifeng Zheng. RRXS: Redundancy reducing XML storage in relations. In Proceedings of the 29th VLDB Conference, 2003[30] Phil Bohannon Juliana Freire Parson Roy Jerome Simeon. From XML Schema to Relations:A Cost-Based Approach to XML Storage. In ICDE,2002[31] Daniela Florescu, Donald Kossmann Storing and Querying XML Data using an RDDMBS. In Bulletin of the Technical Committee on Data Engineering, P27-34, September 1999[32] Y i Chen, Susan. B. Davidson and Yifeng Zheng.Constraint Preserving XML Storage in Relations. In Fifth International Workshop on the Web and Databases (WebDB) June 2002. [33] Wenfei Fan,Leonid Libkin. Finite Implication of Keys and Foreign Keys for XML Data. Technical Report TUCIS-TR-2000-004, Department of Computer and International Science, Temple University, 2000.[34] Y an, L.L., R. J. Miller, L. M. Haas, R. Fagin. Data-Driven Understanding and Refinement of Schema Mappings. SIGMOD, 2001[35] Miller, R. J. et al. The Clio Project: Managing Heterogeneity. SIGMOD Record 30:1:78-83, 2001[36] Do, H. H., E. Rahm: COMA- A Systems for Flexible Combination of Schema Matching Approach. In VLDB 2002[37] Madhavan, J., P. A. Bernstein, E. Rahm: Generic Schema Matching with Cupid. In VLDB 2001 page 49-58.[38] Li, W. S., C. Clifton: Semantic Integration in Heterogeneous Database Using Neural Networks. In VLDA.1994[39] Li, W. S., C. Clifton: SemInt: A Tool for Identifying Attribute Correspondences in Heterogeneous Database Using Neural Network. In. Data and Knowledge Engineering 33: 1, 49-84, 200..[40] Li, W. S., Clifton, S. Y. Liu: Database Integration Using Neural Networks: Implementation and Experiences. Knowledge and Information Systems 2:1, 2000[41] Melnik, S., H. Garcia-Molina, E. Rahm: Similarity Flooding: A V ersatile Graph Matching Algorithm. In ICDE 2002[42] Mitra P, Wiederhold G, Jannink J: Semiautomatic integration of knowledge sources. In: Proc of Fusion ’99, Sunnyvale, USA.[43] Mitra P, Wiederhold G, Kersten M: A graph oriented model for articulation of ontology interdependencies. In Proc Extending Database Technologies, Lecture Notes in Computer Science, vol.1777.2000, pp. 86-100.[44] An Hai Doan, Pedro Domingos, Alon Y. Halevy: Reconciling Schemas of Disparate Data Sources: A Machine-Learning Approach. In SIGMOD 2001[45] Jaewoo Kang Jeffrey F. Naughton On schema matching with opaque column names and data values. In ACM SIGMOD 2003, California Pages: 205-216.[46] Rahm, E., P.A. Bernstein: A Survey of Approach to Automatic Schema Matching. VLDB Journal.10:4, 2001.[47] Hong Hai Do, Sergey Melnik, Erhard Rahm: Comparison of Schema Matching Evaluations. In Proceeding of the 2nd Int. Workshop on Web Databases (German Information Society), 2002 [48] Li Xu and David W. Embley: Discovery Direct and Indirect Matches for Schema Elements. Eighth International Conference on Database Systems for Advanced Applications (DASFAA’03).2003[49] Guuilian Wang, Joseph Goguen, Y ong-Kwang Nam and Kai Lin: Critical Points for Interactive Schema Matching. In Proceedings of the Sixth Asia Pacific Web Conference, Hangzhou, China, April, 2004[50] L. Palopoli, G. Teracina, and D. Ursino. The system DIKE: Towards the semi-automatic synthesis of cooperative information systems and data warehouses. In Proceedings of ADBIS-DASFAA 2000, page3 108-117[51] /TR/rdf-concepts/[52] Anhai Doan, Jayant Madhavan Pedro Domingos, and Alon Y. Halevy: Learning to Map between Ontologies on the Semantic Web. In Proceedings of the 11th International World Wide Web Conference (WWW), 2002[53] Miilo, T., S. Zohar: Using Schema Matching to Simplify Heterogeneous Data Translation. In VLDB. 1998 Pages: 122-133[54] Paul F. Dietz. Maintaining order in a linked list. In Proceedings of the Fourteenth Annual ACM Symposium on Theory of Computing, pages 122-127, San Francisco, California, 5-7 May 1982.[55] R. Sacks-Davis, T. Dao, J.A. Thom, J. Zobel. Indexing Document for Queries on Structure, Content and Attributes. In Proc. of International Symposium on Digital Media Information Base (DMIB), Nara, Japan, pages 236-245,1997[56] C. L. A. Clarke, G. V. Cormack, and F. J. Burkowski. An algebra for structured text search and a framework for its implementation. In The Computer Journal, 38(1): 43-56 1995[57] D. D. Kha, M. Y oshikawa, S.Uemura. An XML Indexing Structure with Relative Region Coordinate. In Proceedings of the 17th ICDE, pages 313-320. Heidelberg, Germany, April, 2001 [58] Q. Li and B. Moon. Indexing and querying XML data for regular path expressions. In Proceedings of the 27th VLDB, pages 361-370. Roma, Italy, September 2001[59] C. Zhang, J. F. Naughton, D. J. DeWitt, Q. Luo, and G. M. Lohman. On supporting containment queries in relational database management systems. In Proceedings of the 27th ACM SIGMOD, pages 425-436. Santa Barbara, California, USA, May 2001[60] W. Wang. H. Jiang, H. Lu and J. X..Y u. PbiTree Coding and Efficient Processing of Containment Join. In Proceedings of 19th ICDE, pages 391-402. Bangalore, India, March 2003 [61] Sl-Khalifa et al. Structural Joins: A Primitive for Efficient XML Query Pattern Matching. In Proc. of ICDE, San Jose, Feb 2002[62] S.-Y. Chien, Z.V agena, . Zhang, V. J. Tsotras, and C. Zaniolo. Efficient structural joins on indexed XML documents. In Proceedings of the 28th VLDB Conference, Hong Kong, China, August 2002[63] Alan Halverson, Josef Burger, etc. Mixed Mode XML Query Processing. In proceedings of the 29th VLDB, pages 361-370. Berlin, Germany 2003[64] Roy Goldman, Jennifer Widom. DataGuides: Enabling Query Formulation and Optimization in Semistructured Database. In Proceeding of the 23rd VLDB Conference Athens, Greece, 1997 [65] Jan Marco Bremer and Michael Gertz. An Efficient XML Node Identification and Indexing Schema. Teach report. Department of Computer Science University of California, Davis.2003 [66] Haixun Wang Sanghyun Park Wei Fan Philip S. Y u. V ist: A Dynamic Index Method for Querying XML Data by Tree Structures. In SIGMOD 2003, June 912, 2003, San Diego, CA. [67] D. Chamberlin, D. Florescu, J. Robie, J. Simon, and M. Stefanescu. XQuery: A query language for XML W3C working draft. Technical Report WD-xquery-20010215, World Wide Web Consortium, 2001[68] D. Chamberlin, J. Robie, and D. Florescu. Quilt: An XML query language for heterogeneous data sources. In WebDB, May 2000[69] J. Clark and S. DeRose. XML path language (XPath) version 1.0 w3c recommendation. Technical Report REC-xpath-19991116, World Wide Web Consortium,1999[70] Edith Cohen, Haim Kaplan, and Tova Milo. Labeling dynamic XML trees. In PODS, pages 271-281, 2002[71] Zhang et al. On Supporting Containment Queries in Relational Database Management Systems, SIGMOD Conference, 2001[72] A. R. Schmidt, F. Wass, M. L. Kersten, D. Florescu, I. Manolescu, M. J. Carey, and R. Busse. The XML benchmark project. Technical Report INS-R0103, Centrum voor Wiskunde en Informatics, 2001[73] Michael Ley. DBLP database web site. rmation.uni-trie.de/ley/db[74] XMARK: The XML-benchmark project. http://monetdb.cwi.nl/xml.[75] Praveen Rao and Bangka Moon PRLK: Indexing And Querying XML Using Prufer Sequences. In ICDE’2004 March 2004[76] H.Jiang, H. Lu, W. Wang and B. C. Ooi. XR-Tree: indexing XML Data for Efficient Structural Joins. In ICDE, 2003[77] N. Bruno, N. Koudas, D. Srivastava. Holistic Twing Joins: Optimal XML Pattern Matching. In SIGMOD 2002[78] H.Jiang, H. Lu, W. Wang. Holistic Twing Joins on Indexed XML Document. In VLDB 2003[79] SAX(Simple API for XML). .Appendix[80] Haixun Wang, Xiaofeng Meng.On the Sequencing of Tree Structures for XML Indexing. In ICDE 2003[81] Proter, M. An Algorithm for Suffix Stripping, Program, 14(3), pp. 130-137,1980[82] Proter, M. An Algorithm for Suffix Stripping, In Reading in Information Retrieval, Sparck Jones and Willett, eds.,pp. 313-316,1997[83] Harman, er-friendly systems instead of user-friendly front-ends. In Journal of the American Society for Information Science, 43(2), pp164-174, 1992[84] ANSI/NISO Z39.50-1995. Information Retrieval(Z39.50):Application Service Definition and Protocol Specification, July 1995[85] Lee, J.H. Properties of extended boolean models in information retrieval, Proceedings of the 17th Annual International ACM SIGIR Conference on Research and Development in Information pp. 182-190,1994[86] Paice, C.P. Soft Evaluation of boolean search queries in information retrieval systems. In Information Technology: Research and Development, 3(1), pp. 33-42, 1984[87] Waller, W.C., Kraft, D.H. A mathematical model of a weighted Boolean retrieval systems. In Information Processing and Management, 15, pp.235-245, 1979[88] Zimmerman, H.J. Fuzzy Set Theory and its Applications, 2nd edition, Kluwer Academic Publishers, 1991[89] Greiff, W. R., Turtle, H. Computationally Tractable Probabilistic Modeling of Boo lean Operators. In Proceedings of the 20th Annual International ACM SIGR Conference and Development in Information Retrieval, pp.119-128, 1997. page 214[90] Salton, G., Fox, E.A., Wu H. Extended Boolean information retrieval. In Communications of the ACM, 26(11), pp.1022-1036, 1983[91] Salton, G. Automatic text processing: The transformation, analysis, and retrieval of information by computer, Addison-Wesley, Reading, MA, 1989[92] Korfhage, R. R. Information Storage and Retrieval, John Wiley and Sons, New Y ork, 1997[93] van Rijsbergen, C. J. Information Retrieval (2nd ed.), Butterworths, London, 1979[94] Lee, bining multiple evidence from different properties of weighting schemes, Proceedings of the 18th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 180-188, 1995[95] Salton, G, Buckley, C. Term-weighting approaches in automatic text retrieval. In Information Processing & Management, 24 (5), pp.513-523, 1988[96] Callan, J. P. Passage-level evidence in document retrieval. In Proceedings of the 17th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 302-310, 1994[97] Wilkinson, R. Effective Retrieval of Structured Document. In Proceedings of the 18th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 311-317, 1994[98] Hearst, M.A., Plaunt, C. Subtopic Structuring for Full-Length Document Access. In Proceedings of the 16th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 59-68, 1993[99] Deerwester, S., Dumais, S., Furnas, G., Landauer, T., Harshman, R. Indexing by latent semantic analysis. In Journal of the American Society for Information Science, 41 (6), pp. 391-407, 1990[100] Hull, D. Improving text retrieval for the routing problem using Latent Semantic Indexing. In Proceedings of the 17th Annual International ACM SIGIR Conference on Research andDevelopment in Information Retrieval, pp. 282-291, 1994[101] Bartrell, B. T., Cottrell, G. W., Belew, R. K. Latent Semantic Indexing is an optimal special case of Multidimensional Scaling. In Proceedings of the 15th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 161-167, 1992[102] Schutze, H., Silvertstein,. C.A. Comparison of Projections for Efficient Document Clustering. In Proceedings of the 20th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 74-81, 1997[103] Cooper, W.S.. Inconsistencies and misnomers in probabilistic IR. In Proceedings of the 14th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 57-61, 1991[104] Copper, W. S.. Some inconsistencies and misidentified modeling assumption in probabilistic information retrieval. In ACM Transaction on Information Systems, V ol.13, No.1, pp.100-111, January 1995[105] Cooper, W .S., Gey, F. C., Dabney, D. P. Probabilistic retrieval based on staged log istic regression. In Proceedings of the 15th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 198-210, 1992[106] Winkler, R. L., Hays, W. L Statistic: Probability, Inference, and Decision, 2nd ed, Holt, Rinehart, and Winston, New Y ork, 1975[107] Robertson, S. E., Sparck Jones, K. Relevance weighting of search terms. In Journal of the American Society for Information Science, 27, pp. 129-146, 1976[108] Turtle, H.,Croft, W.B. Evaluation of an inference network-based retrieval model. In ACM Transactions on Information Systems, V ol.9, No.3, July 1991[109] Callan, J. P., Croft, W. B., Broglio, J. TREC and TIPSTER experiments with INQUERY. In Information Processing & Management, V ol.31, No.3, pp.327-343, 1995[110] Callan, J. P., Croft, W. B., Harding, S. M. The INQUERY retrieval system, in Database and Expert Systems Application. In Proceedings of the International Conference, V alenc ia Spain, pp.78-83, 1992[111] Shaw, W. M. Term-relevance computations and perfect retrieval performance. In Information Processing & Management, V ol.31, No.44, pp.491-498, 1995[112] J. R. Files and H. D. Huskey. An information retrieval system based on superimposed coding. In Proc. AFIPS FJCC, 35 :423—432, 1969[113] M.C.Harrison. Implementation of the substring test by hashing. In CACM, 14(12): 777—779, December 1971[114] D. Tsichritizes and S. Christodoulakis. Message files. In ACM Trans, on Office Information Systems, 1(1): 88—98, January 1983[115] F. Rabitti and J. Zizka. Evaluation of access methods to text documents in office systems. In Proc. 3rd Joint ACM-BCS Symposium on Research and Development in Information Retrieval, 1984[116] R. Sacks-Davis, A. Kent, and K. Ramamohanarao. Multikey access methods based on superimposed coding techniques. In ACM Trans, on Database Systems (TODS), 12(4): 655-696, December 1987[117] R. Sacks-Davis and K. Ramamohanarao. A two level superimposed coding scheme for partial match retrieval. In Information Systems, 8(4): 273—280, 1983[118] U. Deppisch. S-treee: a dynamic balanced signature index for office retrieval. In Proc. OfACM Research and Development in Information Retrieval, pages 77—87, September 1986 [119] D. L .Lee and C. –W. Leng. Partitioned signature file: Designs and performance evaluation. In ACM Trans. On Information Systems (TOIS), 7(2):l 158—180,April 1989[120] G. Salton and M. J. McGill. Introduction to Modern Information Retrieval. McGraw-Hill, 1983[121] D. E. Knuth. The Art of Computer Programming, V ol.3: Sorting and Searching Addison-Wesley, Reading, Mass, 1973[122] IBM.IBM Systems/370(OS/VS),Storage and Information Retrieval/V ertical Storage (STAIRS/VS). IBM World Trade Corporation.[123 R. L. Haskin. Special-purpose processors for text retrieval. In Database Engineering,4(1): 16—29, September 1981[124] G. K. Zipf. Human Behavior and Principle of Least Effort: an Introduction to Human Ecology. Addison Wesley, Cambridge, Massachusetts, 1949[125] C. Faloutsos and H.V. Jagadish. Hybird index organizations for test database. InEDBT’92, pp 310:327, March 1992[126] Chistos Faloutsos and H. V. Jagadish. On b-tree indices for skewed distributions. In 18th VLDB Conference, pages 363—374, V ancouver, British Columbia August 1992[127] Anthony Tomasic, Hector Garcia-Molina, and Kurt Shoens. Incremental updates of inverted lists for text document retrieval. In ACM SIGMOD, pp 289: 300, My 1994[128] Doug Cutting and Jan Pedersen. Optimizations for dynamic inverted index maintenance. In SIGIR, pages 405—411, 1990[129] Sihem Amer-Y ahia, Nick Koudas, Amelie Marian, Divesh Srivastave, David Toman. Structure and Content Scoring for XML. In VLDB 2005[130] Cong Y u, Hong Qi, H. V.Jagadish. Integration of IR into an XML Database. In First Annual Workshop of the Initiative for the Evaluation of XML Retrieval (INEX), 2002[131] N. Fuhr and K. Grobjohann. XIRQL: A Query Language for Information Retrieval in XML Documents. In Proceedings of the 24th Annual ACM SIGIR Conference on Research and Development in Information Retrieval, 2001[132] Y. Mass, M. Mandelbrod, E. Amitay, D. Carmel, Y. Maarek, and A. Soffer. Juru XML-an XML retrieval system. In INEX 2002[133] ET. Grabs, H.-J. Schek. Flexible Information Retrieval from XML with Power DBXML. In INEX 2002[134] T. Schlieder and H. Meuss. Result Ranking for Structure Queries against XML Documents. In DELOS Workshop on Information Seeking, Searching and Querying in Digital Libraries, 2000 [135] Shurug Al-Khalifa, Cong Y u, H.V. Jagadish. Querying Structured Text in an XML Database. In Sigmod 2003[136] Sihem AmerYhahia, Chavdar Botev, Jayavel. TeXQuery: A Full Text Search Extension to XQuery. In WWW 2004[137] L. L. Guo, F. Shao, C.Botev, J.Shanmugasundaram. XRANK: Ranked Keyword Search over XML Documents. In Sigmod 2003[138] Sihem AmerY ahia, Laks V. S. Lakshmanan, Shashank Pandit. FleXPath: Flexible Structure and Full Text Querying for XML. In Sigmod 2004[139] Daniela Florescu, Donald Kossman, loana Manolescu. Integrating Keyword Search into XML Query Processing. In WWW 2000[140] Taurai T. Chinenyanga, Nicholas Kushmerick. An expressive and efficient language for XML information retrieval. In J. American Society for Information Science &Technology 53(6): 438-453 2002[141] R. Sacks- Davis, T. Dao, J. A. Thom, J. Zobel. Indexing Documents for Queries on Structure, Content and Attributes. Proc. Of International Symposium on Digital Media Information Base (DMIB), Nara, 1997[142] Jaap Lamps, Maarten de Rijke, Borkur Sigurbjornsson. Length. Normalization in XML Retrieval. In ACM SIGIR 2004[143] Hugh E. Williams, Justin Zobel, Dirk Bahle. Fast Phrase Querying with Multiple Indexes. In ACM Transactions on Information Systems 22(4):573-594, 2004[144] Raghav Kaushik, Rajasekar Krishnamurthy, Jeffrey F. Naughton, Raghu Ramakrishna. On the Integration of Structure Indexes and Inverted Lists. In Sigmod 2004[145] Galax. /[146] http;///TR/xquery-full-text/[147] Qizx/open. /qizxopen/[148] Zhongming Han, Jiajin Le, Beijing Shen. Effectively Scoring for XML IR Queries. In DEXA 2006, Springer LNCS[149] Zhongming Han, Jiajin Le and Niya Fu. An Efficient Numbering Scheme and Query Algorithms for XML. In International Journal of Computational Science and Engineering. [150] Zhongming Han, Congting Xi, and Jiajin Le. Efficient coding and querying XML document. In 10th DASFAA, Springer LNCS 3433:54-69 2005[151] Zhongming Han, Niyu Fu. Efficient coding and indexing XML document. In 3rd NDIS, Springer LNCS 3453:138-150 2005。

《基于XML的ACCESS数据库文档阅卷系统的设计与实现》范文

《基于XML的ACCESS数据库文档阅卷系统的设计与实现》范文

《基于XML的ACCESS数据库文档阅卷系统的设计与实现》篇一一、引言随着信息技术的飞速发展,教育领域对阅卷系统的需求日益增长。

为了提高阅卷的效率和准确性,本文提出了一种基于XML 的ACCESS数据库文档阅卷系统的设计与实现方案。

该系统旨在通过XML技术实现对文档数据的标准化存储和传输,以及通过ACCESS数据库进行高效的数据管理和查询。

二、系统设计1. 系统架构设计本系统采用C/S(客户端/服务器)架构,分为前端和后端两部分。

前端主要负责文档的上传、编辑和阅卷操作,后端则负责数据的存储、管理和查询。

系统架构设计应遵循高内聚、低耦合的原则,以确保系统的稳定性和可扩展性。

2. 数据库设计本系统采用ACCESS数据库作为数据存储的核心。

数据库设计应遵循规范化原则,确保数据的完整性和一致性。

同时,为了提高查询效率,应合理设计数据库表结构和索引。

此外,为了支持XML数据的存储和传输,应在数据库中创建相应的XML字段。

3. XML技术应用XML(Extensible Markup Language)是一种可扩展的标记语言,具有数据自描述性、跨平台性和易读性等优点。

本系统采用XML技术实现对文档数据的标准化存储和传输。

通过XML,可以将文档数据转换为结构化的格式,方便后续的数据处理和分析。

三、系统实现1. 前端实现前端主要采用Windows Forms或Web技术进行开发。

用户可以通过前端界面上传文档、编辑文档和进行阅卷操作。

为了方便用户使用,前端界面应具有友好的交互设计和丰富的功能。

2. 后端实现后端主要实现数据的存储、管理和查询功能。

通过ACCESS 数据库技术,可以实现高效的数据存储和查询。

同时,后端还应提供相应的API接口,方便前端进行数据交互。

为了支持XML 数据的处理,后端应具备XML解析和生成功能。

3. 系统集成与测试在系统开发和实现过程中,应进行严格的测试和调试,确保系统的稳定性和可靠性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Ab t a t s r c XML d tb s a e n a mp ra tp r f h ed o aa a e , u sb s e sp o u t r u n o efc i l a e n a a a e h s b e n i o tn a t e f l f tb s b t t u i s r d c sa ep tit f t ot i d s i n e man yb s d o
连 接 查 询 算 法 的 问题 , 时借 助全 文 检 索 技 术 达 到 X 同 ML查询 加 速 的 效 果 。该 方 案 应 用 于 实 际软 件 开 发 项 目中 , 很好 地 解 决 了 X ML 文档 的关 系数 据 库 存 储 管理 工 作 , 并且 具 有 很 高 的查 询 效 率。 关 键 词 关 系数 据 库 X ML索 引编 码 结 构连 接 查 询 全 文 检 索
( eatetfC m ue Si c a dE gnei S ag a i tn nvrt,hn h i 0 2 0.hn ) Dp r n o p tr c ne n n i r g,h nh i a og U i sy S aga 0 4 C ia m o e e n Jo ei 2
S OR N A D T I G N QUE YI R NG Y T M OR XML B E ON F L T X E R E AL S SE F AS D UL E T R T I V
Qa h n za La hn i C a gh o i C a g o o
q ey n f ce c . u r ig ef in y i
Ke w r s y o d
R l i a d t ae X d xe c dn S u tr i u r F l t t e e a e t n l a s ML i e n o i ao a b n g t c a j nq e u x r r vl r u lo y le t i
d t b s s i r s le a d XML q e yn a e e p dt d w t h e p o u lt x e r v 1 h o u in i s d i n a t a ot r aa a e s e ov d, n u r i g c n b x e i i t e h l ff l e t r t e a.T e h i o wae
第2 8卷 第 3期
2 1 年 3月 01
计 算机 应 用与软 件
Co p tr App iai n n o wa e m ue l t sa d S f r c o t
V0. 8 N0 3 12 .
M a . 01l r2
基 于全文检索 的 X ML存 储 查 询 系统
但是半结构化 的 XM I文档和纯文本文档毫无二致 ; 此外结构连 接查询算法执行 时, 就相 当于作用 在原始 的 X ML文 档上 , 根本 不 能体现关 系数 据库存储 的优势 。 本文针对关 系数据库 管理 X ML数据 的问题 , 设计 了 ie e D wy 征, X 但 ML本质上只是一种 数据 格式 , 核心并 不在 于 如何 管 其 理数据 , 这就要借助于数据库系统 。投入商业应用的纯 X L数 M
i e o ei poi d wt w ihtepolm o tg t gfl tx rtea t h o g n ML su t a ji q e igi rlinl n xcd r d , i hc rbe i er i ul et er vl e nl yad X t c rl on ur n e t a d s ve h h f n an i c o r u y n ao
些 问题 。例 如, SS L Sre 将 X L文 档看 作一种 单独 的数 M Q evr M
0 引 言
Xa Pt X ur h和 Q e y的发 展 成 熟 , 得 X L具 有 了 数 据 库 的 特 使 M
据类型 , 整个 文 档 存储 在 一 个 字 段 中 。虽 然 可 以构 建 倒 排 索 引 ,
te r lt n ld tb s s wh c e n tl rn n s me t u ls F c n e sta in o o i g XML d t n r lt n l aa a e , e h ea i a aa a e , ih d f i y b i g i o r be . a i g t i t fs r o i e o h u o t n aa i e ai a d tb s s a n w XML o
d v l pn r g a e eo i g p o m wh c h s r i h a wel e l i t e l d a t t h ma a e n o e ain l aa a e tr o XM[ o me t a d h w a o d w h n g me t f r lt a d tb s s e f o o d ( u n S n s o s g o
乔长昭 廖 畅
( 海 交 通 大 学 计 算 机科 学 与 工 程 系 上 上 海 204 020
摘 要
XML数据库 已经成为数据库领域 的重要成 员, 但是在 商业数据库 产 品中它主要构建 在甍 系数播 霹基础之 上, 自然 引 这
入很 多难题。针对 X ML的关 系数据 库存绪 , 出一种新 的 X 提 ML索引编码 , 解决 了在 关 系数据 库 中集 成全 支检 索技术 和 X ML结构
相关文档
最新文档