超链接环境下的权威资源(翻译)
超链接URL路径和include文件包含路径

超链接URL 路径和include 指令文件包含路径的关系1、两种超链接URL 相对路径的写法:超链接URL 路径的写法受服务器环境配置的影响。
在tomcat 环境中,超链接路径受到设置虚拟目录的context 的path 属性设置的影响,根目录开始的相对路径(也叫做根相对路径)前面表示根目录的那根斜线“/”要改为“/path 值”,最终生成的完整的绝对路径的前面还要再加上“127.0.0.1:8080127.0.0.1:8080””。
而当前目录开始的相对路径(也叫做文档相对路径)的写法和通常的写法是一样的,最终生成的完整的绝对路径的前面被加上了“127.0.0.1:8080/“127.0.0.1:8080/path path 值/”。
2、举例1(context 配置path=“/myweb”):假设tomcat 中项目的根目录为:D:\myroot\student其他目录有student\pages\ch3。
网页a3.jsp 在ch3中,main.jsp 在pages 中。
该项目的Context 配置为:配置为:<Context docBase="D:\myroot\student" path="/myweb" reloadable="true" workDir="D:\myroot\student\work"/>在网页a3中有个超链接访问main.jsp 。
当前目录开始的相对路径的写法和根相对路径的写法各自为:根相对路径的写法各自为:<a href="../main.jsp">当前目录开始的相对路径</a><a href="/myweb/pages/main.jsp">根相对路径</a>注意:注意:根相对路径前面不是单纯的代表根目录的斜线根相对路径前面不是单纯的代表根目录的斜线“/”,而是受context 的path 值影响的根目录名称“/myweb”。
IT翻译

Unit one1. A computer is a fast and accurate system that is organized to accept, store and process data, and produce results under the direction of a stored program.计算机是一种快速而精确的系统在存储程序的指导下它是有组织的接收存储和处理数据以及输出结果。
2. like input devices, output devices are instruments of interpretation and communication between humans and computer systems.类似与输入输出设备是人类和计算机系统之间阐述和交流的工具。
3.This means that, in its network server role, the computer is responsible for holding the files and managing the processes that enable everyone in the office to access and use the network.也就是说,在网络服务器的角色中,计算机负责保管文件以及管理着使每个人在办公、公司里能够访问和使用网络的过程。
Unit two1.Like the Macintosh operating environment, Windows provides agraphical user interface (GUI), virtual memory management, multitasking, and support for many peripheral devices.像苹果公司的MAC机的操作环境,窗口提供了一个图形化用户界面,虚拟内存管理进行多任务工作和支持多种外围设备。
互联网及其应用名词解释

1.计算机网络:是以相互共享资源方式而连接起来的、各自具备独立功能的计算机系统的集合。
从物理结构看,计算机网络是在协议控制下,由一台或多台计算机、若干台终端设备、数据传输设备,以及用于终端和计算机之间、或若干台计算机之间数据流动的通讯控制处理机等所组成的系统的集合。
1.计算机网络系统:凡是将地理位置不同,并具有独立功能的多个计算机系统通过通信设备和线路连接起来,以功能完善的网络软件实现网络中的资源共享、信息传递的的系统,称之为计算机网络系统。
2.网络适配器(网卡):也称网卡或网版,是插入计算机中实现与网络设备的接口设备。
网络适配卡中包括与微机总线接口、收发数据缓存、规程处理芯片、线路编码、电压转换五个部分。
3.网络工作站:网络工作站就是比桌面级(我们用的就是桌面级)高一级的电脑,需要安装个人操作系统。
不需要安装网络操作系统,网络操作系统是网络服务器安装的。
4.互联网协议:是两个通信对象在进行通信时所遵从的一组约定与规则。
一个网络协议是由语法、语义和同步三个要素组成。
5.网关:是互联网络中工作在OSI传输层上的设备。
之所以称之为设备,是因为网关吧一定是一台设备、有可能是一台王机中实现网关功能的软件,多数网关是用来互联网络的专用系统。
6.网桥:也叫桥连接器,是连接两个局域网的一种储存一转发设备,它能将一个较大的LAN分割成多个网段,或将两个以上的LAN互连成一个逻辑LAN,使LAN上的所有用户都可以访问服务器。
7.网络操作系统(NOS):是向连入网络的一组计算机用户提供各种服务的一种操作系统。
根据共享资源方式不同,NOS分为两种不同的机制。
如果NOS软件相等的分布在网络上所有的节点,这种机制下的NOS称之为对等式的网络操作系统;如果NOS的主要部分驻留在中心节点,则称为集中式NOS。
8.网络拓扑结构:网络拓扑结构是指用传输媒体互连各种设备的物理布局,就是用什么方式把网络中的计算机等设备连接起来。
拓扑图给出网络服务器、工作站的网络配置和相互间的连接,它的结构主要有星型结构、环型结构、总线结构、分布式结构、树型结构、网状结构、蜂窝状结构等。
搜索引擎的使用与翻译(含硬盘搜索)

④分别在美国和英国网站验证“like
site: “site:”表示在指定服务器上搜索或搜索指定 域名。搜索结果限定在某个具体网站或网站频 道。 检索式:关键词 site:站点 例如:搜索台州学院网站关于翻译竞赛的内容 操作:翻译竞赛 site:
②站点搜索
注意: 第一:域名或站点名前不要加“http://”,也不能加
①逻辑“与” 含义:表示检出同时含有A、B两个检索词的记
录。 用法:常用于连接不同概念的检索词,以表达 复杂主题。 运算符:AND 或者 * 检索式:A AND B 或者 A*B 例如:检索与台州学院和翻译相关的网页 操作:在搜索引擎框输入 台州学院*翻译
例如:检索与China和housing相关的网页
①W算符(with)
A(nW)B,表示A词与B词之间最多可以 插入n个其他的词,同时,A、B保持前后顺序 不变。还可以写作A()B,表示两词之间不得有 其他词,但有些系统允许有空格或标点符号。 例如:输入 translation(3W)research
常写作
例如:输入
translation(10W)research
例如:检索非酒精饮料
操作:在搜索引擎框中输入
drink NOT alcohol
④注意 逻辑运算符在中文数据库中多用符号
*、+、-, 在英文数据库中使用单词 AND、OR、NOT,且 这些单词为大写。
(2)位置算符检索 位置算符也叫全文查找逻辑算符或相邻度算符,用来规 定符号两边的词在文献中所出现的位置。可以表示词与 词之间的相互关系和前后次序。 文献记录中词语的相对次序或位置不同,表义可能不同, 而同一个检索表达式中词语相对次序不同,其检索意图 也不一样。 布尔逻辑检索有时难以表达某些检索确切的提问要求, 而字段限制检索虽能使检索结果在一定程度上进一步满 足提问要求,但无法限制检索词间的相对位置,此时可 以使用位置算符进行检索。 常用位置算符有四种:W算符(with)、N算符 (near)、Same、S算符(subfield)
计算机专业英语名词翻译

第一章(计算机系统概论)digital computer 数字计算机decimal digits 十进制数字binary 二进制bit 位ASCII 美国国家信息交换标准代码computer system 计算机系统hardware system 硬件系统software system 软件系统I/O devices 输入输出设备central processing unit(CPU) 中央处理器memory 存储器application software 应用软件video game 计算机游戏system software 系统软件register 寄存器floating point data浮点数据Boolean布尔值character data字符数据EBCDIC扩充的二十一进制交换代码punched cards穿孔卡片magnetic tape磁带main memory主存vacuum tubes电子管magnetic drum磁鼓transistors晶体管solid-state devices固体器件magnetic cores磁芯integrated circuit(IC)集成电路silicon chip硅芯片multiprogramming多道程序设计timessharing分时分时技术minicomputers小型计算机mainframe大型计算机large-scaleintegrated(LSI)大规模集成very-large-scale integrated(VLSI)超大规模集成word processing文字处理eletronic spreedsheets电子表格database management programs数据库管理程序desktop publishing桌面印刷personalcomputer(PC)个人计算机microcomputer微型计算机storage capacities存储容量stand-alone computer独立计算机local area network(LAN)局域网peripheral devices外部设备assembly line流水线supercomputer巨型计算机第二章(计算机系统结构)memmory subsystem存储子系统I/O subsystem输入输出子系统bus总线system bus系统总线chip 芯片address bus地址总线instructions指令memory location存储单元data bus数据总线control bus控制总线local bus 局部总线microprocessor微处理器register set寄存器组arithmetic logic unit(ALU)运算器clock cycle时钟周期control unit控制器computer architecture计算机体系结构introduction format指令格式addressing modes寻址方式introduction set指令集internal memory内存main memory主存Random Access Memory(RAM)随机存取存储器Read Only Memory (ROM)只读存储器secondary storage副主存储器vitual memory虚拟存储器Dynamic RAM(DRAM)动态存储器refresh circuitry刷新电路Static RAM(SRAM)静态RAMcache memory高速缓冲存储器masked ROM掩膜ROMPROM可编程RAMEPROM可擦写PROMultraviolet light紫外线EEPROM or EEPROM电擦写PROMbasic input/output system(BIOS)基本输入输出系统flash EEPROM 快闪存储器memory hierarchy 存储器体系结构auxiliary memory 辅助存储器storage memory 存储容量keyboard 键盘alphanumeric key字母数字键function key 功能键cursor key 光标键numeric keypad 数字键mouse 鼠标touch screen触屏infrared ray红外线monitor 监视器display screen显示屏laser printer激光打印机ink-jet printer喷墨打印机dot-matrix printer点针式打印机modem调制解调器input-output interface(I/O interface)输入输出接口peripheral外部设备,外设interrupt中断program counter程序计数器vectored interrupt向量中断nonvectored interrupt非向量中断interrupt vector中断向量Direct Memory Acess(DMA)直接存储器存取timeout超时第三单元(计算机体系结构)parallel processing 并行操作serial operations 串行操作instructions stream 指令流data dream 数据流SISD 单指令单数据流SIMD 单指令多数据流MISD 多指令单数据流MIMD 多指令多数据流pipeline processing 流水线处理combinational circuit 组合电路multiplier 乘法器adder 加法器clock pulse 时钟脉冲vector processing 向量处理one-dimensional array 一维数组scalar processer 标量处理器vector instructions 向量指令CISC 复杂指令集计算机decoder 译码器RISC 精简指令集计算机backward compatibility 向下兼容第四单元(算法与数据结构)algorithm 算法parallel algotithm 并行算法primitive 原语syntax 语法semantics 语义pseudocode 伪码exhaustive search 穷举搜索divide-and-conquer algorithm 分治算法dynamic programming 动态规划bottom-up 自上而下top-down 自下而上array 数组one-dimensional array 一维数组pointer 指针program counter 程序计数器instruction pointer 指令指针list 列表linked list 链表singly-linked list 单向链表double-linked list 双向链表circularly-linked list 循环链表FIFO 先进先出LIFO 后进先出stack 栈push 压栈pop 出栈stack pointer 栈指针queue 队列tree 树root 根level 层次degree of a node 结点的度depth of a tree树的深度binary tree 二叉树traversal 遍历M-way search tree M向搜索树第五章(编程语言)Program 程序Program language 程序设计语言Software engineering 软件工程Pseudocode 伪码Flowchart 流程图Coding 编码Program testing 程序测试Desk-checking 手工检查Documentation 文档User documentation 用户文档Operator documentation 操作员文档Programmer documentation 程序员文档Machine language 机器语言Assembly languages 汇编语言High-level languages 高级语言RAD(rapid application development) 快速应用开发Natural language 自然语言Artificial intelligence(AI) 人工智能Compile 编译Assemble 汇编Source code 源代码Object code 目标代码Linker 连接器Executable file 可执行文件Object-oriented programming 面向对象的程序设计Object 对象Class 类ADT(abstract data type)抽象数据类型Member variable 成员变量Class variable 类变量Member function 成员函数Inheritance 继承Derived class 派生类Overload 超载Message 消息Static binding 静态绑定Dynamic binding 动态绑定Polymorphism 多态性Visual programming 可视化编程Markup language 标记语言HTML(hyper text markup language)超文本标记语言Hyperlink 超链接XML(extensible markup language) 可扩展标记语言Java virtual machine java虚拟机第六章(操作系统)Application software 应用软件System software 系统软件Utility software 实用软件Operating system(OS)操作系统Shell 操作系统的外壳程序Graphical user interface(GUI)图形用户界面Kernel 内核Serial processing 串行处理Job 作业Batch processing 批处理Simple batch systems 简单批处理系统Multiprogrammed batch systems 多道程序批处理系统Monitor 监控程序Scheduler 调度程序Multiprogramming 多道程序Multitasking 多任务Time-sharing systems 分时系统Uniprogramming 单道进程Process 进程Process management 进程管理Process control block 进程控制块Mutual exclusion 互斥Multiprocessing 多处理,多进程Distributed processing 分布式管理Concurrent processes 并发处理Deadlock 死锁Synchronize process同步处理Semaphore 信号量Reusable resource 可复用性资源I/O buffers 输入/输出缓冲区I/O channel 输入/输出通道Deadlock prevention 死锁预防Deadlock detection 死锁检测Deadlock avoidance 死锁避免Virtual memory 虚拟内存Logical reference 逻辑引用Real addresse 实地址Paging 分页Segmentation 分段Virtual address 虚拟地址Physical addresses 物理地址Real-time process 实时处理File management 文件管理Plug and play(PnP) 即插即用第七单元(应用软件)application software 应用软件word processing 字处理软件spreadsheet 电子表格personal finance 个人理财presentation graphic 演示图形database manager 数据库管理软件groupware 群件desktop accessory 桌面辅助工具browsers 浏览区desktop publishing 桌面印刷project management 项目管理CAD 计算机辅助设计CAM 计算机辅助制造multimedia authoring 多媒体发布animation 动画MIDI 乐器数字化接口speech synthesis 语音合成insertion point 插入点scroll bar 滚动条window 窗口menu bar 菜单栏pull-down menu 下拉式菜单Button 按钮toolbar 工具条dialog box 对话框default value 缺省值(默认值)macro 宏OLE 对象链接和嵌入clipboard 剪切板column 列row 行cell 单元格cell address 单元格地址cell pointer 单元格指针formula 公式function 函数bar chart 柱形图line chart 线图pie chart 圆饼图workflow software 工作流软件PIM 个人信息管理软件Web browser 浏览器World Wide Web 万维网home page 主页第八单元(数据库)DBMS 数据库管理系统instance 实例schema 模式physical schema 物理模式存储模式内模式logical schema 逻辑模式概念模式模式subschema 子模式外模式data independence 数据独立性physical data independence 物理数据独立性logical data independence 逻辑数据独立性data model 数据模型entity-relationship model 实体联系模型object-oriented model 面向对象模型semantic data model 语义数据类型functional data model 功能数据模型entity 实体entity set 实体集mapping cardinality 映射基数abstract data type 抽象数据类型attribute 属性relation 关系tuple 元组primary key 主键super key 超健candidate key 候选键foreign key 外键DDL 数据定义语言data dictionary 数据字典DML 数据操纵语言procedure DML 过程化DML nonprocedure DML 非过程化DMLSQL 结构化查询语言view 视图the relational algebra 关系代数the tuple relational calculus 元组关系演算atomicity 原子性consistency 一致性duration 持久性transaction 事物DBA 数据库管理员。
部编版八年级语文上册期末综合素质评价 附答案 (2)

部编版八年级语文上册期末综合素质评价限时:150分钟满分:120分一、语言文字运用 (10分)1. 下列句子中,没有错别字且加点字注音全都正确的一项是( ) (2分)A. 放下繁忙的工作,抛开琐屑.(xiāo)的生活,深深吸一口气,无畏长途拔涉,我们的队伍向着山林和田畴.(chóu)健步出发了。
B. 暮春时节,风慢慢燥热起来,各种花朵也次第凋.(diāo)谢,化为落红,满地狼藉.(jiè),不过总有那么几束花儿崛强地傲立在风中。
C. 古有“翰.(hàn)林多吉水”之说,这说明江西吉安这块热土自古以来就重视教育,而出自此地的历史文化名人也灿若星辰.(chén)。
D. 人民海军从在江苏泰州诞生之日起,就以初生牛椟不怕虎的气势,时刻牢记卫国初衷.(zhōng),不折不挠.(ráo)接续奋斗,守卫祖国海疆安宁。
2. 在下面一段文字的横线上依次填入词语,全部恰当的一项是( ) (2分)微雕,是一种以微小精细见长的雕刻技法。
一件________的微雕作品,没有相当高的微观雕刻技艺和书法功底以及熟练运用微雕工具的技能是难以完成的。
而在拿到一段材料后,雕刻师会认真观察,反复____,最后才一丝不苟地动手雕刻。
一些微雕作品,除了刻有事物外,还会刻上____的文字,增强作品的文艺色彩。
可以这么说,很多中国传统微雕作品,其雕刻技艺之纯熟和高超,往往使人________。
A. 入木三分考订遒劲眼花缭乱B. 惟妙惟肖斟酌遒劲张目结舌C. 惟妙惟肖考订秀颀张目结舌D. 入木三分斟酌秀颀眼花缭乱3. 下列句子没有语病的一项是 ( ) (2分)A. 写作可以从小处着眼,抓住一件事、一个场景或者一个方面写开去。
B. 西方一些国家打着维护人权为幌子,肆意污蔑他国治理国家的正当对策。
C. 要实现共同富裕的伟大目标,能否制定行之有效的财富分配机制是关键。
D. 石墨烯广阔的在能源、生物技术、航天航空、工业建设等领域具有应用前景。
专业英语课文翻译
ACCESS 访问the internet and the telephone system are similar—you can connect a computer to the internet much like you connect a phone to the telephone system . 互联网和电话系统是相似的你可以将计算机连接到互联网更像你将电话连接到电话系统。
once you are on the internet ,your computer becomes an extension of what seems like a giant computer-a computer that branches all over the world. 一旦你在互联网上,您的计算机变得什么看起来像一个巨大的计算机——一个计算机的扩展,世界各地的分支机构。
when provided with a connection to the internet ,you can use a browser program to search the Web. 当提供一个连接到互联网,您可以使用要搜索Web 的浏览器程序。
PROVIDERS 提供商the most common way to access the internet is through an internet service provider(ISP).访问互联网的最常见方式是通过互联网服务运营。
(因特网络提供商)the providers are already connected to the internet and provide a path or connection for individuals to access the internet.供应商已经连接到互联网并提供路径或个人能够访问互联网的连接。
your college or university most likely provides you with free access to the internet either through its local area networks or through a dial-up or telephone connection. 你的学院或大学最有可能为您提供免费接入到互联网通过其局域网络或通过拨号或电话连接。
第5章 超链接
5.2.3 外部链接
外部链接指跳转到当前网站外部,与其它 网站中页面或其它元素之间的链接关系。 外部链接的URL地址一般要用绝对路径。
<a href=“http://网址”>
5.2.3 外部链接
表5-2 常用的URL格式
服 务 URL格式
ftp://192.168.0.1 news:// mailto:abc@
5.2.1 设置超链接路径
3.根路径
是指从站点的根文件夹到文档的路径。 站点根目录相对路径以一个正斜杠开始,该正 斜杠表示站点根文件夹。 用于网站的内部链接,不建议使用。
当一个站点放置在几个服务器上或一个服务器 上放置了几个站点时,可以使用根路径。
5.2.1 设置超链接路径
链接本地机器上的文件时,应该使用相对路 径还是绝对路径? 在绝大多数情况下使用相对路径比较好,例如, 用绝对路径定义了链接,当把文件夹改名或者 移动之后,那么所有的链接都要失败,这样就 必须对你的所有html文件的链接进行重新编排, 而一旦将此文件夹移到网络服务器上时,需要 重新改动的地方就更多了,那是一件很麻烦的 事情。而使用相对路径,不仅在本地机器环境 下适合,就是上传到网络或其他系统下也不需 要进行多少更改就能准确链接。
5.2.1 设置超链接路径
所需要的所有信息。 绝对路径是指链接文件的完整路径,包括完整 的协议名称、主机名称、文件夹名称和文件名 称。
用于网站的外部链接。
如果要链接站点外远程服务器上的网页或图像 等文件,必须使用绝对路径进行链接,即使站 点移动至其他位置也不会出现断链现象。
带下划线的蓝色文本
5.2.1 设置超链接路径
每一个文件都有自己的存放位置和路径, 理解一个文件到要链接的那个文件之间的 路径关系是创建链接的根本。
计算机专业术语名词解释
项目一1、计算机网络:是指利用通信设备和通信线路将地理位置分散的自主计算机地连在一起,在相应软件(包括网络操作系统、网络数据库、网络协议、网络通信、网络管理和应用软件)的支持下,实现数据通信和资源共享的系统。
2、协议:指两个主机间通信时对传送信息内容的理解,信息表示形式以及各种情况下信号都必须遵守一个共同的协定。
3、体系结构:在ARPA网中,将协议按功能分成了若干层次,如何分层以及各层中具体采用的协议系统。
4、通信协议:计算机网络中,数据处理主要由计算机系统来完成,数据传输则要依靠数据通信系统来完成,而数据通信系统在数据处理和数据传输中应该遵循的各种规程和标准就是网络系统要实现的通信协议。
5、Internet:是世界上规模最大、覆盖面最广、信息资源最丰富、用户最多、影响最广的计算机互联网络,是一个将全世界不同国家、不同地区、不同部门和机构不同类型的计算机和各种计算机网络(国家主干网、广域网、城域网和局域网等)连接在一起形成的全球性网络,也称为国际互联网或因特网。
6、www:万维网是全球信息网World Wide Web的缩写,也称Web或3W,是由欧洲量子物理实验室的英国工程师Lee在1989年率先提出的。
www采用客户机/服务器C/S(Client/Server)工作模式,是Internet上最受欢迎的一种多媒体信息服务系统中,最大的特点是超链接,以超文本标记语言HTML与超文本传输协议HTTP为基础,为用户提供界面一致的信息浏览系统。
7、HTML:超文本标记语言是用于建立超文本/超媒体文档的标记语言,对网页的内容、格式及连接进行描述,而浏览器的作用就是读取WWW站点上的HTML文档,再根据此类文档中的描述组织并显示相应的网页。
8、HTTP:超文本传输协议是WWW客户机与WWW服务器之间的应用层传输协议,是最经常使用的协议之一。
9、URL:用于维持页面到页面的链接信息。
10、SMTP:简单邮件传输协议,用于用户向邮件服务器发送邮件,向用户提供高效、可靠的邮件传输。
基于warshall算法的改进Clever算法
个包含该结果集合和它邻居页面的一个超 链接子 图, 该子 图通过 HI S T 算法反复的进 行迭代计算 ,最后收敛以得到每一节点的
互加 强只是通过 单一的有 向链接产生 的 , 而没有考虑到多重的连续链接情况 . 本文我 们就是探讨如何有效 的解决这个问题
帮助 。
但是 Ce e g r h 存 在这 么一 个 l rAloi m v t 问题 , 下面我 们给 出 一 个 简单 的 例子 用来 说 明 ,假 定 一个 四 个 节 点 的 子 圈 如 下 :
P ’P, ,P 一 P .
文献I提 出 _ “ r 一个 ̄ HIS , T 算法很好的 } 改进思想,该算法 甬次提 出了 HI TS算法 的 多 重 超 链 接 的 问题 , 并提 出 了多重 连 续 链 接 可 行性 矩 阵 概 念 。 但 是 ,该 方法 的 时
维普资讯
≥
。
改进 C e e 算法 lv r
何拥军 龚发根 广 东科 学技术职业学院计算机工程技 术学院 5 9 9 10 0
权 威 值 。 思 想后 来 任 I M ma e 该 B Al d m实 验
解决 了Ce"算 法在 W b lv e 超链接 结构研 究方面 的一个问题 :l e 算法在 多重连 续的超链接 情 Ce r v
含有指 向内容相 关页面 超链接的页面 。 Kl n eg 明 向量 a h 终 收 敛 , e b r证 i 和 最 并 且 它 们和 权 再 的 初 始 值 设 置 无 关 。 最 后 的 输 出 结 果 页 面 可 以 根据 权 值 的 不 同进 行分
级。
进 行 了 改进 ,但 该 方 法 只 是 为 了弥 补 HI TS算法 的纯 链接 分析 的不足 ,把文 本 内容也 考虑剑该算 法的权值计算 当中去 , 对解决 HIS T 算法的主题漂移 问题有一定的
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
超链接环境下的权威资源1 引言超链接的网络结构是一个有丰富资源的环境内容信息,它提供给我们一个有效的方法让我们去理解它。
在这种情况下,我们针对这种环境下的链接结构开发了一系列的算法工具从中分离信息,并通过在试验中报告和说明它们在万维网中的多种多样内容中的有效作用。
我们尤其关注它在一个广阔的搜索主题中分析和搜集相关网页以及发现最权威网页时链接的使用。
对于万维网,当我们不缺乏技术的时候,我们发现搜索和结构分析的问题在区域上下文中尤其重要。
万维网是一个巨大而复杂的超文本资料库,它同时在以惊人的速度持续扩展着。
更甚者,它可以看做一个错综复杂的超媒体结构。
它同时有数以百万计的在线参与者,这些参与者们有着多种多样互相冲突的目标,同时他们还在不断的创造超链接内容。
所以,当每个人都在以一种极端的本地层次强制整理信息时,全局的组织已经完全的改变了——上层的结构只能通过之后的分析才能浮现出来。
我们的工作就是源于万维网上的搜索问题。
我们可以粗糙的定义为一个过程——给出查询,提供相关的网页。
由于相关性是主观存在的,所以搜索方法的质量需要人类来评估。
我们是从观察万维网上提高搜索方法的质量开始的。
在现阶段,一个丰富而有趣的问题是在很多方式中,它们算法的有效性和存储性是互不相关的。
尤其是现在的搜索引擎都是典型的只搜索万维网上的一定大小的内容的搜索引擎,同时响应还是秒级别的。
尽管可以提高响应时间来换取对于用户来说更重要的结果,但是对于搜索工具来说,用额外的时间来进行计算,这是非常不可行的。
准确的说,我们缺乏一种具体定义的功能,这种功能客观上应满足我们想要搜索到的页面的质量。
查询和权威资源。
我们认为搜索是开始于用户提供的查询的。
它不需要查询的统一概念性的视图;且它不止是一种查询,它需要运用不同的技术来处理。
思考一下,比如说,有下面几种查询:特定查询,如“网景是否支持JDK 1.1代码签名的API(应用程序接口)?”广泛主题查询,如“找到关于JA V A编程语言的信息”相似页面查询,如“找到与相似的页面”我们现在专注前两种类型的查询,我们可以看到它们现在又很多不同种类的障碍。
处理特定查询时的困难是集中的,粗略地说,是围绕所说的稀缺问题的。
有极少的页面包含这些所需的信息,并且通常很难确定这些页面的真正来源。
对于广泛主题查询,另一方面,我们期待在万维网上找到数以千计的相关页面。
这样的一组页面可能通过标引项匹配(如输入一个字符串“Gates”,“search engines”,“censorship”到搜索引擎AltaVista[17]),或者更复杂的方式产生。
因此,这并不是一个稀缺问题,相反,其基本困难在于丰度问题:可以作为相关页面合理地返回的页面数目太大,以至于人们很难消化。
在这些条件下,为了提供有效的搜索方法,就需要一种方法,从巨大的相关网页集合中筛选出最“权威”或“彻底”的那些。
我们对于广泛主题的查询,可以将权威这一概念,作为我们工作中的中心焦点。
我们在处理这一问题所面临的基本障碍之一是准确地模型化在特定的查询主题上下文中的权威网页。
鉴于某一网页,我们如何辨别其权威?讨论一些在这里出现的复杂难懂的问题是很有用的。
首先,考虑报告的自然目标,即哈佛大学主页为查询“哈佛”的最权威页面之一。
不幸的是,在万维网上有超过100 万的网页使用了目标词“Harvard”。
同时 不是最常使用的,或者使用最突出的,或者以任何其他方式支持一种基于文本的排序函数。
事实上,一个疑问是,是否存在一个纯粹的内源性措施去适当地评估一个页面的权威。
第二个问题是找到主要的www 搜索引擎的主页。
我们可以从查询“搜索引擎”开始,但是这存在一个困难,事实上很多权威网站(雅虎,Excite,AltaVista)都没有在其页面上使用这个词。
这是一个基本的和重复出现的现象——另一个例子,我们就没有理由指望本田或丰田的主页包含术语“汽车制造商”。
链接结构分析。
万维网的网页之间的超链接结构分析,给了我们一个方式来处理许多上文讨论过的困难。
超链接隐含了大量潜在的人为判断,我们认为这种类型的判断正是我们制定一个权威的概念所需要的。
具体来说,万维网上链接的建立是以下判断类型的具体表现:页p,通过包括页面q的链接,就可以在在某种程度上赋予页面q 的权威性。
此外,链接通过指向它们页面,让我们完全有机会找到潜在的权威性的东西;针对很多突出的页面没有充足地自我描述的网页,这种方式围绕着以上的问题提供了一种方法。
当然,这种情况下,有大量的链接的应用程序中有很多的潜在缺陷。
首先,针对各种各样的原因创建的链接,其中有很多与权威性无关。
例如,主要用于导航目的而创建大量的链接(“点击此处返回到主菜单”);其他表示的付费的广告。
另一个问题是很难找到相关性和流行性标准之间的适当的平衡,而这两个都有助于权威这个直觉概念的判断。
这对在下面这个简单的启发式算法定位权威页面所固有的严重问题的思考具有指导性作用:包含查询字符串的所有页,都返回导入链接的最大数目。
我们之前已经讨论的许多查询("搜索引擎"、"汽车制造商",......),其中的一些查询的最权威页面不包含相关的查询字符串。
反之,这启发式算法会考虑普遍受欢迎的网页,如 或 所包含的任何查询字符串,它极具权威性。
在这项工作中,我们针对权威的授予,提出了一个基于链接的模型,并提出它是如何统一标识与广泛搜索主题相关的、权威的www 页面的方法。
我们的模型基于权威性的主题与这些权威性页面所链接到的许多有关权威性页面之间所存在的关系——我们把后面的这一种类型的页面叫做枢纽。
我们观察到枢纽和由链接结构定义在图中权值之间存在的某种自然的平衡,我们利用这一点开发算法,能同时识别两种类型的页面。
这种算法操作于我们构建的基于文本的www 搜索引擎输出中的子图;我们构建这些子图的技术是设计产生一个小的可能包含一个给定的主题最权威页面集合。
概述。
我们发现权威万维网资源的方法必须要具有全球性质:我们希望确定万维网中广泛搜索主题的最中央页作为一个整体。
全局办法涉及到了表示和过滤大容量的信息的基本问题,因为所有的与主题有关的广泛主题查询的页面有数以百万计。
这与查询本地的方法不同,理解万维网中的页面的相互连接属于单个逻辑站点或内联网;在这种情况下,本地方法数据量小得多,经常考虑不同组的主导地位。
注意到我们主要关心的这个是一个从根本上与聚类问题不同的问题也是很重要的。
聚类问题剖析了异构迁入子图,在某种程度上这更有凝聚力;在万维网的背景下,这可能涉及到要区分不同含义或感觉的被查询词相关的网页。
因此,聚类的本质上是不同于那些通过权威性而发现提取出广泛主题的问题,虽然后面的部分将表明某些联系。
即使我们完全能够分析含糊不清的查询词(如"Windows"或"Gates")的多个意义,我们将仍然留下一个潜在问题,那就是表示和过滤掉与每个查询词主要意思相关的大量页面。
本文的结构如下。
第二部分讨论的是通过广泛主题搜索来构建万维网上的子图从而产生一系列丰富而理想的相关权威页面的方法。
第三部分和第四部分讨论在这样的一个子图上识别枢纽和权威性的资源的主要算法,以及该算法的一些应用。
第五部分讨论万维网的搜索、文献计量学,和社会网络研究领域的相关工作和联系。
第六部分描述了如何扩展我们基本的算法,进而去搜集多个枢纽页面和相同链接结构内的权威页面。
最后,第七部分研究为了让我们的技术更有效,我们应该如何定义所搜索的主题的“广泛性”。
第八部分针对在这里提出的方法的调查工作,我们进行了一些评价的问题。
2 万维网中构造一个集中性的子图我们可以将任何集合V 的超链接的页面作为一个有向图G = (V ;E):节点对应于页面,一个有向的边(p,q)∈ E 表示的从p 到q 的一个链接。
我们知道一个节点p 出度是其所链接到其他的节点的数目。
而p 的入度是其它的节点链接到P的数目。
在一个图G中,我们可以通过以下方式隔离小区域或子图。
假设W V是一些页面的子集,我们使用G [W] 来表示图中的W:其节点是在W中的页面,且它的边对应于W.在页面之间的所有链接。
假设我们针对字符串δ进行广泛主题查询。
我们希望通过链接结构的分析找到权威性高的页面;但首先我们应该找到我们算法所操作的在万维网中的那个子图。
在这里我们主要是关注在相关页面上的计算量。
因此,在这里我们举个例子,我们可以将分析限制在集合Q(δ),此处Q(δ)是包含所查询字符串的所有页面,但这有两个明显的弊端。
首先,这个集合可能会包含超过百万的页面,因此需要大量的计算成本;第二,我们发现部分或大部分最适合主题的资源可能不属于这一集合。
理想情况下,我们关注于具有以下属性的页面的集合S(δ)。
(I)S(δ)相对小。
(II)S(δ)是具有很多相关的页面。
(III)S(δ)包含大部分(或许多)最权威的资源。
通过保持集合S(δ)小,我们就能够负担得起应用非平凡算法的计算开销;通过确保S(δ)具有很多相关的页面,我们能容易找到好的权威资源,因为这些页面很可能需要大量引用。
我们怎样才能找到这样的一个集合呢?对于参数t(通常设置其值为200),我们首先从一个基于文本的搜索引擎AltaVista [17] 或Hotbot [57] 搜索查询字符串δ,并从中收集t 个排名最高的页面。
我们将这t个页面作为根集合R(δ)。
根集合满足前面所需要的(ⅰ)和(ⅱ)两条性质。
但它一般是不满足(iii)的。
我们看一下这个,最上层的t个页面由我们使用的基于文本的搜索引擎所返回返回的,它们包含所查询的字符串δ。
因此R(δ) 显然是集合Q(δ)的子集,且Q(δ)是所有包含δ的页面。
我们争论的是Q(δ) 往往不满足条件(iii)。
它观察在Q(δ)也是很有趣的,R(δ)页面之间通常链接是极少的,这通常是无结构的。
例如,在我们的实验中,查询词"java"的根集在不同域中的页面之间包含15个链接;查询词" censorship "的根集在不同域中的页面之间包含28个链接.这些数字都是典型的多种查询尝试;他们应与根集页面之间存在的200*199 = 39800个潜在链接进行比较。
然而,我们可以使用根集S(δ),来产生一组页面集合S(δ),它将满足我们一直在寻找的那些条件。
考虑针对查询主题,那些强有力的权威资源---尽管它不在集合R(δ),但是很可能会在R(δ) 所指向的链接中的至少一个页面中。
因此,我们可以通过扩大R(δ) ,在子图中增加权威资源的权值,并沿着链接,进入和离开它。
具体而言,我们定义了下面的过程。
即:对于子图(δ,E,t,d)δ: 所查询字符串.E : 基于文本的搜索引擎T, d : 自然数R(δ):针对字符串δ,搜索引擎E的结果中的前t 个排名最高的页面使 S(δ):= R(δ)对于每个页面 p ∈(δ)使T+(p) 表示p指向的所有的页面使T−(p) 指向p的所有页面将T+(p)中的所有页面添加到 S(δ)中如果T−(p)的绝对值≦ d 则:将T−(p)中的所有页面添加到 S(δ)中.否则从T−(p)中添加d个页面中到 S(δ)中.结束返回S(δ)因此,我们通过与日俱增的 R(δ),获得 S(δ)。