地名地址数据规范

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

地名地址数据规范

一、根据地名查询服务2.0要求,地名数据必须具有以下6个字段

1、Domainname 中文简称

2、Standardname 标准名称

3、Gbcode 行政区代码

4、Addname 中文地址

5、Addcode 地址代码

6、Clsid 分类的代码

注:地名分类编码CLSID与分类查询有关,分类查询通过分类编码进行查询。CLSID字段可以从CODE地址编码中提取。

同时为了方便数据入库后地名搜索服务相关设置,地名地址数据中的6个字段信息和映射字段信息一致,做到一一对应。如下图1、图2

图1 映射字段导入

图2映射字段导入

二、天地图地名数据分类规则

1、类型代码为固定为16位数,五级分类原则,每一级用三位数表示,取值为000-999(000表示为空)如下图3

2、为了避免以0开头造成位数不足,故在代码最前面统一添加一位编码1。

3、若不满足16位,将会在后面补0,前一级为父类,后一级为子类,每一个父类可以有多个子类。具体分几类用户可以自定义。

我们在分类查询中只分到二级分类,所以分类编码只需6位

图3分类编码示例

三、地名查询服务发布步骤:

1、设置共享路径

共享路径是为了存放地名和公交索引文件,当查询的时候直接查询本地的索引文件,而不是直接查询数据库,提高查询效率。共享路径一般在服务器上设置。如下图4

图4设置共享路径

2、创建地名索引

创建地名索引的过程就是在共享文件中生成索引文件的过程。

图5创建地名索引

创建地名索引时需要设置相应的表格,也可以使用系统默认文件,如果系统提示默认文件不符合实际要求可以根据需要整理放到系统中。

地名类型表

地名类型表中的CODE与地名数据表中的CLSID相对应,地名类型表主要用来进行地名分类查询。规范化的地名数据类型,将极大的优化搜索结果的精确度。该表的目标既是通过规范化的编码将地名的类型进行管理,通过某一类型能找到相关或所包含的类型,同时能够定义类型的级别,来对地名搜索结果进行一定意义上的排序。

行政区划表

行政区划表中的CODE(地址编码)与地名数据表中GBCODE相对应。长度为6,采用的是国家统一的6位编码,可参考国家发布的行政区划国标码。

有了这样规范化的行政区划编码,我们就能通过应用程序对查询结果做约束,判断出所查询的地名位于哪个行政区以及在地图上的位置范围,则所查询的地名必须是在此行政区划内的。例如:查询“武汉市肯德基”,通过“武汉市”这个词获取到行政区划表中的CODE 值,此CODE值与地名数据中的GBCODE相关联,则将查询约束到“武汉市”这个行政区划中,缩小查询区域范围。

同义词表

存放同义词,主要是对用户输入的字符串跟同义词表进行对比看有没有同义词,如果发现有,则在查询的时候带上相关同义词进行查询。表达为同一个意思的相近词语,其编码CODE值相同。

拼音检查表

主要是对用户输入的字符串跟拼写检查表进行对比看有没有错误的词语,如果发现有,把正确的词语和查询结果在客户端解析并在页面进行相应的提示,例如“您是不是要找XXX”。

扩展词表

扩展词表用于在地名进行模糊查询时提升匹配精度。进行关键字查询时,例如查询武大吉奥,为了使查询结果更加匹配,精度更高,可在扩展词中添加“武大吉奥”这个词,当用户进行查询的时候,将会查询与“武大吉奥”匹配度高的词,而不会将“武大吉奥”打断成“武大”“吉奥”等词来进行查询,同时也不会将“武大”“吉奥”等一系列词笼统的查出来,当匹配到“武大吉奥”字样的相关词后,将会只显示此类词。

停用词表

停用词表可以将某些敏感词进行屏蔽,同时还有打断一个字段较长词的作用。例如:停用“办事处”,进行有关“办事处”词的查询,将不会返回带有“办事处”字样词的结果。

3、服务创建和发布

服务创建和服具体过程和以前一样,不在详细说明

相关文档
最新文档