语义物联网

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

语义技术——语义工程
语义工程同样由两层组成:服务层和工具层。 1.服务层包含能支持有关本体和数据工程(比如本体模块化、本体转 化、本体查询和不一致决策等等)的服务。由于工程和方法论正在不断地 开发,服务层将允许部署新的服务。这些服务接口需要以后确认。 2.工具层由一组工具展现,这些工具以一种合成的方式来支持本体工 程处理和本体开发方法。由于工程和方法论正在不断地开发,工具层将提 供给机制去集合新的工具到现有的框架里。 以下是一些初始的工具: 本体浏览器,该工具可以让用户通过本体网络来浏览和呈现本体 本体编辑器,该工具允许用户去编辑已存在系统中的本体 仓库管理,该工具允许用户与语义框架中的仓库进行交互。
语义搜索——架构
关键技术——语义抽取
RDF(Resource Description Framework) 是一个处理元数据的 XML应用,所谓元数据,就是“描述数据的数据”或者“描述信息的 信息”。用于语义物联网中的资源描述,能很好地描述资源。RDF三 元组也能够完全包含一个句子中的信息。 RDF三元组包含三个组成部分: 主语,这是一个RDF URI引用或空白节点,即一些资源。 谓语,这是一个RDF URI引用,代表一定的关系 宾语,这是一个RDF URI引用,文字或空白节点,即一些资源 或价值。 一个RDF三元组通常写成(主体,谓语,宾语)。谓词也被称为主 语的属性。一个正常的查询语句包含主语,谓语,宾语和修饰成分 (定语,状语,补语等)等关键组成部分。 一个或多个三元组能很好的表达一个句子的所有意思,句式是有 限的,我们可以总结一些规则和模板来提取三元组。
语义搜索——现状分析
自然语言包含关键词,同时也可以蕴含着关键词之间的 结构关系。自然语言的退化就是关键词检索,完整的自 然语句既包含了关键词信息又包含了词汇之间的语法结 构关系。 自然语言具备关键词查询无需具备专业知识的优点。同 时自然语言查询又具有结构查询的结构关系,加入关键 词之间的结构信息,使查询倾向更加确定。 选用语义网中的RDF三元组作为自然语言抽取后的表示 形式,可以很好的表达自然语言的语义。
物联网本体——构建模式
目前的物联网本体都是基于领域专家人工构建,较权威的有W3C 语义传感器网络孵化器构建的SSN本体,此外还有CSIRO、MMI、 CESN、A3ME、OntoSensor等十余个物联网领域本体。这些本体 以粗粒度方式描述了物联网领域的基本概念,但受限于人工构建速 度的局限和物联网技术的飞速发展,这些本体缺乏对特定系统特征、 新兴概念的描述,不适合直接运用在我们特定的物联网系统中。因 此,我们需要研究更为便捷、更为自动化的本体自动构建技术。 现阶段本体自动构建模型一般包含如下几个部分:对文本信息源进 行分词、去停止词等预处理;通过模式提取从文本信息源中获取知 识元组(知识元组由概念与概念间的关系组成);计算知识元组全 集中概念、关系的语义相似性,合并相似的概念、关系构成初始化 本体;计算初始化本体中概念、关系的重要度及布尔关系,构成层 次化的本体。
物联网本体——API文档
物联网本体——构建示例
Xively: https:/// Cloudsensing: / Evrythng: https:///
Thingspeak: https:/// Exosite: / Yeelink: /
资源描述
需求与概念 现有资源描述 构建模型
资源描述——需求与概念
资源描述是物联网中设备、数据及服务的自描述信息, 是物联网资源开放的基本载体。现有成果可以分为两类: 第一类是由各个标准化机构定义的基于XML的资源模型 及资源描述框架;第二类是在第一类的基础上引入本体 思想,将描述框架提供的词汇、层次结构本体化。 这里的资源描述不是RDF,RDF只是一个定义了三元组 的XML schema,我们这里的资源描述是在利用RDF三 元组结构之上的,与具体业务场景相结合的一套定制化 XML schema。按照依赖结构可以分为:XML<=RDF schema <=资源描述schema <=资源描述文件。
资源描述——现有资源描述
在第一类中,主要代表有ANSI N42.42、OGC SWE工作组创建的 三个协议(SensorML、TransducerML和O&M)标准。SensorML 是基于XML schema的,主要用于描述传感器的功能模型和传感器 观测值处理过程。SensorML提供了一个良好的框架来表示物理资 源、虚拟资源、传感器网和一套从原始数据衍生出高级信息的机制。 TransducerML基于XML的,他的目的是为传感器和处理程序之间 交互、融合异构传感器数据、获取传感器数据精度和准度数据提供 标准。O&M提供了一个统一的模型来表示传感器的观测数据。 在第二类中,主要代表有OntoSensor、Sensor Web for Autonomous Mission Operations(SWAMO) ontology、 Wireless Sensor Networks Ontology(WISNO)等。OntoSensor 使用SUMO本体、ISO 19115标准(地理信息模式)、OGC SensorML。本体使用OWL-Full构建,由Proté gé工具实现并用 Prolog工具测试和验证。SWAMO被设计用来实现传感器设备及服 务之间动态的可互操作性。WISNO将传感器划分为传感器和控制 器两类。
构建流程:从文本信息源中提取带有上下文标签的知识元组;对基 本知识元组进行规范化处理;选择合适的领域本体作为上层本体; 计算上层本体及知识元组全集中概念、关系的语义相似性,合并相 似概念构成系统本体。
物联网本体——构建工具
包含十余种常用的本体 构建基本组件,例如: NLP及XML提取主谓宾 三元组、中文分词、同 近意词等。 集成了基于非结构化文 档和结构化文档的两个 构建模型。
移动生活与新媒体实验室
语义物联网
徐源 祝云凯 北京邮电大学
目录
语义技术 物联网本体 物联网资源描述 语义搜索
语义web技术
需求与概念 架构 语义物联网
语义技术——需求与概念
语义网(Semantic Web)的核心是:通过给万维网上的文档(如: HTML)添加能够被计算机所理解的语义(Meta data),从而使整个互联 网成为一个通用的信息交换媒介。语义万维网通过使用标准、置标语言和 相关的处理工具来扩展万维网的能力。 现在语义web已经运用在很多领域,随着物联网资源的丰富,不同系 统间及同一系统内不同层次间的数据描述格式的差异将极大的限制资源间 的知识共享。
Google的蜂鸟语义搜索算法和 沃尔玛的语义 搜索引擎“Polaris”。
语义技术——架构
语义技术——架构
上图标识了三个部分:语义架构、语义工程和外部组件: 1.语义架构包含了能提供核心功能给语义工程和外部组件 的服务和API。 2.语义工程包含了建立在语义架构功能的基础上能提供给 人类用户本体管理和开发功能的工具和服务。 3.外部组件包含了利用语义架构提供的功能的软件代理。 因为语义工程和外部组件都使用了统一一个语义架构,人们可 以使用开发功能来改变已存储的信息,这样可以轻松地修改和 管理外部组件的行为。
物联网本体
概念与体系结构 构建模型 构建工具
物联网本体——概念与体系结构
本体是一类与具体领域相结合的知识库,通过定义领域内概念及概 念间关系的方式为整个领域建立网状的知识系统。 本体作为语义技术的核心模块,为基于语义的搜索、推理等应用提 供了基本知识。
物联网本体——现有本体
语义技术——语义架构
语义架构由两层组成:存储层和实用层。 1.存储层包含能够提供存储基于元数据的语义信息的组件。因此,仓 库将存储RDF三元组,而注册将存储本体,让存储在仓库中的数据能通过 HTTP协议访问。两个存储组件应该满足高安全、可拓展和性能要求,以便 能支持大规模的应用程序。 2.实用层包含了能够提供业务逻辑(允许应用能使用RDF和本体)的 语义能力。这些组件包括: 查询组件,该组件允许在RDF仓库里执行SPARQL查询请求 发布组件,该组件允许发布RDF数据到一个仓库中 订阅组件,该控件允许订阅特定的数据 推理组件,该控件允许在当前知识和本体里产生新的知识 由于性能的原因,历史上一些推理功能已经由仓库来提供而不是特定 的组件。
语义技术——语义物联网架构
设备层包括物联网环境中所有感知、控制设备,这些设备提供了所在环境的感知数据或者 可以执行操作、控制任务。 数据层将设备层中的每个设备一一映射为数据层中的一个数据集,并通过Restful API的方 式实现数据的开放。通过设备层到数据层的映射,屏蔽了设备在硬件、通信模式上的异构。 资源抽象层对数据层中的设备自描述信息进行了设备层面上的抽象,屏蔽了系统内、同层 次设备在资源描述模型上的异构。 概念抽象层屏蔽了物联网环境下异构系统间及同一系统内不同层次间资源描述模型的异构。
物联网本体——构建模型
基于结构化信息源的物联网本体自动构建
物联网环境下含有大量的结构化信息源,这些结构化文档从平台、 网关、设备、数据等不同侧面提供了领域概念及关系。 通过利用结构化信息源中的 树形结构信息,可以方便的提取三元 组用于构建物联网本体。
物联网本体——构建模型
基于上层本体的物联网本体自动构建
资源描述——现有资源描述
不同IOT平台的 资源描述结构。
资源描述——需求
定制化:不同IOT平台面向的资源层次不同(平台、网 关、设备、数据、逻辑等),同层次资源的描述需求也 不相同,因此资源描述schema需要具备定制化能力。 互通性:定制化带来的是不同资源描述schema之间的 封闭性,因此需要建立物联网上层知识库(本体),以 实现不同资源描述schema之间的互通性。 便捷性:现有资源描述schema主要依靠专家手动生成, 约束条件来自两个方面:平台的定制化需求和本体的知 识集约束。手动构建十分繁琐。
资源描述——构建模型
在假设知识集足够完善的情况下,可以基于本体和专家 输入的需求自动生成资源描述schema,满足定制化、 互通性和便捷性。
语义搜索
研究现状 架构
语义搜索——研究现状
语义搜索方法可以被分类为: 基于结构化语言的查询 以SHOE,Swoogle为代表的的结构化语言查询以知识库 或者本体为基础,查询输入为树形或者RDF形式,要求用户 具有一定的相关背景知识。 基于关键词的查询 以SemSearch、Falcons、QUICK为代表要求用户输入一 个或者多个关键词,然后将这些词映射到本体中,然后根据 模板形成查询请求。 基于自然语言的查询 以PowerAqua为代表基于自然语言的查询应该是查联网本体——普遍问题
选择合适的现有领域本体作为上层本体是经典的本体构建工程五步骤之一, 这一步骤可以充分利用已有的领域本体知识;同时,针对不同系统构建的 不同本体都将以特定的领域本体作为统一的上层本体,不同本体中的概念 可以通过统一的上层本体实现知识的跨系统互通,而现有的本体自动构建 模型中都忽略了这一步骤。 知识元组提取部分中,现有的本体自动构建模型普遍采用自然语言处理算 法从信息源的每个句子中分别提取知识元组,忽视了单个语句与信息源的 段落上下文信息的关系,这一问题将直接影响本体概念提取的准确性。 语义相似性体现了一对概念在特定领域、特定环境下指代对象的相似性, 包含了参照词典获得的语言相似性和所在环境带来的结构相似性。现有研 究缺乏对结构相似性的深入研究,这一问题将导致本体中的概念仅仅体现 了概念词汇的语言学特性而不是这一词汇在具体场景中的语义特性。 物联网环境中广泛的存在着以xml为代表的结构化信息源。与非结构化信 息源相比,结构化信息源提供了更为精炼的知识表达方式和精确的分层知 识。
相关文档
最新文档