云数据库Cloud Database

合集下载

技术部的名词解释英文

技术部的名词解释英文在现代科技和信息时代，技术部门扮演着至关重要的角色。

技术部负责管理和支持各种技术工具、设备和软件，并确保其正常运行。

然而，对于非技术人员来说，技术部门的术语和专有名词可能令人困惑。

本文将为您解释一些技术部的常见名词的英文术语，以便更好地理解和交流。

1. 服务器 (Server)服务器是一种在网络环境中提供服务的计算机。

它能够接收和响应来自其他计算机或设备的请求，并回应所需数据。

服务器通常用于存储和管理网站、电子邮件、数据库和其他网络服务。

2. 网络 (Network)网络是指由连接在一起的计算机、设备和系统所形成的互联网。

网络可分为局域网（LAN）、广域网（WAN）和互联网。

技术部门负责确保网络的稳定、安全和高效运行。

3. 数据库 (Database)数据库是一个存储和组织大量相关数据的集合。

它可以通过结构化查询语言（SQL）进行访问和管理。

技术部门通常使用数据库来存储和管理企业的数据，例如员工信息、订单记录和产品清单。

4. 云计算 (Cloud Computing)云计算是一种通过互联网提供计算资源和服务的模型。

它可以提供虚拟服务器、存储空间和应用程序，使用户能够在任何时间、任何地点访问和共享数据。

技术部门负责管理和维护云计算基础设施。

5. 软件开发 (Software Development)软件开发是指创建、设计和维护计算机程序的过程。

技术部门的软件开发人员使用不同的编程语言和工具来开发应用程序、网站和其他软件解决方案。

6. 数据分析 (Data Analytics)数据分析是指通过收集、整理和解释大量数据来提取有用信息和见解的过程。

技术部门的数据分析师使用统计学和分析工具来帮助企业做出决策和优化业务流程。

7. 增强现实 (Augmented Reality)增强现实是一种通过叠加计算机生成的图像和信息来扩展现实世界的技术。

它可以应用于虚拟现实游戏、培训模拟和虚拟导航等领域。

数据库管理系统的分类与特点

数据库管理系统的分类与特点数据库管理系统（Database Management System，简称DBMS）是计算机科学领域中的关键技术，用于管理、组织和存储大量的数据。

随着数据量的不断增长，数据库管理系统的分类和特点也越发重要。

本文将对数据库管理系统进行分类，并介绍各个分类的特点。

一、按数据模型分类1. 层次模型数据库管理系统层次模型数据库管理系统（Hierarchical Model DBMS）以树状结构来组织数据。

它的特点是数据之间存在父子关系，并且一个父节点可以对应多个子节点，但一个子节点只能有一个父节点。

这种数据库管理系统适用于具有明确层级结构关系的数据。

例如，公司组织架构可以使用层次模型数据库管理系统进行管理，其中每个员工节点连接到其直接上级的节点。

2. 网状模型数据库管理系统网状模型数据库管理系统（Network Model DBMS）也是基于树状结构的，但与层次模型不同的是，它允许一个子节点具有多个父节点。

这种模型适用于数据之间存在复杂关系的场景，如银行系统中的借贷关系。

3. 关系模型数据库管理系统关系模型数据库管理系统（Relational Model DBMS）是目前应用最广泛的数据库管理系统之一，它将数据组织为表格的形式，其中每一行代表一个数据记录，每一列代表字段或属性。

关系模型中的表格可以结合使用，通过键值进行关联查询。

这种模型相对于层次模型和网状模型更灵活，能够适应不同领域和复杂的数据关系。

4. 对象模型数据库管理系统对象模型数据库管理系统（Object Model DBMS）是在关系模型基础上发展起来的一种模型。

它将实体和实体之间的关系都视为对象，并通过对象间的继承和多态来实现数据的组织和查询。

对象模型数据库管理系统特别适用于面向对象的编程环境。

二、按运行环境分类1. 集中式数据库管理系统集中式数据库管理系统（Centralized DBMS）运行在一个集中服务器上，所有的数据存储在该服务器中，用户通过网络访问数据。

大数据分析知识：数据存储与管理——数据仓库、云计算和数据库

大数据分析知识：数据存储与管理——数据仓库、云计算和数据库随着技术的不断发展，越来越多的数据产生并蓄积，如何进行有效管理和利用已成为人们关注的焦点之一。

本文将从数据存储和管理的角度出发，分别介绍数据仓库、云计算和数据库的概念、特点及其在大数据领域的应用。

一、数据仓库数据仓库（Data Warehouse）是指从各个数据源中提取数据并经过处理后存储到一个统一且独立的数据集合中，以方便用户进行分析和决策的系统。

数据仓库通过将数据分析和查询分离，实现了数据决策支持系统的高效运行，从而提高数据的利用率。

数据仓库的特点：1.面向主题：数据仓库是面向主题的，即数据集中一般针对某个主体领域或数据分析任务。

例如，销售数据仓库、人力资源数据仓库等。

2.集成性：数据仓库具有集成性，可以将不同类型的数据源通过ETL（Extract-Transform-Load）的方式进行标准化、转换和加载，并保证数据之间的一致性和完整性。

3.时间性：数据仓库关注历史数据的存储和分析，并提供不同时间维度的数据展示方式，为决策者提供多样化的选择。

数据仓库在大数据领域的应用：1.数据分析和挖掘：通过数据仓库中的数据进行多维分析和数据挖掘，为决策者提供全面的数据支持。

2.企业级统一视图：数据仓库可以实现企业级统一视图，使决策者可以获得一份全面的数据报告。

3.交互式查询：数据仓库提供交互式的查询功能，用户可以根据需要自定义查询条件和维度，获得满足自己需求的数据结果。

二、云计算云计算（Cloud Computing）是指通过网络以服务方式提供计算资源的一种模式。

云计算基于分布式计算、虚拟化技术和自动化管理，通过网络实现数据处理和存储，通过服务模式进行资源使用和计费。

云计算的特点：1.弹性伸缩：云计算可以根据需求进行弹性伸缩，为企业和个人提供更加灵活的资源使用方式，从而降低IT成本、提高效率。

2.服务化：云计算基于服务的方式提供资源，用户可以根据需要选择提供商和服务类型，并根据实际使用量进行计费，降低了技术和资金门槛。

云数据库在在线教育中的学习资源存储与学习进度跟踪

云数据库在在线教育中的学习资源存储与学习进度跟踪云数据库（Cloud Database）作为云计算技术应用的重要组成部分，已经在各个行业得到广泛应用。

其中，在线教育领域，云数据库的应用对于学习资源的存储和学习进度的跟踪具有重要作用。

本文将探讨云数据库在在线教育中的具体应用以及其带来的好处。

一、学习资源存储在传统的教育方式中，学习资源通常以书籍、讲义等形式存在，学生需要花费大量时间和精力进行查阅和整理。

而在云数据库的应用下，学习资源可以以数字化的形式进行存储，并通过云端技术提供给学生随时查阅。

这种方式不仅方便学生，同时也极大地减轻了教育机构的负担。

云数据库通过存储学习资源，使得这些资源可以被多人多次使用，实现了资源共享的目标。

学生只需要通过网络连接，便可以随时随地获取到所需的学习资料，无论是在校内还是校外都可以轻松学习。

同时，云数据库提供了强大的存储能力，学习资源的数量和种类不再受限制，为教育机构提供了更多的选择余地。

二、学习进度跟踪云数据库的另一个重要应用是学习进度的跟踪。

传统的教育方式中，学生的学习进度通常需要通过纸质或电子表格进行记录，教师和学生之间的交流也是有限的。

而通过云数据库的应用，学生的学习进度可以被自动记录并上传至云端，教师可以实时了解学生的学习情况。

基于云数据库的学习进度跟踪，教师可以更好地指导学生学习。

教师可以根据学生的学习进度进行个性化的辅导，给予相应的建议和帮助。

同时，学生也可以根据自己的学习情况进行合理的安排和调整，提高学习效率和成绩。

三、云数据库的优势云数据库在在线教育中的应用带来了诸多优势。

首先，云数据库提供了高效的存储能力，可以存储庞大的学习资源，实现资源共享和随时随地的学习。

其次，云数据库具有较高的安全性，学习资源和学生的学习记录受到有效的保护，不易被非法获取。

此外，云数据库还具备高可靠性和灵活性，能够满足教育机构在规模和需求上的变化。

总结：云数据库在在线教育中的学习资源存储与学习进度跟踪起到了重要的作用。

集合系统的名词解释

集合系统的名词解释随着科技的不断发展，各种集合系统在我们的日常生活中扮演着越来越重要的角色。

从社交媒体平台到电商网站，从智能家居到自动驾驶系统，无一不依赖于集合系统的设计和优化。

然而，在我们谈论这些系统时，很少有人能清晰地解释它们背后的核心概念。

因此，本文旨在对集合系统的一些重要名词进行解释，以帮助读者更好地理解和应用这些概念。

1. 数据库（Database）数据库是集合系统的核心组成部分之一。

它是指按一定的结构和规则组织起来的、用于存储和管理大量数据的集合。

数据库通常由一个或多个表组成，每个表由行和列组成，分别代表数据的记录和属性。

通过数据库，我们可以方便地存储、查询和更新大量数据，保证数据的一致性和完整性。

2. 数据仓库（Data Warehouse）数据仓库指的是一个用于存储大量历史数据的集中式仓库。

与传统的数据库不同，数据仓库旨在支持决策支持和分析工作，而不是日常的事务处理。

数据仓库通常采用异构的数据源，并经过清洗、集成和转换，以提供决策者所需的一致、准确的数据视图。

数据仓库的架构通常分为数据提取、数据转换、数据加载和数据查询等环节，以确保数据的完整性和可用性。

3. 数据挖掘（Data Mining）数据挖掘是一种通过在大规模数据集中发现模式和规律的技术。

它包括从数据中提取特征、进行统计分析、构建模型和预测未来趋势等过程。

数据挖掘可以帮助我们发现隐藏在庞杂数据背后的知识，为决策和预测提供支持。

常见的数据挖掘技术包括聚类、分类、关联规则挖掘和异常检测等。

4. 人工智能（Artificial Intelligence）人工智能是一种使机器能够像人类一样思考和行动的技术。

在集合系统中，人工智能常常用于处理和分析大量数据，以及实现自动化的决策和推荐。

其中，机器学习是人工智能的重要方法之一，它通过从数据中学习并建立模型，实现对未知数据的预测和分类。

5. 云计算（Cloud Computing）云计算是一种通过网络提供计算资源和服务的模式。

软件中的专业名词解释

软件中的专业名词解释随着科技的发展，软件已经成为人们日常生活和工作中不可或缺的一部分。

然而，对于很多非专业人士来说，软件中常见的专业名词可能会令人困惑。

本文将解释一些常见的软件专业名词，帮助读者更好地了解软件技术。

1. 用户界面（User Interface，UI）用户界面是软件与用户之间的桥梁，通过它用户可以与软件进行交互。

UI设计旨在提供直观、易于理解和操作的界面，使用户能够快速、高效地完成任务。

主要包括图形界面、菜单、工具栏、按钮等元素。

2. 操作系统（Operating System，OS）操作系统是计算机中的重要软件组件，负责管理和控制计算机硬件资源，为应用程序提供必要的服务和接口。

常见的操作系统有Windows、macOS、Linux等。

操作系统的主要功能包括进程管理、内存管理、文件系统管理等。

3. 数据库（Database）数据库是一个用来存储和管理数据的系统。

它采用结构化的数据模型，以表格的形式组织数据，并提供灵活的查询和操作功能。

数据库在许多应用领域广泛使用，如企业管理系统、电子商务网站等。

4. 网络协议（Network Protocol）网络协议是计算机网络中用于控制和管理数据传输的规则和约定。

常见的网络协议有TCP/IP、HTTP、FTP等。

网络协议确保数据能够在不同的计算机和网络设备之间传输，实现信息的交换和共享。

5. 编程语言（Programming Language）编程语言是一种用于编写和组织计算机程序的形式化语言。

常见的编程语言有C、C++、Java、Python等。

每种编程语言都有其独特的语法和特性，用于实现不同类型的软件应用。

6. 编译器（Compiler）编译器是将高级编程语言转换为机器语言的软件工具。

它将程序源代码逐行翻译成计算机可以理解的指令，然后生成可执行文件。

编译器起到了连接开发人员和计算机硬件的关键作用。

7. 进程和线程（Process and Thread）进程是在计算机中运行的程序的实例。

云数据是什么意思

云数据是什么意思1. 什么是云数据云数据（Cloud Data）是指存储在云平台上的、可从任何地点访问和共享的数据。

它们可以是各种类型的数据，包括文件、数据库、应用程序数据等。

云数据存储在云服务器上，可以通过网络连接进行访问和管理。

云数据通过云计算技术来实现，云计算提供了一种基于网络的计算模型，能够按需提供计算资源和存储空间。

通过云计算，用户可以通过互联网连接到云平台，将数据存储在云服务器上，并通过云服务提供商提供的接口进行数据的访问和管理。

2. 云数据的特点2.1 高可扩展性云数据存储使用了分布式系统和集群技术，能够扩展到数百甚至数千个服务器节点上。

这种高可扩展性使得云数据能够存储大量的数据，并提供高效的数据访问和处理能力。

2.2 高可靠性云数据采用了冗余和备份技术，可以在数据出现故障或损坏的情况下进行恢复。

云数据存储提供商通常会在多个地理位置建立数据中心，并将数据复制到多个服务器上，以确保数据的安全性和持久性。

2.3 高可用性云数据存储通过多节点架构和负载均衡技术，能够在服务器节点故障时自动切换到其他节点，从而保证数据的持续访问。

这种高可用性使得用户在任何时间、任何地点都能够访问并操作云数据。

2.4 弹性计费云数据存储通常采用了按需付费的模式，用户只需要根据实际使用情况支付费用，可以根据需要灵活调整存储容量和计算资源。

这种弹性计费模式使得用户可以根据业务需求来管理和控制成本。

3. 云数据的应用3.1 数据备份与恢复云数据存储可以作为数据备份和恢复的解决方案。

用户可以将重要数据备份到云平台上，以防止数据丢失或损坏。

当数据需要恢复时，用户可以从云数据存储中获取备份数据，并进行恢复操作。

3.2 数据共享与协作云数据存储可以实现数据共享和协作。

用户可以将数据存储在云平台上，并授权其他用户访问和编辑这些数据。

这样可以方便地进行团队合作、信息共享和版本管理。

3.3 数据分析与挖掘云数据存储可以用于数据分析和挖掘。

分布式数据库与云数据库的特点对比研究

分布式数据库与云数据库的特点对比研究随着互联网的不断发展，数据的规模和复杂性也在不断增加。

为了应对这一挑战，分布式数据库和云数据库应运而生。

分布式数据库是将数据分散存储在多台计算机上，而云数据库则是将数据存储在云平台上。

本文将对这两种数据库进行特点对比研究。

一、数据存储方式分布式数据库采用分片的方式将数据存储在多台计算机上，每台计算机存储部分数据。

这种方式可以提高数据的存储容量和读写性能，并且具有较好的可扩展性。

而云数据库则将数据存储在云平台上，用户可以根据需要进行灵活的扩容和缩容。

云数据库的存储方式更加灵活，适合对存储需求有较大波动的场景。

二、数据一致性分布式数据库中，数据的一致性是一个重要的问题。

由于数据存储在多台计算机上，可能会出现数据不一致的情况。

为了解决这个问题，分布式数据库采用了一致性协议，如Paxos和Raft等。

这些协议可以保证数据的一致性，但是会增加系统的复杂性和延迟。

而云数据库则通过数据冗余和备份来保证数据的一致性。

云数据库具有较好的数据一致性，但是也需要考虑数据备份和恢复的问题。

三、数据安全性数据安全性是数据库的重要特点之一。

分布式数据库通过数据分片和数据复制来提高数据的安全性。

即使某台计算机发生故障，数据仍然可以从其他计算机中恢复。

而云数据库则通过数据加密和访问控制来保护数据的安全。

云数据库具有较好的数据安全性，但是也需要考虑数据隐私和合规性的问题。

四、数据访问性能数据访问性能是数据库的关键指标之一。

分布式数据库通过数据分片和并行处理来提高数据的访问性能。

每台计算机只需处理部分数据，可以减少单台计算机的负载。

而云数据库则通过云平台的资源调度和负载均衡来提高数据的访问性能。

云数据库具有较好的数据访问性能，但是也需要考虑网络延迟和带宽的问题。

五、数据成本数据成本是数据库的重要考虑因素之一。

分布式数据库通过多台计算机共同存储和处理数据，可以降低硬件成本和维护成本。

而云数据库则通过按需付费和资源弹性调度来降低数据成本。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

《大数据技术基础》
厦门大学计算机科学系
林子雨
ziyulin@
2013年9月第一版
云数据库领域的研究问题-体系架构
数据访问方法
1、客户端首先向管理器请求一份分区映射图 2、管理器向客户端发送分区映射图 3、客户端在映射图中根据键值找到所需数据的存储位置 4、客户端到指定的数据节点请求数据 5、由该数据节点把数据返回给客户端
云数据库市场主力军
•Google BigTable是一种满足弱一致性要求的大规模数据库系统 •Google开发的另一款云计算数据库产品是Fusion Tables，采用了基于数据空间的技术
云数据库产品
Amazon Google
开源
Microsoft
云数据库市场重要参与者
•HBase[CryansAA08]和Hypertable 利用开源MapReduce平台Hadoop 提供了类似于BigTable的可伸缩数据库实现
实际上，为了改进性能，同时也为了避免管理器的性能瓶颈，通常会在客户端缓存常用的分区映射图，这样，客户端在很多情况下不用与管理器交互就可以直接访问相应的数据节点。
《大数据技术基础》厦门大学计算机科学系林子雨 ziyulin@ 2013年9月第一版
云数据库领域的研究问题-编程模型 M a p Reduce
林子雨 ziyulin@ 2013年9月第一版
DB1
服务器1
客户
网络
服务器2
服务器3
DB2
DB3
客户
客户
图
分布式数据库系统示意图
厦门大学计算机科学系
《大数据技术基础》
云数据库的影响
Cloud
1、极大地改变企业管理数据的方式
•Forrester Research分析师Noel Yuhanna指出，18%的企业正在把目光投向云数据库。 •中小企业会更多地采用云数据库产品，但是，对于大企业而言，云数据库并非首选，因为大企业通常自己建造数据中心。
时间戳
《大数据技术基础》
厦门大学计算机科学系
林子雨
ziyulin@
2013年9月第一版
云数据库领域的研究问题-数据模型
Big Tab le
Row Key
Timestamp contents: …
Column Family anchor: CNN … <html>… <html>… … <html>… … … … … … anchor:my.look.ca …
•甲骨文开源数据库产品 BerkelyDB也提供了云计算环境中的实现
云数据库市场主力军
•SQL AZure可以允许用户通过网络在云中创建、查询和使用SQL SERVER数据库 •属于关系型数据库 •支持云中的事务（局部事务）
•支持存储过程
《大数据技术基础》
厦门大学计算机科学系
林子雨
ziyulin@
BigT able在行键上根据字典顺序对数据进行维护。对于一个表而言，行区间是根据行键的值进行动态划分的。每个行区间称为一个T ablet，它是负载均衡和数据分发的基本单位，这些T ablet会被分发到不同的数据服务器上。
列键
被分组成许多“列家族”的集合，它是基本的访问控制单元。存储在一个列家族当中的所有数据，通常都属于同一种数据类型，这通常意味着具有更高的压缩率。数据可以被存放到列家族的某个列键下面，但是，在把数据存放到这个列家族的某个列键下面之前，必须首先创建这个列家族。在创建完成一个列家族以后，就可以使用同一个家族当中的列键。在BigT able中的每个单元格当中，都包含相同数据的多个版本，这些版本采用时间戳进行索引。BitT able时间戳是64位整数。一个单元格的不同版本是根据时间戳降序的顺序进行存储的，这样，最新的版本可以被最先读取。
《大数据技术基础》厦门大学计算机科学系林子雨 ziyulin@ 2013年9月第一版
云数据库概念和特点
云数据库概念
•云数据库是部署和虚拟化在云计算环境中的数据库
云数据库特点

动态可扩展高可用性较低的使用代价易用性大规模并行处理

云数据库应用示意图
在云数据库应用中，客户端不需要了解云数据库的底层细节，所有的底层硬件都已经被虚拟化，对客户端而言是透明的，它就像在使用一个运行在单一服务器上的数据库一样，非常方便容易，同时又可以获得理论上近乎无限的存储和处理能力。
2013年9月第一版
云数据库领域的研究问题
数据模型
体系结构
云数据库的重点研究问题
事务一致性
编程模型
《大数据技术基础》
厦门大学计算机科学系
林子雨
ziyulin@
2013年9月第一版
云数据库领域的研究问题-数据模型
键/值模型
BigTa b le
行键
一个BigTable实际上就是一个稀疏的、分布的、永久的多维排序图，它采用行键（row key）、列键（column key）和时间戳（timestamp）对图进行索引。图中的每个值都是未经解释的字节数组。
企业 Amazon Google Microsoft Oracle Yahoo! Vertica EnerpriseDB 开源项目其他 SimpleDB、RDS BigTable、FusionTable、GoogleBase Microsoft SQL Azure Oracle Cloud PNUTS Analytic Database v3.0 for the Cloud Postgres Plus in the Cloud HBase、Hypertable
产品
EnerpriseDB、FathomDB、ScaleDB、Objectivity/DB、M/DB:X
《大数据技术基础》
厦门大学计算机科学系
林子雨
ziyulin@
2013年9月第一版
云数据库产品
云数据库市场先行者
•提供著名的S3存储服务和EC2 计算服务，提供基于云的数据库服务SimpleDB •Amazon EC2应用托管服务可以部署多种数据库产品，如 SQL Server、Oracle 11g、 MySQL和IBM DB2等数据库平台
影响
Database
3、数据库市场份额面临重新分配
2、催生新一代的数据库技术
•第一代是20世纪70年代的早期关系数据库 •第二代是80到90年代的更加先进的关系模型 •第三代的数据库技术，要求数据库能够灵活处理各种类型的数据，而不是强制让数据去适应预先定制的数据结构。
ห้องสมุดไป่ตู้
•此前，Teradata、Oracle、IBM DB2、 Microsoft SQL Server、Sybase等传统数据库厂商垄断市场 •Amazon和Google扮演引领者角色
•从数据模型设计方式来看，已经有些产品（比如SimpleDB、HBase、 Dynamo、BigTable）放弃传统的行存储方式，而采用键/值存储，从而可以在分布式的云环境中获得更好的性能。
•新的云数据库厂商开始出现 Vertica和EnterpriseDB
《大数据技术基础》
厦门大学计算机科学系
林子雨
• Map/Reduce计算流程
《大数据技术基础》
厦门大学计算机科学系
林子雨
ziyulin@
2013年9月第一版
云数据库领域的研究问题-编程模型 M a p Reduce
在MapReduce环境下执行两个关系的联接操作
假设关系R(A,B)和S(B,C)都存储在一个文件中。为了联接这些关系，必须把来自每个关系的各个元组都和一个key关联，这个 key就是属性B的值。可以使用一个Map进程集合，把来自R的每个元组(a,b)转换成一个key-value 对，其中的key就是b，值就是(a,R)。注意，这里把关系R包含到value中，这样做使得我们可以在Reduce阶段，只把那些来自R的元组和来自S的元组进行匹配。类似地，可以使用一个Map进程集合，把来自S的每个元组(b,c )，转换成一个key-value对，key是b，value是(c,S)。这里把关系名字包含在属性值中，可以使得在Reduce阶段只把那些来自不同关系的元组进行合并。 Reduce进程的任务就是，把来自关系R和S的具有共同属性B值的元组进行合并。这样，所有具有特定B值的元组必须被发送到同一个Reduce进程。假设使用k个Reduce进程。这里选择一个哈希函数h，它可以把属性B的值映射到k个哈希桶，每个哈希值对应一个Reduce进程。每个Map进程把key是b 的key-value对，都发送到与哈希值h(b)对应的Reduce进程。Reduce进程把联接后的元组(a,b,c)，写到一个单独的输出文件中。
ziyulin@
2013年9月第一版
云数据库产品
•传统的数据库厂商：Teradata、Oracle、IBM DB2和Microsoft SQL Server； •涉足数据库市场的云供应商：Amazon、Google和Yahoo； •新兴小公司：Vertica、LongJump和EnterpriseDB。
n.www
t9 t8 t7 t6 t5 t4 t3
《大数据技术基础》
厦门大学计算机科学系
林子雨
ziyulin@
2013年9月第一版
云数据库领域的研究问题-数据模型
关系模型
表：一个表是一个逻辑关系，它包含一个分区键，用来对表进行分区。表组：具有相同分区键的多个表的集合，称为表组。行组：在表组中，具有相同分区键值的多个行的集合，称为行组。一个行组中包含的行，总是被分配到同一个数据节点上。每个表组会包含多个行组，这些行组会被分配到不同的数据节点上。数据分区：一个数据分区包含了多个行组。因此，每个数据节点都存储了位于某个分区键值区间内的所有行。