NOSQL数据库大比拼

NOSQL数据库大比拼
NOSQL数据库大比拼

CouchDB

Written in: Erlang

关键点Main point: DB consistency一致性, ease of use易用

License: Apache

Protocol: HTTP/REST

Bi-directional (!) replication, 双向复制

continuous or ad-hoc,

with conflict detection,冲突检测

thus, master-master replication. (!)主主复制

MVCC - write operations do not block reads 写操作不会阻塞读操作Previous versions of documents are available文本式

Crash-only (reliable) design 可靠性设计

Needs compacting from time to time

Views: embedded map/reduce 内部嵌入Hadoop之类map/reduce算法Formatting views: lists & shows

Server-side document validation possible

Authentication possible

Real-time updates via _changes (!)实时更新

Attachment handling

thus, CouchApps (standalone js apps)

jQuery library included

适合: 累计堆积计算, 偶尔改变数据, 预先定义的查询. 非常注重版本控制的场合. 举例:: CRM, CMS系统. 主-主复制是其特别亮点,可以易于多个站点部署。

Redis

Written in: C/C++

关键点Main point:超快Blazing fast

License: BSD

Protocol: Telnet-like

Disk-backed in-memory database, 磁盘后备,内存数据库。

but since 2.0, it can swap to disk.但是从2.0开始直接交换到磁盘。Master-slave replication主-从复制

Simple keys and values,简单的key-value形式

but complex operations like ZREVRANGEBYSCORE但是复杂操作类似ZREVRANGEBYSCORE

INCR & co (good for rate limiting or statistics)

Has sets (also union/diff/inter)

Has lists (also a queue; blocking pop)

Has hashes (objects of multiple fields)

Of all these databases, only Redis does transactions (!)在这些数据库中,只有Redis有事务机制。

Values can be set to expire (as in a cache)如同缓存一样,值能被设置为超过一定时间过期失效。

Sorted sets (high score table, good for range queries)有排序的sets,善于range查询。

Pub/Sub and WATCH on data changes (!)采取Pub/Sub 和观察者WATCH事件触发数据变化。

适合: 在可以控制的数据库大小情况下(放得下整个内存),快速改变数据,快速写数据。

案例:股票价格系统分析,实时数据收集,联系等等。

MongoDB

Written in: C++

关键点: 保留类似SQL风格. (Query, index)

License: AGPL (Drivers: Apache)

Protocol: Custom, binary (BSON)

Master/slave replication主从复制(分布式状态集群方式)

Queries are javascript expressions查询是javascript表达式

Run arbitrary javascript functions server-side

Better update-in-place than CouchDB比CouchDB更好地就地更新

Sharding built-in 内置分片碎片

Uses memory mapped files for data storage 使用内存对应文件方式实现数据存储

Performance over features

After crash, it needs to repair tables 当崩溃后,需要修复表。

适合: 需要动态查询. 愿意事先定义索引indexes, 不需要map/reduce 功能. 你需要巨大的数据库有良好性能,你需要CouchDB但是你数据变化改变很频繁,需要频繁写。

案例:适合所有MySQL 或者PostgreSQL场合,它也适合

Cassandra

Written in: Java

关键点: 大表模型BigTable 和Dynamo中最好的

License: Apache

Protocol: Custom, binary (Thrift)

Tunable trade-offs for distribution and replication (N, R, W)

Querying by column, range of keys 按列查询

BigTable-like features: columns, column families 列

Writes are much faster than reads (!)写快于读

Map/reduce possible with Apache Hadoop

部分复杂性可能由于Java自身原因(如配置configuration, seeing exceptions, etc)

适合: 当写操作多于读操作(如日子logging).

案例:: 银行Banking, 金融系统,写必须快于读的场合,实时的数据分析等.

Riak

Written in: Erlang & C, some Javascript

关键点: 容错性Fault tolerance 失败恢复可靠性好

License: Apache

Protocol: HTTP/REST

Tunable trade-offs for distribution and replication (N, R, W)

Pre- and post-commit hooks,

for validation and security.

Built-in full-text search 内置全文本搜索

Map/reduce in javascript or Erlang Map/reduce支持

Comes in "open source" and "enterprise" editions 有两个版本

适合: 如果你希望有类似Cassandra-like (Dynamo-like)风格, 但是你不想处理器复杂性和膨胀性。单服务器有良好可伸缩性scalability, 可用性availability 和容错性fault-tolerance, 采取是昂贵的多站点复制multi-site replication.

案例:销售点数据收集,工厂控制系统,那些不能允许几秒当机的场合。

HBase

Written in: Java

关键点: 十亿级别的行X 百万级别的列大容量

License: Apache

Protocol: HTTP/REST (also Thrift)

Modeled after BigTable大表模型

Map/reduce with Hadoop 内置Map/reduce

能够实时获得基于查询的优化

A high performance Thrift gateway 高性能的节约型网关

HTTP supports XML, Protobuf, and binary

Cascading, hive, and pig source and sink modules

Jruby-based (JIRB) shell

No single point of failure 无单点风险

Rolling REST art for configuration changes and minor upgrades Random access performance is like MySQL 随机访问的性能类似MySQL

适合: 如果你喜欢大表模型BigTable. :) 你需要随机实时的读写操作

案例:: Facebook 消息数据库

8种NoSQL数据库比较

2011/08/30 | 分类:工具与资源, 程序员| 4 条评论| 标签:NOSQL, 数据库 分享到:38 导读:Kristóf Kovács 是一位软件架构师和咨询顾问,他最近发布了一片对比各种类型nosql 数据库的文章。文章由敏捷翻译–唐尤华编译。如需转载,请参见文后声明。 虽然SQL数据库是非常有用的工具,但经历了15年的一支独秀之后垄断即将被打破。这只是时间问题:被迫使用关系数据库,但最终发现不能适应需求的情况不胜枚举。 但是NoSQL数据库之间的不同,远超过两SQL数据库之间的差别。这意味着软件架构师更应该在项目开始时就选择好一个适合的NoSQL数据库。针对这种情况,这里对Cassandra、Mongodb、CouchDB、Redis、Riak、Membase、Neo4j和HBase进行了比较: (编注1:NoSQL:是一项全新的数据库革命性运动,NoSQL的拥护者们提倡运用非关系型的数据存储。现今的计算机体系结构在数据存储方面要求具备庞大的水平扩展性,而NoSQL致力于改变这一现状。目前Google的BigTable 和Amazon 的Dynamo使用的就是NoSQL型数据库。参见NoSQL词条。) 1. CouchDB ?所用语言:Erlang ?特点:DB一致性,易于使用 ?使用许可:Apache ?协议:HTTP/REST ?双向数据复制, ?持续进行或临时处理, ?处理时带冲突检查, ?因此,采用的是master-master复制(见编注2) ?MVCC –写操作不阻塞读操作 ?可保存文件之前的版本 ?Crash-only(可靠的)设计 ?需要不时地进行数据压缩 ?视图:嵌入式映射/减少 ?格式化视图:列表显示 ?支持进行服务器端文档验证 ?支持认证 ?根据变化实时更新 ?支持附件处理 ?因此,CouchApps(独立的js应用程序) ?需要jQuery程序库 最佳应用场景:适用于数据变化较少,执行预定义查询,进行数据统计的应用程序。适用于需要提供数据版本支持的应用程序。

NoSQL数据库学习教程

NoSQL数据库学习教程 本文档由https://www.360docs.net/doc/e37675887.html,整理发布。 1序 2思想篇 2CAP 2最终一致性 2变体 2BASE 2其他 2I/O的五分钟法则 2不要删除数据 2RAM是硬盘,硬盘是磁带 2Amdahl定律和Gustafson定律 2万兆以太网 3手段篇 3一致性哈希 3亚马逊的现状 3算法的选择 3Quorum NRW 3Vector clock 3Virtual node 3gossip 3Gossip (State Transfer Model) 3Gossip (Operation Transfer Model) 3Merkle tree 3Paxos 3背景 3DHT 3Map Reduce Execution 3Handling Deletes 3存储实现 3节点变化 3列存 3描述 3特点 4软件篇 4亚数据库 4MemCached 4特点 4内存分配 4缓存策略 4缓存数据库查询 4数据冗余与故障预防 4Memcached客户端(mc) 4缓存式的Web应用程序架构 4性能测试 4dbcached 4Memcached 和dbcached 在功能上一样吗?

4列存系列 4Hadoop之Hbase 4耶鲁大学之HadoopDB 4GreenPlum 4FaceBook之Cassandra 4Cassandra特点 4Keyspace 4Column family(CF) 4Key 4Column 4Super column 4Sorting 4存储 4API 4Google之BigTable 4Yahoo之PNUTS 4特点 4PNUTS实现 4Record-level mastering 记录级别主节点 4PNUTS的结构 4Tablets寻址与切分 4Write调用示意图 4PNUTS感悟 4微软之SQL数据服务 4非云服务竞争者 4文档存储 4CouchDB 4特性 4Riak 4MongoDB 4Terrastore 4ThruDB 4Key Value / Tuple 存储 4Amazon之SimpleDB 4Chordless 4Redis 4Scalaris 4Tokyo cabinet / Tyrant 4CT.M 4Scalien 4Berkley DB 4MemcacheDB 4Mnesia 4LightCloud 4HamsterDB 4Flare 4最终一致性Key Value存储 4Amazon之Dynamo 4功能特色 4架构特色 4BeansDB

浅析NoSQL数据库_卢冬海

开 发 应 用
浅析NoSQL数据库
卢冬海 何先波
(西华师范大学计算机学院,四川 南充 637002) 摘 要:NoSQL数据库打破了传统的关系模型,以一种模式自由的方式存储数据,提供了新型的访问接口,并克服了传 统RDBMS的缺点。NoSQL数据库可部署在廉价的硬件之上,支持分布式存储,能透明地扩展节点。本文介绍了NoSQL数据 库的基本特点与设计思想,列举了几种流行的NoSQL数据库产品,分析了其应用方向、优缺点及发展前景。 关键词:NoSQL;SQL;关系型数据库 DOI:10.3969/j.issn.1671-6396.2011.02.008 The Analysis of NoSQL Database LU Dong-hai,HE Xian-bo (School of Computer Science,China West Normal University,Nanchong Sichuan 637002) Abstract: NoSQL database that breaks the traditional relational model, stores data as a free style, provides a new type of access interface, and overcomes the shortcomings of RDBMS database to design to be deployed on inexpensive hardware to support distributed storage and to transparent extension node. This article described some common ideas of NoSQL database, listed kinds of popular NoSQL database products, and analyzed their applications, advantages, disadvantages and prospects. Key words:NoSQL;SQL;RDBMS

关系型数据库面临的挑战
明地扩展节点。典型的NoSQL数据库以key-values的形式存 储数据,具有模式自由的特点。 2.1 key-values key-values是指一个键名对应一个键值,可以通过键名 访问键值。例如一条员工的记录信息如图1和图2所示,有 Name、 Age、 Profession等 键 名 , 各 个 键 名 对 应 着 一 个 键 值。
employeeA { “tom”, Name : Age:13, “tearcher ”, Profession : Birth: {year : 1990, month: 9:day:10}, “myemail@https://www.360docs.net/doc/e37675887.html,” Email : }
1.1 数据库高并发读写需求 在Web2.0时代,网站通常要根据用户的个性化定制实 时生成页面,例如现在流行的SNS网站,微博网站等。网 站几乎要实时地为用户提供信息。该类应用对数据库提出 了很高的并发负载要求,传统的RDBMS面临很大的挑战。 1.2 海量数据的高效存储需求 在Web2.0时代,网站信息的提供者由传统的网站信息 管理员变成了普通的用户,用户提供的信息是海量的。类 似facebook,qq空间等SNS类型的网站,可能每天都会产 生千万级的数据。如果在RDBMS里的一张存有亿级记录的 数据表里作SQL查询,耗费时间巨大。虽然可通过分库、 分表等方法切分数据,部分地解决查询问题,但也带来了 诸如加重程序开发的复杂度和数据备份以及数据库扩容的 复杂度等问题。 1.3 数据库高扩展性和高可用性需求 在云计算时代,一项很重要的任务就是存储交由云 端,云计算供应商需面对存储海量数据的挑战。如果用传 统的RDBMS来保证存储的海量性和高可用性,云计算供应 商必须花费巨额的资金去购置高性能高可靠性的机器。同 时,RDBMS的无缝、不宕机扩容实现难度也大大增加。 2 NoSQL介绍 NoSQL数据库指那些非关系性的、定义不是很明确的
employeeB { Name “ : tom”, Age:13, Profession“ :tearcher” , Birth : {year : 1990, month: 9: day: 10}, }
图1
图2
2.2 模式自由 模式自由是指使用数据库前不再预先定义数据模型。在 传统的RDBMS中,如果想要存储某一员工的信息,必须先定 义一张员工表,表里有各项与员工相关的字段。如果日后需 求有变更,要增加员工的信息就必须去修改原先定义的数据 模型。模式自由的数据库没有预先定义要存储的数据的数据 模型。仍以员工信息为例,并不是所有员工的记录信息里都 有name,age,profession,email这些key,有可能员工B的
数据存储仓库。NoSQL数据库不再使用关系模型的概念, 放弃了SQL数据库操作语句。NoSQL数据库克服了RDBMS的 缺点,可部署在廉价的硬件之上,支持分布式存储,能透
收稿日期:2010-11-20 修回日期:2010-12-17
作者简介:卢冬海(1986-),男,汉族,浙江三门籍,研究生,研究方向为嵌入式系统。
15

NoSQL数据库总结

数据库 一、N oSQL数据 简介 NoSQL(NoSQL = Not Only SQL ),意即反SQL运动,指的是非关系型的数据库,是一项全新的数据库革命性运动 随着互联网web2.0网站的兴起,传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。 优点 可以处理超大量的数据 可以运行在便宜的PC服务器集群上 打破了性能的瓶颈 NoSQL的支持者称,通过NoSQL架构可以省去将Web或Java应用和数据转换成SQL友好格式的时间,执行速度变得更快。 “SQL并非适用于所有的程序代码,” 对于那些繁重的重复操作的数据,SQL 值得花钱。但是当数据库结构非常简单时,SQL可能没有太大用处。 没有过多的操作 Bootstrap支持 因为NoSQL项目都是开源的,因此它们缺乏供应商提供的正式支持。这一点它们与大多数开源项目一样,不得不从社区中寻求支持。 缺点 没有正式的官方支持,万一出了差错会是可怕的 nosql并未形成一定标准,各种产品层出不穷,内部混乱,各种项目还需时间来检验 二、N oSQL数据库开源软件 1.MongoDB: 简介 MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。 MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。他支持的数据结构非常松散,是类似json的bjson 格式,因此可以存储比较复杂的数据类型。Mongo最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。

典型的十大NOSQL数据库

分布式系统 论文题目:NOSQL数据库 专业 班级 学生 学号 指导教师 2014 年秋季学期

目录 1.引言 (1) 2. NoSQL数据库类型 (1) 2.1按照NoSQL存储模型和特点分类 (1) 2.2根据CAP原理分类 (2) 3.NoSQL架构 (5) 3.1 纯NoSQL架构 (5) 3.2 以NoSQL作为数据源的架构 (6) 4.典型NoSQL数据库概述 (8) 4.1 HBase简介 (8) 4.2 Redis简介 (9) 4.3 MongoDB简介 (10) 4.4 Cassandra简介 (11) 4.5 CouchDB简介 (11) 5.总结 (12)

NoSQL数据库 1.引言 随着互联网Web2.0网站的兴起,非关系型的数据库现在成了一个极其热门的新领域,其相关产品的发展也非常迅速。传统的关系数据库在应付Web2.0网站时暴露了很多难以克服的问题,主要有包括:不能满足对数据库高并发读写的需求;不能满足对海量数据的高效率存储和访问的需求;不能满足对数据库的高可扩展性和高可用性的需求。另外,许多Web2.0网站并不需要关系数据库提供的一些服务,诸如:数据库事务一致性、数据库的写实时性和读实时性、对复杂的SQL查询等。因此,关系数据库在这些越来越多的应用场景下显得不那么合适了,为了解决这类问题的非关系数据库应运而生。 NoSQL 是非关系型数据存储的广义定义。它打破了长久以来关系型数据库与ACID理论大一统的局面。NoSQL 数据存储不需要固定的表结构,通常也不存在连接操作。在大数据存取上具备关系型数据库. 无法比拟的性能优势。该术语在 2009 年初得到了广泛认同。 2. NoSQL数据库类型 2.1按照NoSQL存储模型和特点分类 按照NoSQL存储模型和特点分类形式如表1所示,表1 参照存储模型的NoSQL分类中根据NoSQL数据库的存储原理,列出了六大类主要的NoSQL数据库分类,分别是:列存储、文档型存储、Key-value存储、图存储、对象存储和xml存储。表1中仅列出了一些比较常见的NoSQL数据库,在所有的这些类型的NoSQL数据库中,当前应用较多的就是前三种类型:列存储类型、文档存储、key-value存储类型。特别需要说明的是,图数据库也可称为面向/基于图的数据库,对应的英文是Graph database。图数据库的基本含义是以“图”这种数据结构存储和查询数据,不是存储图片的数据库。

NoSQL数据库的特点与应用场景

NoSQL数据库的特点与应用场景 MongoDB、HBase、Redis

目录 1.NoSQL的四大种类 (3) 2.MongoDB (4) 3.HBase (6) 4.Redis (8)

1.NoSQL的四大种类 NoSQL数据库在整个数据库领域的江湖地位已经不言而喻。在大数据时代,虽然RDBMS很优秀,但是面对快速增长的数据规模和日渐复杂的数据模型,RDBMS渐渐力不从心,无法应对很多数据库处理任务,这时NoSQL凭借易扩展、大数据量和高性能以及灵活的数据模型成功的在数据库领域站稳了脚跟。 目前大家基本认同将NoSQL数据库分为四大类:键值存储数据库,文档型数据库,列存储数据库和图形数据库,其中每一种类型的数据库都能够解决关系型数据不能解决的问题。在实际应用中,NoSQL数据库的分类界限其实没有那么明显,往往会是多种类型的组合体。 主流nosql的详解:MongoDB、Hbase、Redis

2.MongoDB MongoDB 是一个高性能,开源,无模式的文档型数据库,开发语言是C++。它在许多场景下可用于替代统的关系型数据库或键/值存储方式。 1.MongoDB特点 ?所用语言:C++ ?特点:保留了SQL一些友好的特性(查询,索引)。 ?使用许可:AGPL(发起者:Apache) ?协议:Custom, binary(BSON) ?Master/slave复制(支持自动错误恢复,使用sets 复制) ?内建分片机制 ?支持javascript表达式查询 ?可在服务器端执行任意的javascript函数

?update-in-place支持比CouchDB更好 ?在数据存储时采用内存到文件映射 ?对性能的关注超过对功能的要求 ?建议最好打开日志功能(参数--journal) ?在32位操作系统上,数据库大小限制在约2.5Gb ?空数据库大约占192Mb ?采用GridFS存储大数据或元数据(不是真正的文件系统) 2.MongoDB优点: 1)更高的写负载,MongoDB拥有更高的插入速度。 2)处理很大的规模的单表,当数据表太大的时候可以很容易的分割表。 3)高可用性,设置M-S不仅方便而且很快,MongoDB还可以快速、安全及自动化的实现节点(数据中心)故障转移。 4)快速的查询,MongoDB支持二维空间索引,比如管道,因此可以快速及精确的从指定位置获取数据。MongoDB在启动后会将数据库中的数据以文件映射的方式加载到内存中。如果内存资源相当丰富的话,这将极大地提高数据库的查询速度。 5)非结构化数据的爆发增长,增加列在有些情况下可能锁定整个数据库,或者增加负载从而导致性能下降,由于MongoDB的弱数据结构模式,添加1个新字段不会对旧表格有任何影响,整个过程会非常快速。 3.MongoDB缺点: 1)不支持事务。

8种Nosql数据库系统对比

8种Nosql数据库系统对比 2013/05/01 ·工具与资源, 开发· 128.3K 阅读· 7 评论· NoSQL, 数据库 分享到:240 ?Android-打造万能适配器 ?Android猜歌游戏是这样炼成的 ?Android必学-AsyncTask基础 ?Android高级Root技术原理解析 本文由伯乐在线 - 唐尤华翻译。未经许可,禁止转载! 英文出处:Kristóf Kovács。欢迎加入翻译组。 导读:Kristóf Kovács 是一位软件架构师和咨询顾问,他最近发布了一片对比各种类型N oSQL数据库的文章。 虽然SQL数据库是非常有用的工具,但经历了15年的一支独秀之后垄断即将被打破。这只是时间问题:被迫使用关系数据库,但最终发现不能适应需求的情况不胜枚举。 但是NoSQL数据库之间的不同,远超过两SQL数据库之间的差别。这意味着软件架构师更应该在项目开始时就选择好一个适合的NoSQL数据库。针对这种情况,这里对Cassan dra、Mongodb、CouchDB、Redis、Riak、Membase、Neo4j和HBase进行了比较:(编注1:NoSQL:是一项全新的数据库革命性运动,NoSQL的拥护者们提倡运用非关系型的数据存储。现今的计算机体系结构在数据存储方面要求具备庞大的水平扩展性,而N oSQL致力于改变这一现状。目前Google的BigTable 和Amazon 的Dynamo使用的就是NoSQL型数据库。参见NoSQL词条。)

1. CouchDB ?所用语言:Erlang ?特点:DB一致性,易于使用 ?使用许可:Apache ?协议:HTTP/REST ?双向数据复制, ?持续进行或临时处理, ?处理时带冲突检查, ?因此,采用的是master-master复制(见编注2)?MVCC –写操作不阻塞读操作 ?可保存文件之前的版本 ?Crash-only(可靠的)设计 ?需要不时地进行数据压缩 ?视图:嵌入式映射/减少 ?格式化视图:列表显示 ?支持进行服务器端文档验证 ?支持认证 ?根据变化实时更新

NOSQL数据库大比拼

CouchDB Written in: Erlang 关键点Main point: DB consistency一致性, ease of use易用 License: Apache Protocol: HTTP/REST Bi-directional (!) replication, 双向复制 continuous or ad-hoc, with conflict detection,冲突检测 thus, master-master replication. (!)主主复制 MVCC - write operations do not block reads 写操作不会阻塞读操作Previous versions of documents are available文本式 Crash-only (reliable) design 可靠性设计 Needs compacting from time to time Views: embedded map/reduce 内部嵌入Hadoop之类map/reduce算法Formatting views: lists & shows Server-side document validation possible Authentication possible Real-time updates via _changes (!)实时更新 Attachment handling thus, CouchApps (standalone js apps) jQuery library included 适合: 累计堆积计算, 偶尔改变数据, 预先定义的查询. 非常注重版本控制的场合. 举例:: CRM, CMS系统. 主-主复制是其特别亮点,可以易于多个站点部署。 Redis Written in: C/C++ 关键点Main point:超快Blazing fast License: BSD Protocol: Telnet-like Disk-backed in-memory database, 磁盘后备,内存数据库。 but since 2.0, it can swap to disk.但是从2.0开始直接交换到磁盘。Master-slave replication主-从复制 Simple keys and values,简单的key-value形式

SQL与NoSQL数据库入门基础知识详解

SQL与NoSQL数据库入门基础知识详解 这几年的大数据热潮带动了一激活了一大批hadoop学习爱好者。有自学hadoop的,有报名培训班学习的。所有接触过hadoop的人都知道,单独搭建hadoop里每个组建都需要运行环境、修改配置文件测试等过程。对于我们这些入门级新手来说简直每个都是坑。国内的发行版hadoop那么多,似乎都没有来填这样的坑?不知道是没法解决,还是没有想到? 安装运行环境这样的坑,那些做国产大数据底层开发的,如果不能解决这个问题的话,我觉得不是一个合格的大数据底层开发机构。不过比较幸运的是,三月的时候申请拿到了一个DKHadoop的三节点发行版,大快开源的发行版hadoop。这个国产发行版就把各种常用的组建比如:HDFS,Hbase,Storm,Flume,Kafka,Mahout,Es等集成到了一起,终于不需要绞尽脑汁去折腾底层平台的搭建与配置了,简单的完成安装即可。这对于hadoop初学者来说,可谓是福音了。 扯的稍微多了点,后面在给家分享DKHadoop的安装以及使用,今天想给大家分享的是大数据基础内容中的数据库:SQL与NOSQL。理解这两种数据,只需要搞清楚二者的概念以

及有何不同即可。 二者概念: 1、SQL数据库,指关系型数据库。主要代表:SQL Server,Oracle,MySQL(开源),PostgreSQL(开源)。 2、NoSQL泛指非关系型数据库。主要代表:MongoDB,Redis,CouchDB。 二者区别: SQL数据与NOSQL数据的区别其实还是比较大的,总结起来基本可以从以下几个方面进行对比分析: (1)使用场景:SQL 是数字,它最适合明确的定义,精确规范的独立项目。典型的使用案例是在线商城和银行系统; NoSQL 是模拟,它最适合无固定要求的组织数据。典型的使用案例是社交网络,客户管理和网络分析系统。 (2)存储方式:SQL数据存在特定结构的表中,SQL通常以数据库表形式存储数据。举个例子,存个学生借书数据: NoSQL存储方式比较灵活,存储方式可以是JSON文档、哈希表或者其他方式。比如使用类JSON文件存储上表中熊大的借阅数据: (3)SQL中如果需要增加外部关联数据的话,规范化做法是在原表中增加一个外键关联外部数据表。例如需要在借阅表中增加审核人信息,先建立一个审核人表:

相关主题
相关文档
最新文档