+大数据时代的列式数据库(卢东明)

合集下载

面向列存储的数据库设计与实现

面向列存储的数据库设计与实现

面向列存储的数据库设计与实现近年来,随着大数据时代的到来,数据量急剧增长,数据处理能力的需求也越来越高。

传统的行存储数据库在处理大规模查询时存在一些瓶颈,因此,面向列存储的数据库逐渐被广泛采用。

本文将介绍面向列存储的数据库设计与实现的相关内容,包括数据模型设计、存储方式、查询优化等。

面向列存储的数据库与传统的行存储数据库有所不同。

传统数据库将数据按行存储,一条记录的所有字段值连续存放,而面向列存储的数据库将数据按列存储,即将每个字段的值存放在一起。

这种存储方式的优势在于可以只加载需要的列,大大提升了数据查询的效率。

因此,面向列存储的数据库尤其适用于大规模数据的分析查询场景。

在设计面向列存储的数据库时,一个关键的问题是如何表示和管理列。

一种常见的方法是使用列族(column family)的概念来组织数据。

列族是将相关字段(列)按照逻辑关系分组的集合。

每个列族可以含有不同的列,不同的列族可以包含相同类型的数据。

这样的设计可以有效地组织数据,并且提供了良好的横向扩展性。

此外,为了提高访问效率,可以采用压缩技术来减小存储空间,例如使用字典压缩、位图压缩等。

在面向列存储的数据库中,查询优化也是一个重要的研究方向。

由于数据存储的方式发生了变化,传统的查询优化技术不一定适用于列存储数据库。

因此,需要针对列存储的数据模型设计相应的查询优化算法。

一种常见的查询优化技术是基于预先分析的查询计划生成,即在执行查询之前,根据查询的特点和数据的分布情况,生成最优的查询计划。

此外,可以采用列存储索引来加速对数据的查询,例如基于列存储的B树索引、位图索引等。

与传统的行存储数据库相比,面向列存储的数据库在大数据处理和分析任务上有明显的优势。

首先,列存储数据库可以提供更快的查询效率。

由于将每个字段的值都存放在一起,可以减少不必要的IO访问,并且更好地利用CPU的缓存。

其次,列存储数据库适合处理大批量的读多写少的场景,如数据仓库、数据分析等业务。

大数据技术导论_北京理工大学中国大学mooc课后章节答案期末考试题库2023年

大数据技术导论_北京理工大学中国大学mooc课后章节答案期末考试题库2023年

大数据技术导论_北京理工大学中国大学mooc课后章节答案期末考试题库2023年1.大数据是一个什么领域的问题?答案:多学科综合领域2.以下哪种技术对大数据技术的发展起了最重要基础支撑作用?答案:云计算技术3.科学研究的第三范式是计算思维-()答案:仿真模拟4.与大数据直接相关的职业不包括答案:首席执行官5.下面科学研究的四个范式顺序正确的是()答案:经验范式-理论范式-模拟范式-数据密集型范式6.常见的分布式网络爬虫架构不包含()答案:Master-worker7.以下哪项不是传统关系型数据库的弱点?答案:无法满足数据一致性和完整性的需求8.HBase是一种()数据库答案:列式数据库9.访问HBase表中的行,不可以用以下哪种方式答案:通过某列的值区间10.HDFS中文件块默认保存几份()答案:3 份11.下面与HDFS类似的框架是()答案:GFS12.下列关于NoSQL数据库和关系型数据库的比较,不正确的是答案:NoSQL数据库很容易实现数据完整性,关系型数据库很难实现数据完整性13.下列数据库属于文档数据库的是答案:MongoDB14.NoSQL数据库的CAP不包含()答案:持久性15.NoSQL数据库的BASE不包含()答案:持续性16.关于NoSQL数据库和关系数据库,下列说法不正确的是:答案:NoSQL数据库和关系数据库各有优缺点,但随着NoSQL的发展,终将取代关系数据库17.下列关于数据可视化的介绍,不正确的是()答案:雷达图不适用于多维数据18.下列不可以用于多维数据可视化的方法有()答案:GMap19.数据度量的常用方法不包括:答案:聚类系数20.Spark的组件中,用于做查询分析的是()答案:Spark SQL21.关于MapReduce,下列说法错误的是答案:Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写22.传统并行计算框架(比如MPI)和MapReduce并行计算框架相比较的特点不包含答案:前者相比后者学习起来更容易23.关于RDD论述正确的是()答案:RDD提供一种高度受限的共享内存模型,是一个弹性分布式数据集24.Apache软件基金会最重要的三大分布式计算系统开源项目不包括()答案:MapReduce25.以下哪项对数据隐私问题的影响相对最小答案:政府和企业成立安全联盟26.科学研究的第一到第四范式数据思维依次分别采用:仿真模拟、模型推演、关联分析、科学归纳答案:错误27.大数据处理中的批处理框架包含Flink、hadoop、jvm、Spark答案:错误28.系统的控制方式一般分为模型驱动和数据驱动答案:正确29.4V特征包含:数据规模大、数据密度低、数据处理速度快、价值密度低答案:错误30.模拟范式是以数据考察为基础,联合理论、实验和模拟一体的数据密集计算的范式答案:错误31.全表对比是一种需要计算MD5校验码的非增量抽取方法答案:错误32.大数据中的非结构化数据包括视频、图像、语音、文本答案:正确33.电子表格Excel、网页HTML均属于结构化数据答案:错误34.HBase依靠Hadoop存储底层数据答案:错误35.在分布式文件系统中,采用采用多副本冗余存储可以节约存储空间、保证数据可靠性、更容易检查数据错误并加快数据传输速度答案:错误36.分布式文件系统改变了数据存储和管理方式,相对于本地文件系统具有易扩展、低成本、强可靠、高可用的优势答案:正确37.Hadoop的框架最核心的设计是HDFS和MapReduce答案:正确38.HDFS 专为解决大数据存储问题而产生的,其具备了强大的跨平台兼容性,支持批和流数据读写,实现了低延时数据访问,并兼容廉价的硬件设备答案:错误39.目前,NoSQL的含义是“Not only SQL”,而不是“No SQL”。

南开24年秋季《大数据开发技术(一)》作业参考二

南开24年秋季《大数据开发技术(一)》作业参考二

24秋学期《大数据开发技术(一)》作业参考1.D3是哪种可视化工具()选项A:信息图表选项B:地图工具选项C:时间线工具选项D:分析工具参考答案:A2.每个Region服务器存储()个Region选项A:1选项B:10选项C:10-1000选项D:0参考答案:C3.Hbase中-ROOT-表有()个Region选项A:1选项B:10选项C:10-1000选项D:0参考答案:A4.以下哪个命令是Ubuntu中创建系统用户的命令()。

选项A:adduser选项B:useradd选项C:sudo选项D:sudo user参考答案:A5.Amazon DynamoDB属于()选项A:关系数据库选项B:键值数据库选项C:NoSQL数据库选项D:数据仓库参考答案:C6.Hbase采用()作为底层数据存储选项A:HDFS选项B:GFS选项C:Hbase选项D:传统文件系统参考答案:A7.Hbase中Zookeeper文件记录了()的位置选项A:.META.表选项B:-ROOT-表选项C:Region选项D:Master参考答案:B8.R是哪种可视化工具()选项A:信息图表选项B:地图工具选项C:时间线工具选项D:分析工具参考答案:D9.应用于涉及频繁读写、拥有简单数据模型的应用,内容缓存,比如会话的数据库是哪种()选项A:列族数据库选项B:键值数据库选项C:图数据库。

数据库如何给企业带来可持续发展的绿色效应

数据库如何给企业带来可持续发展的绿色效应

数据库如何给企业带来可持续发展的绿色效应
卢东明
【期刊名称】《机械设计与制造工程》
【年(卷),期】2007(000)024
【摘要】@@ 提到企业IT层面的"节能环保"更多是从硬件上体现.现如今,面对网络应用的飞速发展、多媒体数据的日益增长、视频音频等内容的不断丰富、更庞大的数据存储需求等,企业如何在节省投资成本的同时通过软件来管理与日俱增的海量数据?
【总页数】2页(P64-65)
【作者】卢东明
【作者单位】无
【正文语种】中文
【相关文献】
1.绿色工业多重效应——来宾电厂以综合循环利用带来连锁变化
2.数据库如何给企业带来可持续发展的绿色效应
3.绿色经济背景下企业可持续发展如何转化为企业价值--基于万科绿色地产的案例研究
4.绿色防控带来"增值"效应
5.绿色并购能提高民营企业经营活力吗?
——兼论审计师行业专长的调节效应及绿色技术创新的中介效应
因版权原因,仅展示原文概要,查看原文内容请购买。

南大通用大数据新型列存储数据库GBase 8a 技术白皮书

南大通用大数据新型列存储数据库GBase 8a 技术白皮书

皮书
GBase 8a 产品介绍
3. GBase 8a 产品介绍
GBase 8a 的架构设计充分满足了海量数据分析需求, 是具有高效复杂统计和分析 能力的列存储关系型数据库管理系统。 GBase 8a 面向分析型应用领域, 以列为基本存 储结构和数据运算对象,结合列数据压缩处理、并行处理、智能索引等新型数据处理 技术。下图展现了 GBase 8a 的体系结构。

GBase 8a 技术白皮书
GBase 8a 产品简介
1. 分析型数据库
1.1. 分析型应用的产生背景
在过去的十年里,数据的有效利用已经成为各单位议事日程上最优先的项目之 一。近几年来,企业和政府机构已经完成了信息化建设的初步阶段,即数据的采集和 事务应用。但随之而来产生了新的问题: 如何对已有海量数据进行有效利用; 如何对数据进行挖掘、分析; 如何从历史数据中获取规律,以指导企业的规划和决策; 怎样支持海量数据的即席查询、数据比对; 如何有效解决这些问题是信息化建设新的阶段和发展方向。 有这样一个案例: 某电信运营商发现用户在已经拥有一个移动号码的情况下,再次购买归属的同一 运营商的新号码入网,新号码全部或者部分替代原有旧号码,这种现象称为“重入网 现象” 。重入网泛滥使得该运营商营销渠道成本剧增,导致卡资源号码资源的紧缺, 严重影响正常运营。运营商非常希望找到一种方法,识别出重入网用户。但面对每月 新增 70 万用户和已有的 40 TB 历史数据,如何及时准确的甄别出重入用户,使用传 统事务型数据库管理系统几乎是不可能完成的。这一应用场景需要专为海量数据分析 处理使用的新型列存数据库管理系统的支持。 面对这类日益增加的海量数据分析需求,现有的传统数据库有明显的缺陷。这些 弊端包括: 低下的数据查询性能(传统数据库对上述案例的响应时间为几个小时) ; 对异构数据库访问困难; 惊人的存储成本; 沉重的维护成本。

构建企业数据战略——访SAP公司大数据专家卢东明

构建企业数据战略——访SAP公司大数据专家卢东明

1 0 4 《 企 业 管 理》 杂 志2 0 1 3 年 第 六 期
i n En t er p r i s e
养数 据意识 ,建立 自己的数据 战略 ,
们 就 可 以 毫 无 顾 忌 地 对 着 昙 花 拍
卢 东 明 :什 么 是 战 略? 对 于
以适 应大 数据 时代 的 发展变 化 。他 照 ,哪怕 照几 百 张照 片都 可 以。甚 企 业 来 说 , 战 略 更 多 的 是 一 种 观
数据分 析 能力处 理每 天 2 0 0万个 订 深 刻 地 影 响 着 我 们 。其 实 , 早 在 1 9 9 7 年 ,斯 坦福 大学 的 P a t i t S a f o
比如 ,阿迪 达斯 的经销 商每 天都 会 单 , 并且监督超过 8 0 亿美 元的存货 。
总有 一 天 ,“ 很 多 公 司 会 收 集 门店 的销售 数据 ,并将 它们上 对 于 在 途 存 货 的 管 理 ,Mc Ke s s o n 就预言 : 传 至 阿 迪达 斯 总 部 。收 到 数 据后 , 阿迪 达斯 总 部 会 对数 据 进 行 整合 、 开发 了一种供 应链模 型 ,它根据 产 突 然 发 现 它 们 的 主 要 业 务 就 是 数 品线 、运 输费 用甚 至碳排放 量等 方 据 ” 。 2 0 0 3年 ,马 云也 说 过 : “ 未
9大 数 据 的 数 据 观
企 业管理 : 进 入大数据 时代 ,
大 变化 ,我 们 应 该 怎 样 认 识 大 数 据
时代 “ 数据 ” 的概 念 呢 ?
们把现在称为 “ 大 数 据 时代 ” , 因 成数 十 项收购 ,以提 升 自己的数 据
I T i n En t e r pr i s e

常用列式数据库

常用列式数据库常用列式数据库概述列式数据库是一种基于列而非行的数据存储方式,它将同一列的数据存储在一起,而不是将整行数据存储在一起。

这种存储方式可以提高查询效率,并且适用于大型数据集和复杂的分析查询。

本文将介绍几种常用的列式数据库,包括Apache Cassandra、Google Bigtable、Amazon Redshift和Vertica。

Apache CassandraApache Cassandra是一个开源分布式NoSQL数据库系统,最初由Facebook开发。

它使用了类似于Google Bigtable的数据模型,并且具有高可扩展性和高可用性。

特点:1. 分布式架构:Cassandra可以在多个节点上运行,并且支持自动分2. 数据复制:Cassandra可以自动将数据复制到多个节点上,以提高可用性和容错性。

3. 数据模型:Cassandra使用了类似于Google Bigtable的数据模型,即键值对+列族。

每个键值对都包含一个主键和多个列族。

4. 支持ACID事务:Cassandra支持原子性、一致性、隔离性和持久性(ACID)事务。

5. 灵活的查询语言:Cassandra支持类似于SQL的查询语言(CQL),同时还支持更灵活的查询方式,如范围查询和分页查询。

Google BigtableGoogle Bigtable是一个高性能、高可扩展性的分布式列式数据库系统,用于存储大型数据集。

它最初由Google开发,并且作为Google Cloud Platform的一部分提供。

特点:1. 分布式架构:Bigtable可以在多个节点上运行,并且支持自动分片2. 数据模型:Bigtable使用了类似于哈希表的数据模型,即键值对+列族。

每个键值对都包含一个行键、一个列族和一个时间戳,而每个列族包含多个列。

3. 高性能:Bigtable具有高性能的读写能力,并且可以处理大量并发请求。

4. 可扩展性:Bigtable可以轻松地扩展到数百甚至数千台服务器,以适应不断增长的数据集。

大数据概论智慧树知到课后章节答案2023年下上海商学院

大数据概论智慧树知到课后章节答案2023年下上海商学院上海商学院第一章测试1.下列哪个表述是错误的?A:在芯片里运行的程序可以是C语言编写。

B:在芯片里运行的程序可以是面向对象语言编写。

C:在芯片里运行的程序可以是汇编语言编写。

D:在芯片里运行的程序可以是二进制语言编写。

答案:在芯片里运行的程序可以是面向对象语言编写。

2.以下哪一种不是计算机操作系统?A:Linux B:iOS C:Android D:Oracle答案:iOS3.微软对Windows界面的开发主要受到哪家公司的启发?A:3M B:施乐 C:IBM D:苹果答案:苹果4.Windows和Linux或者iOS和Android之间的最大区别在于什么?A:速度:前者快后者慢 B:用户体验:前者优后者差 C:价格:前者贵后者便宜 D:思想:前者封闭后者开源答案:思想:前者封闭后者开源5.医疗领域如何利用大数据?A:用户行为分析 B:社保资金安全 C:个性化医疗 D:临床决策支持答案:用户行为分析;社保资金安全;个性化医疗;临床决策支持6.现在非结构化数据已经占人类数据量的25%。

A:对 B:错答案:错7.大数据与云计算结合起来将给世界带来一场深刻的管理技术革命与社会治理创新。

A:错 B:对答案:对8.Python是一种面向对象、()计算机程序设计语言。

A:编译型 B:解释型答案:解释型9.ASCII码使用一个字节编码。

A:错 B:对答案:对10.GBK是只用来编码汉字的,GBK全称《汉字内码扩展规范》,使用双字节编码。

答案:对第二章测试1.人类科学主要经过了经验科学、理论科学、计算科学、数据科学四个阶段。

A:错 B:对答案:对2.大数据的利用过程是()。

A:采集-清洗-统计-挖掘 B:采集-挖掘-清洗-统计 C:采集-统计-清洗-挖掘 D:采集-清洗-挖掘-统计答案:采集-清洗-统计-挖掘3.信息只有通过反思、启发和学习等过程被每个个体予以有效处理,才能有用。

大数据处理与存储中的列式数据库优化研究

大数据处理与存储中的列式数据库优化研究随着大数据时代的到来,数据处理和存储的需求也不断增长。

在面对大规模数据的处理和存储时,传统的行式数据库往往无法满足要求。

列式数据库作为一种性能优越的数据库存储格式,正逐渐受到广泛应用和研究。

本文将重点研究大数据处理与存储中的列式数据库优化方法。

一、列式数据库的概念和特点列式数据库是一种以列为存储单位的数据库,与传统的行式数据库相比,具有以下几个特点:1. 压缩和编码优势:列式数据库以列为单位存储数据,可以采用列压缩和编码技术,提高数据的存储效率和压缩比率。

2. 查询效率高:列式数据库只读取需要的列数据,可以减少IO 操作,提高查询效率。

尤其适用于分析型查询,可以进行更复杂的数据分析和挖掘。

3. 数据压缩率高:由于列式数据库采用列压缩技术,可以大大减少存储空间的占用,降低存储成本。

4. 提供更好的并行处理能力:列式数据库可以并行处理不同列的数据,提供更好的数据处理能力和性能。

二、列式数据库的优化方法1. 数据划分和分布:将数据划分成不同的列族,每个列族存储相关的列数据,可以提高数据读取和写入的效率。

同时,可以根据数据的特点和访问模式,将数据分布到不同的存储节点上,实现负载均衡和数据并行处理。

2. 索引优化:对于列式数据库来说,索引对于查询效率的提升非常关键。

可以根据实际需求,选择合适的索引策略,如BloomFilter、BitMap Index等。

此外,还可以通过对索引数据进行压缩和编码,提高索引的查询性能。

3. 数据压缩和编码:列式数据库通过压缩和编码技术,减小存储空间的占用和提高数据的传输效率。

可以采用多种压缩算法,如gzip、Snappy、LZO等。

同时,还可以根据列的数据类型和特点,选择合适的编码方式,如Run-Length Encoding、Delta Encoding等。

4. 数据分区和分段:对于大规模数据,可以将数据进行分区和分段,分散存储于多个存储节点上。

大数据文献综述

大数据文献综述随着信息技术的飞速发展,数据的产生和积累速度呈指数级增长,大数据已经成为当今社会各个领域关注的焦点。

大数据不仅改变了我们获取、处理和分析信息的方式,也为科学研究、商业决策、社会治理等带来了前所未有的机遇和挑战。

本文将对大数据相关的文献进行综合梳理和分析,旨在全面了解大数据的概念、特点、技术架构以及其在不同领域的应用和影响。

一、大数据的概念与特点大数据的概念最早由知名咨询公司麦肯锡提出,其定义为:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

海量的数据规模是大数据最显著的特点之一。

在当今数字化时代,数据的生成来源极为广泛,包括互联网、物联网、社交媒体、金融交易、医疗记录等。

这些数据的总量已经达到了 PB 级甚至 EB 级,远远超出了传统数据处理技术的处理能力。

快速的数据流转意味着数据的产生和更新速度非常快。

在一些实时应用场景中,如金融交易、物流监控等,数据需要在极短的时间内被处理和分析,以做出及时的决策。

多样的数据类型也是大数据的重要特点。

除了传统的结构化数据(如关系型数据库中的表格数据),大数据还包含大量的半结构化数据(如 XML、JSON 格式的数据)和非结构化数据(如文本、图像、音频、视频等)。

价值密度低则是指在海量的数据中,真正有价值的信息往往只占很小的比例。

因此,如何从海量的数据中挖掘出有价值的信息成为了大数据处理的关键挑战之一。

二、大数据的技术架构大数据的处理需要一套完整的技术架构来支持,包括数据采集、数据存储、数据处理和数据分析等环节。

数据采集是大数据处理的第一步,其目的是从各种数据源中获取数据。

常见的数据采集技术包括网络爬虫、传感器数据采集、系统日志采集等。

数据存储是大数据处理的重要环节,由于大数据的规模巨大,传统的关系型数据库已经无法满足需求。

因此,分布式文件系统(如 HDFS)和分布式数据库(如 HBase、Cassandra 等)成为了大数据存储的主流选择。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

什么是Big Data : 亚马逊新体验
1,当日推荐
2,其他搜索人后来买了那些东西
4 – Sybase Confiden.al – October 22, 2011
4
什么是Big Data: 亚马逊购物新体验
3,希望购买列表 6,对已购买产 品作评价 4, 购买单
8 – Sybase Confiden.al – October 22, 2011
社交媒体 – 大数据的下一一波挑战
Twitter 和品牌 • 43% 的 Twitter 用户关注一一个 品牌(为了获取打折等信息) • 75% 的 Twitter 用户有可能从 自己关注的品牌那里购买商品 • 67% 的用户愿意将自己关注的 品牌帐户推荐给其他人 • 一一条推广的 Tweet 一一天大概要 花费 120000 美元 • 财富 100 强公司里有 88 家每 天在 Twitter 上更新新闻 • Twitter 估值达到了 80 亿美元
11 – Sybase Confiden.al – October 22, 2011
列式数据库 揭开云计算时代
12 – Sybase Confiden.al – October 22, 2011
2 – Sybase Confiden.al – October 22, 2011
Agenda • 大数据有多“大” • 大数据怎么“数” • 大数据en.al – October 22, 2011
列式数据库的优秀案例
v 美国税务局(IRS): 全美国所有报税人7年报税记录(及原始文档) (15亿条记录): v 2006年审计数量为2000年的3倍 v 2006年审计中收缴税款创下记录,达到 592 亿美元 ,上升 75%! v 190TB数据仓库(压缩后数据量) v 六到八周加载一一年的数据 [15 到 20TB] -- 四个小时 ! v 花旗银行: Sybase IQ保存6年所有交易记录,HR数据及文档 v 美国证监会(SEC): 分析数据仓库以及非结构化数据(灾难备份点) v 美国航空公司(American Airlines): 使用Sybase IQ节约了5百万 美金 v ComScore: 全球第一一大互联网监测公司: 1800亿URL v 中国农业银行,国家电网,铁道部,中国移动
5,其他类似购物者还买了什么
5 – Sybase Confiden.al – October 22, 2011
5
社交媒体 – 大数据的下一一波挑战
Twitter 和 Tweets • Twitter 有 2,000,000,000注册用户 • 每天新注册用户 450,000 • 用户每周更新 10 亿条 Tweets = 将近 1.8 亿条每天 = 138888 条 每分 = 1650 条每秒 • 有将近 52% 的用户每天更新消息 • 5% 的用户制造了 75% 的内容 • 24% 的用户每天会查看好几次 Twitter • 下午 5 点时发推最容易被转发 • Twitter 上每天有 16 亿将搜索, 每秒 18000 次
6 – Sybase Confiden.al – October 22, 2011
社交媒体 – 大数据的下一一波挑战
使用方式 • 40% 的 Tweets 来自移动设备 • 50% 的用户使用超过 1 个 平台接入 Twitter,比如通 过手机,iPad,家里电脑等 • 81% 用户关注不到 100 人, 150 万用户关注超过 500 人 • Twitter 上注册的第三方应 用有超过 100 万个,每 1.5 秒产生一一个新应用 • 61% 的 Tweets 是英语
7 – Sybase Confiden.al – October 22, 2011
社交媒体 – 大数据的下一一波挑战
用户分布 • 70% 的 Twitter 用户是非 美国用户 • 46% 的用户是男性,54% 的用户是女性 • 53% Twitter 用户没有小孩 ,有小孩的用户比例是 47% • 英国网民 11% 使用 Twitter • 30% Twitter 用户的家庭收 入超过 10 万美元
大数据时代的 列式数据库
卢东明 Sybase软件(中国)有限公司技术总监 新浪微博:Sybase卢东明
• 1992年加入Sybase China • 1994-2006年在硅谷13年,效 力Sybase公司,巴克莱资产 管理公司(BGI) • 2006年回到Sybase China 任技术总监 • 新浪微博:Sybase卢东明 • 微群版主:“列式数 据库”,“CEP”
9 – Sybase Confiden.al – October 22, 2011
数据库市场的细分格局
内存数据库 更多事务处理 OLTP 交易 业务
传统行式数据库
列式数据库
大数据、 复杂分析
OLAP 分析系统
10 – Sybase Confiden.al – October 22, 2011
相关文档
最新文档