emc 的大数据解决方案

24
Think big, Think fast EMC 的的的的的的的的 22/6/8

Upload: medea

Post on 22-Jan-2016

160 views

Category:

Documents


0 download

DESCRIPTION

EMC 的大数据解决方案. 2014/9/1. 什么是 大数据 ? EMC Greenplum 简介 DB 软件架构介绍 行业解决方案 实际案例分享. 2. 2014/9/1. 什么是 大数据 ?. 什么是大数据?. 数据大( Volume ) 时效性高( Velocity ) 种类和来源多样化( Variety ). EMC & Greenplum ?. 2014/9/1. 是一家 数据库软件 公司。 在全球 数据处理和 BI/DW 领域,提供容量最大、 速度最快、 性价比最好的 数据仓库引擎产品和咨询服务. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: EMC 的大数据解决方案

Think big, Think fast

EMC 的大数据解决方案

23/4/21

Page 2: EMC 的大数据解决方案

Think big, Think fast

• 什么是大数据?• EMC Greenplum 简介• DB 软件架构介绍• 行业解决方案• 实际案例分享

223/4/21

Page 3: EMC 的大数据解决方案

Think big, Think fast

什么是

大数据 ?

Page 4: EMC 的大数据解决方案

Think big, Think fast

什么是大数据?

数据大( Volume )

时效性高( Velocity )

种类和来源多样化( Variety )

Page 5: EMC 的大数据解决方案

Think big, Think fast

EMC &Greenplum ?

23/4/21

Page 6: EMC 的大数据解决方案

Think big, Think fast

是一家数据库软件公司。 在全球数据处理和 BI/DW 领域,提供容量最大、 速度最快、性价比最好的

数据仓库引擎产品和咨询服务

Page 7: EMC 的大数据解决方案

Think big, Think fast

Page 8: EMC 的大数据解决方案

Think big, Think fast

2010 年 EMC 公司收购 Greenplum

EMC 公司是全球信息基础架构技术与解决方案的领先开发商与提供商,是全球最大的企业存储设备和软件提供商。

23/4/21

Page 9: EMC 的大数据解决方案

Think big, Think fast

EMC Greenplum 大数据三部曲

23/4/21

Page 10: EMC 的大数据解决方案

Think big, Think fast

Greenplum Product Line

23/4/21

Page 11: EMC 的大数据解决方案

Think big, Think fast

典型的数据分析体系架构业务系统

Oracle

DB2

SQLServer

MySQL

Postgres

数据移动、抽取、转换、加载(ETL)

Informatica

DataStage

AbInitio

Pervasive

Segent

报表和分析

• MicroStrategy• Arcplan• Business Objects• Cognos• Hyperion• SAS• Insight

运营系统

ERP

SCM

CRM

OA,HR…

23/4/21

集成数据库、存储和硬件于一体

Page 12: EMC 的大数据解决方案

Think big, Think fast

全球各地的代表性客户

12

Page 13: EMC 的大数据解决方案

Think big, Think fast

DB 软件架构介绍

23/4/21

Page 14: EMC 的大数据解决方案

Think big, Think fast

Share-Nothing 的完全并行架构

共享磁盘例如:

Oracle RAC

DB

SAN/ 共享磁盘

DB DBDB

网络

SAN/FC

完全共享例如:

SMP 服务器

DB

磁盘

完全不共享例如:

Greenplum

DBDB DBDB

网络

磁盘 磁盘 磁盘 磁盘

Master

注:所有的共享资源都用蓝灰色表示

Page 15: EMC 的大数据解决方案

Think big, Think fast

Greenplum 基础架构 MPP

应用程序通过 Master主机访问数据应用程序通过 Master主机访问数据

在存储节点和 Master 主机之间交换数据在存储节点和 Master 主机之间交换数据

每一个存储节点都是独立的数据库(无共享)

每一个存储节点都是独立的数据库(无共享)

Query Plan

23/4/21

MPP=Massive Parallel Processing 海量并行处理结构

Page 16: EMC 的大数据解决方案

Think big, Think fast

MPP/ 无共享架构的优势• 最易于扩展的架构 – 云数据库和数据分析的最佳选择• 自动化的并行处理机制 – 内部处理自动化并行,无需人工分区或优化 – 加载与访问方式与一般数据库相同• 数据分布在所有的并行节点上 – 每个节点只处理其中一部分数据• 最优化的 I/O 处理 – 所有的节点同时进行并行处理 – 节点之间完全无共享,无 I/O 冲突• 增加节点实现线性扩展 – 增加节点可线性增加存储、查询和加载性能

Page 17: EMC 的大数据解决方案

Think big, Think fast

行业解决方案

23/4/21

Page 18: EMC 的大数据解决方案

Think big, Think fast

行业商务智能解决方案

政府 电信金融服务

信息传播公民服务国家安全电子政务

人力资本管理法规实施和监管

合规性报告 欺诈检测客户报表电汇通知

分部记分卡资产组合分析

客户关系管理、收购和盈利率

欺诈分析客户流失分析

响应时间流量分析

产品关联 / 捆绑

零售

预防亏损优化供应链

存储运营分析客户忠诚度计划协作规划和预估

Page 19: EMC 的大数据解决方案

Think big, Think fast

实际案例分享

23/4/21

Page 20: EMC 的大数据解决方案

EMC 劲霸男装 BI方案

Page 21: EMC 的大数据解决方案

Greenplum 大数据分析提高商业智能效率

Page 22: EMC 的大数据解决方案

Greenplum 统一智能管理

Page 23: EMC 的大数据解决方案

多用户查询

Page 24: EMC 的大数据解决方案

Think big, Think fast2423/4/21

谢谢观看