Download - DATA WAREHOUSE

Transcript
Page 1: DATA WAREHOUSE

Oracle Data Warehouse Mit Big Data neue Horizonte für das Data Warehouse ermöglichen

Alfred Schlaucher, Detlef Schroeder

DATA WAREHOUSE

Page 2: DATA WAREHOUSE

Big Data Buzz Word oder eine neue Dimension und Möglichkeiten

Oracles Technologie zu Speichern von unstrukturierten und teilstrukturierten Massendaten

Cloudera Framwork

„Connectors“ in die neue Welt Oracle Loader for Hadoop und HDFS

Big Data Appliance Mit Oracle R Enterprise neue

Analyse-Horizonte entdecken Big Data Analysen mit Endeca

Themen

Page 3: DATA WAREHOUSE

<Insert Picture Here>

Big Data Ökosystem

Page 4: DATA WAREHOUSE

Big Data ApplianceMögliches Szenario

Oracle Big Data Appliance

Oracle Exadata

InfiniBand

Acquire Organize Analyze

Oracle Exalytics

InfiniBand

Oracle Big Data Connectors

Page 5: DATA WAREHOUSE

Warum eine Hadoop Appliance?

• Zeit zum Aufbau?• Optimierungsaufwand?• Kosten und Aufwand für Wartung?

Page 6: DATA WAREHOUSE

<Insert Picture Here>

Big Data Appliance

Hardware Überblick

Page 7: DATA WAREHOUSE

•18 Sun X4270 M2 Servers per Rack– 864 GB RAM

– 216 cores

– 648 TB storage

•40 Gb/s InfiniBand Fabric– Inter-rack Connectivity

– Inter-node Connectivity

•10 Gb/s Ethernet Connectivity– Data center connectivity

Oracle Big Data Appliance Hardware

Full Rack Configuration Only

Page 8: DATA WAREHOUSE

BDA Node – Sun Fire X4270 M2

Processors 2 Six-Core Intel® Xeon® X5675 Processors (3.06 GHz)

Memory 48GB (6 * 8GB) expandable to 96 GB or 144

Disks 12 x 3 TB 7.2K RPM High Capacity SAS (hot-swap)

Disk Controller Disk Controller HBA with 512MB Battery Backed Cache

Network 2 InfiniBand 4X QDR (40Gb/s) Ports (1 Dual-port PCIe 2.0 HCA)4 Embedded Gigabit Ethernet Ports

Remote Management

ILOM with 1 Gigabit Ethernet port

Power Supplies Redundant Hot-Swappable power supplies and fans

Page 9: DATA WAREHOUSE

Memory Expansion Kit

• Optionale Erweiterung für einzelne Knoten in der BDA (z.B. dem Name Node)• Änderung der Konfiguration der X4270 M2 von 48GB zu

entweder 96Gb (12 x 8 GB) oder 144 GB (18 x 8 GB)• Kann für Alle oder Einzelne Knoten gelten (Name Node,

HBase master etc.)

Page 10: DATA WAREHOUSE

InfiniBand Network

• Sun 4x QDR (40Gb/s) InfiniBand switches• Immer ein Subnet Manager ist aktiv• 2 “leaf” switches (32 port QDR gateway switch) für die

Leafverknüpfung• Ein Port für die Erweiterung auf andere EXA-Maschinen

• Einzelne Server• Jeder Server hat einen Dual-port QDR (40Gb/s) IB HCA• Dient der Vernetzung der “Leafs” untereinander und mit dem “Name

Node”• Vorverdrahtet

Page 11: DATA WAREHOUSE

Horizontale ErweiterungVernetzung mehrer Racks durch InfiniBand

Exadata Anschluss ebenfalls durch InfiniBand

Page 12: DATA WAREHOUSE

<Insert Picture Here>

Oracle Big Data Appliance

Software Überblick

Page 13: DATA WAREHOUSE

Software vor-installiert und optimiert für

eine optimale Performance:

•Oracle Linux 5.6

•Java Hotspot VM

•Cloudera CDH

•Cloudera Manager

•Open Source R Distribution

•Oracle NoSQL Database CE

•Oracle Big Data Connectors*

Oracle Big Data Appliance Software

* Separate linzenzpflichtige Software, kann vorinstalliert unf konfiguriert werden

Page 14: DATA WAREHOUSE

Cloudera CDH

• Cloudera CDH 3 enthält:• Apache Hadoop• Apache Hive• Apache Pig• Apache HBase• Apache Zookeeper• Apache Flume• Apache Sqoop• Apache Mahout• Apache Whirr• Apache Oozie• Fuse-DFS• Hue

Aktuelle Details unter: http://www.cloudera.com/hadoop-details/

Page 15: DATA WAREHOUSE

Hadoop Software Layout (Masters) • Node 1:

• M: Name Node, Balancer & HBase Master• S: HDFS Data Node, NoSQL DB Storage

Node*• Node 2:

• M: Secondary Name Node, Cloudera Manager, Zookeeper, MySQL Slave

• S: HDFS Data Node, NoSQL DB Storage Node*

• Node 3:• M: JobTracker, MySQL Master, ODI Agent, Hive

Server• S: HDFS Data Node, NoSQL DB Storage

Node*2

1

3

* Optionale Konfiguration

Page 16: DATA WAREHOUSE

Oracle NoSQL DB Eine verteilte, hoch skalierbare Key-Value Datenbank

• Einfaches Daten Model• Key-Value Paar mit major+sub-key • Read/insert/update/delete Operationen

• Skalierbarkeit• Dynamische Partitionierung und Verteilung• Optimierter Daten Zugriff über dieTreiber

• Hoch Verfügbarkeit• Ein oder mehrere Replicate• Disaster recovery über die Replicate• Kein “single point of failure”

• Transparentes “load balancing”• Es wird vom Master

oder einem Replicat gelesen• Die Treiber berücksichtigen die Netzwerk-Topologie

und die Latenzzeiten

Storage NodesData Center A

Storage NodesData Center B

NoSQLDB Driver

Application

NoSQLDB Driver

Application

Page 17: DATA WAREHOUSE

NoSQL DB

NoSQL Konfiguration (Optional für die BDA)

Master Node

Replicat

Vor-Konfiguriert mit dreifacher Replikation

Page 18: DATA WAREHOUSE

<Insert Picture Here>

Zusammenfassung

Page 19: DATA WAREHOUSE

Big Data ApplianceBig Data fürs gesamte Unternehmen

• Optimiert und Vollständig• Alles was man zur Speicherung und

Integration von Daten mit geringer Informationsdichte braucht

• Integration mit Oracle Exadata• Erweiterung des DWH

• Einfach und schnell einsetzbar• Riskoarme, einfache und schnelle Einführung

• Ein Ansprechpartner• Für den Support der gesamten Lösung

Page 20: DATA WAREHOUSE

Kontakt und mehr Informationen

Oracle Data Warehouse Community Mitglied werdenViele kostenlose Seminare und Events

Download – Server:www.ORACLEdwh.de

Nächste deutschsprachige Oracle DWH Konferenz:19. + 20. März 2013 Kassel

Page 21: DATA WAREHOUSE

Top Related