pdf cassandra

Upload: luis-serrano

Post on 11-Oct-2015

16 views

Category:

Documents


0 download

TRANSCRIPT

  • Olga Madrigal Arias

    Jenny Gonzlez

    Luis Serrano Rojas

    Milton Ruiz Cid

    Rigoberto Carvajal

    Integrantes:

  • HISTORIA

    Cdigo Abierto

    Fusin

    Que es?

    Facebook Apache

    Donde Verticalidad

    B.D.R. Ajustar Costos

    Por qu?

    Clave- Valor

    Tipo?

  • TIPOS DE ALMACENAMIENTOASCII

    BIGINT

    BOOLEAN

    BLOB

    COUNTER

    DECIMAL

    FLOAT

    MapReduce

    Fraccionar operacin

    compleja para recoger los resultados y unificarlos

    NoSQL Cassandra -Hadoop

  • Visin general de Cassandra

    BigTable + Dynamo Modelos de datos semiestructurados Descentralizado no hay roles especiales, no

    hay SPOF Es horizontalmente escalable Las escrituras son rpidas, lee rpido Consistencia tunable

  • Configuracin analtica separada

    Un solo grupo Cassandra con diferentes centros de datos virtuales

    Nodos de acceso aleatorio en tiempo real

    Nodos para la analtica

    CassandraHadoop

    Hadoop

    HadoopCassandra

    Cassandra

  • Costos

    Entrenamiento

    Soporte

    Consultora

    Ofrece la posibilidad de utilizar hardware de los productos bsicos baratos y maximizar el rendimiento.

    Los requisitos de almacenamiento slo van a incrementar con forme los datos crecen.

  • Escenarios y ejemplos en los que se utilizaWEB

    Juegos

    Gobierno

    Marketing y Publicidad

    Entretenimiento DigitalSoftware

    Viajes

    Seguridad

    Aplicaciones Mviles

  • Lenguajes de programacin soportados Lenguaje de consulta: CQL

    Clientes:

    Python

    Java (Incluido Driver)

    Scala

    Node.js (Incluido Driver)

    Clojure

    .NET

    Ruby (Incluido Driver)

    PHP (Incluido PDODriver)

    Perl

    C++

    Haskel

  • Arquitectura local

    1) El cliente escribe a cualquiera de los nodos.

    2)El nodo coordinador replica a los nodos y zonas

    3)Los nodos devuelven al coordinado un ACK

    4)El Coordinador devuelve un ACK al cliente.

    5)Los datos se escriben al disco interno de commit log.

  • Multi zonas y rack

  • Arquitectura global

  • Cassandra segn CAP

    AP

    CP

    CA

  • Componentes Principales

    Clster

    Nodo

    Keyspace

    Tabla

    Columnas {clave, valor, timestamp}

  • Seguridad

    SSL Cliente-nodo

    Nodo-nodo

    Cqlsh

    Autenticacin interna Basada en cuentas de login y contraseas

    Autorizacin interna GRANT/REVOKE

    Software de seguridad externa: Kerberos

    LDAP (Lightweight Directory Access Protocol)

  • Alta disponibilidad

    Teorema CAP? Cassandra es AP (Availability, Partition

    tolerance)

    Replicacin SimpleStrategy

    OldNetworkTopologyStrategy

    NetworkTopologyStrategy

    Optimizaciones (modo asincrnico) Hinted Handoff

    Read Repair

  • Alta escalabilidad

    Replicacin en muchos servidores

    Escalabilidad lineal: solo agregue mas nodos

    Sin un nico punto de fallo

    No se compromete el rendimiento

  • Recuperacin ante desastres

    Cassandra tolerante a fallos por diseo Sistema distribuido, peer-to-peer

    Nodos en cluster equivalentes No existe PUF Protocolo Gossip Commit log

    Copias geodistribuidas Rack Data Center Multi Data Center

    Respaldo y restauracin de copias de seguridad Snapshot

    Un nodo nodetool snapshot Todo el cluster nodetool snapshot + pssh

  • Diferencias y Similitudes con los Sistemas

    Tradicionales

    ComplejidadVolumenVariedadVelocidad

    Datos entrada y salida

    Datos estructurados, semi y no estructurados

    Datos de terabyte o petabytes de tamao

    Datos que se almacenan en diferentes lugares

  • Diferencias y Similitudes con los Sistemas

    Tradicionales

    Cassandra

    81.58

    SQL Server

    1246.60

    Oracle

    1485.12

  • Diferencias y Similitudes con los Sistemas

    Tradicionales

    Caracterstica

    Versin Licencia Lenguaje SQL

    Cassandra

    2008 Open Source Java NoSQL

    SQL Server

    1989 Comercial C++ Si

    Oracle

    1980 Comercial C y C++ Si

  • Diferencias y Similitudes con los Sistemas

    Tradicionales

    OracleAIX

    LinuxSolaris

    Windows

    SQL ServerWindows

    CassandraLinux OS X

    Windows

    Sistemas Operativos

  • Diferencias y Similitudes con los Sistemas

    TradicionalesCaracteristica

    ndices Script Servidor Paricionamiento

    Cassandra

    Si No S

    SQL Server

    Si Transac Si

    Oracle

    Si Pl/SQL Si

    S

    Cassandra

    Segn la Versin

    SQL Server S

    Oracle

    Replicacin

  • KEY AO

    ESTADONOMBRE

    COLUMNFAMILY: USUARIOS

    KEYSPACE: MYKEYSPACE

    Parte 1: Laboratorio

    GNERO

  • MUCHAS GRACIAS!