pdf cassandra
TRANSCRIPT
-
Olga Madrigal Arias
Jenny Gonzlez
Luis Serrano Rojas
Milton Ruiz Cid
Rigoberto Carvajal
Integrantes:
-
HISTORIA
Cdigo Abierto
Fusin
Que es?
Facebook Apache
Donde Verticalidad
B.D.R. Ajustar Costos
Por qu?
Clave- Valor
Tipo?
-
TIPOS DE ALMACENAMIENTOASCII
BIGINT
BOOLEAN
BLOB
COUNTER
DECIMAL
FLOAT
MapReduce
Fraccionar operacin
compleja para recoger los resultados y unificarlos
NoSQL Cassandra -Hadoop
-
Visin general de Cassandra
BigTable + Dynamo Modelos de datos semiestructurados Descentralizado no hay roles especiales, no
hay SPOF Es horizontalmente escalable Las escrituras son rpidas, lee rpido Consistencia tunable
-
Configuracin analtica separada
Un solo grupo Cassandra con diferentes centros de datos virtuales
Nodos de acceso aleatorio en tiempo real
Nodos para la analtica
CassandraHadoop
Hadoop
HadoopCassandra
Cassandra
-
Costos
Entrenamiento
Soporte
Consultora
Ofrece la posibilidad de utilizar hardware de los productos bsicos baratos y maximizar el rendimiento.
Los requisitos de almacenamiento slo van a incrementar con forme los datos crecen.
-
Escenarios y ejemplos en los que se utilizaWEB
Juegos
Gobierno
Marketing y Publicidad
Entretenimiento DigitalSoftware
Viajes
Seguridad
Aplicaciones Mviles
-
Lenguajes de programacin soportados Lenguaje de consulta: CQL
Clientes:
Python
Java (Incluido Driver)
Scala
Node.js (Incluido Driver)
Clojure
.NET
Ruby (Incluido Driver)
PHP (Incluido PDODriver)
Perl
C++
Haskel
-
Arquitectura local
1) El cliente escribe a cualquiera de los nodos.
2)El nodo coordinador replica a los nodos y zonas
3)Los nodos devuelven al coordinado un ACK
4)El Coordinador devuelve un ACK al cliente.
5)Los datos se escriben al disco interno de commit log.
-
Multi zonas y rack
-
Arquitectura global
-
Cassandra segn CAP
AP
CP
CA
-
Componentes Principales
Clster
Nodo
Keyspace
Tabla
Columnas {clave, valor, timestamp}
-
Seguridad
SSL Cliente-nodo
Nodo-nodo
Cqlsh
Autenticacin interna Basada en cuentas de login y contraseas
Autorizacin interna GRANT/REVOKE
Software de seguridad externa: Kerberos
LDAP (Lightweight Directory Access Protocol)
-
Alta disponibilidad
Teorema CAP? Cassandra es AP (Availability, Partition
tolerance)
Replicacin SimpleStrategy
OldNetworkTopologyStrategy
NetworkTopologyStrategy
Optimizaciones (modo asincrnico) Hinted Handoff
Read Repair
-
Alta escalabilidad
Replicacin en muchos servidores
Escalabilidad lineal: solo agregue mas nodos
Sin un nico punto de fallo
No se compromete el rendimiento
-
Recuperacin ante desastres
Cassandra tolerante a fallos por diseo Sistema distribuido, peer-to-peer
Nodos en cluster equivalentes No existe PUF Protocolo Gossip Commit log
Copias geodistribuidas Rack Data Center Multi Data Center
Respaldo y restauracin de copias de seguridad Snapshot
Un nodo nodetool snapshot Todo el cluster nodetool snapshot + pssh
-
Diferencias y Similitudes con los Sistemas
Tradicionales
ComplejidadVolumenVariedadVelocidad
Datos entrada y salida
Datos estructurados, semi y no estructurados
Datos de terabyte o petabytes de tamao
Datos que se almacenan en diferentes lugares
-
Diferencias y Similitudes con los Sistemas
Tradicionales
Cassandra
81.58
SQL Server
1246.60
Oracle
1485.12
-
Diferencias y Similitudes con los Sistemas
Tradicionales
Caracterstica
Versin Licencia Lenguaje SQL
Cassandra
2008 Open Source Java NoSQL
SQL Server
1989 Comercial C++ Si
Oracle
1980 Comercial C y C++ Si
-
Diferencias y Similitudes con los Sistemas
Tradicionales
OracleAIX
LinuxSolaris
Windows
SQL ServerWindows
CassandraLinux OS X
Windows
Sistemas Operativos
-
Diferencias y Similitudes con los Sistemas
TradicionalesCaracteristica
ndices Script Servidor Paricionamiento
Cassandra
Si No S
SQL Server
Si Transac Si
Oracle
Si Pl/SQL Si
S
Cassandra
Segn la Versin
SQL Server S
Oracle
Replicacin
-
KEY AO
ESTADONOMBRE
COLUMNFAMILY: USUARIOS
KEYSPACE: MYKEYSPACE
Parte 1: Laboratorio
GNERO
-
MUCHAS GRACIAS!