consistencia y replicaciÒn estudiar .docx

5
CONSISTENCIA Y REPLICACIÒN Replicación: - Los datos se replican para aumentar la disponibilidad o el rendimiento. - Un aspecto fundamental es la consistencia entre las réplicas: cuando se actualiza una copia, se deben actualizar también las demás. - La replicación está muy relacionada con la escalabilidad. Si la replicación ayuda a mejorar la confiabilidad y el rendimiento, ¿quién estaría en su contra? Por desgracia, hay un precio a pagar cuando se replican datos. El problema con la replicación es que tener muchas copias puede provocar problemas de consistencia. Siempre que se modifica una copia, ésta se vuelve diferente al resto de copias. Por tanto, para garantizar la consistencia, las modificaciones deben realizarse en todas las copias. El precio de la replicación lo determinan exactamente el cuándo y el cómo deben realizarse dichas modificaciones. Razones para la Replicación Existen dos razones principales para replicar datos: la confiabilidad y el rendimiento Hay dos razones principales para la replicación de datos: Confiabilidad Continuidad de trabajo ante caída de la réplica: Si un sistema de archivos se replicó, es posible continuar trabajado después de que una réplica falle con tan sólo cambiar a una de las otras réplicas Mayor cantidad de copias mejor protección contra la corrupción de datos: Además, al mantener varias copias se hace posible proporcionar una mejor protección contra datos corruptos. Rendimiento El SD escala en número : el escalamiento en números ocurre cuando un número creciente de procesos necesita acceder a datos que son administrados por un solo servidor. En ese caso, el rendimiento puede mejorarse replicando el servidor y, posteriormente, dividiendo el trabajo

Upload: elena-penafiel-velez

Post on 26-Sep-2015

15 views

Category:

Documents


3 download

TRANSCRIPT

CONSISTENCIA Y REPLICACINReplicacin:- Los datos se replican para aumentar la disponibilidad o el rendimiento.- Un aspecto fundamental es la consistencia entre las rplicas: cuando se actualiza una copia, se deben actualizar tambin las dems.- La replicacin est muy relacionada con la escalabilidad.

Si la replicacin ayuda a mejorar la confiabilidad y el rendimiento, quin estara en su contra?Por desgracia, hay un precio a pagar cuando se replican datos. El problema con la replicacin es que tener muchas copias puede provocar problemas de consistencia. Siempre que se modifica una copia, sta se vuelve diferente al resto de copias. Por tanto, para garantizar la consistencia, las modificaciones deben realizarse en todas las copias. El precio de la replicacin lo determinan exactamente el cundo y el cmo deben realizarse dichas modificaciones.

Razones para la ReplicacinExisten dos razones principales para replicar datos: la confiabilidad y el rendimiento

Hay dos razones principales para la replicacin de datos:ConfiabilidadContinuidad de trabajo ante cada de la rplica: Si un sistema de archivos se replic, es posible continuar trabajado despus de que una rplica falle con tan slo cambiar a una de las otras rplicasMayor cantidad de copias mejor proteccin contra la corrupcin de datos:Adems, al mantener varias copias se hace posible proporcionar una mejor proteccin contra datos corruptos.RendimientoEl SD escala en nmero: el escalamiento en nmeros ocurre cuando un nmero creciente de procesos necesita acceder a datos que son administrados por un solo servidor. En ese caso, el rendimiento puede mejorarse replicando el servidor y, posteriormente, dividiendo el trabajoEscala en rea geogrfica (disminuye el tiempo de acceso al dato): el rendimiento percibido por ese proceso aumenta. Tambin muestra que puede ser difcil evaluar los beneficios de la replicacin en cuanto al rendimiento. Aunque un proceso cliente puede percibir un mejor rendimiento,tambin puede darse el caso de que se consuma ms ancho de banda de la red para mantener todas las rplicas actualizadas.

MODELOS DE CONSISTENCIAEn un sistema distribuido hay una serie de posibles modelos de consistencia de datos. Un sistema soporta cierto modelo, si las operaciones en memoria siguen normas especficas. La consistencia de los datos es definida entre el programador y el sistema, que garantiza que si el programador sigue las reglas, la memoria ser consistente, y el resultado de las operaciones de memoria ser predecible.

MODELO DE CONSISTENCIA CENTRADA DE DATOSEs el contexto de operaciones de lectura y escritura sobre datos compartidos, disponibles mediante memoria compartida (distribuida), una base de datos compartida (distribuida), o un sistema de archivo (distribuido). Una operacin de datos se clasifica como una operacin de escritura cuando sta cambia los datos, de otro modo se clasifica como una operacin de lectura.Cada modelo restringe efectivamente los valores que puede devolver una operacin de lectura sobre un elemento de datos. Como es de esperarse, los modelos con ms restricciones son ms fciles de utilizar, por ejemplo, cuando se desarrollan aplicaciones, mientras que aquellos con menos restricciones resultan ms difciles.

CONSISTENCIA CONTINUAYu y Vahdat (2002) consideran un mtodo general para diferenciar tres ejes independientes para definir inconsistencias: desviacin en valores numricos entre rplicas, desviacin en el deterioro entre rplicas, Medir la inconsistencia en trminos de desviaciones numricas puede utilizarse en aplicaciones para las que los datos tienen semnticas numricasComo alternativa, podra especificarse una desviacin numrica relativa, lo cual establece que dos copias deben diferir no ms de, por ejemplo, 0.5%. En ambos casos, veramos que si una accin va hacia arriba (y una de las rplicas se actualiza inmediatamente) sin violar las desviaciones numricas especificadas, las rplicas an seran consideradas como mutuamente consistentes.La desviacin numrica tambin puede comprenderse en trminos del nmero de actualizaciones que se han aplicado a una rplica dada, pero que an no han sido vistas por otras rplicas. Por ejemplo, un cach web puede no haber visto un lote de operaciones realizadas por un servidor web.Las desviaciones viejas se relacionan con la ltima vez que se actualiz una rplica. Para algunas aplicaciones, es tolerable que una rplica proporcione datos viejos siempre y cuando no sean demasiado viejos. Por ejemplo, los informes sobre el clima permanecen a menudo razonablemente precisos durante cierto tiempo, digamos algunas horas. En tales casos, un servidor principal puede recibir actualizaciones oportunas, pero decidir propagar las actualizaciones a las rplicas de vez en cuando..

CONSISTENCIA SECUENCIALLa consistencia secuencial es una forma ligeramente ms dbil de la consistencia estricta. Satisface la siguiente condicin:El resultado de una ejecucin es el mismo si las operaciones (lectura y escritura) de todos los procesos sobre el dato fueron ejecutadas en algn orden secuencial y las operaciones de cada proceso individual aparecen en esta operaciones de cada proceso individual aparecen en esta secuencia en el orden especificado por su programa

CONSISTENCIA CAUSALEs un debilitamiento de la consistencia secuencial. Se hace una diferenciacin entre eventos que estn potencialmente relacionados en forma casual y aquellos que no.La condicin a cumplir para que unos datos sean casualmente consistentes es:Escrituras que estn potencialmente relacionados en forma casual deben ser vistas por todos los procesos en el mismo orden. Escrituras concurrentes pueden ser vistas en un orden diferente sobre diferentes mquinas.Esta secuencia es permitida con un almacenamiento casualmente consistente o con un almacenamiento consistente en forma estricta.El modelo de consistencia causal (Hutto and Ahamad, 1990) es un debilitamiento de la consistencia secuencial. Se hace una diferenciacin entre eventos que estn potencialmente relacionados en forma causal y aquellos que no. Las operaciones que no estn causalmente relacionadas se dicen concurrentes.