Transcript
Page 1: Sistemas De Archivos Distrivuidos

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

INTAGRANTES

Henri GuarnizoCristina OcampoByron OchoaGonzalo Piedra

Page 2: Sistemas De Archivos Distrivuidos

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

• Un sistema de archivos distribuido (distributed file system, DFS) es una implementación distribuida del modelo clásico de tiempo compartido de un sistema de archivos, donde múltiples usuarios comparten archivos y recursos de almacenamiento.

• El propósito de un DFS es soportar la misma clase de compartimiento cuando los archivos están dispersos físicamente entre los diversos sitios de un sistema distribuido.

Page 3: Sistemas De Archivos Distrivuidos

Antecedentes

Page 4: Sistemas De Archivos Distrivuidos

Un sistema distribuido es un conjunto de máquinas débilmente acopladas interconectadas mediante una red de comunicación.Se emplea el término máquina para designar una computadora o una estación de trabajo.

Estructura;

Para saber como es la estructura de un DFS necesitamos definir los términos:• Servicio• Servidor• Cliente

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Page 5: Sistemas De Archivos Distrivuidos

Servicio: Es una entidad de software que corre en una o más máquinas y proporciona un

tipo particular de función a clientes que no se conocen por adelantado.

Servidor: Es el software de servicio que corre en una sola máquina.

Cliente: Es un proceso que puede llamar a un servicio empleando operaciones que forman su interfaz de cliente .

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Page 6: Sistemas De Archivos Distrivuidos

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

• Una interfaz de cliente para un servicio de archivos se forma mediante un conjunto de operaciones de archivos primitivos tales como el de crear, borrar, leer o escribir en un archivo.

• El componente principal de hardware que controla a un servidor de archivos es un conjunto de dispositivos locales de almacenamiento secundarios tales como discos magnéticos.

Page 7: Sistemas De Archivos Distrivuidos

Otros Antecedentes de un DFS:

• Un DFS es un sistema de archivos cuyos clientes, servidores y dispositivos de almacenamiento están dispersos entre las máquinas de un sistema distribuido.

• La medida de desempeño más importante de un DFS es la cantidad de tiempo necesaria para satisfacer las diversas solicitudes de servicios.

• Un DFS idealmente debería aparecer a sus clientes como un sistema de archivos convencional y centralizado.

• El espacio de almacenamiento global administrado por un DFS está compuestos de diferentes espacios de almacenamiento más pequeños localizados remotamente.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Page 8: Sistemas De Archivos Distrivuidos

NOMENCLATURA

Y

TRANSPARENCIA

Page 9: Sistemas De Archivos Distrivuidos

• Una nomenclatura es un tipo de mapeo entre objetos lógicos y físicos, por ejemplo: los usuarios manejan objetos de datos lógicos representados por nombres de archivos, en tanto que el sistema se encarga de manipular los bloques físicos de datos almacenado en disco.

• En un DFS transparente se agrega una nueva dimensión a la abstracción: como la de ocultar el lugar en la red donde se localiza dicho archivo.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Page 10: Sistemas De Archivos Distrivuidos

Estructura de Nomenclatura:

Existen dos tipos de nomenclatura para los mapeos de nombres en un DFS:

• Transparencia de ubicación: el nombre de un archivo no revela pista alguna de la ubicación del almacenamiento físico del archivo.

• Independencia de la ubicación: el nombre de un archivo no necesita modificarse cuando cambia la ubicación del almacenamiento físico del archivo.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Page 11: Sistemas De Archivos Distrivuidos

Otros aspectos que pueden diferenciar la independencia y transparencia de ubicación estática:

• Separar los datos de la ubicación según lo exhibe la independencia de ubicación para proporcionar una mejor abstracción para los archivos.

• Los usuarios pueden compartir archivos remotos, simplemente nombrando a los archivos en una forma transparente a la ubicación , como si los archivos fueran locales.

• La independencia de ubicación separa la jerarquía de nomenclatura de la jerarquía de los dispositivos de almacenamiento y de la estructura entre computadoras.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Page 12: Sistemas De Archivos Distrivuidos

Esquema de Nomenclatura:

Existen tres enfoques principales para los esquemas en un DFS:

• El más sencillo es aquel en el cual a los archivos se les asigna un nombre que es una ubicación del nombre de su anfitrión y el nombre local, lo cual garantiza un nombre único en todo el sistema.

• El segundo enfoque fue popularizado por el sistema de archivos de red de Sun (Network File System, NFS), el cual proporciona medios para ligar directorios remotos a directorios locales, dando de esta forma la apariencia de un árbol coherente de directorios.

• En el tercer enfoque, se logra una integración total de los sistemas de archivos, aquí podemos notar que su estructura es isomórfica con respecto a la estructura de un sistema de archivos convencional, pero sin embargo los diversos archivos especiales, como los de UNIX y los directorios binarios de la máquina, hacen que esta meta sea difícil de alcanzar.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Page 13: Sistemas De Archivos Distrivuidos

Técnicas de Implementación:

• La implementación que posee o que tiene una nomenclatura transparente requiere una provisión para el mapeo de un nombre de archivo en la ubicación asociada.

• Para una mejor disponibilidad de la información de mapeo podemos emplear métodos como la replicación, el uso de cachés o ambos si es necesario.

• Podemos introducir identificadores de archivos de bajo nivel independientes de la ubicación, los cuales nos servirán para hacer actualizaciones simples y la vez consistentes de una determinada información en memoria.

• La implementación de árboles de directorios tipo UNIX utilizando estos identificadores de bajo nivel independientes de la ubicación, hace que toda la jerarquía sea invariante bajo la migración de unidades componentes.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Page 14: Sistemas De Archivos Distrivuidos

Acceso a Archivos

Remotos

Page 15: Sistemas De Archivos Distrivuidos

• Un mecanismo de servicio remoto es aquel mediante el cual la solicitudes de acceso se entregan al servidor, la máquina del servidor realiza los accesos y los resultados se envían de regreso al usuario

• Para asegurar un desempeño razonable en un mecanismo de servicio remoto podemos emplear una forma de uso de cachés que en los archivos convencionales, el raciocinio para el uso de cachés es reducir la E/S de disco, mientras que en los DFS, la meta es reducir tanto el tráfico en la red como en la E/S de disco.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Page 16: Sistemas De Archivos Distrivuidos

Esquema básico de uso de cachés:

• Si los datos necesarios para satisfacer la solicitud de acceso no se encuentran ya en caché, entonces se lleva una copia de dichos datos desde el servidor al sistema del cliente.

• Los accesos se realizan en la copia que está en caché.• Una política de reemplazo por ejemplo: los menos recientemente

usados mantienen limitado el tamaño de la caché.• Los archivos se siguen identificando con una copia que reside en la

máquina del servidor, pero aquí las copias o partes del archivo están dispersas en diferentes cachés.

• El tamaño del bloque y el tamaño total de la caché tienen una importancia obvia en los esquemas de uso de cachés con bloques

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Page 17: Sistemas De Archivos Distrivuidos

Ubicación de cachés:• Las cachés de disco tienen una ventaja muy clara

sobre las cachés de memoria principal: como es su confiabilidad.

• Las modificaciones que se hacen a datos en caché se pierden durante una caída de dicha caché; es decir solo se mantienen en memoria volátil

• Por lo tanto si los datos que se encuentran en caché se mantienen en disco siguen estando ahí durante la recuperación, por lo que ya no es necesarios traerlos nuevamente.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Page 18: Sistemas De Archivos Distrivuidos

Ventajas de cachés de memoria principal:

• Permiten tener estaciones de trabajo sin discos.• Pueden accederse más rápidamente a sus datos.• La tendencia actual en la tecnología es hacía memorias con

mayor capacidad y menor costo.• Las cachés de servidores estarán en memoria principal

independientemente de donde se encuentren ubicadas las cachés de usuario.

• Si en la máquina del usuario también se usa cachés de memoria principal se puede crear un solo mecanismo de uso de cachés para que sea utilizado tanto por el servidor como el usuario.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Page 19: Sistemas De Archivos Distrivuidos

Políticas de actualización de cachés:

• La política más sencilla es la de escribir datos en el disco tan pronto como son colocados en cualquier caché.

• Una de las ventajas de esta política de escritura directa es la confiabilidad; es decir, se pierde poca información cuando falla un el sistema de un cliente.

• Una alternativa es la política de escritura demorada, que es donde retrasamos las actualizaciones en la copia maestra.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Page 20: Sistemas De Archivos Distrivuidos

Variantes de estas políticas:

• Una de estas variantes consiste en vaciar un bloque cuando está a punto de ser expulsado de la caché del cliente

• Otra variante de la escritura demorada consiste en escribir datos de regreso al servidor cuando se cierra el archivo, cabe señalar que ésta política se utiliza más en el sistema Andrew. Además la política de escritura de cierre requiere que se demore el proceso de cierre mientras el archivo se está escribiendo.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Page 21: Sistemas De Archivos Distrivuidos

Consistencia:• Una máquina cliente se enfrenta al problema de decidir si una copia

de los datos en caché es o no consistente con la copia maestra. Para ello existen dos enfoques para verificar la validez de los datos en caché.

1. Enfoque iniciado por el cliente: aquí el cliente inicia una verificación de validez en la que se pone en contacto con el servidor y verifica si los datos locales son consistentes con su copia maestra.

2. Enfoque iniciado por el servidor: el servidor registra para cada cliente las partes de los archivos que colocan en caché, para cuando el servidor detecte una inconsistencia potencial poder reaccionar.Un potencial de inconsistencia ocurre cuando un archivo es colocado en caché por dos clientes diferentes en modo de conflicto

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Page 22: Sistemas De Archivos Distrivuidos

Comparación entre el uso de cachés y de servicios remotos:Una comparación entre estos dos tiene que ver con un incremento potencial en el desempeño y una disminución en la simplicidad tanto de los cachés como los servicios remotos.Entre sus ventajas y des ventajas que éstos presentan tenemos:

• Un número considerable de los accesos remotos puede ser manejado eficientemente por la caché local cuando se hace uso de cachés.

• El trabajo total adicional de la red en la transmisión de grandes porciones de datos es menor que cuando se transmiten series de respuestas a solicitudes específicas.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Page 23: Sistemas De Archivos Distrivuidos

• El problema de consistencia, es la principal desventaja del uso de cachés, debido a que en los patrones de acceso que exhiben escrituras poco frecuentes el uso de cachés es superior.

• Para que el uso de cachés confiera un beneficio la ejecución deberá realizarse en máquinas con discos locales o grandes memorias principales.

• En el caso del uso de cachés, debido a que los datos se transfieren en masa entre el servidor y el cliente y no en respuesta a las necesidades específicas de una operación sobre archivos, la interfaz inferior entre máquinas es diferente de la interfaz de usuario superior.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS


Top Related