unidad iv manejo de archivos m.c. juan carlos olivares rojas

39
Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Upload: belen-suarez-cabrera

Post on 25-Jan-2016

229 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Unidad IV Manejo de archivos

M.C. Juan Carlos Olivares Rojas

Page 2: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Temario

4.1 Introducción

4.2 Notación de archivo real y virtual

4.3 Componentes de un sistema de archivos

4.4 Organización lógica y física

4.5 Mecanismos de acceso a los archivos

4.6 Manejo del espacio de memoria secundaria

Page 3: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Temario4.7 Modelo jerárquico4.8 Mecanismos de recuperación en caso de fallas4.9 Estructura del sistema operativo 4.9.1 BIOS 4.9.2 Kernel o núcleo 4.9.3 Procesador de comandos4.10 Manejadores de interrupción 4.10.1 Interrupción del BIOS 4.10.2 Interrupción del MS-DOS 4.10.3 Interrupción del hardware

Page 4: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

4.1 Introducción• Un archivo es un conjunto de elementos de

información relacionados entre si y que fueron definidos por su creador.

• Por lo general, los archivos representan datos y programas.

• Un archivo de datos puede ser texto (alfanumérico) o binario (secuencia de bytes).

Page 5: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción

• Los archivos pueden ser de formato libre, como los archivos de texto, o pueden estar rigurosamente formateados (en general los archivos binarios).

• En general, un archivo es una secuencia de bits, bytes, líneas o registros cuyo significado es definido por el creador del archivo y por el usuario.

Page 6: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• Un archivo se puede manipular como una

unidad mediante operaciones tales como:

– Abrir (open()), – Cerrar (close()), – Crear (create()), – Destruir (destroy()), – Copiar (copy()), – Renombrar (rename()) y – Listar (list()).

Page 7: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• Los elementos de información individuales

que conforman un archivo se pueden manipular con acciones tales como leer (read()), escribir(write()), modificar(modify()) y eliminar(remove()).

• De acuerdo a las características y tipo de trabajo que se realicen sobre los archivos, estos pueden caracterizarse por su: Volatilidad, Actividad y Tamaño.

Page 8: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• Volatilidad: se refiere a la frecuencia con la

que se inserta o elimina información. • Actividad: se refiere al porcentaje de los

elementos de información de un archivo al que se tuvo acceso en un periodo de tiempo dado.

• Tamaño: se refiere a la cantidad de información que conforma el archivo.

Page 9: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• Archivo físico: es la información vista desde

la perspectiva de hardware.

• Por ejemplo, el archivo 1 está formado por los sectores 3, 10 y 15 del archivo.

• Otro ejemplo: el archivo X es la secuencia de bytes localizados en la RAM en el bloque 0A703h:03000h al 0A703h:04200h.

Page 10: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• Archivo lógico: son datos cuyo significado

esta definido por el usuario.

• Ejemplo, el archivo Y es la información de 1000 artículos, cada uno con su código, descripción y precio. Generalmente, un archivo lógico se representa de manera tabular.

Page 11: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• El sistema de archivos (File System) de un

sistema operativo, está conformado por todas aquellas rutinas encargadas de administrar todos los aspectos relacionados con el manejo de Archivos.

  • En general, un Sistema de Archivos está

compuesto por: Métodos de Acceso, Administración de Archivos, Administración de Almacenamiento Secundario, y Mecanismos de Integridad.

 

Page 12: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• Los Métodos de Acceso se ocupan de la

manera en que se tendrá acceso a la información almacenada en el archivo. Ejemplo: Secuencial, Directo, indexado, etc.

• El Administración de Archivos se ocupa de ofrecer los mecanismos para almacenar, compartir y asegurar archivos, así como para hacer referencia a ellos.

Page 13: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• La Administración de Almacenamiento

Secundario se ocupa de asignar espacio para los archivos en los dispositivos de almacenamiento secundario.

• Los Mecanismos de Integridad se ocupan de garantizar que no se corrompa la información de un archivo, de tal manera que solo la información que deba estar en él, se encuentre ahí.

Page 14: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• La Organización de archivos se refiere a las

diferentes maneras en las que puede ser organizada la información de los archivos, así como las diferentes maneras en que ésta puede ser accedida.

• Dado que hay 2 niveles de visión de los archivos (físico y lógico), se puede hablar también de 2 aspectos de organización de archivos: organización de archivos lógicos y de archivos físicos.

Page 15: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• La organización de archivos lógicos

contempla la organización desde el punto de vista lógico. Por ejemplo, secuencial, directo, etc.

• La organización de archivos físicos contempla la administración de archivos desde la perspectiva física, particularmente la organización del almacenamiento en disco a nivel de pistas y sectores.

Page 16: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• Este tipo de organización muestra a su vez,

dos aspectos importantes: Métodos de Asignación de Espacio Libre y Asignación De Espacio de Almacenamiento del Archivo.

• Un método de asignación de espacio libre determina la manera en que un Sistema Operativo controla los lugares del disco que no están siendo ocupados.

Page 17: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• Para el control del espacio libre se puede

utilizar como base alguno de los métodos teóricos: Vector de Bits, Lista Ligada, por Agrupacion y por Contador.

• En un Vector de Bits, el número de bits que se tiene, representa cada sector del disco, es decir, que si los sectores 10 y 11  están ocupados su representación será:

Page 18: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• Lista Ligada: existe una cabecera en la que

se tiene la dirección del primer sector vacío, ese sector a su vez, tiene un apuntador al siguiente bloque, y así sucesivamente hasta que se encuentre una marca indicando que ya no hay espacio libre.

• Sistemas de archivos como FAT y EXT2 funcionan con características de este esquema.

Page 19: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• Por agrupación: es similar a la lista ligada,

solo que en este se tiene por cada sector, un grupo de apuntadores a varios espacios vacios, al final de cada bloque se tiene un apuntador a otro grupo de apuntadores.

• Por contador: aquí, por cada conjunto de bloques contiguos que estén vacios, se tiene por cada apuntador, un número de inicio y el tamaño del grupo de sectores vacios.

Page 20: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• Métodos de asignación de espacio en disco:

un método de asignación de espacio en disco determina la manera en que un Sistema Operativo controla los lugares del disco ocupados por cada archivo de datos.

• Se debe controlar básicamente la identificación del archivo, sector de inicio y sector final.

Page 21: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• Para el control del espacio ocupado en disco

se puede utilizar como base alguno de los métodos teóricos: Asignación Contigua, Asignación Ligada, Asignación Indexada.  

• Asignación continua: este método consiste en asignar el espacio en disco de tal manera que las direcciones de todos los bloques correspondientes a un archivo definen un orden lineal.

Page 22: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• Las ventajas y desventajas que presenta

este método de asignación son las siguientes:

• La cabeza de lectura no se mueve demasiado en la lectura de un archivo (ventaja)

• Produce fragmentación externa.

Page 23: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• Asignación Ligada: en este método, cada

archivo es una lista ligada de bloques de disco.

• En el directorio hay un apuntador al bloque de inicio y un apuntador al bloque final para cada archivo.

• En cada uno de los bloques donde se encuentra un archivo hay un apuntador al siguiente bloque de la lista.

Page 24: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• Las ventajas y desventajas que produce este

método son las siguientes:– No produce fragmentación externa (ventaja). – La cabeza de lectura se puede mover

demasiado en la lectura de un archivo (desventaja). 

– Si una liga se pierde, se perderá el archivo completo (desventaja). 

– Es ineficiente para la implementación de archivos directos (desventaja). 

– Se necesita un campo extra para el apuntador (desventaja).

Page 25: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• Asignación Indexada: resuelve el problema de la

fragmentación externa poniendo todos los apuntadores en una sola localidad: El bloque índice.

• Cada archivo tiene su bloque índice, El cual es un arreglo de direcciones de bloques de disco.

• La i-ésima entrada en el bloque índice apunta al i-ésimo bloque que conforma el archivo. En el directorio se controla la dirección del bloque índice de cada archivo. 

Page 26: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• Las ventajas y desventajas que presenta este

método son las siguientes:– No produce fragmentación externa (ventaja). 

– Eficiente para la implementación de archivos directos (desventaja).  

– Existe desperdicio cuando hay archivos muy chicos (desventaja). 

– Desbordamiento de bloque índice (solución: creación de un esquema ligado; el ultimo bloque índice apunta a otro índice).

Page 27: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• Método FAT (MS-DOS): un aspecto importante

de cualquier Sistema Operativo es la manera de gestionar los archivos.

• En el antiguo MS-DOS, la gestión de los archivos era casi todo lo que hacía el Sistema Operativo, esencialmente cuando se ejecutaba Windows de 16 bits sobre él.

• Windows de 16 bits se ocupaba de todo a excepción de la manipulación de los discos fijos y flexibles, que los dejaba para MS-DOS.

Page 28: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• El objetivo de la FAT es el de asignar

espacio en disco para archivos.

• La tabla FAT contiene una entrada para cada grupo que está en el disco. Cada grupo es un conjunto de sectores.

• Al querer crear un archivo o revisar uno existente, el sistema operativo revisa las entradas que están asociadas a la FAT de acuerdo con la ubicación del archivo.

Page 29: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción• El área de sistema tiene 3 componentes:

Registro de arranque, FAT y directorio. La tabla tiene una captación por bloque, ésta define cuantos bloques tiene el primer archivo. Esta ranura de la FAT contiene el número de bloque del siguiente bloque.

Page 30: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción

• Método VFAT: la VFAT emplea la misma técnica que la FAT, a diferencia de que la VFAT la implementa Windows '95 con direccionamiento a 32 bits. En sí éste módulo de 32 bits está escrito en código reentrante, lo que permite que múltiples hilos concurrentes ejecuten el código del sistema de archivos.

Page 31: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Introducción

• Parte esencial de cualquier sistema corresponde con el almacenamiento de la información, esto se logra a través de un sistema de archivos.

• Los archivos son las unidades lógicas para representar la información, y en un sistema distribuido los archivos pueden estar en prácticamente cualquier parte.

Page 32: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Archivos

• Algunas características que comparten los sistemas de archivos son:

• En general son pequeños (<10 KB)• La lectura es más común que la escritura• La lectura y escritura son secuenciales, es

raro el acceso aleatorio• La mayoría de los archivos tiene una vida

corta.

Page 33: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Archivos

• Es poco usual compartir archivos

• Los procesos promedio utilizan pocos archivos

• Se recomienda el uso de cachés para evitar problemas de escritura simultánea.

Page 34: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

4.2. Duplicidad de datos • Se utiliza la duplicidad de los datos para tener

sistemas tolerantes a fallos, de más fácil acceso, entre otras ventajas.

• El principal problema que presenta la duplicación de los datos tiene que ver con la transparencia de almacenamiento.

• Otro problema importante consiste en la consistencia de la información.

Page 35: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Duplicidad de datos

• Se manejan esquemas de actualización de réplicas primarias y secundarias, basado en quorum, entre otros mecanismo.

• La duplicidad de los datos se puede hacer a nivel físico como los sistemas RAID.

• Las cachés son un ejemplo de duplicidad de datos que traen grandes beneficios.

Page 36: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Referencias

• Tanebaum, A., Woodhull, A. (1997) Sistemas Operativos. Diseño e Implementación. México, Prentice Hall. ISBN: 970-17-0165-8.

• Tutorial de Sistemas Operativos 2. Instituto Tecnológico de la Paz. http://sistemas.itlp.edu.mx/tutoriales/sistemasoperativos2/ [octubre 2007]

Page 37: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Referencias

• Tanenbaum, Andrew (1996). Sistemas Operativos Distribuidos. México, Prentice Hall.

• Shah, Steve (2001). Manual de administración de Linux. Capítulo 18: Sistema de archivos de red (NFS), pp 375-386. España, Osborne McGraw-Hill.

Page 38: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

Referencias

• Silberschatz, Abraham, Galvin, Peter, Sistemas Operativos, Quinta edición (1999). México, Pearson.

Page 39: Unidad IV Manejo de archivos M.C. Juan Carlos Olivares Rojas

¿Preguntas?