introduccion al procesamiento de datos final

89
REPÚBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DEL PODER POPULAR PARA LA EDUCACIÓN SUPERIOR UNIVERSIDAD EXPERIMENTAL “SIMON RODRIGUEZ” CONVENIO: I.N.N. - IPASME MENCION: RECURSOS HUMANOS CÁTEDRA: INTRODUCCION AL PROCESAMIENTO DE DATOS INTRODUCCION AL PROCESAMIENTO DE DATOS INTEGRATES: JENIFER DIAZ C.I. 14.194.414 Caracas, Mayo 2012

Upload: jennidr

Post on 21-Jul-2015

445 views

Category:

Documents


0 download

TRANSCRIPT

REPBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DEL PODER POPULAR PARA LA EDUCACIN SUPERIOR UNIVERSIDAD EXPERIMENTAL SIMON RODRIGUEZ CONVENIO: I.N.N. - IPASME MENCION: RECURSOS HUMANOS CTEDRA: INTRODUCCION AL PROCESAMIENTO DE DATOS

INTRODUCCION AL PROCESAMIENTO DE DATOS

INTEGRATES: JENIFER DIAZ C.I. 14.194.414

Caracas, Mayo 2012

CAPITULO I INTRODUCCIN AL PROCESAMIENTO DE DATOS DATOS Datos son los hechos que describen sucesos y entidades."Datos" es una palabra en plural que se refiere a ms de un hecho. A un hecho simple se le denomina "data-tem" o elemento de dato. Los datos son comunicados por varios tipos de smbolos tales como las letras del alfabeto, nmeros, movimientos de labios, puntos y rayas, seales con la mano, dibujos, etc. Estos smbolos se pueden ordenar y reordenar de forma utilizable y se les denomina informacin. Los datos son smbolos que describen condiciones, hechos, situaciones o valores. Los datos se caracterizan por no contener ninguna informacin. Un dato puede significar un nmero, una letra, un signo ortogrfico o cualquier smbolo que represente una cantidad, una medida, una palabra o una descripcin. La importancia de los datos est en su capacidad de asociarse dentro de un contexto para convertirse en informacin. Por si mismos los datos no tienen capacidad de comunicar un significado y por tanto no pueden afectar el comportamiento de quien los recibe. Para ser tiles, los datos deben convertirse en informacin para ofrecer un significado, conocimiento, ideas o conclusiones. SISTEMAS Es un conjunto de partes o elementos organizados y relacionados que interactan entre s para lograr un objetivo. Los sistemas reciben (entrada) datos, energa o materia del ambiente y proveen (salida) informacin, energa o materia. INFORMACION La informacin no es un dato conjunto cualquiera de ellos. Es ms bien una coleccin de hechos significativos y pertinentes, para el organismo

u organizacin que los percibe. La definicin de informacin es la siguiente: Informacin es un conjunto de datos significativos y pertinentes que describan sucesos o entidades. PROCESAMIENTO DE DATOS Es la tcnica que consiste en la recoleccin de datos primarios de entrada, que evaluados y ordenados, para obtener informacin til, que luego sern analizados por el usuario final, para as tomar las decisiones o realizar las acciones que estime conveniente. EVOLUCION DELPROCESO DE DATOS Desde hace mucho tiempo, el hombre ha tratado de facilitar las tareas de clculos matemticos, a veces complejas, o repetitivas. A lo largo de la historia, se perfeccionaron mecanismos que resultaron fundamentales para el desarrollo de los que hoy en da utilizamos. El instrumento de clculo ms antigo es quizs un conjunto de piedras que, por medio de ranuras hechas en el suelo, eran utilizadas hace miles de aos para contar. A partir de este elemento de clculo, aparecieron varios instrumentos similares llamados bacos. El baco ms antiguo data del ao 3500 a.C. y fue descubierto en Egipto. Alrededor del ao 2600 a.C. apareci el baco chino o suan-pan y el japons denominado soroban. El baco fue el primer instrumento de clculo manual, y serva para contar y realizar operaciones sencillas. Est formado por un marco de madera dividido en dos partes y posee en su interior varias varillas verticales, correspondientes a las cifras. En la parte inferior de cada varilla hay cinco discos, denominados cuentas, que quedan hacia abajo y en la parte superior de cada varilla hay dos discos denominados quintas, que quedan hacia arriba. El funcionamiento consiste en contar unidades de tal forma que, al sumar uno, se desplaza un disco de la parte inferior hacia arriba; si las cinco cuentas de una varilla se encuentran hacia arriba, hay que bajar todas las

cuentas y bajar tambin una quinta, quedando as representado el nmero cinco(una quinta y todas las cuentas hacia abajo); si al seguir sumando unidades se llega a la situacin en que hay una quinta y las cinco cuentas utilizadas(diez), se debe poner en cero esa cifra(todas las cuentas hacia abajo y todas las quintas hacia arriba) y sumar una cuenta en la siguiente cifra hacia la izquierda. Con este instrumento se puede calcular con nmeros de "X" cantidad de cifras, donde "x" es el nmero de varillas que posee el baco. El uso del baco ha perdurado hasta el siglo XVI y en algunos pases orientales sigue utilizndose en tareas sencillas. A comienzos del siglo XVII, a fin de simplificar las operaciones de potenciacin, multiplicacin y divisin, fueron inventados, en 1614, los logaritmos naturales o los neperianos por el matemtico john Napier (15501617), quien ide adems una serie de varillas cifradas que permitan multiplicar y dividir en forma automtica y una calculadora de tarjetas que serva para multiplicar (estructuras de Napier). Aos despus, el matemtico francs Blais Pascal (1623-1662)ide una mquina de calcular automtica, basada en ruedas dentadas, que permita sumar y restar mostrando el resultado por unas ventanillas. Esta mquina en el ao 1642, recibi el nombre de maquina aritmtica de Pascal o pascalina. Pocos aos despus Gottfried Wilhelm von Leibiniz (1646-1716) mejor la mquina de Pascal construyendo su calculadora universal, que realizaba operaciones de suma, resta, multiplicacin, divisin y extraa races cuadradas. En 1847 otro mecnico ingls, George Boole (1815-1864), desarroll en su libro Anlisis matemtico de la lgica una teora que posibilit despus el diseo de circuitos y el desarrollo del lgebra binaria conocida como lgebra de Boole o lgebra booleana.

En el ao 1885 el norteamericano Herman Holleirth (1860-1929), quien era funcionario de la Oficina de Censos de los Estados Unidos, observ que para procesar los datos del censo realizado en su pas se demoraba muchos aos y que la materia de las preguntas realizadas tena respuestas por s o por no. Ide una tarjeta perforada para realizar la encuesta y una mquina que permita leer y procesar las tarjetas llamada mquina pensadora o tabuladora. En 1895, se utiliz la mquina de Hollerith para la contabilidad de los Ferrocarriles Centrales de Nueva York y fue la primera aplicacin comercial automtica. Al ver los resultados, su creador fund la empresa Tabulating Machines Company en 1896 dando la internacional Business Machines o IBM. En 1937 el fsico norteamericano John V. Atanasoff, profesor de la universidad de lowa, junto a su colaborador Clifford Berry, construy una mquina electrnica que operaba en binario siguiendo la idea de Babbage. Fue la primera mquina de calcular digital, puesto que no tom carcter de computadora porque no exista la posibilidad de programarla. En 1944 John von Neumann (1903-1957), desarroll la idea de una computadora en la los programas no eran parte de la computadora, sino que se los poda cambiar sin modificar el cableado llamado modelo Von Neumann, construyndose por fin en 1952 una maquina basaba en este modelo llamado EDVAC (electronic Discrete Variable Automatic Computer) (Computadora automtica electrnica de variable discreta). Unos aos despus, en 1951, fue construida por los creadores de ENIAC la primera computadora de serie, llamada UNIVAC-Iy a partir de 1952 se construyeron computadoras de fabricacin en serie como MANIAC-I, MANIAC-IIy la UNIVAC-II. Como Habrs visto, a lo largo de la historia el hombre ha ideado mecanismos e instrumentos para ms fciles y rpidas las tareas. Tanto el

primer instrumento de clculo (el baco) como las ltimas computadoras digitales surgieron como solucin a problemas de clculos de la poca. PRIMEROS REGISTRADORES Y COMPUTADORES En 1971, el Dr. Ted Hoff reuni todos los elementos de un procesador para computadora en un solo chip de silicona ligeramente ms grande que una pulgada cuadrada. El resultado de su esfuerzo fue el Intel 4004, el primer microprocesador disponible en el mundo. Casi de la noche a la maana, el chip encontr miles de uso. La primer microcomputadora comercialmente disponible, la Altair 880, fue la primera mquina en ser llamada computadora personal. Tena 64KB de memoria y una estructura de canal abierta de 100. Dos jvenes estudiantes colegas, Paul Allen y Bill Gates, escribieron el interpretador de lenguaje BASIC para la computadora Altair. Formaron una compaa llamada Microsoft, que ahora es la compaa ms grande del mundo. 1976, Steve Wozniak y Steve Jobs crearon la computadora Apple I. Era menos poderosa que la Altair, pero tambin menos cara y complicada. 1977, Se dio a conocer la computadora Apple II, las ventas fueron lentas, ya que, los negocios y el pblico en general no saban exactamente qu hacer con ella. 1978, Intel puso a la venta el microprocesador 8086 de 16 bits, estableciendo un nuevo estndar de poder, capacidad y velocidad para microprocesadores. 1979, Intel produjo el microprocesador 8088, ofreciendo una arquitectura interna de 16 bits y un canal externo de 8 bits. 1980, IBM escogi a Microsoft (Gates y Allen) para proporcionar el sistema operativo de su ultima PC 1981, IBM introdujo la PC IBM con CPU Intel 8088 a 4.77 MHz, 16KB de memoria, un teclado, un monitor, una o dos unidades de diskette de 5.25 pulgadas.

Hayes Microcomputer Products, produjo el SmartModem 300, que rpidamente se convirti en el estndar industrial. Ashton-Tate desarroll dBaseII, que estableci el estndar para los programas de base de datos Xerox dio a conocer la computadora Xerox, su alto costo la conden al fracaso. 1982, Intel puso a la venta el 80286, un microprocesador de 16 bits. Peter Norton introdujo las Utilerias Norton, un conjunto de herramientas de software para que la PC ayudara a los usuarios a recuperar archivos contaminados, optimizar el espacio de disco e incrementar la seguridad de los programas y archivos de datos. 1983, Apple introdujo Lisa, la primer computadora comercial con un sistema operativo completamente grfico y un ratn. IBM dio a conocer la IBMPC XT, posea un disco duro y ms memoria. Se puso en circulacin la Compaq Portatil, el primer clon de PC exitoso cien por ciento compatible. 1984, Apple introdujo la microcomputadora Macintosh amigable con el usuario. 1985, Intel coloc en circulacin el procesador 80386, un procesador de 32 bits con la capacidad de dirigir ms de cuatro mil millones de bytes de memoria diez veces ms rpida que la 80286. 1986, IBM distribuy la PC convertible, la primer computadora laptop. 1987, IBM dio a conocer la nueva lnea de computadoras PS/2 que ofrecan un procesador 80386 a 20 MHz, como su mejor caracterstica. 1989, Intel coloc en el mercado el chip 80486, el primer microprocesador en el mundo con un milln de transistores. 1990, Microsoft sac a la venta, Windows 3.0 distribuyendo un milln de copias en cuatro meses. 1991, Apple Computer lanz su nuevo sistema operativo Systen 7.0

1992, Internet se convirti en la red ms grande en el mundo de correo electrnico. 1993, Intel mezclando elementos de su diseo 486 con nuevos procesos, caractersticas y tecnologas emiti el largamente esperado procesador Pentium. 1995, Microsoft dio a conocer su sistema operativo Windows 95 con una campaa masiva. 1996, Intel anunci el Procesador Pentium a 200 MHz Microsoft aadi capacidad para conexin con Internet a su sistema operativo Windows 95. 1997, Intel anunci la tecnologa MMX que incrementa las capacidades multimedios de un microprocesador. Tambin anunci el microprocesador Pentium II, tiene velocidades de hasta 333 MHz e introdujo un nuevo diseo en su presentacin. LAS GENERACIONES DE LAS COMPUTADORES Primera Generacin (1951-1958) Segunda Generacin (1958-1964) Tercera Generacin (1964-1971) Cuarta Generacin (1971-1988) Quinta Generacin (1983 al presente) BIT Es la unidad mnima de informacin empleada en informtica, en cualquier dispositivo digital, o en la teora de la informacin. Con l, podemos representar dos valores cuales quiera, como verdadero o falso, abierto o cerrado, blanco o negro, norte o sur, masculino o femenino, rojo o azul, etc. Basta con asignar uno de esos valores al estado de "apagado" (0), y el otro al estado de "encendido" (1).

BYTE Es una secuencia de bits contiguos, cuyo tamao depende del cdigo de informacin o cdigo de caracteres en que sea definido. Se usa comnmente como unidad bsica de almacenamiento de datos en combinacin con los prefijos de cantidad. Originalmente el byte fue elegido para ser un submltiplo del tamao de palabra de un ordenador, desde cinco a doce bits. SISTEMA BINARIO Es un sistema de numeracin en el que los nmeros se representan utilizando solamente las cifras cero y uno (0 y 1). Es el que se utiliza en las computadoras, debido a que trabajan internamente con dos niveles de voltaje, por lo cual su sistema de numeracin natural es el sistema binario. HARDWARE Corresponde a todas las partes tangibles de un sistema informtico; sus componentes son: elctricos, electrnicos, electromecnicos y mecnicos. ESQUEMA DE UN COMPUTADOR

SOFTWARE Es el conjunto de los programas de cmputo, procedimientos, reglas, documentacin y datos asociados que forman parte de las operaciones de un sistema de computacin. CAPITULO II SOFTWARE SISTEMA OPERATIVO Es un programa o conjunto de programas que en un sistema informtico gestiona los recursos de hardware y provee servicios a los programas de aplicacin, y se ejecuta en modo privilegiado respecto de los restantes.

ORIGEN Fue desarrollado en el Centro de Investigaciones y Desarrollo de la General Motors Company a principio de la dcada de los cincuenta. Solo contemplaba la ejecucin de una tarea en un mtodo llamado de bloques o bath.

FUNCIONES Y APLICACIONES Los sistemas operativos proporcionan una plataforma de software encima de la cual otros programas, llamados aplicaciones, puedan funcionar. Las aplicaciones se programan para que funcionen encima de un sistema operativo particular, por tanto, la eleccin del sistema operativo determina en gran medida las aplicaciones que puedes utilizar. Los sistemas operativos ms utilizados en los PC son DOS, OS/2, y Windows, pero hay otros que tambin se utilizan, como por ejemplo Linux. DISTINTOS SISTEMAS OPERATIVOS DOS: El famoso DOS, que quiere decir Disk Operating System (sistema operativo de disco), es ms conocido por los nombres de PC-DOS y MSDOS. MS-DOS fue hecho por la compaa de software Microsoft y es en esencia el mismo SO que el PC-DOS. UNIX: El sistema operativo UNIX fue creado por los laboratorios Bell de AT&T en 1969 y es ahora usado como una de las bases para la supercarretera de la informacin. Unix es un SO multiusuario y multitarea, que corre en diferentes computadoras, desde supercomputadoras, Mainframes, Minicomputadoras, computadoras personales y estaciones de trabajo. Esto quiere decir que muchos usuarios puede estar usando una misma computadora por medio de terminales o usar muchas de ellas. WINDOWS: Es el nombre de una familia de sistemas operativos desarrollados por Microsoft desde 1981, ao en que el proyecto se denominaba Interface Manager.

MULTIPROGRAMACION

Se denomina multiprogramacin a la tcnica que permite que dos o ms procesos ocupen la misma unidad de memoria principal y que sean ejecutados al "mismo tiempo" (pseudo-paralelismo, en una nica CPU slo puede haber un proceso a la vez) en la unidad central de proceso o CPU. MULTIPROCESAMIENTO Es tradicionalmente conocido como el uso de mltiples procesos concurrentes en un sistema en lugar de un nico proceso en un instante determinado. Como la multitarea que permite a mltiples procesos compartir una nica CPU, mltiples CPUs pueden ser utilizados para ejecutar mltiples hilos dentro de un nico proceso. MULTIUSUARIO La palabra multiusuario se refiere a un concepto de sistemas operativos, pero en ocasiones tambin puede aplicarse a programas de ordenador de otro tipo (ej. aplicaciones de base de datos). En general se le llama multiusuario a la caracterstica de un sistema operativo o programa que permite proveer servicio y procesamiento a mltiples usuarios simultneamente (tanto en paralelismo real como simulado). En contraposicin a los sistemas mono usuario, que proveen servicio y procesamiento a un solo usuario, en la categora de multiusuario se encuentran todos los sistemas que cumplen simultneamente las necesidades de dos o ms usuarios, que comparten los mismos recursos. Actualmente este tipo de sistemas se emplean especialmente en redes, pero los primeros ejemplos de sistemas multiusuario fueron sistemas centralizados que se compartan a travs del uso de mltiples dispositivos de interfaz humana (ej. una unidad central y mltiples pantallas y teclados).

MULTITAREAS

Es una caracterstica de los sistemas operativos modernos. Permite que varios procesos sean ejecutados al mismo tiempo compartiendo uno o ms procesadores. PROGRAMAS UTILITARIOS Los Programas Utilitarios realizan diversas funciones para resolver problemas especficos, adems de realizar tareas en general y de mantenimiento. Algunos se incluyen en el sistema operativo. NAVEGADORES DE INTERNET 1.- MOZILLA FIREFOX : Por la sencillez, estabilidad y el gran nmero de posibilidades que ofrece, Mozilla Firefox es el segundo navegador ms usado por detrs de Internet Explorer. 2.- GOOGLE CHROME: Google Chrome es un navegador web desarrollado por Google y compilado con base en componentes de cdigo abierto. 3.- OPERA: El Opera Browser es uno de los mejores navegadores que existe en la actualidad. 4.- AVANT BROWSER: Avant Browser es un navegador de internet que usa el motor de bsqueda de Windows Internet Explorer. 5.- IE, INTERNET EXPLORER: Es el navegador de Internet ms utilizado de la actualidad.

6.- NETSCAPE NAVIGATOR: Netscape Navigator compiti cabeza a cabeza con Internet Explorer.

7.- FINEBROWSER: Este multinavegador permite la visualizacin de pginas web de forma mltiple en una sola ventana. 8.- SAFARI: Este navegador de Apple, denominado Safari crece cada da ms en el mercado. 9.- CRAZY BROWSER: Crazy Browser es un novedoso navegador web. 10.- KALGAN: Es un conjunto de herramientas que permite al usuario tener un producto muy completo. 11.- GREEN BROWSER: GreenBrowser es un prctico navegador basado en Internet Explorer. 12.- SEA MONKEY: SeaMonkey es un completo navegador web del grupo Mozilla. 13.- MAXTHON: Maxthon es un navegador web que usa y mejora el motor de Internet Explorer aadiendo una infinidad de novedades. 14.- FLOCK: Flock es un completo navegador gratuito que aade novedosas funciones. 15.- LIVELY BROWSER: Lively Browser es un original navegador que aade adems de navegacin por pestaas. 16.- CHROMIUM: Navegador de cdigo abierto muy rpido, seguro y estable, que incoporporta funciones muy interesantes.

CAPITULO III DATOS Y ESTRUCTURA DE DATOS TIPOS DE DATOS Es un atributo de una parte de los datos que indica al ordenador (y/o al programador) algo sobre la clase de datos sobre los que se va a procesar. Esto incluye imponer restricciones en los datos, como qu valores pueden tomar y qu operaciones se pueden realizar. Tipos de datos comunes son: enteros, nmeros de coma flotante (decimales), cadenas alfanumricas, fechas, horas, colores, coches o cualquier cosa que se nos ocurra. Por ejemplo, en el tipo "int" representa un conjunto de enteros de 32 bits cuyo rango va desde el -2.147.483.648 al 2.147.483.647, as como las operaciones que se pueden realizar con los enteros, como la suma, resta y multiplicacin. ARCHIVO Un archivo o fichero informtico es un conjunto de bits almacenado en un dispositivo. CARACTERISTICAS Las principales caractersticas de esta estructura son:

Independencia de las informaciones respecto de los programas. La informacin almacenada es permanente. Un archivo puede ser accedido por distintos programas en distintos momentos. Gran capacidad de almacenamiento.

DISEO DE DATOS Consiste en descubrir y la definir completamente de los procesos y caractersticas de los datos de la aplicacin. El diseo de datos es un

proceso de perfeccionamiento gradual que abarca desde la cuestin ms elemental, "Qu datos requiere la aplicacin?", hasta los procesos y estructuras de datos precisos que proporcionan dichos datos. Si el diseo de datos es bueno, el acceso a los datos de la aplicacin ser rpido y fcil de mantener, y podr aceptar sin problemas las futuras mejoras de los datos. CAMPO Es un espacio de almacenamiento para un dato en particular. En las bases de datos, un campo es la mnima unidad de informacin a la que se puede acceder; un campo o un conjunto de ellos forman un registro, donde pueden existir campos en blanco, siendo ste un error del sistema operativo. En las hojas de clculo(como los programas de Excel) los campos son llamados celdas. REGISTRO Un registro informtico es un tipo o conjunto de datos almacenados en un sistema. Para la informtica, existen distintos tipos de registros, pero en todos los casos hay una referencia al concepto de almacenar datos o informacin sobre el estado, procesos o uso de la computadora. TABLA Se refiere al tipo de modelado de datos, donde se guardan los datos recogidos por un programa. Su estructura general se asemeja a la vista general de un programa de Hoja de clculo. RELACIONES Una relacin o vnculo entre dos o ms entidades describe alguna interaccin entre las mismas.

TIPOS DE CONSULTAS DE COMANDOS Una consulta de comandos aporta modificaciones a muchos registros con una nica operacin. Existen cuatro tipos de consultas de comando: de Eliminacin, de Actualizacin, de Alineacin y de Creacin de Tablas. CONSULTAS DE ELIMINACION Este tipo de consulta elimina un grupo de registros de una o ms tablas. Existe la posibilidad, por ejemplo, de utilizar una consulta de eliminacin para reemplazar los productos que se han dejado de producir o para aquellos sobre los cuales no existen pedidos. Con las consultas de eliminacin siempre se eliminan registros internos y no nicamente determinados campos de su interior. CONSULTAS DE ACTUALIZACION Este tipo aporta modificaciones globales a uno o ms tablas. Existe la posibilidad, por ejemplo, de aumentar en un 10 por ciento el precio de todos los productos lcteos o aumentar los salarios en un 5 por ciento a las personas pertenecientes a una determinada categora laboral. CONSULTAS DE ALINEACION Estas consultas agregan un grupo de registros de una o ms tablas al final de una o ms tablas. Supongamos, por ejemplo, que se han conseguido nuevos clientes y existe una base de datos que contiene una tabla de informacin sobre estos. En vez de teclear nuevamente todas estas informaciones, se alinean en la tabla correspondiente de Clientes. CONSULTAS DE CREACION DE TABLAS Este tipo de consultas crea una nueva tabla basndose en todos los datos o parte de estos existentes en una o ms tablas.

CONSULTAS DE PARAMETROS Una consulta de parmetros es una consulta que, cuando se ejecuta, muestra una ventana de dilogo que solicita informaciones, como por ejemplo criterios para recuperar registros o un valor que se desea insertar en un campo. CONSULTAS DE BUSCAR DULICADOS Encuentra los registros repetidos en una misma tabla. DISEO DE CONSULTAS Al disear una consulta, una vista, una funcin inline o un procedimiento almacenado de una sola instruccin, el diseador que utiliza est formado por cuatro paneles: el panel Diagrama, el panel Criterios, el panel SQL y el panel Resultados. Puede crear una consulta o una vista en cualquiera de los paneles; para hacer aparecer una columna, puede seleccionarla en el panel Diagrama, puede introducirla en el panel Criterios o puede incluirla en la instruccin SQL del panel SQL. BASE DE DATOS Es un conjunto de datos pertenecientes a un mismo contexto y almacenados sistemticamente para su posterior uso. En este sentido, una biblioteca puede considerarse una base de datos compuesta en su mayora por documentos y textos impresos en papel e indexados para su consulta. Actualmente, y debido al desarrollo tecnolgico de campos como la informtica y la electrnica, la mayora de las bases de datos estn en formato digital (electrnico), que ofrece un amplio rango de soluciones al problema de almacenar datos.

TIPOS DE ARCHIVOS En computacin existen bsicamente dos tipos de archivos, los archivos ascii y los archivos binarios. El vocablo ascii es un acrnimo para American Standard Code for Information Interchange. Es un estndar que asigna un valor numrico a cada carcter, con lo que se pueden representar los documentos llamados de Texto Plano, es decir, los que son legibles por seres humanos. Los archivos binarios son todos los dems. Como ejemplos tenemos: ARCHIVOS BINARIOS

De imagen: .jpg, .gif, .tiff, .bmp (Portable bitmap), .wmf (Windows Meta File), .png (Portable Network Graphics), .pcx (Paintbrush); entre muchos otros.

De video: .mpg, .mov, .avi, .gif. Comprimidos o empaquetados: .zip, .Z, .gz, .tar, .lhz. Ejecutables o compilados: .exe, .com, .cgi, .o, .a. Procesadores de palabras: .doc.

ARCHIVOS DE ASCII

Archivos fuente: .f, .c, .p Formatos de texto: .tex, .txt, .html Formatos de intercambio: .rtf, .ps, .uu Dentro de los archivos ASCII de uso comn por los programas de bioinformtica estn los siguientes:

De secuencias: .seq De secuencias mltiples: .aln, .msf (Multiple Sequence Format, secuencias alineadas), .rsf (Rich Sequence Format, estos archivos pueden incluir una o ms secuencias relacionadas o no).

ORGANIZACIN DE ARCHIVOS Los archivos se encuentran organizados lgicamente como una secuencia de registros de varias longitudes diferentes. Existen dos aspectos bsicos del estudio de los archivos: el lgico y el fsico. Desde el punto de vista lgico, al usuario no le puede interesar como se encuentra almacenado el archivo en la memoria secundaria, que es el nivel fsico. METODOS DE ACCESO La finalidad es encontrar el mejor mtodo para acceder a la informacin del archivo para alguna aplicacin especfica. La informacin que guardan los archivos es preciso leerla y colocarla en la memoria de la CPU. Hay dos formas principales de acceso a la informacin de un archivo. Acceso secuencial. Acceso directo. RESGUARDO DE ARCHIVOS El Archivo Institucional est integrado en un espacio fsico que cumple con la normatividad en materia de conservacin de archivos, como es la regulacin de la temperatura, la humedad y la luz, el equipamiento por su parte favorece tambin la conservacin, el control y el fcil acceso a los documentos. Asimismo, el archivo est dotado con las condiciones de seguridad adecuadas. DISPOSITIVOS DE ALMACENAMIENTOS DE DATOS Son componentes que leen o escriben datos en medios o soportes de almacenamiento, y juntos conforman la memoria o almacenamiento secundario de la computadora.

Estos dispositivos realizan las operaciones de lectura o escritura de los medios o soportes donde se almacenan o guardan, lgica y fsicamente, los archivos de un sistema informtico. DISCO DURO Los discos duros tienen una gran capacidad de almacenamiento de informacin, pero al estar alojados normalmente dentro de la computadora (discos internos), no son extrables fcilmente. Para intercambiar informacin con otros equipos (si no estn conectados en red) necesitamos utilizar unidades de disco, como los disquetes, los discos pticos (CD, DVD), los discos magneto-pticos, memorias USB, memorias flash, etc. sirve para muchas cosas. El disco duro almacena casi toda la informacin que manejamos al trabajar con una computadora. En l se aloja, por ejemplo, el sistema operativo que permite arrancar la mquina, los programas, archivos de texto, imagen, vdeo, etc. Dicha unidad puede ser interna (fija) o externa (porttil), dependiendo del lugar que ocupe en el gabinete o caja de computadora. Un disco duro est formado por varios discos apilados sobre los que se mueve una pequea cabeza magntica que graba y lee la informacin. Este componente, al contrario que el micro o los mdulos de memoria, no se pincha directamente en la placa, sino que se conecta a ella mediante un cable. Tambin va conectado a la fuente de alimentacin, pues, como cualquier otro componente, necesita energa para funcionar. Adems, una sola placa puede tener varios discos duros conectados. Las caractersticas principales de un disco duro son:

Capacidad: Se mide en gigabytes (GB). Es el espacio disponible para almacenar y hasta TB. secuencias de 1 byte. La capacidad aumenta constantemente desde cientos de MB, decenas de GB, cientos de GB

Velocidad de giro: Se mide en revoluciones por minuto (RPM). Cuanto ms rpido gire el disco, ms rpido podr acceder a la informacin la cabeza lectora. Los discos actuales giran desde las 4.200 a 15.000 RPM, dependiendo del tipo de ordenador al que estn destinadas.

Capacidad de transmisin de datos: De poco servir un disco duro de gran capacidad si transmite los datos lentamente. Los discos actuales pueden alcanzar transferencias de datos de 3 GB por segundo.

Tambin existen discos duros externos que permiten almacenar grandes cantidades de informacin. Son muy tiles para intercambiar informacin entre dos equipos. Normalmente se conectan al PC mediante un conector USB. Cuando el disco duro est leyendo, se enciende en la carcasa un LED (de color rojo, verde u otro). Esto es til para saber, por ejemplo, si la mquina ha acabado de realizar una tarea o si an est procesando datos. DISQUETERA La unidad de 3,5 pulgadas permite intercambiar informacin utilizando disquetes magnticos de 1,44 MB de capacidad. Aunque la capacidad de soporte es muy limitada si tenemos en cuenta las necesidades de las aplicaciones actuales se siguen utilizando para intercambiar archivos pequeos, pues pueden borrarse y reescribirse cuantas veces se desee de una manera muy cmoda, aunque la transferencia de informacin es bastante lenta si la comparamos con otros soportes, como el disco duro o un CD-ROM. UNIDAD DE CD-ROM La unidad de CD-ROM permite utilizar discos pticos de una mayor capacidad que los disquetes de 3,5 pulgadas: hasta 700 MB. sta es su principal ventaja, pues los CD-ROM se han convertido en el estndar para distribuir sistemas operativos, aplicaciones, etc.

El uso de estas unidades est muy extendido, ya que tambin permiten leer los discos compactos de audio. Para introducir un disco, en la mayora de las unidades hay que pulsar un botn para que salga una especie de bandeja donde se deposita el CDROM. Pulsando nuevamente el botn, la bandeja se introduce. En estas unidades, adems, existe una toma para auriculares, y tambin pueden estar presentes los controles de navegacin y de volumen tpicos de los equipos de audio para saltar de una pista a otra, por ejemplo. Una caracterstica bsica de las unidades de CD-ROM es la velocidad de lectura, que normalmente se expresa como un nmero seguido de una x (40x, 52x,..). Este nmero indica la velocidad de lectura en mltiplos de 128 kB/s. As, una unidad de 52x lee informacin de 128 kB/s 52 = 6,656 kB/s, es decir, a 6,5 MB/s. UNIDAD DE CD-RW Las unidades de CD-ROM son de slo lectura. Es decir, pueden leer la informacin en un disco, pero no pueden escribir datos en l. Una regrabadora puede grabar y regrabar discos compactos. Las caractersticas bsicas de estas unidades son la velocidad de lectura, de grabacin y de regrabacin. En los discos regrabables es normalmente menor que en los discos que slo pueden ser grabados una vez. Las regrabadoras que trabajan a 8X, 16X, 20X, 24X, etc., permiten grabar los 650, 700 o ms megabytes (hasta 900 MB) de un disco compacto en unos pocos minutos. Es habitual observar tres datos de velocidad, segn la expresin ax bx cx (a: velocidad de lectura; b: velocidad de grabacin; c: velocidad de regrabacin). UNIDAD DE DVD-ROM Las unidades de DVD-ROM son aparentemente iguales que las de CD-ROM, pueden leer tanto discos DVD-ROM como CD-ROM. Se

diferencian de las unidades lectoras de CD-ROM en que el soporte empleado tiene hasta 17 GB de capacidad, y en la velocidad de lectura de los datos. La velocidad se expresa con otro nmero de la x: 12x, 16x... Pero ahora la x hace referencia a 1,32 MB/s. As: 16x = 21,12 MB/s. Las conexiones de una unidad de DVD-ROM son similares a las de la unidad de CD-ROM: placa base, fuente de alimentacin y tarjeta de sonido. La diferencia ms destacable es que las unidades lectoras de discos DVD-ROM tambin pueden disponer de una salida de audio digital. Gracias a esta conexin es posible leer pelculas en formato DVD y escuchar seis canales de audio separados si disponemos de una buena tarjeta de sonido y un juego de altavoces apropiado (subwoofer ms cinco satlites). UNIDAD DE DVD-RW Puede leer y grabar y regrabar imgenes, sonido y datos en discos de varios gigabytes de capacidad, de una capacidad de 650 MB a 9 GB. UNIDAD DE DISCO MAGNETICO-OPTICO La unidad de discos magneto-pticos permite el proceso de lectura y escritura de dichos discos con tecnologa hbrida de los disquetes y los discos pticos, aunque en entornos domsticos fueron menos usadas que las disqueteras y las unidades de CD-ROM, pero tienen algunas ventajas en cuanto a los disquetes:

Por una parte, admiten discos de gran capacidad: 230 MB, 640 Mb o 1,3 GB. Adems, son discos reescribibles, por lo que es interesante emplearlos, por ejemplo, para realizar copias de seguridad.

LECTOR DE TARJETAS DE MEMORIA El lector de tarjetas de memoria es un perifrico que lee o escribe en soportes de memoria flash. Actualmente, los instalados en computadores (incluidos en una placa o mediante puerto USB), marcos digitales, lectores de DVD y otros dispositivos, suelen leer varios tipos de tarjetas. Una tarjeta de memoria es un pequeo soporte de almacenamiento que utiliza memoria flash para guardar la informacin que puede requerir o no bateras (pilas), en los ltimos modelos la batera no es requerida, la batera era utilizada por los primeros modelos. Estas memorias son resistentes a los rasguos externos y al polvo que han afectado a las formas previas de almacenamiento porttil, como los CD y los disquetes. OTRO DISPOSITIVOS DE ALMACENAMIENTO Otros dispositivos de almacenamiento son las memorias flash o los dispositivos de almacenamiento magnticos de gran capacidad.

Memoria flash: Es un tipo de memoria que se comercializa para el uso de aparatos porttiles, como cmaras digitales o agendas electrnicas. El aparato correspondiente o bien un lector de tarjetas, se conecta a la computadora a travs del puerto USB o Firewire.

Discos y cintas magnticas de gran capacidad: Son unidades especiales que se utilizan para realizar copias de seguridad o respaldo en empresas y centros de investigacin. Su capacidad de almacenamiento puede ser de cientos de gigabytes.

Almacenamiento en lnea: Hoy en da tambin debe hablarse de esta forma de almacenar informacin. Esta modalidad permite liberar espacio de los equipos de escritorio y trasladar los archivos a discos rgidos remotos provistos que garantizan normalmente la disponibilidad de la informacin. En este caso podemos hablar de dos tipos de almacenamiento en lnea: un almacenamiento de corto plazo normalmente destinado a la transferencia de grandes archivos va

web; otro almacenamiento de largo plazo, destinado a conservar informacin que normalmente se dara en el disco rgido del ordenador personal. SOPORTE DE ALMACENAMIENTO DE DATOS Son los discos magnticos (disquetes, discos duros), los discos pticos (CD, DVD), las cintas magnticas, los discos magneto-pticos (discos Zip, discos Jaz, SuperDisk), las tarjetas de memoria, etc. Los componentes de hardware que escriben o leen datos en los medios de almacenamiento se conocen como dispositivos o unidades de almacenamiento. Por ejemplo, una disquetera o una unidad de disco ptico, son dispositivos que realizan la lectura y/o escritura en disquetes y discos pticos, respectivamente. El propsito de los dispositivos de almacenamiento es almacenar y recuperar la informacin de forma automtica y eficiente. El almacenamiento se relaciona con dos procesos:

Lectura de datos almacenados para luego transferirlos a la memoria de la computadora. Escritura o grabacin de datos para que ms tarde se puedan recuperar y utilizar.

Los medios de almacenamiento han evolucionado en forma notable desde las primeras computadoras. En la actualidad existe una gran variedad tecnologas y dispositivos nuevos, pero el disco rgido sigue siendo el "almacn" principal de la informacin en la computadora. EVOLUCION

Tarjetas perforadas Cintas perforadas Cintas magnticas Discos magnticoso

Disquetes

o

Discos duros

Discos duros externos

Discos pticoso

CD

CD-ROM CD-R CD-RW DVD-R DVD+R DVD-RW DVD+RW

o

DVD

o

Blu-ray

Tarjetas de memoria USBo o o o o o o o

Secure Digital (SD) MultiMediaCard (MMC) Memory Stick (MS) CompactFlash (CF) I y II Microdrive (MD) SmartMedia (SM) xD-Picture Card Discos de estado slido

TECNICAS DE ALMACENAMIENTO DE DATOS La medicin de rendimiento de almacenamiento (SPM) siempre ha sido una propuesta difcil para los grupos de TI (Tecnologas de la Informacin) y la tarea es cada vez ms exigente ahora que los servidores virtuales son tan populares.

Tomemos el RiskMetrics Group Inc., por ejemplo. La empresa de servicios financieros con base en Nueva York dispone de 30 Servidores ESX de VMware Inc. distribuidos en seis ubicaciones, incluyendo centros de datos en EEUU y Suiza. Cada servidor ESX normalmente soporta de 10 a 15 mquinas virtuales (VM). Muchas de estas mquinas virtuales al principio fueron mquinas fsicas que utilizaban un disco local, de forma que el equipo de almacenamiento no tena que preocuparse por ellas. Ahora los empleados necesitan asegurar no slo que las VM funcionan de la misma forma que lo haran si fueran servidores fsicos, sino tambin planificar su crecimiento potencial exponencial. El host fsico es fcil de analizar y cuando surge un problema en un entorno de servidores fsicos, generalmente se produce en el host o en el almacenamiento, indic Ed Delgado, arquitecto de almacenamiento de RiskMetrics. Pero los entornos de servidores virtuales significan que el equipo de almacenamiento no puede depender slo de las cifras de rendimiento del host o del almacenamiento. Esto se debe a la cantidad de otras mquinas virtuales sobre el mismo almacn de datos. Una VM se ha descontrolado con escrituras y ahora est estrangulando a las otras 14 VM en ese almacn de datos? Cmo sabe que las otras 14 VM no estn haciendo lo mismo? ha escrito Delgado en un correo electrnico. En un host fsico, usted puede comprobar los MB/seg. De lectura y escritura de un host y confiar en dicha cifra, pero en entornos de VMware bsicamente usted tiene que sumar los nmeros de 15 VM para ver cmo se est haciendo realmente. RiskMetrics utiliza la herramienta Tek-Tools Software Inc.s Profiler para registrar las cifras de KBps de lectura/escritura para un nodo ESX concreto con el fin de estrechar el cerco de cualquier problema hasta un almacn de datos concreto. Delgado indic que el Profiler se ejecuta en uno de los centros de datos en EEUU de RiskMetrics y recopila informacin del

Servidor vCenter de VMware (antes conocido como Centro virtual VMware), y visualiza los 30 ESX en un panel. Si tres personas distintas se quejan de que las VLM van lentas, puede ver si las tres VM se encuentran en el mismo almacn de datos. Ayuda a la identificacin del problema, indic Delgado. No ofrece soluciones para corregirlo, pero es til en lo relativo a solucionar el problema. HERRAMIENTAS PARA ENTORNOS DE MAQUINAS VIRTUALES Marc Staimer, presidente de Dragon Slayer Consulting, con sede en Beaverton, Oregn, explic que herramientas como Tek-Tools Profiler, Akorri Inc.s BalancePoint, NetApps SANscreen (a travs de la compra de Onaro Inc.), SANpulse Technology Inc.s SANlogics y Veeam Softwares Veeam Monitor pueden ayudar a los administradores a asegurar que no hay demasiada sobregrabacin entre la aplicacin y el almacenamiento. Las cosas son muy distintas entre el mundo fsico y el virtual, coment Staimer. Usted necesita herramientas de software para ayudar a evaluar su entorno con el fin de asegurar que no le sale el tiro por la culata. Staimer recomienda herramientas de terceros en lugar de los proporcionados por los suministradores de almacenamiento, que normalmente no miden otros sistemas que no sean los suyos. Explic que las herramientas de terceros tambin proporcionan cobertura al servidor virtual y a la aplicacin. Necesita supervisin extremo a extremo, no una supervisin parcial, coment Staimer. Puesto que las mquinas virtuales son tan fciles de desplegar, los usuarios las crean a gran velocidad y las mueven con bastante frecuencia, generando el potencial para sobrecargar los recursos compartidos, segn Rich Corley, mximo responsable de tecnologa de Akorri. Coment que las herramientas de su empresa analizan los recursos compartidos (matriz, red y

servidores) para ayudar a averiguar qu componente se est sobre utilizando. Brian Radovich, director jefe de producto de Tek-Tools, calcul que entre el 70% y el 80% de los clientes de su empresa han desplegado al menos varios servidores virtuales. Explic que desde que Tek-Tools sac al mercado su modulo VMware hace un ao, ha sido testigo de una explosin en la utilizacin en produccin de los servidores virtuales. Lo que es distinto entre hace tres aos y ahora es que los papeles para gestionar la aplicacin, el servidor y el almacenamiento se estn fusionando ya que se tiene este concepto de virtualizacin y estos recursos compartidos, coment Radovich. Puede analizar la matriz e identificar los problemas estndares pero eso se traduce en un mejor rendimiento en la experiencia del usuario final?. RiskMetrics sigue algunos principios generales para lograr un mejor rendimiento de almacenamiento con su entorno de servidores virtuales. El equipo de almacenamiento, por ejemplo, no asigna ningn disco SATA al cluster) de ESX, en su lugar dedica discos de canal de fibra (Fibre Channel FC) de 15K rpm a su entorno VMware. Definitivamente, VMware ha aadido algo de complejidad en nuestro entorno de almacenamiento, ha dicho Delgado, pero lo manejamos usando discos de la mejor calidad y segregndolo de otras aplicaciones que ejecutamos. Todas nuestros clsters tienen sus propios grupos RAID y LUN (nmeros de unidades lgicos) dedicados y, hasta ahora, hemos podido mantenernos por delante de los problemas. Con este sistema de archivo del correo electrnico, RiskMetrics decidi saltarse el sistema de gestin de disco interno de Vmware y presentar un LUN de 1 TB directamente a la VM que ejecuta su ocupado Symantec Corp. Enterprise Vault.

Lo hicimos por motivos de rendimiento, dijo Delgado. Lo hicimos porque ahora nadie puede tocar ese LUN. No pueden poner ninguna mquina virtual en l porque no es parte del entorno del VMware. VMware aconseja a los clientes la necesidad de reservar espacio para intercambiar la asignacin de memoria. Por tanto, RiskMetrics asign el 20%, o 200 GB, del LUN de 1TB para ese propsito. Su herramienta Profiler enva una alerta por correo electrnico al equipo de VMware si el almacn de datos supera el umbral del 80%. Cuando RiskMetrics lanz el primer Enterprise Vault, esperaban que la aplicacin sobrepasara su LUN de 1TB en ocho meses. En su lugar, super todo el LUN en unos seis meses. El equipo de almacenamiento coloc un segundo LUN de 1 TB con la esperanza de que pudiera durar otros seis meses. RiskMetrics tiene previsto cambiar el Enterprise Vault de una mquina virtual a un clster de alta disponibilidad en los dos meses siguientes. Cuando completen el traslado, la instancia principal del Enterprise Vault correr en un servidor fsico, aunque la recuperacin ante fallos continuar siendo una VM. En caso de fallos, ahora el Enterprise Vault se ejecuta en una VM en un servidor ESX distinto. ES un sistema muy ocupado, haciendo un trabajo similar al que hace el Exchange y est en constante crecimiento ya que se trata de un sistema de archivo, explic Delgado. Delgado ofreci asesoramiento a algunos de sus colegas arquitectos de almacenamiento que necesitan medir o afinar el rendimiento del almacenamiento en un entorno de servidores virtuales. Advirti que puesto que la mayora de las mquinas virtuales que se crean no se borrarn cada mes, los administradores se encontrarn cada vez ms con VM que se ejecutan en el clster. Encuentre el tiempo para comprobar el rendimiento al menos una vez a la semana, aconsej, sugiriendo que los administradores tomen vistas

instantneas de los atributos claves de rendimiento del disco (MBps de lectura/escritura, cmputo de accesos de lectura/escritura) el mismo da y a la misma hora para proporcionar datos de control que puedan indicar la superacin de un umbral de rendimiento. Puede rastrear hacia atrs hasta la instalacin de una VM que ha estado acaparando recursos, coment. Honestamente, asegurarse que tiene Delgado termin diciendo, mi mejor consejo es una estrecha relacin de trabajo con los

administradores de la mquina virtual. Son los que crean las VM y los que mantienen al administrador informado sobre lo que puede ocurrir y lo que puede tener un fuerte impacto en su entorno de VMware, como una mquina virtual para un Servidor SQL de Microsoft Corp. o una base de datos de Oracle Corp. LA INFORMACION Es un conjunto organizado de datos procesados, que constituyen un mensaje que cambia el estado de conocimiento del sujeto o sistema que recibe dicho mensaje. Para Gilles Deleuze, la informacin es el sistema de control, en tanto que es la propagacin de consignas que deberamos de creer o hacer que creemos. En tal sentido la informacin es un conjunto organizado de datos capaz de cambiar el estado de conocimiento en el sentido de las consignas trasmitidas. UNIDADES Y SOPORTES DE SALIDA Estos dispositivos traducen los bits y bytes a una forma comprensible para el usuario.

CAPITULO IV TECNOLOGIAS DE HARDWARE EL PROCESADOR Este es el cerebro del computador. Dependiendo del tipo de procesador y su velocidad se obtendr un mejor o peor rendimiento. Hoy en da existen varias marcas y tipos, de los cuales intentaremos darles una idea de sus caractersticas principales. TIPOS DE PROCESADORES Sempron Opteron Turion Centrino Core2Duo/Quad/i7 Athlon 64 X2 / Phenom Xeon Celeron DIRECCIONAMIENTO Es un proceso de aplicacin desea establecer una conexin con un proceso de aplicacin remoto, debe especificar a cul debe conectarse, ya sea con transporte con conexin o sin conexin. El mtodo que se emplea es definir direcciones de transporte en las que los procesos pueden estar a la escucha de solicitudes de conexin. Se usar el trmino neutral TSAP (Transport Service Acces Point, punto de acceso al servicio de transporte). Los puntos terminales anlogos de la capa de red se llaman NSAP (Network Service Access Point, puntos de acceso al servicio de red), como por ejemplo las direcciones IP.

MEMORIA RAM Acrnimo de Random Access Memory, (Memoria de Acceso Aleatorio) es donde el ordenador guarda los datos que est utilizando en el momento presente. Se llama de acceso aleatorio porque el procesador accede a la informacin que est en la memoria en cualquier punto sin tener que acceder a la informacin anterior y posterior. Es la memoria que se actualiza constantemente mientras el ordenador est en uso y que pierde sus datos cuando el ordenador se apaga. MEMORIA ROM Se caracteriza porque solamente puede ser leda (ROM=Read Only Memory). Alberga una informacin esencial para el funcionamiento del computador, que por lo tanto no puede ser modificada porque ello hara imposible la continuidad de ese funcionamiento. Uno de los elementos ms caractersticos de la memoria ROM, es el BIOS, (Basic Input-Output System = sistema bsico de entrada y salida de datos) que contiene un sistema de programas mediante el cual el computador "arranca" o "inicializa", y que estn "escritos" en forma permanente en un circuito de los denominados CHIPS que forman parte de los componentes fsicos del computador, llamados "hardware". MEMORIA CACHE Es un sistema especial de almacenamiento de alta velocidad. Puede ser tanto un rea reservada de la memoria principal como un dispositivo de almacenamiento de alta velocidad independiente. Hay dos tipos de cach frecuentemente usados en las computadoras personales: memoria cach y cach de disco. Una memoria cach, llamada tambin a veces almacenamiento cach o RAM cach, es una parte de memoria RAM esttica de alta velocidad (SRAM) ms rpida que la lenta y barata RAM dinmica (DRAM) usada como memoria principal. La memoria cach es

efectiva dado que los programas acceden una y otra vez a los mismos datos o instrucciones. Guardando esta informacin en SRAM, la computadora evita acceder a la lenta DRAM. UNIDADES Y SOPORTES DE ENTRADA Los dispositivos de entrada traducen los datos a una forma que la computadora pueda interpretar, para luego procesarlos y almacenarlos. DISPOSITIVOS MANUALES

Teclado alfanumrico: El estndar es actualmente el teclado de 101 letras con la distribucin QWERTY, 12 teclas de funciones, un teclado o pad numrico, teclas de funcin y teclas para el control del cursos. Algunos teclados estn diseados para aplicaciones especficas, permitiendo una interaccin rpida con los sistemas de computacin (v.g.: caja registradora). El teclado es un circuito en forma de matriz; cada circuito est conectado al dispositivo controlador, que reconoce la letra o cdigo que enva el usuario cuando se cierra o abre un circuito. La configuracin del teclado puede ser modificado por software.

DISPOSITIVOS APUNTADORES

Ratn: La efectividad de las GUI depende de la capacidad del usuario para hacer una seleccin rpida de una pantalla con conos o menes. En estos casos el mouse puede colocar el apuntador (o cursos grfico) sobre un cono con rapidez y eficiencia. Los ms comunes tienen una esfera en su parte inferior que puede rodar en un escritorio.

Bola rastreadora (trackball) o bola palmar: Es una bola insertada en una pequea caja que se hace girar con los dedos para mover el curso grfico.

Palanca de mando (joystick): tambin llamada palanca de control de juegos. Es una palanca vertical que mueve los cursos grficos en la direccin en que se mueve la palanca.

Pantalla sensible al tacto (Touch Screen): Sirven cuando hay muchos usuarios no familiarizados con las computadoras. Puede ser sensible al tacto por la presin o por el calor. Son de muy baja velocidad.

DISPOSITIVOS OPTICOS

Lector de marcas o rastreador de marca ptica: Usa la luz reflejada para determinar la ubicacin de marcas de lpiz en hojas de respuestas estndar y formularios similares.

Lector de cdigo de barras: Usa la luz para leer UPC (Universal Product Codes, Cdigos universales de productos), cdigos de inventario y otros cdigos creados con patrones de barras de anchura variable. Los cdigos de barra representan datos alfanumricos variando el ancho y la combinacin de las lneas verticales adyacentes. La ventaja de los cdigos de barras sobre los caracteres es que la posicin u orientacin del cdigo que se lee no es tan importante para el lector.

Lector de vara (lpiz ptico): Usa luz para leer caracteres alfabticos y numricos escritos con un tipo de letra especial, siendo tambin legible para las personas este tipo de letra; muchas veces estos lectores estn conectados a terminales POS (point-of-sale, punto de venta). Cuando se usan de esta forma el computador lleva a cabo un reconocimiento recognition). ptico de caracteres Rastrea e (OCR, optical los character caracteres

Rastreador

de

pginas:

interpreta

alfanumricos de las pginas impresas normales. Se usa para convertir una copia dura a un formato que la mquina puede leer. Este

tipo de rastreador puede reducir al mnimo o eliminar la captura de datos mediante el teclado. DISPOSITIVOS MAGNETICOS

MICR

(magnetic

ink

character

recognition, reconocimiento

de

caracteres en tinta magntica) o Lectora de caracteres magnticos: lee los caracteres impresos con tinta magntica en los cheques. En ellos el nmero de cuenta y el nmero de cheque se encuentran codificados; la fecha de la transaccin se registra automticamente para todos los cheques procesados ese da; por tanto, slo se debe teclear el importe en un inscriptor MICR. Un lector-ordenador MICR lee los datos de los cheques y los ordena para el procesamiento que corresponda. Estos dispositivos de reconocimiento son ms rpidos y precisos que los OCR.

Lectora de bandas magnticas: Las bandas magnticas del reverso de las tarjetas de crdito, por ejemplo, ofrece otro medio de captura de datos directamente de la fuente (como los dispositivos pticos). Se codifican las bandas con datos apropiados para la aplicacin. Las bandas magnticas contienen muchos ms datos por unidad de espacio que los caracteres impresos o los cdigos de barras. Adems, dado que no se pueden leer visualmente, son perfectos para almacenar datos confidenciales.

DIGITALIZADORES Para que un computador pueda reconocer texto manuscritos, primero tiene que digitalizar la informacin, convertirla en alguna forma digital para poder almacenarla en la memoria del computador. Hay diferentes dispositivos de entrada para capturar y digitalizar informacin:

Digitalizador

de

imgenes

(scanner):

Puede

obtener

una

representacin digital de cualquier imagen impresa. Convierte

fotografas, dibujos, diagramas y otra informacin impresa en patrones de bits que pueden almacenarse y manipularse con el soft adecuado

Cmara digital: Es un digitalizador de imgenes que permite tomar fotografas del mundo real y obtener imgenes digitales; es decir que no se limita a capturar imgenes impresas planas, puede registrar las mismas cosas que una cmara normal, slo que en lugar de registrar las imgenes en pelcula, las cmaras digitales almacenan patrones de bits en discos u otros medios de almacenamiento digital.

Digitalizador de audio: Permite digitalizar sonidos de micrfonos y otros dispositivos de sonido. Para que el computador interprete correctamente la entrada de voz digitalizada como si fueran palabras se requiere software de inteligencia artificial. Una unidad de respuesta auditiva o un sintetizador de vos hace que la conversacin sea un dilogo. El reconocimiento del habla funciona de la siguiente manera:

Se dice la palabra. Cuando se habla en un micrfono, cada sonido se divide en sus diversas frecuencias. Se digitaliza la palabra. Se digitalizan los sonidos de cada palabra de modo que la computadora los pueda manejar. Se compara la palabra. Se compara la versin digitalizada contra modelos similares del diccionario electrnico de la computadora. El modelo digitalizado es una forma que las computadoras pueden almacenar e interpretar. Se presenta la palabra o se realiza el comando. Cuando se encuentra una igualdad, se presenta en una VDT o se realiza el comando adecuado.

En el reconocimiento del habla, la creacin de los datos se conoce como capacitacin. La mayor parte de los sistemas de reconocimiento del habla son dependientes del locutor, es decir que responde a la voz de un individuo particular.

La tecnologa ms reciente permite sistemas independientes del locutor, pero necesitan una base de datos muy grande para aceptar el patrn de voz de cualquier persona.

Digitalizador de vdeo: Es una coleccin de circuitos que puede capturar entradas de una fuente de vdeo y convertirla en una seal digital que puede almacenarse en la memoria y exhibirse en pantallas de computador. Cuando se pone en operacin el sistema, ste compara la imagen digitalizada que se debe interpretar con las imgenes digitalizadas registradas previamente en la base de datos. Estos sistemas de entrada de visin son apropiados para tareas especializadas, en que slo se encuentran unas cuantas imgenes.

Dispositivos sensores: diseados para hacer seguimientos de la temperatura, la humedad, l presin y otras cantidades fsicas, proporcionan datos tiles en robtica, control ambiental, pronsticos meteorolgicos, supervisin mdica, biorretroalimentacin, investigacin cientfica y cientos de aplicaciones ms.

CONCEPTOS VINCULADOS

Documentos retornables: Un documento retornable es una salida generada por computadora que finalmente regresa como una entrada que la mquina puede leer.

Sistemas OCR (optical character recognition): Es un proceso de naturaleza topolgica (analiza la forma por medio de funciones matemticas) y neuronal (acta como las neuronas de las personas; el problemas es que a veces falla la conexin entre ellas). El primer paso en el reconocimiento ptico de caracteres consiste en digitalizar la imagen de la hoja en la memoria del computador mediante un digitalizador (scanner), una cmara digital o un fax mdem. La imagen digitalizada no es ms que un patrn de bits en la memoria. Antes de que el computador pueda procesar el texto de la pgina, debe

reconocer los caracteres individuales y convertirlos en cdigos de texto. El software de OCR localiza e identifica los caracteres impresos que aparecen en la imagen, "lee" el texto. Lo programas de OCR se valen de varias tcnicas:

la segmentacin de la pgina en imgenes, bloques de texto y (finalmente) caracteres individuales; tecnologa de sistemas expertos, a una escala menor, para reconocer las reglas bsicas de distincin de letras; "expertos" en contextos para ayudar a identificar letras ambiguas de acuerdo con su contexto; aprendizaje a partir de ejemplos reales y retroalimentacin de un entrenador humano. CAPITULO V SOFTWARE: GESTIN Y PROGRAMACIN

SOFTWARE Se conoce como software al equipamiento lgico o soporte lgico de un sistema informtico, comprende el conjunto de los componentes lgicos necesarios que hacen posible la realizacin de tareas especficas, en contraposicin a los componentes fsicos, que son llamados hardware. Es el conjunto de los programas de cmputo, procedimientos, reglas, documentacin y datos asociados que forman parte de las operaciones de un sistema de computacin. CLASIFICACIN DEL SOFTWARE Si bien esta distincin es, en cierto modo, arbitraria, y a veces confusa, a los fines prcticos se puede clasificar al software en tres grandes tipos:

Software de sistema: Su objetivo es desvincular adecuadamente al usuario y al programador de los detalles del sistema informtico en particular que se use, aislndolo especialmente del procesamiento

referido a las caractersticas internas de: memoria, discos, puertos y dispositivos de comunicaciones, impresoras, pantallas, teclados, etc. El software de sistema le procura al usuario y programador adecuadas interfaces de alto nivel, controladores, herramientas y utilidades de apoyo que permiten el mantenimiento del sistema global. Incluye entre otros:o o o o o o

Sistemas operativos Controladores de dispositivos Herramientas de diagnstico Herramientas de Correccin y Optimizacin Servidores Utilidades

Software de programacin: Es el conjunto de herramientas que permiten al programador desarrollar programas informticos, usando diferentes alternativas y lenguajes de programacin, de una manera prctica. Incluyen bsicamente:o o o o o o

Editores de texto Compiladores Intrpretes Enlazadores Depuradores Entornos de Desarrollo Integrados (IDE): Agrupan las anteriores herramientas, usualmente en un entorno visual, de forma tal que el programador no necesite introducir mltiples comandos para compilar, interpretar, depurar, etc. Habitualmente cuentan con una avanzada interfaz grfica de usuario (GUI).

Software de aplicacin: Es aquel que permite a los usuarios llevar a cabo una o varias tareas especficas, en cualquier campo de actividad susceptible de ser automatizado o asistido, con especial nfasis en los negocios. Incluye entre muchos otros:

o

Aplicaciones para Control de sistemas y automatizacin industrial Aplicaciones ofimticas Software educativo Software empresarial Bases de datos Telecomunicaciones (por ejemplo Internet y toda su estructura lgica) Videojuegos Software mdico Software de clculo Numrico y simblico. Software de diseo asistido (CAD) Software de control numrico (CAM)

o o o o o

o o o o o

Modelos de proceso o ciclo de vida: Para cada una de las fases o etapas listadas en el tem anterior, existen sub-etapas (o tareas). El modelo de proceso o modelo de ciclo de vida utilizado para el desarrollo, define el orden de las tareas o actividades involucradas,[6] tambin define la coordinacin entre ellas, y su enlace y realimentacin. Entre los ms conocidos se puede mencionar: modelo en cascada o secuencial, modelo espiral, modelo iterativo incrementa. Modelo cascada: Este, aunque es ms comnmente conocido como modelo en cascada es tambin llamado modelo clsico, modelo tradicional o modelo lineal secuencial. El modelo en cascada puro difcilmente se utiliza tal cual, pues esto implicara un previo y absoluto conocimiento de los requisitos, la no volatilidad de los mismos (o rigidez) y etapas subsiguientes libres de errores; ello slo podra ser aplicable a escasos y pequeos sistemas a desarrollar. Desventajas del modelo cascada:

Los cambios introducidos durante el desarrollo pueden confundir al equipo profesional en las etapas tempranas del proyecto. Si los

cambios se producen en etapa madura (codificacin o prueba) pueden ser catastrficos para un proyecto grande.

No es frecuente que el cliente o usuario final explicite clara y completamente los requisitos (etapa de inicio); y el modelo lineal lo requiere. La incertidumbre natural en los comienzos es luego difcil de acomodar.

El cliente debe tener paciencia ya que el software no estar disponible hasta muy avanzado el proyecto. Un error detectado por el cliente (en fase de operacin) puede ser desastroso, implicando reinicio del proyecto, con altos costos.

Modelos evolutivos: Los evolutivos son modelos iterativos, permiten desarrollar versiones cada vez ms completas y complejas, hasta llegar al objetivo final deseado; incluso evolucionar ms all, durante la fase de operacin. Los modelos iterativo incremental y espiral (entre otros) son dos de los ms conocidos y utilizados del tipo evolutivo. Modelo iterativo incremental: El incremental es un modelo de tipo evolutivo que est basado en varios ciclos Cascada Realimentados aplicados repetidamente, con una filosofa iterativa. El modelo incremental no es recomendable para casos de sistemas de tiempo real, de alto nivel de seguridad, de procesamiento distribuido, o de alto ndice de riesgos. Modelo espiral: Es un modelo evolutivo que conjuga la naturaleza iterativa del modelo MCP con los aspectos controlados y sistemticos del Modelo Cascada. El Modelo evolutivo como el Espiral es particularmente apto para el desarrollo de Sistemas Operativos (complejos); tambin en sistemas de altos riesgos o crticos (Ej. navegadores y controladores aeronuticos) y en todos aquellos en que sea necesaria una fuerte gestin del proyecto y sus riesgos, tcnicos o de gestin.

Desventajas importantes:

Requiere mucha experiencia y habilidad para la evaluacin de los riesgos, lo cual es requisito para el xito del proyecto. Es difcil convencer a los grandes clientes que se podr controlar este enfoque evolutivo.

Este modelo no se ha usado tanto, como el Cascada (Incremental) o MCP, por lo que no se tiene bien medida su eficacia, es un paradigma relativamente nuevo y difcil de implementar y controlar. METODOLOGIAS TRADICIONALES Y METODOLOGIAS AGILES Diversos autores coinciden en sealar algunos requisitos que deben tener las metodologas de desarrollo:

Visin del producto. Vinculacin con el cliente. Establecer un modelo de ciclo de vida. Gestin de los requisitos. Plan de desarrollo. Integracin del proyecto. Medidas de progreso del proyecto. Mtricas para evaluar la calidad. Maneras de medir el riesgo. Como gestionar los cambios. Establecer una lnea de meta.

En tiempos recientes, han surgido las metodologas giles, como una alternativa, una reaccin a las metodologas tradicionales y principalmente a su burocracia. APLICACIONES EN LA PYME Es una PYME, un modelo de negocio basado en software libre para diferenciarse de sus competidores y poder mantener una dinmica distinta el

primer problema que tendr ser la eleccin de distintos programas que utilizar para su cometido. Para ello pueden acudir a OpenPyme, catlogo de aplicaciones de software libre especializado en la pyme. Es un catlogo de Software Libre donde se recopilan, de forma categorizada, productos slidos y fiables que pueden incorporarse en cualquier mbito productivo de una empresa, mejorando as su gestin y competitividad gracias a la inclusin de herramientas TIC. Es un buen punto de partida para conocer las alternativas que nos ofrece el software libre. Disponemos de todo tipo de aplicaciones, categorizadas y ordenadas de manera que encontrarlas nos resultar bastante fcil. Junto con cada aplicacin tenemos una pequea resea de su funcionalidad y lo que nos puede aportar a nuestra empresa. CAPITULO VI COMUNICACIONES INTRODUCCION A LA COMUNICACIN DE DATOS La precisin de las mediciones de Mettler Toledo viene apoyada por una amplia variedad de estndares de comunicacin tan sencillos como USB, RS232/485 o 4-20ma o buses de comunicacin industrial ms complejos como Profibus, Ethernet/IP, DeviceNet y ControlNet. Ethernet vincula muchas de nuestras estaciones de control de inventario, formulacin y contaje intensivo de datos/operador a su red. PROTOCOLOS DE COMUNICACIN Los protocolos son los que definen un conjunto de reglas para intercambiar informacin y cooperar. Son ellos, por ejemplo, los que definen la manera como compartimos informacin a travs del Internet o incluso la manera como chateamos. En la actualidad contamos con muchos protocolos de comunicacin

comerciales, incluso algunas empresas de telecomunicaciones tales como la AT&T han llegado a desarrollar sus propios protocolos, dependiendo de los servicios que ofrezcan a sus usuarios. Estos protocolos muchas veces aun sin darnos cuenta son usados por nosotros y nos ayudan a hacer tareas como los son el Internet, una transferencia por mdem o una simple comunicacin a un servicio en lnea inteligente de algn banco. Los protocolos que a continuacin se relacionan son los ms importantes y comerciales que existen hoy da, aunque la cantidad que se ha desarrollado es muy amplia pero tambin difcil de condensar en un solo trabajo y bastante complicado es ubicar, igualmente, informacin sobre ellas. Los protocolos a tratar son: ftp, http, Ipx/spx, Nfs, pop3, Scp, Tcp/ip. Cada uno est hecho para diferentes tipos de tareas. 1.1. FTP. El protocolo FTP o file transfer protocol (protocolo de transferencia de archivos) tiene como objetivo principal varios puntos, como son, promover el compartir archivos entre computadoras (programas y datos), alentar el uso remoto de las computadoras, y transferir datos de una forma segura y optima por computadora. FTP ms que para ser usado por un usuario directamente es para que los programas lo usen entre ellos para comunicarse. Con este tipo de forma de hacer las cosas le ayudamos al usuario para que no tenga que preocuparse por el tipo de computadora con la cual tiene contacto, sean microcomputadoras, micro, mini o simples computadores personales. Gracias a este tipo de protocolo no se necesita saber mucho y se pueden lograr muchas cosas. El protocolo ha ido evolucionando demasiado en todos estos aos desde que se creo, este empez en 1.971 con un modelo de transferencia llamado RFC 141 en MIT. Fue hasta despus de muchas revisiones que lleg a RFC 265 cuando ya se le considero como un protocolo de transferencia de archivos completo entre HOSTs (o servidores de archivos) de ARPHANET.

Finalmente un documento declarando un FTP oficial se public cuando se llego a RFC 454. El FTP cambio mucho pero al final de la edicin de RFC 765 se incluy alguno de los que son ahora los comandos de este protocolo: CDUP (change to parent directory). SMNT (structure mount). STOU (store unique). RMD (remove directory). MKD (make directory). PWD (print directory). SYST (system). Existen tres tipos de datos en la transferencia por FTP, el tipo ASCII, EBCDIC, IMAGEN. El tipo ASCII es el ms comn, se usa cuando se transfieren archivos de texto en el cual el SENDER debe convertir cualquiera que sea su estructura de archivos interna al formato genrico de 8 bits, y el RECEIVER a su propio formato. El EBCDIC es el ms eficiente cuando ambos equipos lo usan como formato propio, se representa tambin en 8 bits pero de forma EBCDIC, la diferencia se da en la forma de reconocer los cdigos de los caracteres. IMAGEN es cuando se empaca todo lo que se quiere enviar en cadenas seguidas de paquetes de 8 bits, esto es no importa el formato en que internamente se maneje la informacin, cuando se va enviar se tiene que hacer una conversin de 8 en 8 bits y cuando el que recibe tiene todo el paquete, el mismo debe codificarlos de nuevo para que la transmisin sea completada. En FTP se consideran tres tipos deferentes de archivos. Estos son FILESTRUCTURE (donde no hay estructuras internas y el archivos es considerado una secuencia continua de bytes), RECORD-STRUCTURE

(donde los archivos contienen puros registros iguales en estructura) y PAGESTRUCTURE (donde los archivos contienen paginas enteras indexadas separadas). Al establecer una conexin por FTP se debe tomar en cuenta que el mecanismo de transferencia consiste en colocar bien la transferencia de datos en los puertos adecuados y al concluir la conexin estos puertos deben ser cerrados adecuadamente. El tamao de transferencia es de 8 bits, en ambos. El que va a transferir, debe escuchar desde el puerto hasta que el comando enviado sea recibido y este ser el que de la direccin de la transferencia. Una vez recibido el comando y establecido una transferencia del servidor a que solicita se inicializa la comunicacin de la transferencia para verificar la conexin, esta es una cabecera con un formato especfico, despus de esto se comienza a enviar las tramas de 8 bits sin importar el tipo de datos que sea (antes mencionado), y al finalizar se enva otra trama cabecera ya establecida confirmando la transferencia completada. Existen tres modos de transferencia en FTP como son el STREAM MODE, BLOCK MODE y COMPRESSED MODE. Algunos de los comandos mas usados en FTP son los siguientes: Comandos de acceso USER NAME (USER) PASSWORD (PASS ACCOUNT (ACCT) CHANGE WORKING DIRECTORY (CWD) CHANGE TO PARENT DIRECTORY (CDUP) REINITIALIZE (REIN) LOGOUT (QUIT) Comandos de transferencia DATA PORT (PORT) PASSIVE (PASV) FILE STRUCTURE (STRU)

TRANSFER MODE (MODE) Comandos de servicio RETRIEVE (RETR) STORE (STOR) STORE UNIQUE (STOU) APPEND (with create) (APPE) ALLOCATE (ALLO) RENAME TO (RNTO) ABORT (ABOR) DELETE (DELE) REMOVE DIRECTORY (RMD) MAKE DIRECTORY (MKD) PRINT WORKING DIRECTORY (PWD) LIST (LIST) HELP (HELP) Algunos de los cdigos usados en la transferencia son los siguientes, estos cdigos no son ms que mensajes enviados por el protocolo: Cdigos normales 200 Command okay. 500 Syntax error, command unrecognized. This may include errors such as command line too long. 501 Syntax errors in parameters or arguments. 202 Command not implemented, superfluous at this site. 502 Command not implemented. 503 Bad sequence of commands. 504 Command not implemented for that parameter. 110 Restart marker reply. In this case, the text is exact and not left to the particular implementation; it must read: 211 System status or systems help reply. 212 Directory status.

213 File status. 214 Help message. On how to use the server or the meaning of a particular non-standard command. This reply is useful only to the human user. 215 NAME system type. Where NAME is an official system name from the list in the Assigned Numbers document. 120 Service ready in nnn minutes. 220 Service ready for new user. 221 Service closing control connection. Logged out if appropriate. 421 Service not available, closing control connection. This may be a reply to any command if the service knows it must shut down. 125 Data connection already open; transfer starting. 225 Data connection open; no transfer in progress. 425 Can't open data connection. 226 Closing data connection. Requested file action successful (for example, file transfer or file abort). 426 Connection closed; transfer aborted. 227 Entering Passive Mode (h1, h2, h3, h4, p1, p2). 230 User logged in, proceed. 530 not logged in. 331 User name okay, need password. 332 Need account for login. 532 Need account for storing files. 150 File status okay; about to open data connection. 250 Requested file action okay, completed. 257 "PATHNAME" created. 350 Requested file action pending further information. 450 Requested file action not taken. File unavailable (e.g., file busy). 550 Requested action not taken. File unavailable (e.g., file not found, any access).

451 Requested action aborted. Local error in processing. 551 Requested action aborted. Page type unknown. 452 Requested action not taken. Insufficient storage space in system. 552 Requested file action aborted Exceeded storage allocation (for current directory or dataset). 553 Requested action not taken. File name not allowed. Cdigos de mensajes con operaciones numricas 110 Restart marker reply. 120 Service ready in nnn minutes. 125 Data connection already opens; transfer starting. 150 File status okay; about to open data connection. 200 Command okay. 202 Command not implemented, superfluous at this site. 211 System status or system help reply. 212 Directory status. 213 File status. 214 Help message. On how to use the server or the meaning of a particular non-standard command. This reply is useful only to the human user. 215 NAME system type. Where NAME is an official system name from the list in the Assigned Numbers document. 220 Service ready for new user. 221 Service is closing control connection. Logged out if appropriate. 225 Data connection open; no transfer in progress. 226 Closing data connection. Requested file action successful (for example, files transfer or file abort). 227 Entering Passive Mode (h1, h2, h3, h4, p1, p2). 230 User logged in, proceed. 250 Requested file action okay, completed.

257 "PATHNAME" created. 331 User names okay need password. 332 Need account for login. 350 Requested file action pending further information. 421 Service not available, closing controls connection. This may be a reply to any command if he service knows it must shut down. 425 can't open data connection. 426 Connection closed; transfer aborted. 450 Requested file action not taken. File unavailable (e.g., file busy). 451 Requested action aborted: local error in processing. 452 Requested action not taken. Insufficient storage space in system. 500 Syntax error, command unrecognized. This may include errors such as command line too long. 501 Syntax error in parameters or arguments. 502 Command not implemented. 503 Bad sequence of commands. 504 Command not implemented for that parameter. 530 Not logged in. 532 Need account for storing files. 550 Requested action not taken. File unavailable (e.g., file not found, no access). 551 Requested action aborted: page type unknown. 552 Requested file action aborted. Exceeded storage allocation (for current directory or dataset). 553 Requested action not taken. File name not allowed. 1.2. HTTP. El protocolo HYPER TEXT TRANSFER PROTOCOL (protocolo para la transferencia de hipertextos) es para todos los sistemas de informacin distribuidos que tengas la necesidad de mostrar la informacin y pasarla por

una comunicacin normal haciendo uso de las ligas de este lenguaje. La primera versin de este lenguaje (http 0.9) se uso desde 1.990. El protocolo fue implementado inicialmente para WWW en 1.991 como una iniciativa de software y se denomin http 0.9. El protocolo completo fue definido en 1.992 e implementado en marzo de 1.993. HTTP 1.0. esta especificacin prev las caractersticas bsicas del protocolo. HTTP 1.1. la primera versin no est aun habilitada, pero las especificaciones son muy similares a la anterior. HTTP-NG next generation of HTTP, es un protocolo binario con nuevas caractersticas para un acceso ms rpido usando TCP. Este es el ltimo HTTP en la actualidad, es ms complejo que un 0.9. El protocolo encierra cierta terminologa como: Conexin. Es el circuito virtual establecido entre dos programas en una red de comunicacin con el proceso de una simple comunicacin. Mensaje. Esta es la unidad bsica, estos consisten en una secuencia estructurada que es transmitida siempre entre los programas. Servidor. El que presta el servicio en la red. Proxy. Un programa intermedio que acta sobre los dos, el servidor y el cliente. 1.3. IPX/SPX El internetwork packet exchange, sequence packet exchanged es un protocolo usado y registrado por la compaa mundial de redes NOVELL. 1.4. NFS. El network file system (sistema de archivos de red) es un sistema distribuido para archivos, este es para las redes heterogneas, con este protocolo, el usuario solo ve un directorio cuando esta dentro de la red, claro que tiene ramas dentro pero no puede ver ms arriba de el nivel en el que se entra, tal

vez los archivos dentro esta estructura del directorio ni siquiera est en la misma computadora. 1.5. POP3. El protocolo Post office protocol versin 3 es netamente un protocolo para la administracin de correo en Internet. En algunos nodos menores de Internet normalmente es poco prctico mantener un sistema de transporte de mensajes (MTS). Por ejemplo, es posible que una estacin de trabajo no tenga recursos suficientes (hdd, entre otros) para permitir que un servidor de SMTP y un sistema local asociado de entrega de correo estn residentes y continuamente en ejecucin. De forma similar, puede ser caro mantener una computadora personal interconectada a una red tipo IP durante grandes cantidades de tiempo. A pesar de esto, a menudo es muy til poder administrar correo sobre estos nodos, y frecuentemente soportan un user agent (agente de usuario) para ayudar en las tareas de manejo de correo. Para resolver este problema, un nodo que s sea capaz de soportar un MTS ofrecer a estos nodos menos dotados un servicio MAILDROP (es el lugar en el sistema con el MTS donde el correo es almacenado para que los otros nodos puedan trabajar con l sin necesidad de mantener su propio MTS. El protocolo de oficina de correos est destinado a permitir que una estacin de trabajo acceda dinmicamente a un MAILDROP en un HOST servidor de forma til y eficiente. Esto significa que el protocolo POP3 se usa para permitir a una estacin de trabajo recobrar correo que el servidor tiene almacenado. POP3 no est destinado a proveer de extensas operaciones de manipulacin de correo sobre el servidor; normalmente, el correo es transmitido y entonces borrado. IMAP4 es un protocolo ms avanzado y complejo. De aqu en adelante el trmino host cliente se refiere a un host haciendo uso del servicio POP3 y host servidor al que ofrece este servicio. Inicialmente, el

host servidor comienza el servicio POP3 leyendo el puerto 110 TCP. Cuando un host cliente desea hacer uso del servicio, establece una conexin TCP con el host servidor. Cuando la conexin se establece, el servidor POP3 enva un saludo. Entonces, el cliente y el servidor POP3 intercambian comandos y respuestas respectivamente hasta que la conexin se cierra o es abortada. Los comandos en el POP3 consisten en una palabra clave (keyword), posiblemente seguida de uno o ms argumentos. Todos los comandos terminan con un par CRLF. Las palabras clave y los argumentos consisten en caracteres ASCII imprimibles. Las palabras clave son de una longitud de tres o cuatro caracteres, mientras que cada argumento puede ser de hasta 40 caracteres de longitud. Las respuestas en el POP3 consisten de un indicador de estado y una palabra clave posiblemente seguida de informacin adicional. Todas las respuestas acaban en un par CLRF. Las respuestas pueden ser de hasta 512 caracteres de longitud, incluyendo el CRLF de terminacin. Tambin existen dos indicadores de estado, positivo o afirmativo (+OK) y negativo (-ERR). Los servidores deben enviarlos en maysculas. Las respuestas a ciertos comandos son multilnea (una respuesta compuesta de varias lneas). En estos casos despus de enviar la primera lnea de la respuesta y un CRLF, se enva cualquier lnea adicional, cada una termina en un par CRLF. Cuando todas las lneas de la respuesta han sido enviadas, se enva una lnea final, que consiste en un octeto de terminacin y un par CRLF. Si alguna lnea de la respuesta multilnea comienza con el octeto de terminacin, se ponen bites de relleno precedidos por el byte de terminacin en esa lnea de la respuesta. De aqu en adelante una respuesta multilnea termina con los cinco bytes CRLF.CRLF. Al examinar una respuesta multilnea, el cliente comprueba si la lnea comienza con el byte de terminacin. Si es as y si siguen otros bytes a excepcin del CRLF, el primer

byte de la lnea o de terminacin es ignorado. De este modo se el CRLF sigue inmediatamente al carcter de terminacin, entonces la respuesta desde el servidor POP termina y la lnea conteniendo CRLF no es considerada como parte de la respuesta multilnea. Una sesin POP3 progresa a travs de una serie de estados a lo largo de su vida. Una vez la conexin TCP ha sido abierta y el servidor de POP3 ha enviado el saludo, la sesin entra en el estado de autorizacin. En este estado, el cliente debe identificarse al servidor de POP3. Una vez el cliente lo ha hecho satisfactoriamente, el servidor adquiere los recursos asociados al maildrop del cliente, y la sesin entra en el estado de transaccin. En este estado, el cliente realiza una serie de solicitudes al servidor de POP3. Cuando el cliente ha emitido el comando de finalizacin (QUIT) la sesin entra en el estado de actualizacin. En este estado, el servidor de POP3 libera cualquiera de los recursos adquiridos durante el estado de transicin, se despide y la conexin TCP se cierra. Un servidor debe responder a comandos no reconocidos, no implementados, o sintctica mente incorrectos con un indicador negativo de estado (respuesta negativa). Tambin debe responder con un indicador negativo de estado cuando la sesin se encuentra en un estado incorrecto. No hay un mtodo general para que el cliente distinga entre un servidor que no implementa un comando opcional y un servidor que no esta dispuesto o es incapaz de procesar el comando. Un servidor de POP3 puede disponer de un temporizador o cronmetro de inactividad (autologout inactivity timer). Tal cronmetro debe ser de por lo menos 10 minutos de duracin. La recepcin de cualquier comando desde el cliente durante este intervalo reinicia la cuenta de este cronmetro. Cuando el cronmetro llega a los diez minutos, la sesin no entra en el estado de actualizacin. Entonces, el servidor debera cerrar la conexin TCP sin eliminar ningn mensaje y sin enviar ninguna respuesta al cliente. USER nombre

Argumentos: una cadena identificando un mailbox, el cual solo tiene significado para el servidor Restricciones: solo puede darse en el estado de autorizacin despus del saludo o de los comandos USER o PASS sin xito. Definicin: Para autentificar usando la combinacin de los comandos USER y PASS, el cliente debe primero emitir el comando USER. Si el servidor responde afirmativamente (+OK), entonces el cliente puede responder con el comando PASS para completar la autentificacin, o el comando QUIT para finalizar con la conexin. Si el servidor responde negativamente (-ERR) al comando USER, el cliente puede emitir un nuevo comando de autenticacin o bien el comando QUIT. El servidor puede devolver una respuesta afirmativa incluso a pesar de que no exista ningn mailbox. El servidor puede devolver una respuesta negativa si el mailbox existe, pero no permitir la autenticacin. PASS cadena Argumentos: palabra de acceso al mailbox Restricciones: solo puede darse en el estado de autorizacin inmediatamente despus de un comando USER satisfactorio. Definicin: Cuando el cliente el comando PASS, el servidor utiliza el par de argumentos de los comandos USER y PASS para determinar si al cliente se le debe dar acceso al maildrop apropiado. Ya que el comando PASS tiene exactamente un argumento, un servidor de POP3 puede tratar los espacios como parte del password en lugar de cmo separadores de argumentos. APOP nombre digest Argumentos: una cadena identificando un mailbox y una cadena digest MD5 Restricciones: solo puede darse en el estado de autorizacin despus del saludo o de los comandos USER o PASS sin xito. Definicin: Normalmente, cada sesin POP3 comienza con intercambio USER/PASS. Esto tiene como resultado una clave de acceso especfica

enviada a travs de la red. Para un uso intermitente del POP3, no conlleva un riesgo considerable. Sin embargo, muchas implementaciones de cliente POP3 conectan al servidor regularmente para comprobar si hay correo nuevo. Adems, el intervalo de iniciacin de la sesin puede ser del orden de 5 minutos. Por lo tanto, el riesgo de que la clave de acceso sea capturada es alto. Se requiere un mtodo alternativo de autenticacin que no implique el envo de claves de acceso a travs de la red. Esta funcionalidad la proporciona el comando APOP. Un servidor que implemente el comando APOP incluir una marca de tiempo (timestamp) en sus "saludos". La sintaxis de la marca de tiempo corresponde al "msg-id" en la RFC 882 (actualizada por RFC 973 y despus por RFC 1982), y debe ser diferente cada vez que el servidor enva un saludo. Por ejemplo, en una implementacin UNIX en la cual un proceso UNIX separado es el encargado de cada instancia de servidor, la sintaxis de la marca de tiempo podra ser: process-ID.clock@hostname, donde process ID es el valor decimal del PID del proceso, clock es el valor decimal del reloj del sistema, y hostname es el nombre de dominio del host donde el servidor est funcionando. El cliente recibe esta marca de tiempo y emite un comando APOP. El parmetro nombre tiene el mismo significado que el parmetro nombre del comando USER. EL parmetro digest se calcula aplicando el algoritmo MD5 (RFC 1321) a una cadena consistente en una marca de tiempo (incluyendo