aplicacion de redes neuronales artificiales para la ingenieria de trafico de internet

7/26/2019 Aplicacion de Redes Neuronales Artificiales Para La Ingenieria de Trafico de Internet

1/20

Escuela de Ciencias de la Computacin, Universidad Tcnica Particular de Loja

Estudio de la Aplicacin de Redes Neuronales Artificiales en laIngeniera de Trfico de Internet

Nelson Piedra1, Jorge Lpez

2

5937-2570275 ext 222

Direccin: 11-01-608 Loja EcuadorUniversidad Politcnica de Madrid

Universidad Tcnica Particular de Loja

1Nelson Piedra, Universidad Tcnica Particular de Loja, Escuela de Ciencias de la Computacin, [email protected] Lpez, Universidad Tcnica Particular de Loja, Unidad de Proyectos y Sistemas Informticos, [email protected]

Abstract ! En este documento se aborda una va para

solucionar la congestin que se prodecen en las redes de

Internet a travs de la utilizacin de Redes Neuronales

Artificiales que permitan cumplir con el propsito de la

Ingeniera de Trfico: adaptar el flujo de trfico a los

recursos fsicos de la red, de manera que no haya recursos

congestionados mientras que otros son subutilizados. A

travs de un proceso de entrenamiento, las RNA, son

capaces de determinar relaciones no lineales entre unconjunto de datos, asociando a patrones de entrada la o las

salidas correspondientes. De ah que la aplicacin de las

RNA en el mbito de la Ingeniera de Trfico puede ayudar

a cumplir su objetivo global; agentes/sistemas

"inteligentes", capaces de adaptar los diferentes flujos de

datos de acuerdo a los recursos disponibles.

El presente trabajo est estructurado en tres captulos, en el

primer y segundo apartados, se presentan los fundamentos

de la Ingeniera de Trfico y las Redes Neuronales

Artificiales, respectivamente; luego en el tercer captulo, se

analizan algunas aplicaciones experimentales y de

comparacin de resultados de las RNA con otras tcnicas

para la implementacin de tareas de ingeniera de trficoespecficas, se desarrolla una discusin sobre la aplicacin

de RNA y se generan conclusiones.

Index Terms ! Traffic Engineering, RNA ,Redes

Neuronales Artificiales, Ingeniera de Trfico.

INTRODUCCIN

El acelerado crecimiento de Internet, en cuanto aservicios, aplicaciones, cobertura y usuarios, ha cambiado deenfoque tradicional de uso de las redes de comunicaciones;hasta hace algunos aos consideradas nicamente como unmedio restringido por el cual circulaban datos. Hoy en da,

debido a, la apertura, flexibilidad y facilidad de acceso aInternet se ha incrementado la exigencia de losrequerimientos de las aplicaciones: mayor calidad deservicio, mayor ancho de banda, menor latencia en la red,mayor calidad en la transmisin, entre otros. Esto implicala bsqueda y aplicacin de soluciones ms ingeniosas para

brindar una mayor calidad en los servicios proporcionados alos usuarios de estas redes.

Uno de los mayores problemas que deben enfrentar losproveedores y usuarios de red, es el congestionamiento desus servicios, lo que provoca consecuencias indeseables enla calidad de servicio para ambas partes: insatisfaccin yprdida de dinero. Una via rpida para solucionar estasituacin, consiste en incrementar la capacidad de los

recursos que ofrecen esos servicios; sin embargo, sta no esuna alternativa razonable: el consumo de servicio no esconstante/esttico, ni el presupuesto de recursos es ilimitado.Como se sabe, la distribucin de trfico de datos es unproceso estocstico y por tanto, durante ciertos perodos detiempo existen niveles bajos o nulos de actividad, quedandoesta capacidad subutilizada.

Para mejorar el rendimiento de las redes, reduciendo lacongestin y gestionando de mejora manera el trfico y susrecursos, se aplican los principios, conceptos y tecnologasde la Ingeniera de Trfico, IT. El RFC 3272 de la IETF -Internet Engineering Task Force-, describe los soportes de laIngeniera de Trfico en Internet -Internet Traffic

Engineering, ITE -.Por otro lado, las Redes Neuronales Artificiales, RNA -por sus capacidades y caractersticas-, estn siendo aplicadasen diferentes mbitos, en los cuales los mtodos y tcnicastradicionales o conocidos no han podido resolver coneficacia los problemas subyacentes.

Las RNA, surgieron con el objetivo de emular ciertascaractersticas de los seres humanos, especficamente lacapacidad de memorizar, asociar hechos y generar acciones.

A travs de un proceso de entrenamiento, las RNA, soncapaces de determinar relaciones no lineales entre unconjunto de datos, asociando a patrones de entrada la o lassalidas correspondientes. De ah que la aplicacin de lasRNA en el mbito de la Ingeniera de Trfico puede ayudar acumplir su objetivo global; agentes/sistemas "inteligentes",capaces de adaptar los diferentes flujos de datos de acuerdoa los recursos disponibles.

El presente trabajo est estructurado en tres captulos,en el primer y segundo apartados, se presentan losfundamentos de la Ingeniera de Trfico y las Redes


2/20


Neuronales Artificiales, respectivamente; luego en el tercercaptulo, se analizan algunas aplicaciones experimentales yde comparacin de resultados de las RNA con otras tcnicaspara la implementacin de tareas de ingeniera de trficoespecficas.

INGENIERA DE TRFICO

La Ingeniera de Trfico, trata de resolver, uno de losmayores problemas de las redes IP actuales: ajustar el trficoIP para hacer un mejor uso del ancho de banda, as comoenviar flujos especficos por caminos especficos [Alcober,2001].

IETF, ha propuesto varias tcnicas para proveer calidadde servicio -QoS- en Internet. Las redes como Internet,tienen tres caractersticas significativas: 1) proporcionanservicios en tiempo real, 2) son de misin crtica, y 3) susentornos operativos son muy dinmicos [RFC-3272,Awduche], desde este punto de vista, resulta complejomodelar, analizar y resolver los problemas asociados al

mantenimiento, gestin y afinamiento de las redes.En las siguientes secciones se presentan los conceptos,objetivos y tareas de la Ingeniera de Trfico; adems sehace una breve revisin de los eventos o tecnologas que leprecedieron y que en algunos casos han servido de base parala Ingenier de Trfico TE Traffic Enfineering y lostrabajos actuales; finalmente, se enlistan algunasrecomendaciones para TE definidas por entidades como laInternational Telecommunication Union- ITU y la InternetEngineering Task Force, IEFT.

Conceptos de Ingeniera de Trfico

Segn [Garca, 2002], la Ingeniera de Trfico se define

como el proceso de controlar los flujos de datos a travs deuna red, es decir, es el proceso de optimizar la utilizacin delos recursos disponibles por parte de los distintos flujos ypor tanto, optimizar el uso global de los recursos y lasprestaciones de la red [XIAO, 1999] y [XIAO, 2000] en[Garca, 2002].

La Ingeniera de Trfico tiene que ver con laplanificacin, control y optimizacin de red con el fin decumplir su propsito: adaptar el flujo de trfico a losrecursos fsicos de la red, de manera que no haya recursoscongestionados mientras que otros son subutilizados.

En el RFC 3272 de la IETF (Internet Engineering TaskForce), se describen los principios de la Ingeniera de

Trfico en Internet (ITE, Internet Traffic Engineering);incluyendo una perspectiva de algunos de los aspectosbsicos relacionados, como: contexto, modelo y taxonomade Ingeniera de Trfico; adems de una revisin histrica,tcnicas de Ingeniera de Trfico contemporneas yrecomendaciones, entre otros aspectos fundamentales.

Segn se define en el [RFC-2702, Awduche] en [RFC-3272, Awduche], Internet Traffic Engineering, ITE, es ladisciplina encargada de gestionar la capacidad dedistribucin de trfico de red, considerando aspectos como:

la evaluacin y optimizacin de rendimiento de las redes IPoperativas. La Ingeniera de Trfico comprende la aplicacinde principios tecnolgicos y cientficos para la medicin,caracterizacin, modelado y control de trfico de Internet.

Objetivo de la Ingeniera de Trfico

El objetivo global de la IT, es mejorar el rendimiento deuna red operacional [RFC-3272, Awduche], minimizando lacongestin en una red al mismo tiempo que se intentaincrementar la eficiencia de la utilizacin de sus recursos[Delfino A.].

Causas de la congestin en una red

La congestin3 en una red, puede deberse a [DelfinoA.]: Insuficiencia de recursos en la red (por ejemplo,

capacidad de enlaces). Utilizacin ineficiente de los recursos debido al

mapeado del trfico.

El primer caso, se podra resolver aumentando lacapacidad de los recursos; para el segundo caso, laIngeniera de Trfico adapta los flujos de trfico a losrecursos fsicos de la red, tratando de equilibrar de formaptima la utilizacin de esos recursos, de manera que nohaya algunos que estn subutilizados, y otros sobre-utilizados que crean cuellos de botella. Solucionar losproblemas de congestin en costos razonables es uno de losmayores objetivos de la ITE.

La utilizacin de recursos de la red de una formaeconmica y confiable, se puede realizar teniendo en cuentalos requerimientos y mtricas de rendimiento -retardo,variacin de retardo, prdida de paquetas y throughput-,

mecanismos y polticas que mejoren la integridad de la red[RFC-3272, Awduche].La aplicacin de los conceptos de ingeniera de trfico a

redes operacionales permitir identificar y estructurar metasy prioridades en trminos de mejorar la calidad de losservicios distribuidos; y ayudar en la medicin eidentificacin de objetivos globales.

Como una regla general, los conceptos y mecanismos deIngeniera de Trfico pueden ser especificados y definidospara cubrir los requerimientos de las organizaciones, pero almismo tiempo deben ser flexibles y escalables para soportarfuturas demandas.

Tareas de la Ingeniera de Trfico

En [ITU, Villn] se definen 4 de las tareas ms grandesde Ingeniera de Trfico:

Caracterizacin de la demanda de trfico

3Un recurso de red se considera congestionado si la tasa de llegada depaquetes excede la capacidad de salida del recurso sobre un intervalo detiempo; esta situacin puede provocar retraso o descarte de paquetes [RFC-3272, Awduche].


3/20


Se realiza mediante modelos que aproximan elcomportamiento estadstico de la red. Los modelos detrfico, adoptan suposiciones simplificadas acerca de losprocesos de trfico que usualmente son complicados.Usando estos modelos, el trfico se caracteriza por unconjunto limitado de parmetros (solamente los parmetrosque sean relevantes para determinar el impacto de lademanda de trfico sobre el rendimiento de la red, porejemplo: media, varianza, ndice de dispersin decontadores, etc.)

Las mtricas de trfico son definidas para validar losmodelos; stas mtricas estiman el valor de los parmetrospor cada segmento de red durante cada perodo de tiempo.

Como complemento al modelado de trfico y mtricasde trfico, se requiere un sistema de prediccin de trfico para propsitos de planeacin y dimensionamiento, estopermitir pronosticar las demandas de trfico segn perodosde tiempo anteriores.

Objetivos del Grado de Servicio (GoS, Grade of Service)

Los objetivos del Grado de Servicio GoS se derivan delos requerimientos de Quality of Service (QoS).

El GoS, se refiere al nmero de parmetros deingeniera de trfico que proporcionan una medida adecuadao suficiente de la infraestructura bajo condicionesespecficas; estos parmetros GoS puede ser expresadoscomo una probabilidad de bloqueos o de retardos, etc. Elbloqueo y el retardo pueden ser causados por: la capacidadlimitada de manejo de trfico de la red -o de un componentede ella- y la naturaleza estocstica de la demanda de trfico.

Controles de trfico y dimensionamiento

Una vez que las demandas de trfico han sido

caracterizadas y los objetivos de GoS han sido establecidos,la TE debe proveer un diseo de operacin de la red quegarantice el soporte de la demanda de trfico mientras losobjetivos de GoS son satisfechos.

Las entradas para el diseo y operacin de la red son: eldimensionamiento de la red y los controles de trfico. Eldimensionamiento(de los elementos de la red fsica y lgica)asegura que la red tenga suficientes recursos para atender lademanda de trfico. Los controles de trfico, incluyen:enrutamiento de trfico, controles de gestin de trfico dered, mtodos de proteccin de servicio, supervisin detrfico a nivel de paquetes, controles de sealizacin y redesinteligentes.

Monitoreo del rendimiento

Una vez que la red es operacional, se requiere unmonitoreo continuo de los GoS. Aunque la red seacorrectamente dimensionada, hay situaciones de sobrecargay fallos no considerados (sobre todo cuando se tomanacciones de gestin de trfico en perodos de tiempo cortos -minutos, horas-). El monitoreo del GoS es necesario paradetectar errores o aproximaciones incorrectas durante eldimensionamiento y para producir una retroalimentacin

para la caracterizacin de trfico y diseo de la red.Dependiendo de los problemas detectados, las re-configuraciones de la red, los cambios en los patrones deenrutamiento o el ajuste de los patrones de control de trfico,se pueden realizar en plazos de tiempo medios (semanas,meses).

FIGURA 1.TAREAS DE LA INGENIERA DE TRFICO [ITU, VILLN]

La figura anterior, muestra las relaciones entre lascuatro tareas principales de la TE. La primer tarea en la TEes caracterizar la demanda de trfico y especificar objetivosde GoS. Los resultados de estas dos tareas se convierten enentradas para el dimensionamiento de los recursos de red y

para establecer los controles de trfico apropiados.Finalmente, se requiere monitorear el rendimiento paraverificar si los objetivos de GoS han sido alcanzados,resultados que se usan como retroalimentacin para todo elproceso.

Revisin histrica y desarrollos actuales

En un entorno de redes que utilizan IP como protocolode nivel de red, el encaminamiento de los paquetes se basaen los resultados de algoritmos de encaminamiento comoIGP, Interior Gateway Protocol- y stos suelen utilizar elcriterio de escoger el camino ms corto para decidir elcamino que deben seguir los paquetes [Garca, 2002].

Este tipo de algoritmos, diseados hace unos aos,trataba de minimizar el uso de recursos de red escogiendo elcamino ms corto, pero este criterio de seleccin puedeproducir congestin en algunos enlaces de la red mientrasque otros enlaces pueden estar infrautilizados [Garca,2002]. Aplicando conceptos de TE, algunos flujos viajaranpor otros enlaces, los cuales estn menos transitados aunqueestn en una ruta ms larga [Roca, T.].


4/20


FIGURA 2.ENRUTAMIENTO DE PAQUETES MEDIANTE IGP Y MPLS [ROCA,T.]

En la figura anterior, se distingue algunas rutas por lasque pueden enviarse los paquetes desde los nodos defrontera A (origen) y B (destino); si se considera elalgoritmo IGP, para llegar los paquetes desde el nodo A

hasta el nodo B, se transportaran por el camino ms corto, elque tiene 2 saltos. Con MPLS (Multi Protocol LabelSwitching) se pueden considerar rutas alternativas aunqueimplique ms saltos por ejemplo, la ruta con tres saltos-.

MPLS, hoy en da, es ampliamente elegida en especialpara las aplicaciones de backbone- como la tecnologa queproporciona capacidad de Ingeniera de Trfico y QoS[Sawant A.]. Entre otros aspectos, MPLS ofrece: reserva derecursos, tolerancia a fallos y optimizacin de recursosdurante la transmisin. La combinacin de MPLS yDiffServ-TE (Servicios Diferenciados e Ingeniera deTrfico) rene sus ventajas para proporcionar QoS mientrasse optimiza el uso de recursos de la red [Minei I., 2004].Entre las caractersticas de MPLS para proporcionar TE,estn [Roca, T.]: Establecimiento de rutas explicitas (camino fsico a

nivel de LSPs Label Switched Path-). Generacin de estadsticas de uso de LSPs, informacin

que podra ser utilizada para la planificacin yoptimizacin de la red.

Flexibilidad en la administracin de la red, se puedeaplicar encaminamiento restringido (Constraint-BasedRouting) de tal manera que se puedan seleccionar rutaspara servicios especiales.

Discusin sobre aproximaciones implementadas para

Ingeniera de TrficoHay otras aproximaciones propuestas e implementadas

en telecomunicaciones y redes de computadoras para ofrecerTE. Primero se va ha describir algunas aproximaciones deenrutamiento utilizadas aos atrs [RFC-3272, Awduche]. En ARPANET, se enviaban los paquetes a su destino

por el camino para la cual el tiempo de trnsito totalestimado fuera el ms pequeo esquema conocidocomo:enrutamiento adaptativo,donde las decisiones de

ruteo son realizadas considerando el estado actual de lared-; informacin de la ruta ms corta, tambin erapropagada. Un inconveniente de esta aproximacin esque puede provocar congestin en diferentes segmentosde red, resultando en oscilacin e inestabilidad de la red.

Como se conoce, Internet evolucion a partir deARPANET y adopt algoritmos de enrutamientodinmicoscon control distribuido para determinar lasrutas que los paquetes deberan tomar para llegar a sudestino. Este tipo de algoritmos son adaptaciones de losalgoritmos de la ruta ms corta donde los costos sonbasados en mtricas de enlaces. Una de las desventajasde utilizar mtricas de enlace es que puede provocarcargas no balanceadas de la red.

El enrutamiento basado en el campo Tipo de servicio(Type-of-Service -ToS-) implica la seleccin de rutasdependiendo de su valor. Cada enlace es asociado conmltiples costos, los cuales son usados para calcularcaminos para un ToS particular. Se establece un rbolde la ruta ms corta para cada ToS. El enrutamiento

clsico basado en ToS no siempre es aplicable puestoque ste ha sido ha sido reemplazado por el campoDiffServ. La TE es difcil realizar bajo estaaproximacin porque cada clase confa exclusivamenteen la ruta ms corta.

Equal Cost Multi-Path, ECMP es otra tcnica queintenta superar las deficiencias de los mtodosanteriores basados en, Shortest Path First (SPF). SPF esmodificado levemente en ECMP de manera que siexisten dos o ms rutas cortas de igual costo entre dosnodos, el trfico es distribuido entre stas rutas. Ladistribucin de trfico a travs de rutas de igual costo esgeneralmente realizada considerando dos mtodos: 1)

basado en paquetes, mediante round-robin, o 2) basadoen flujos, usando hashing sobre algunos de los camposdel encabezado IP como: direcciones IP fuente ydestino.

La primera aproximacin puede causar el deterioro depaquetes mientras la segunda es dependiente del nmeroy distribucin de flujos. La carga basada en flujos puedeser ms efectiva en redes pblicas donde el nmero deflujos es grande y heterogneo.

Con este algoritmo, en general, dadas dos rutas de igualcosto, es posible que una de las rutas sea mscongestionada que la otra. Otro inconveniente es que lacomparticin de carga no puede ser alcanzada entre

mltiples rutas si no tienen costos idnticos. Nimrod, es un protocolo de enrutamiento desarrolladopara proporcionar ruteo de servicios heterogneos enInternet, mientras se consideran mltiples restricciones[RFC-1992]. Usa el concepto de mapeado pararepresentar la conectividad de redes y servicios enmltiples niveles de abstraccin.

A pesar de que Nimrod no cuenta con desarrollos enInternet, algunos conceptos clave son incorporados ensu arquitectura, tales como, enrutamiento explcito el

Camino ms corto segn mtrica IGP tradicional

Camino ms corto segn ingeniera de trfico MPLS

B

A


5/20


cual permite seleccionar rutas en nodos de entrada. Redes tales como ATM, Frame Relay o WDM

proporcionan conectividad de circuito virtual entre losrouters de frontera; de sta forma, dos routers que estnconectados a travs de un circuito virtual ven unaadyacencia directa entre ellos independiente de la rutafsica. El modelo de cubierta basado en ATM o FrameRelay posibilita a un administrador de red o a unautmata beneficiarse de los conceptos de ingeniera detrfico para realizar la optimizacin de rutas de maneraque un circuito virtual sobre un enlace fsicocongestionado o no ptimo pueda ser re-enrutado a unenlace menos congestionado o ms ptimo. En estemodelo, TE tambin es empleado para establecerrelaciones entre los parmetros de gestin de trficodependiente de la tecnologa de circuitos virtuales y deltrfico actual que atraviese cada circuito.

El modelo de cobertura usando IP sobre ATM requierela administracin de dos redes separadas con diferentestecnologas (IP y ATM) resultando en un incremente de

la complejidad operacional y costos. Mediante Constrained-Based Routing, CBR

(Encaminamiento restringido), el administrador de lared puede seleccionar determinadas rutas para serviciosespeciales con distintos niveles de calidad (garantasexplcitas de retardo, ancho de banda, fluctuacin,prdida de paquetes, etc.). CBR puede determinar lasrutas de acuerdo a ciertas restricciones (como: ancho debanda disponible, restr icciones administrativas, etc.), esdecir, este tipo de soluciones considera datos ms allde la topologa de la red para calcular el camino msconveniente.

Tecnologas orientadas a trayectoria tales como MPLS

hacen que el ruteo basado en restricciones sea factible yatractivo en redes IP pblicas. CBR, MPLS y TE pararedes IP son definidas en el RFC 2702.

Como se ha mencionado MPLS, es usada paraproporcionar TE. Actualmente existe una ampliavariedad de protocolos utilizados para la distribucin deetiquetas. La arquitectura MPLS no especifica uno deestos en particular, sino que, ms bien, recomienda sueleccin dependiendo de los requerimientos especficosde la red. Los protocolos utilizados pueden agruparse endos grupos: protocolos de enrutamiento explcito yprotocolos de enrutamiento implcito. El enrutamientoexplcito es idneo para ofrecer ingeniera de trfico y

permite la creacin de tneles. El enrutamientoimplcito, por el contrario, permite el establecimiento deLSPs pero no ofrece caractersticas de ingeniera detrfico [Sienra L., 2003].

Entre los protocolos de enrutamiento explcito mscomunes estn: el protocolo LDP de Ruta Restringida (CR-LDP) y el Protocolo de Reservacin de Recursos conIngeniera de Trfico (RSVP-TE). El primero de estosprotocolos, en adicin a LDP (protocolo de enrutamiento

implcito), permite negociar con anticipacin una ruta enespecial, es decir, se podr establecer LSPs punto a puntocon calidad de servicio en MPLS. CR-LDP es un protocolode estado slido, es decir, que despus de haberseestablecido la conexin, sta se mantiene "abierta" hasta quese le indique lo contrario. RSVP-TE opera de manera similarque CR-LDP, pues permite negociar un LSP punto a puntoque garantice un nivel de servicio de extremo a extremo. Ladiferencia es que CR-LDP permite negociar una ruta para latransmisin de informacin, misma que debe "refrescarse"constantemente para que sta se mantenga activa (estadoblando). Mediante estos ltimos protocolos y la aplicacinde distintas estrategias de ingeniera de trfico es posibleasignar diferentes niveles de calidad de servicio en redesMPLS.

Recomendaciones para Ingeniera de Trfico

En [ITU, Villn] se proponen algunas recomendacionespara la Ingeniera de trfico clasificadas segn 4 de sus ms

grandes tareas. As mismo en [RFC-3272, Awduche] sedescriben recomendaciones de alto nivel para ITE.Segn [RFC-3272, Awduche], las recomendaciones

describen las capacidades necesarias para resolverproblemas de TE o para conseguir los objetivos de TE.Hablando en trminos generales, estas recomendacionespueden ser categorizadas como funcionales (funciones que elsistema de TE debera realizar; necesarias para realizar losobjetivos de TE direccionando los problemas de TE) y no-funcionales (relacionadas con los atributos de calidad ocaractersticas de estado del sistema de TE; pueden contenerafirmaciones conflictivas y pueden en algunas ocasiones serdificultosas para precisar de forma cuantitativa).

As mismo en [Feamster N., 2003] se presentan unasguas para proporcionar ingeniera de trfico entre dominios;especficamente se discute algunas aproximaciones dentrodel contexto de BGP (Border Gateway Protocol), protocoloque por s solo no facilita las tareas comunes de TE.

REDES NEURONALES ARTIFICIALES

El cerebro humano, sin duda la red neuronal mscompleja que existe, consta de unos cien mil millones deneuronas, cada una de las cuales est conectada con hastavarios miles de otras neuronas, produciendo entre ellas entorno a 1015 conexiones o sinapsis. La idea de las redes

neuronales fue concebida originalmente como un intento demodelar la biofisiologa del cerebro humano, esto es,entender y explicar como funciona y opera el cerebro. Lameta era crear un modelo capaz en emular el procesohumano de razonamiento. La mayor parte de los trabajosiniciales en redes neuronales fue realizada por fisilogos yno por ingenieros [TREC, 2005].


6/20


ARN, antecedentes

Walter Pitts y Warren McCulloch intentaron explicar en1943 el funcionamiento del cerebro humano, por medio deuna red de clulas conectadas entre s podan ejecutaroperaciones lgicas.

Las neuronas, al igual que las dems clulas del cuerpo,

funcionan a travs de impulsos elctricos y reaccionesqumicas. Los impulsos elctricos que utiliza una neuronapara intercambiar informacin con otras neuronas de unared, viajan por el axn que hace contacto con las dendritasde la neurona vecina mediante lassinpsis . La intensidad dela corriente transmitida depende de la eficiencia de latransmisin sinptica. La seal que se transmite a la neuronapodr ser adems ya sea inhibitoria o excitatoria. La neuronadispara, esto es, manda el impulso por su axn, si laexcitacin excede su inhibicin por un valor crtico, elumbral de la neurona.[TREC, 2005]

En 1949, el fisilogo Donald Hebb expuso en su libroThe Organitation of Behavior la conocida regla de

aprendizaje. Su propuesta tenia que ver con la conductividadde la sinapsis, es decir, con las conexiones entre neuronas.Hebb expuso que la repetida activacin de una neurona porotra a travs de una sinapsis determinada, aumenta suconductividad, y la haca ms propensa a ser activadasucesivamente, induciendo a la formacin de un circuito deneuronas estrechamente conectadas entre s.

Durante el verano de 1951, Minsky y Edmonsmontaron la primera mquina de redes neuronales,compuesta bsicamente de 300 tubos de vaco y un pilotoautomtico de un bombardero B-24 (en desuso porsupuesto). Llamaron a su creacin "Sharc", se trataba nadamenos que de una red de 40 neuronas artificiales que

imitaban el cerebro de una rata.En 1957, Frank Rosenblatt present al Perceptrn, unared neuronal con aprendizaje supervisado cuya regla deaprendizaje era una modificacin de la propuesta por Hebb.En 1969, Marvin Minsky y Seymour Paper escribieron unlibro llamado Perceptrons, en donde definan a estos comocaminos sin salida. Tambin es verdad que indagaron enellos y sacaron conclusiones muy curiosas e interesantes,pero dado que ambos eran dos personalidades de peso en elmundo de la IA, en cuanto se public el libro, todas lasinvestigaciones a cerca de Perceptrones se paralizaron yanularon.

En los aos 60 se propusieron otros dos modelos,tambin supervisados, basados en el Perceptrn deRosenblatt denominados Adaline y Madaline. En estos, laadaptacin de los pesos se realiza teniendo en cuenta elerror, calculado como la diferencia entre la salida deseada yla dada por la red, al igual que en el Perceptrn. Sinembargo, la regla de aprendizaje empleada es distinta.

La era moderna de las redes neuronales artificialessurge con la tcnica de aprendizaje de propagacin haciaatrs o Backpropagation. En 1977, James Andersondesarroll un modelo lineal, llamado Asociador Lineal, que

consista en unos elementos integradores lineales (neuronas)que sumaban sus entradas. En 1982 John Hopfield presentun trabajo sobre redes neuronales en la Academia Nacionalde las Ciencias; en el cual describe con claridad y rigormatemtico una red a la que ha dado su nombre, que viene aser una variacin del Asociador Lineal. En este mismo aola empresa Fujitsu comenz el desarrollo de computadorespensantes para aplicaciones en robtica.

Caractersticas

Las redes neuronales tienen su origen en la observacinde los sistemas neuronales de los organismos vivientes, sinembargo, stas no son un fiel reflejo de dichas redesbiolgicas.

Las RNA estn compuestas de un gran nmero deelementos de procesamiento altamente interconectados(neuronas) que trabajan al mismo tiempo en la solucin deproblemas especficos. Las RNA, tal como las personas,aprenden de la experiencia.

Se trata de una nueva forma de computacin que escapaz de manejar las imprecisiones e incertidumbres queaparecen cuando se trata de resolver problemas relacionadoscon el mundo real (reconocimiento de formas, toma dedecisiones, etc.), ofreciendo soluciones robustas y de fcilimplementacin.

Las RNA estn compuestas de muchos elementossencillos que operan en paralelo, el diseo de la red estdeterminado por las conexiones entre sus elementos. Aligual que las conexiones de las neuronas cerebrales.

Las RNA han sido entrenadas para la realizacin defunciones complejas en variados campos de aplicacin. Hoyen da pueden ser entrenadas para la solucin de problemasque son difciles para sistemas computacionales comunes opara el ser humano, un ejemplo es su aplicacin en laIngeniera de Trfico. Entre las caractersticas msrelevantes tenemos:1. Comportamiento altamente no-lineal, lo que les permite

procesar informacin procedente de otros fenmenosno-lineales. Esta propiedad las hace convenientes enciertas aplicaciones, donde, una avera puede constituirun serio peligro.

2. Posibilidad de procesamiento paralelo, aspecto queaprovechado en la implementacin lleva a aumentarconsiderablemente la velocidad de procesamiento.

3. Inclinacin natural a adquirir el conocimiento a travsde la experiencia, el cual es almacenado, al igual que en

el cerebro, en el peso relativo de las conexiones nterneuronales.

4. Altsima plasticidad y gran adaptabilidad, son capacesde cambiar dinmicamente con el medio.

5. Alto nivel de tolerancia a fallas, es decir, pueden sufrirun dao considerable y continuar teniendo un grancomportamiento, al igual que ocurre con los sistemasbiolgicos.


7/20


Estas caractersticas, entre otras, hacen de las redesneuronales una herramienta fundamental en varios camposdel conocimiento. [UPVG, dESALL]

Representacin de una RNA

Una RNA es una coleccin de procesadores paralelos

conectados entre ellos en forma de un grafo dirigido,organizados de tal manera que la estructura de la red noslleva por s misma a considerarla como una caracterstica atener en cuenta a la hora de crear una RNA. Podemosrepresentar de manera sistemtica cada elemento de proceso(unidad) de la red como un nodo, con conexiones entreunidades representadas mediante arcos, adems estos arcosnos indican la direccin en la que fluye la informacin.

De manera formal Rumelhart defini los componentesde un sistema neuronal:1. Un conjunto de procesadores elementales o neuronas2. Un patrn de conectividad entre las neuronas o

arquitectura

3.

Una dinmica de activaciones.4. Una regla de aprendizaje5. El entorno donde opera

FIGURA 3.SISTEMA DE REDNEURONAL ARTIFICIAL [MARTINEZ I.]

Arquitectura y Topologa de las RNA

Una RNA de gran tamao consta a lo sumo de varioscentenares de neuronas y algunos miles de pesos sinpticos(el peso de sus conexiones).

Las neuronas artificiales estn conectadas unas conotras, formando una estructura de red. Esta conexin, cuyonombre tcnico es sinapsis, no es meramente arquitectnica.Las neuronas pueden comunicarse entre s a travs de lasinapsis, es decir son capaces de transmitirse informacinentre ellas. Esta informacin est ponderada en funcin del

peso o fuerza de la relacin que las une, es decir, es diferentepara cada par de neuronas; y asimismo, puede variar a lolargo del tiempo.

A su vez, la cantidad de informacin que llega a unaneurona, procedente de otras, puede ser ampliada o reducidapor sta, y el resultado a su vez enviarse a otras neuronas.Cada neurona se comporta como un pequeo sistema deprocesamiento de informacin.

La conexin entre neuronas sigue una cierta estructura,ya que stas se organizan en capas, de forma que la mayorade las conexiones se dan entre neuronas de capas contiguas4.

A efectos de diseo y desarrollo, es aconsejable pensaren las redes neuronales como si realmente cada neuronafuese una unidad de proceso individualizada. Existen en laactualidad varias decenas de modelos distintos de redesneuronales artificiales, siendo el ms habitual el denominadomultiperceptrn con entrenamiento por retropropagacin(backpropagation).

Se entiende por topologa de una red el conjunto deparmetros que definen su arquitectura: el nmero de capas,el nmero de neuronas por capa y el grado de conectividad

entre las neuronas. El multiperceptrn es una red de lasdenominadas feedward, o de alimentacin hacia delante. Enl la informacin slo fluye de las neuronas de una capahacia las neuronas de la capa siguiente, distinguindose portanto una capa de entrada (la primera), una capa de salida (laltima) y capas ocultas (todas las intermedias). [Pizarro F]

Elementos De Una Red Neuronal ArtificialNormalmente una neurona recibe muchas y mltiples

entradas simultneas. Cada entrada tiene su propio pesorelativo el cual proporciona la importancia de la entradadentro de la funcin de agregacin de la neurona. Estospesos realizan la misma funcin que realizan las fuerzassinpticas de las neuronas biolgicas. En ambos casos,algunas entradas son ms importantes que otras de maneraque tienen mayor efecto sobre el procesamiento de laneurona al combinarse para producir la respuesta neuronal.

FIGURA 4.ELEMENTO BSICOS DE UNA NEURONA ARTIFICIAL

Entradas Xj a la neurona.Los pesosson coeficientes que pueden adaptarse dentro

de la red que determinan la intensidad de la seal de entrada

registrada por la neurona artificial. Ellos son la medida de lafuerza de una conexin de entrada. Estas fuerzas pueden sermodificadas en respuesta de los ejemplos de entrenamientode acuerdo a la topologa especfica o debido a las reglas deentrenamiento.

4Nota explicativa: se suelen distinguir en el cerebro humano 6 7 capas


8/20


Funcin De Propagacin

Esta regla permite obtener, a partir de las entradas y lospesos el valor del potencial postsinptico hide la neurona:

( ) jij xwithi ,!= (1)

La funcin ms habitual es la suma ponderada de todas

las entradas. Podemos agrupar las entradas y pesos en dosvectores (X1;X2; ::: Xn) y (W1j ;W2j ; :::Wnj) podemoscalcular esta suma realizando el producto escalar sobre estosdos vectores.

( ) jijj

i xwth .!= (2)

La funcin de propagacin puede ser ms compleja quesimplemente una suma de productos. Las entradas y lospesos pueden ser combinados de diferentes maneras antes depasarse el valor a la funcin de activacin. Por ejemplopodemos usar como funcin de propagacin, el mnimo,mximo, la mayora, producto, o diversos algoritmos denormalizacin. El algoritmo especfico para la propagacinde las entradas neuronales est determinado por la eleccinde la arquitectura.

Funcin De Activacin O Transferencia

El resultado de la funcin de propagacin, en la mayorade los casos es una suma ponderada, es transformada en lasalida real de la neurona mediante un proceso algortmicoconocido como funcin de activacin.

ai t( ) = fi ai t"1( ),hi t( )( ) (3)En la funcin de activacin el valor de la salida de

combinacin puede ser comparada con algn valor umbralpara determinar la salida de la neurona.

Si la suma es mayor que el valor umbral, neurona

generar una seal. Si la suma es menor que el valor umbral,ninguna seal ser generada.Normalmente el valor umbral, o valor de la funcin de

transferencia, es normalmente no lineal. El uso de funcioneslineales es limitado ya que el valor de la salida esproporcional al de la entrada, de hecho este fue uno de losproblemas en los primeros modelos de redes neuronalescomo fue identificado por Minsky y Papert en Perceptrons.La funcin de activacin pudiera ser algo tan simple comodependiente sobre si el resultado de la funcin decombinacin es positivo o negativo.

FIGURA 5.TIPOS DE FUNCIONES DE ACTIVACIN

De las funciones presentadas en la figura anterior,destacan las funciones sigmoidales. Desde el punto de vistamatemtico, la utilidad de estas funciones es que ella y sus

derivadas son continuas. Estas funciones funcionan bastantebien y son normalmente las elegidas.

Antes de aplicar la funcin de activacin, se puedeaadir cierto ruido a las entradas. La fuente y la cantidad deeste ruido estn determinadas por el modo de entrenamientode una red particular. Este ruido normalmente es conocidocomo temperatura de la neurona. De hecho, al aadirdiferentes niveles de ruido al resultado de la combinacinlleva a crearse un modelo ms parecido al cerebro. El usodel ruido por temperatura est an en fase de investigacin yno es aplicado habitualmente en las aplicaciones.

Escalamiento y Limitacin

El valor de salida de la funcin de activacin puede serprocesado de manera adicional mediante un escalamiento ylimitacin. El escalamiento simplemente multiplica el valorde la funcin de transferencia por un factor de escala ydespus se le suma un desplazamiento.

El mecanismo de limitacin es el que asegura que elresultado del escalamiento no excede una cota superior oinferior. Esta limitacin se realiza de manera adicional a loslmites que puede imponer la funcin de transferenciaoriginal.

Normalmente este tipo de escalamiento y limitacin esusado principalmente en topologas usadas para verificarmodelos neuronales biolgicos.

Funcin de salida (Competitividad) Cada elemento deprocesamiento tiene permitido una nica salida Yi(t)quepuede estar asociada con un nmero elevado de otrasneuronas.

Normalmente, la salida es directamente equivalente alvalor resultante de la funcin de activacin.

( ) ( )( ) ( )tataFtyiiii

== (4)


9/20


Algunas topologas de redes neuronales, sin embargo,modifican el valor de la funcin de transferencia paraincorporar un factor de competitividad entre neuronas quesean vecinas. Las neuronas tienen permitidas competir entreellas, inhibiendo a otras neuronas a menos que tengan unagran fortaleza.

Funcin De Error Y El Valor Propagado Hacia Atrs

En la mayora de algoritmos de entrenamiento de redesneuronales necesitamos calcular la diferencia entre la salidaactual y la esperada. Esta diferencia es transformada por lafuncin de error correspondiente a la arquitectura particular.El error de la neurona se propaga normalmente dentro delalgoritmo de aprendizaje de otra neurona. Este trmino deerror es algunas veces denominado error actual. El erroractual normalmente es propagado hacia atrs a la capaanterior, siendo este valor o bien el valor actual de error deesa capa obtenido al escalarlo de alguna manera (lo habituales usando la derivada de la funcin de transferencia) o bien

es tomado como la salida esperada (esto sucede en algunastopologas).Normalmente el valor que propagamos hacia atrs, una

vez escalado por la funcin de aprendizaje, se multiplica porlos pesos de la neurona para modificarlas antes de pasar alciclo siguiente.

Tasa de Aprendizaje

La tasa de aprendizaje de la RNA depende de distintosfactores controlables que hay que tener en cuenta.Obviamente, un valor bajo de tasa de entrenamiento equivalea que necesitamos gastar mucho tiempo para llevar a cabo elentrenamiento para producir una RNA bien entrenada. Con

valores de entrenamiento mayores, la red puede no ser capazde discriminar de manera tan adecuada como un sistema queaprende ms despacio.

Generalmente, factores adicionales a parte del tiempotienen que ser considerados cuando se discute elentrenamiento off-line: Complejidad de la red: tamao, paradigma, arquitectura Tipo de algoritmo de aprendizaje empleado. El error admitido de la red final.

Si cambiamos alguno de estos factores podemos oaumentar el tiempo de entrenamiento a un valor elevado uobtener un error inaceptable.

La mayora de algoritmos de aprendizaje requieren quese les pase una tase de aprendizaje, o un trmino unaconstante de aprendizaje. Normalmente este trmino es unvalor positivo entre 0 y 1.

Si la tasa de aprendizaje es mayor que 1, es fcil para elalgoritmo de aprendizaje provocar que se creen pesosincorrectos y la red oscilara. Pequeos valores de tasa deaprendizaje no corregirn el error actual de manera rpida.[6]

EVALUACIN DEL TIPO DE RED NEURONAL AUTILIZAR

Segn el nmero de capas:

Redes Neuronales Monocapa

Las redes monocapa son redes con una sola capa. Paraunirse las neuronas crean conexiones laterales para conectarcon otras neuronas de su capa. Las redes ms representativasson la red de Hopfield, la red BRAIN-STATE-IN-A-BOX omemoria asociativa y las maquinas estocsticas deBotzmann y Cauchy. Entre las redes neuronales monocapa,existen algunas que permiten que las neuronas tenganconexiones a si mismas y se denominan autorecurrentes.Las redes monocapa han sido ampliamente utilizada encircuitos elctricos ya que debido a su topologa, sonadecuadas para ser implementadas mediante hardware,usando matrices de diodos que representan las conexiones delas neuronas.

Redes Neuronales MulticapaEs una generalizacin de la anterior existiendo un

conjunto de capas intermedias entre la entrada y la salida(capas ocultas). Este tipo de red puede estar total oparcialmente conectada.

Segn el Tipo de Conexiones:

Redes Neuronales No Recurrentes.

En esta red la propagacin de las seales se produce enun sentido solamente, no existiendo la posibilidad derealimentaciones. Lgicamente estas estructuras no tienen

memoria.Redes Neuronales Recurrentes.

Esta red viene caracterizada por la existencia de lazosde realimentacin. Estos lazos pueden ser entre neuronas dediferentes capas, neuronas de la misma capa o, mssencillamente, entre una misma neurona. Esta estructurarecurrente la hace especialmente adecuada para estudiar ladinmica de sistemas no lineales.

Segn el Grado de Conexin:

Redes Neuronales Totalmente Conectadas

En este caso todas las neuronas de una capa se

encuentran conectadas con las de la capa siguiente (redes norecurrentes) o con las de la anterior (redes recurrentes).

Redes Parcialmente Conectadas.

En este caso no se da la conexin total entre neuronasde diferentes capas. Estas estructuras neuronales se podranconectar entre s para dar lugar a estructuras mayores:estamos en el nivel de la mesoestructura. Esta conexin sepuede llevar a cabo de diferentes formas siendo las msusuales las estructuras en paralelo y jerrquicas. En la


10/20


primera estructura se plantea un consenso entre lasdiferentes redes para obtener la salida mientras que en laestructura jerrquica existen redes subordinadas a otras queactan como elementos centrales en la salida final de la red.[8]

Redes Neuronales Segn Su Aprendizaje:

Redes Neuronales SupervisadasEl entrenamiento de redes neuronales mediante un

profesor se llama el aprender supervisado. Los algoritmos derede supervisadas tienden a ser motivados porrequerimientos de un sistema para realizar una tareaespecfica. Esto conduce a definir bien los algoritmos deentrenamiento de manera que se puedan disear paraoptimizar criterios estadsticos especficos de sufuncionamiento. [9]

Redes Neuronales No Supervisadas

Estas redes generalmente estn inspiradas en modelosde sistemas fisiolgicos, el objetivo principal es que se

llegue a concretar la autoorganizacin. ste es el procesopor el que un sistema aprende automticamente a extraer lainformacin til de los datos de entrada anlogos al procesodel conjunto de anlisis en el campo del reconocimiento depatrones.

Las arquitecturas de red ms populares en esta categorason ART y la red de Kohonen. La red ART proporcionauna simulacin funcional razonable para algunas partes delcerebro basado en modelos fisiolgicos pero proporcionanhasta ahora muy poco que sirva y contine la investigacinalgortmica La red de Kohonen esta ligada intrnsecamente ala idea de mapeo topogrfico y proporciona una tcnica tilpara trazar altos sistemas de datos dimensionales en pocas

dimensiones.

PERCEPTRON

Este modelo se conoce como perceptrn de McCulloch-Pitts, y es la base de la mayor parte de las arquitecturas delas RNA que se interconectan entre s. Las neuronasemplean funciones de activacin diferentes segn laaplicacin, algunas veces son funciones lineales, otrasfunciones sigmoidales, y otras funciones de umbral dedisparo. La eficiencia sinptica se representa por factores de

peso de interconeccinij

w , desde la neurona i, hasta la

neurona j.

Los pesos pueden ser positivos (excitacin) o negativos(inhibicin). Los pesos junto con las funciones f(z) dictan laoperacin de la red neuronal. Normalmente las funciones nose modifican de tal forma que el estado de la red neuronaldepende del valor de los factores de peso (sinpsis) que seaplica a los estmulos de la neurona.

En un perceptrn, cada entrada es multiplicada por elpeso W correspondiente, y los resultados son sumados,siendo evaluados contra el valor de umbral, si el resultado esmayor al mismo, el perceptrn se activa.

LimitantesEl perceptrn es capaz tan slo de resolver funciones

definidas por un hiperplano (objeto de dimensin N-1contenida en un espacio de dimensin N). que corte unespacio de dimensin N. Un ejemplo de una funcin que nopuede ser resuelta es el operador lgico XOR.

Una explicacin mas sencilla de un hiperplano sera,hablando en un plano de dos dimensiones, una lnea quesepara a los elementos existentes en dos grupos. Elperceptrn slo puede resolver una funcin, si todos losposibles resultados del problema pueden separarse de staforma (en dos secciones) es decir, que no se combinen entres.

EntrenamientoEl entrenamiento de un perceptrn es por medio de la

regla de aprendizaje delta:Para cada peso W se realiza un ajuste dW segn la regla:

dW = LR ( T - Y ) XDonde LR es la razn de aprendizaje, T el valor

deseado, Y el valor obtenido, y X la entrada aplicada al

perceptrn.Tipos de PerceptronEl Perceptrn bsico de dos capas (entrada con neuronas

lineales, analgicas, y la de salida con funcin de activacinde tipo escaln, digital) solo puede establecer dos regionesseparadas por una frontera lineal en el espacio de patronesde entrada, donde se tendra un hiperplano.

Un Perceptrn con tres niveles de neuronas puedeformar cualquier regin convexa en este espacio. Lasregiones convexas se forman mediante la inteleccin entrelas regiones formadas por cada neurona de la segunda capa,cada uno de estos elementos se comporta como unPerceptrn simple, activndose su salida para los patrones de

un lado del hiperplano.Un Perceptrn con cuatro capas puede generar regionesde decisin arbitrariamente complejas. El proceso deseparacin en clases que se lleva a cabo consiste en laparticin de la regin deseada en pequeos hipercubos. Cadahipercubo requiere 2n neuronas en la segunda capa (siendo nel nmero de entradas a la red), una por cada lado delhipercubo, y otra en la tercera capa, que lleva a cabo el andlgico de la salida de los nodos del nivel anterior. La salidade los nodos de este tercer nivel se activarn solo para lasentradas de cada hipercubo. Los hipercubos se asignan a laregin de decisin adecuada mediante la conexin de lasalida de cada nodo del tercer nivel solo con la neurona de

salida (cuarta capa) correspondiente a la regin de decisinen la que este comprendido el hipercubo llevndose a cabouna operacin lgica Or en cada nodo de salida. Esteprocedimiento se pude generalizar de manera que la formade las regiones convexas sea arbitraria, en lugar dehipercubos.

En teora, el Perceptrn de 4 capas puede resuelve unagran variedad de problemas cuyas entradas sean analgicas,la salida sea digital y sea linealmente separable. El problemaprctico radica en el numero de neuronas, en el numero


11/20


idneo de capas ocultas, la extensin de la funcin deactivacin, el tiempo de entrenamiento de la red, lasimplicaciones en la generacin de ruido (al tener un numeroexcesivo de neuronas) en contraparte con la ventaja de tenerun sistema tolerante a fallas al tener un numero de neuronasredundante.

Aplicaciones Del PerceptronEl rango de tareas que el Perceptrn puede manejar es

mucho mayor que simples decisiones y reconocimiento depatrones. Por ejemplo, se puede entrenar una red para formarel tiempo pasado de los verbos en ingles, leer texto en inglesy manuscrito. El Perceptrn multicapa (MLP) puede serusado para la prediccin de una serie de datos en el tiempo;tal a sido su xito en la medicin de la demanda de gas yelectricidad, adems de la prediccin de cambios de valor endiversos campos.

BACKPROPAGATION

Backpropagation es un tipo de red de aprendizajesupervisado, que emplea un ciclo propagacin adaptacinde dos fases. Una vez que se ha aplicado un patrn a laentrada de la red como estmulo, este se propaga desde laprimera capa a travs de las capas superiores de la red, hastagenerar una salida. La seal de salida se compara con lasalida deseada y se calcula una seal de error para cada unade las salidas.

Las salidas de error se propagan hacia atrs, partiendode la capa de salida, hacia todas las neuronas de la capaoculta que contribuyen directamente a la salida. Sin embargolas neuronas de la capa oculta solo reciben una fraccin de laseal total del error, basndose aproximadamente en la

contribucin relativa que haya aportado cada neurona a lasalida original. Este proceso se repite, capa por capa, hastaque todas las neuronas de la red hayan recibido una seal deerror que describa su contribucin relativa al error total.Basndose en la seal de error percibida, se actualizan lospesos de conexin de cada neurona, para hacer que la redconverja hacia un estado que permita clasificarcorrectamente todos los patrones de entrenamiento.

Estructura: Una red backpropagation o multicapa tieneuna capa de entrada, una capa de salida, y al menos una capaoculta de neuronas internas. No hay ningn lmite terico enel nmero de capas ocultas pero normalmente es una o dos.En la siguiente figura se puede observar estructura tpica deeste tipo de redes neuronales:

En esta red se interconectan varias unidades deprocesamiento en capas, en la cual las neuronas de cada capano se interconectan entre s, pero cada neurona de una capaproporciona una entrada a cada una de las neuronas de lasiguiente capa, con la finalidad de que cada neuronatransmita su seal de salida a cada neurona de la capasiguiente.

Regla de Aprendizaje, el algoritmo Backpropagationpara redes multicapa es una generalizacin del algoritmo

LMS, ambos algoritmos realizan su labor de actualizacin depesos y ganancias con base en el error medio cuadrtico. Lared Backpropagation trabaja bajo aprendizaje supervisado ypor tanto necesita un set de entrenamiento que le describacada salida y su valor de salida esperado de la siguienteforma:

{p1,t1}, {p2,t2}, . . .

,{pQ, tQ}

Donde pQ es una entrada a la red y tQ es lacorrespondiente salida deseada para el patrn q-simo. Elalgoritmo debe ajustar los parmetros de la red paraminimizar el error medio cuadrtico.

El entrenamiento de una red neuronal multicapa serealiza mediante un proceso de aprendizaje, para realizareste proceso se debe inicialmente tener definida la topologade la red esto es: nmero de neuronas en la capa de entradael cual depende del nmero de componentes del vector deentrada, cantidad de capas ocultas y nmero de neuronas decada una de ellas, nmero de neuronas en la capa de la salidael cual depende del nmero de componentes del vector desalida o patrones objetivo y funciones de transferenciarequeridas en cada capa, con base en la topologa escogidase asignan valores iniciales a cada uno de los parmetros queconforma la red.

Es importante recalcar que no existe una tcnica paradeterminar el nmero de capas ocultas, ni el nmero deneuronas que debe contener cada una de ellas para unproblema especifico, esta eleccin es determinada por laexperiencia del diseador, el cual debe cumplir con laslimitaciones de tipo computacional.

Cada patrn de entrenamiento se propaga a travs de la

red y sus parmetros para producir una respuesta en la capade salida, la cual se compara con los patrones objetivo osalidas deseadas para calcular el error en el aprendizaje, esteerror marca el camino mas adecuado para la actualizacin delos pesos y ganancias que al final del entrenamientoproducirn una respuesta satisfactoria a todos los patrones deentrenamiento, esto se logra minimizando el error mediocuadrtico en cada iteracin del proceso de aprendizaje.

La deduccin matemtica de este procedimiento serealizar para una red con una capa de entrada, una capaoculta y una capa de salida y luego se generalizar pararedes que tengan ms de una capa oculta.

Algoritmos de aprendizaje asociativo para redes no

supervisadasUno de los algoritmos de aprendizaje de las redes nosupervisadas es el asociativo, el cual pretende extraer lascaractersticas de los datos de entrada. Una asociacin escualquier vnculo entre la entrada de un sistema y sucorrespondiente salida.

Las redes con aprendizaje autosupervisado no requiereninfluencia externa para ajustar los pesos de las conexionesentre sus neuronas, la red no recibe ninguna informacin porparte del entorno que le indique si la salida generada en


12/20


respuesta a una determinada entrada es o no correcta, porello suele decirse que estas redes son capaces deautoorganizarse.

Estas redes encuentran las caractersticas, regularidades,correlaciones o categoras que se puedan establecer entre losdatos que se presenten en su entrada; puesto que no haysupervisor que indique a la red la respuesta que debe generarante una entrada concreta.

En algunos casos, la salida presenta el grado defamiliaridad o similitud entre la informacin que se le estapresentando en la entrada de la red y las informaciones quese le han presentado hasta entonces, en otro caso la redpodra realizar una clusterizacin o establecimiento decategoras, indicando la salida de la red a que categorapertenece la informacin presentada a la entrada, siendo lapropia red quien deba encontrar las categoras apropiadas apartir de correlaciones entre las informaciones presentadas.

Aprendizaje CompetitivoEn este tipo de aprendizaje las neuronas compiten entre

ellas con el propsito de llevar a cabo una tarea dada.

Cuando se le presenta a la red datos de entrada solo deberactivarse solo una de las neuronas de salida de la red o unapor cada grupo de neuronas, por tanto las neuronas compitenpara activarse quedando finalmente una, o una por grupo,como vencedora y el resto quedan anuladas, con el objetivode categorizar (clusterizar) los datos que se introducen en lared. La regla de aprendizaje que nos permite entrenar lospesos en una red competitiva sin conocer los vectoresprototipo es la regla Instar, por lo que para redescompetitivas a tiene un valor de cero solamente para laneurona ganadora (i=i*).

Entonces, la fila de la matriz de pesos ms cercana alvector de entrada, se inclinar al vector entrada.

)( anteriorii

anteriori

nuevoi

wpww !+= " Se clasificarn los vectores en grupos. Se otorgan pesos aleatorios. Luego se encuentra el vector de peso ms cercano a la

entrada. Aplica la regla de Kohonen a la neurona ganadora con

una rata de aprendizaje, esta regla permitir que el pesotienda ms hacia el vector de entrada.

APLICACIONES DE REDES NEURONALES ENINGENIERA DE TRFICO

En la seccin anterior se describieron aspectosrelacionados a las Redes Neuronales Artificiales, rea de laInteligencia Computacional, que desde que a mediados de ladcada de los 80s, el grupo PDP (Paralell DistributedProcessing) populariz el algoritmo de aprendizaje deretropropagacin hacia atrs, tuvo un interesante e imparabledesarrollo, influenciado tambin con la posterior propuestade otros modelos y la comprobacin de Kolmorov de quearquitecturas de caractersticas similares al perceptrnmulticapa, con una nica capa oculta, resultaba ser un

aproximador universal de funciones [Del Brio, M., pg. 64];es decir, formalmente cualquier problema real generalmente complejos y no lineales- puede ser resueltosmediante este tipo de sistemas.

El mbito de aplicacin de las Redes NeuronalesArtificiales, RNA, en las Redes y Telecomunicaciones puedeser muy importante, considerando por un lado el tipo deproblemas a resolver, por ejemplo, relacionados al trfico dedatos, y por otro lado, las soluciones que pueden serproporcionas por las redes neuronales para este tipo deproblemas. A continuacin, se enlista algunas de lascaractersticas de las RNA que pueden ser determinantes a lahora de considerarlas en la aplicacin en reas como lacitada. Las redes neuronales artificiales, a travs de su proceso

de entrenamiento son capaces de determinar relacionesno lineales entre un conjunto de datos, asociando apatrones de entrada la o las salidas correspondientes. Esas, que algunos modelos de RNA son utilizados paradeterminar proyecciones a partir de una fuente de datos;

esta caracterstica puede ser aprovechada para realizarpredicciones, por ejemplo, para determinar ancho debanda disponible, detectar patrones de congestin detrfico, predecir el uso de recursos -como enlaces- eincluso para establecer o mejorar algoritmos deencaminamiento y en general para aplicar en tareasrelacionadas a la Ingeniera de Trfico.

Los tipos de aprendizaje disponibles para algunosmodelos: aprendizaje por lotes (batch) y aprendizaje enserie (on line) puede utilizarse para tareas de predicciny clasificacin, dependiendo de los datos que sedisponga y la capacidad de procesamiento disponible,por ejemplo, el aprendizaje en serie es habitualmente

empleado en aquellos problemas en los que se disponede un muy numeroso conjunto de patrones deentrenamiento. Con estas capacidades se podraprocesar -en tiempo real o fuera de lnea- los archivosde traza generados por algunos equipos y aplicacionesde comunicaciones sobre el uso de recursos en la red ycon las salidas proporcionadas por las RNA poderfacilitar tareas de la Ingeniera de Trafico como:modelamiento del trfico; control, optimizacin ydimensionamiento de la red.

Modelos supervisados como el Perceptrn Multicapamediante el algoritmo backpropagation o modelos nosupervisados como mapas de Kononen -por su

capacidad de memorizar patrones-, pueden ser aplicadospara extraer o cancelar el ruido de las seales. Una red neuronal tiene en cuenta los cambios en las

condiciones del entorno y puede adaptarse por s mismaa los cambios; es decir, una vez que la red ha sidoentrenada y probada, ser de capaz de establecer lasrelaciones aprendidas sobre un nuevo conjunto da datos.

Una aproximacin basada en RNA puede aprender losmodelos especficos de cada sistema de red yproporcionar aproximaciones aceptables de los sistemas


13/20


reales subyacentes.Ahora se citar algunas caractersticas de las tareas a

cubrir por la Ingeniera de Trfico y ms adelante sedetallar algunos proyectos de aplicacin de las RNA en starea. Medir y predecir el rendimiento de la red. El uso de los

recursos de red compartidos y el ancho de banda sondinmicos, vara con el tiempo [Eswaradass, A]. Portanto, la prediccin de ancho de banda resulta ser unatarea compleja para ser tratada con mtodostradicionales como la Estadstica. Adems

Modelamiento de los sistemas de red. Esta es una tareacompleja, que puede ser resuelta mediante redesneuronales capaces de representar sistemas no-lineales(la naturaleza del trfico de red es no lineal y complejade modelar, por tanto, de predecir). Adems lasestadsticas de trfico de diferentes aplicaciones indicanque cada tipo de trfico presenta un patrn de trficodiferente. Usando una red neuronal se puedecaracterizar los patrones de trfico generales para

ocultar la heterogeneidad del trfico de red [Eswaradass,A].

Planificacin de red. En determinados instantes, puedeexistir congestin sobre ciertos recursos de red, portanto, una red neuronal al ser capaz de establecerpatrones que modelen la naturaleza del trfico, se podrestablecer mecanismos para la planificacin de red,proporcionando guas para adaptar adaptar el flujo detrfico a los recursos fsicos de la red -de manera que nohaya recursos congestionados mientras que otros sonsubutilizados, objetivo de la Ingeniera de Trfico-.

Prediccin del ancho de banda

Existen algunas metodologas y herramientas paraestimar la capacidad y disponibilidad de ancho de bandarespectivamente (algunas se citan en [Eswaradass, A]), sinembargo, no proporcionan mtricas completas, por ejemplo,no predicen el ancho de banda. Debido a la heterogeneidad ynaturaleza dinmica del trfico de red, se encuentran pocostrabajos disponibles para predecir el rendimiento de una reden trminos de ancho de banda disponible y latencia[Eswaradass, A].

En [Eswaradass, A] se propone un mtodo deprediccin de ancho de banda disponible, basado en RedesNeuronales Artificiales; la prediccin debe considerardiferentes aplicaciones de red (como TCP, UDP, ICMP y

otros). El sistema ha sido probado sobre archivos de trazatradionales y comparado con un sistema conocido comoNWS (Network Weather Service, modelo usadoampliamente para prediccin). Los resultadosexperimentales demostraron que la aproximacin de redesneuronales siempre proporciona una mejor prediccin mayor precisin en funcin del error global mnimoalcanzado- sobre los sistemas NWS.

Las predicciones han sido realizadas construyendo unaRNA para cada tipo de trfico de red, integrando losresultados parciales para obtener predicciones globales. Enesta propuesta adems se categoriza el ruido y laspredicciones de rendimiento despus de la reduccin deruido.

A continuacin se presentan algunos detalles delmodelo construido, segn se describe en [Eswaradass, A].Aunque no se especifica en el documento, se concluye que eltipo de red utilizado -por la descripcin de la solucin- es elPerceptrn Multicapa, red basada en algoritmos deaprendizaje supervisado; es decir, para que la red aprendadebe proporcionrsele el valor real del ancho de banda y enbase al clculo del error la red ajusta sus pesos.

Tabla a. Descripcin del modelo de red neuronal utilizadopara la prediccin de ancho de bandaParmetros de configuracin

Parmetro Descripcin Valor

Factor deaprendizaje Determina el ritmo de aprendizaje dela red 0.01

Nmero depocas

Indica el nmero de veces que unconjunto de datos es entrenado

700

Arquitectura de la red

Tipo de capa Descripcin

Capa deentrada

Depende del nmero de parmetros seleccionados:timestamp, velocidad promedio de paquetes yvelocidad promedio de bits, 3 en este caso.

Capa oculta 3 capas ocultas y 3 perceptrones por cada capa. Lafuncin de activacin utilizada es la no lineal,sigmoidea.

Capa de salida Ancho de banda disponible/minuto

Patrones de entrenamiento

Se utilizan archivos de traza5histricos y preprocesados, quecontienen el registro del tiempo y datos del trfico de red dediferentes tipos: TCP, ICMP y UDP-. Cada archivo de traza contiene:

paquetes de llegada, con datos como fecha-tiempo, longitud depaquete, direccin IP origen y destino. En [Eswaradass, A] seconsidera que el nmero de paquetes/segundo y el nmero de

bits/segundo son suficientes para producir estimaciones del ancho debanda consumido en cada unidad de tiempo.

Dependiendo del perodo de tiempo para el cual se desea predecir elancho de banda, los paquetes se asignan a depsitos no superpuestosde tamao especficos (por ejemplo, si se requiere predecir para los

prximos 5 minutos, el tamao de depsitos es fijado a 300 segundos;para la presente experimentacin se han elegido depsitos de: 10,

100, 300, 600, 900 y 1800 segundos). Segn [Eswaradass, A] sellama a este proceso, prediccin de un solo paso, pues, se predice paraun determinado perodo de tiempo.

Funcin de coste

La mtrica usada para evaluacin es el error de prediccin relativo,

5Se ha elegido los datos de traza generados en la Universidad de Aucklandporque son archivos de traza que cubren perodos de tiempo adecuados parapoder procesar (un da hasta 2 meses) [Eswaradass, A].


14/20


err.

PredictedValue, es el ancho de banda predecido para los siguientes nsegundos y ActualValue es el ancho de banda real para los siguientesn segundos. El error medio- promedio general de todos los erroresrelativos- es utilizado como la funcin de coste a minimizar.

Software de simulacin

Como se sabe el proceso de aprendizaje en una red supervisada serealiza en dos fases: entrenamiento y prueba; la aproximacin de[Eswaradass, A] usa cada mitad del archivo de traza para cada una delas fases. Para la simulacin del modelo de red diseado, se hautilizado WEKA6, herramienta que ofrece una coleccin de diferentesalgoritmos que implementan tcnicas de minera de datos, incluidaslas redes neuronales.

DISCUSIN SOBRE PROBLEMAS Y VENTAJAS DE LAPROPUESTA BASADA EN ARNS

A continuacin se describen algunos problemas,ventajas y futuros trabajos de la propuesta basada en redesneuronales. A ms parmetros y datos de entrada, la precisin de los

resultados es mejor; sin embargo, el incremento de losparmetros y datos de entrada aumenta el tiempo deprediccin y entrenamiento de la red [Eswaradass, A].Por tanto, se debe analizar los archivos de traza, paraidentificar pequeos conjuntos de datos y parmetros deentrada.

La seleccin de parmetros se puede realizar mediantela tcnica conocida como: anlisis de componentesprincipales , implementada por un modelo de red nosupervisado; es decir, se podra proporcionar todos loscomponentes de un patrn de entrada a una red neuronalsupervisada y sus salidas constituirse en las entradaspara la red neuronal supervisada.

Otro problema es seleccionar un conjunto deentrenamiento apropiado, segn se ha verificado en[Eswaradass, A] el rendimiento de la prediccinmediante RNA no es satisfactoria para archivos de trazade pequeo alcance -que contengan datos para un par dehoras o menos de 1 da-, ni para archivos que contengadatos de trfico de ms de 3 semanas; ms bien se hacomprobado que para entrenar la red es suficiente quelos archivos contengan datos de 7 a 10 das.

El costo de construccin de una RNA en general es

mayor que aquellos sistemas de prediccin que usanmodelos de prediccin lineal.

La propuesta es factible y prctica, se puede utilizarcomo componente nico de prediccin o puede serincorporado a sistemas como NWS para una mejorprediccin de red.

6Weka es un paquete de software libre para minera de datos; contieneherramientas para pre-procesamiento de datos, clasificacin, regresin,agrupamiento, reglas de asociacin y visualizacin.

Las predicciones basadas en la propuesta de RNAofrece resultados en un 5.5% menos que el sistemaNWS.

La propuesta utiliza aprendizaje por lotes, es decir,considera como patrones de entrenamiento archivos detraza histricos, el siguiente paso es proporcionarprediccin en tiempo de ejecucin, para esto se deberautilizar la versin del algoritmo para procesamiento enlnea.

Tabla b. Diferencia del error global de los sistemas NWS yRNA

Prediccinoriginal

Antes deeliminar elruido

Despus deeliminar el ruido

IV 1.39% 2.33% 3.14%AUCKLAND

II 2.49% 3.68% 5%

La tabla anterior resume los resultados experimentales

de la prediccin de trfico original; la prediccin despus deanalizar la composicin del trfico de red (antes de reducir elruido) y la prediccin despus de remover los componentesinsignificantes del trfico de red (despus de reducir elruido, quitando trfico UDP y ICMP y conservando soloTCP, trfico predominante en un 95%). Como se observa elporcentaje de error que ms se reduce es cuando seconsidera la prediccin separada para cada tipo de trfico llegando hasta un 5%-; esto demuestra que si el archivo detraza estuviera formado por datos de trfico en una solaaplicacin, la prediccin puede ser an ms precisa.

Clasificacin de trfico de Internet

La clasificacin de trfico de Internet puede teneralgunas motivaciones, por ejemplo, para diferenciarservicios o para aplicar esquemas de seguridad de red7. Elmecanismo tradicional de clasificacin se basa en el valordel campo:puerto, del encabezado de la capa 4 (TCP/UDP).Sin embargo, el uso de este nmero puede no ser confiableen la clasificacin de trfico de Internet dada la naturaleza ycaractersticas propias de esta red: free; por tanto, no esobligatorio que las aplicaciones utilicen nmeros de puertoespecficos [Fulu, L.] en [Trussell, H].

En [Trussell, H] se propone un mtodo de clasificaciny estimacin de la cantidad de trfico por aplicacin, basadoen la distribucin del tamao de los paquetes registrados en

un switch (o router) durante un perodo de tiempo corto;identificando los flujos que tienen cantidades significativasde datos sensitivos al tiempo, tales como voz sobre IP o

7Una de las aplicaciones de la clasificacin de trfico es la deteccin deaplicaciones; el poder identificar la clase a la que pertenecen determinadosflujos tales como; transferencia de archivos peer-to-peer (Napster yeDonkey), puede ayudar al administrador de red a limitar las accionesindeseables de los usuarios [Trussell, H].


15/20


video de tiempo real, un switch (o router) puede darpreferencia a estos flujos, constituyndose en un mecanismopara incrementar la calidad del servicio (QoS).

Como se mencion, la distribucin del tamao de lospaquetes -al ser parte de las caractersticas de unaaplicacin- es utilizada como indicador del tipo deaplicacin. Los datos de la distribucin se obtienen delpaquete IP (capa 3), esto evita tener que acceder alencabezado TCP, lo cual conllevara tiempo y cmputoadicionales y se considera puede ser encriptado en el futuro[Trussell, H].

Comparacin entre MMSE, POCS y ARNs

En [Trussell, H] se compara tres mtodos para laestimacin de trfico: MMSE (Minimum Mean-SquareError), POCS (Projections Onto Convex Sets) y RedesNeuronales; de las pruebas realizadas, segn se demuestra enese material, los mtodos que utilizan RNA obtuvieron

mejores resultados, la deteccin de varias clasessignificativas es posible con una alta precisin.A continuacin se describen algunos detalles del

proyecto:Tabla c. Detalles del Proyecto [Trussell, H]

Datos de entrenamiento

Los datos para el entrenamiento de la RNA fueron obtenidos del backbonede la Universidad de Carolina del Norte mediante la herramienta deanlisis de trfico de red, TCPDUMP, stos fueron recogidos durantecuatro horas, a intervalos de 5 minutos, informacin registrada en unarchivo de texto. Entre los parmetros de inters registrados estn: nmerode puerto de origen, nmero de puerto de destino y tamao de paquete (en

bytes). Las aplicaciones fueron identificadas usando los nmeros de puerto

origen y destino dependiendo de las asignaciones de puerto realizadas porIANA (Internet Assigned Numbers Authority).

Generacin del Histograma

Para reducir la dimensionalidad de los datos, se consideraron paquetesEthernet comprendidos entre 60 y 1514 bytes (algunos divididos en piezas-contenedores- ms manejables). Debido a la poca densidad de los datos y

para reducir la dimensionalidad del problema, se construyeron histogramascon tamaos variables de piezas.

Agrupamiento (Clustering)

Para comprobar la hiptesis de que las aplicaciones se pueden caracterizarpor sus histogramas, se analiz la coleccin de histogramas mediantediferentes mtodos de clustering, que en su totalidad dieron lugar aagrupaciones naturales de los histogramas de aplicaciones.

Estimacin y Deteccin

La distribucin total del tamao de los paquetes en un nodo de redparticular es, la combinacin de la distribucin de sus aplicacionesindividuales. Por tanto, se puede modelar el trfico de red total como lacombinacin lineal de las aplicaciones ms importantes.

La arquitectura usada para las redes neuronales estcompuesta de una capa oculta y una neurona de salida. Entodos los casos, las neuronas de la capa oculta utilizan unafuncin de activacin tipo sigmoidea. Para la estimacin, laneurona de salida utiliza una funcin lineal y para el caso de

la deteccin, utiliza una funcin tipo sigmoidea. Segn seindica en [Trussell, H], para la estimacin, se encontr queel uso de seis neuronas en la capa oculta es apropiado paramodelar el problema. En el caso de la deteccin, se encontrque dos neuronas ocultas eran suficientes para proporcionarbuenos resultados. En el material no se indica ningnmtodo para poder establecer el nmero de neuronas ocultasque se debera utilizar por capa, por tanto, la simulacinmediante herramientas de software y la prueba y error sonrequeridos para determinar este dato.

El resultado del rendimiento de la estimacin sepresenta en la tabla siguiente. El error RMS (Root MeanSquare) obtenido por las redes neuronales es mejor que losotros mtodos. Los resultados han sido obtenidos entrenando24 conjuntos de entrenamiento y probando en otro conjuntode datos. Si se limitase la estimacin a una sola aplicacin,todos los mtodos mejoraran y como en el caso anterior lasRNA proporcionan mejores resultados.

Tabla d. Resultados de la estimacin de aplicaciones

especficas (conjunto 1) [Trussell, H]

Error RMSAplicacin Promedio

CLLSQ POCS RNA

RTP 0.0119 0.0010 0.0029 0.0004

Napster 0.0111 0.0016 0.0013 0.0001

eDonkey 0.0097 0.0052 0.0010 0.0002

Para estimar la probabilidad de que una aplicacinespecfica est presente en un flujo de trfico, se us una redneuronal. Puesto que cada conjunto de datos contiene datosde varias aplicaciones, para probar la deteccin, se creconjuntos de datos artificiales, basados en los archivos dedatos reales. Segn se describe, el mtodo presenta unaexactitud muy alta para detectar la presencia de aplicacionesespecficas, aunque stas estn en porcentajes bajos[Trussell, H]. En algunas aplicaciones el ndice de deteccines ms baja, esto debido a que tienen caractersticasestadsticas similares a otras aplicaciones (en este caso,eDonkey). Una ventaja de la aplicacin de RNA es que lospesos asociados a la capa oculta proporcionan un buenindicador de la importancia de ciertos contenedores en elhistograma. Esto permitir la reduccin del tamao de loshistogramas y una consecuentemente una disminucin deltiempo de cmputo. Considerando el vector de pesos entre la

entrada y las neuronas de la capa oculta, se puede determinarsi este nmero de contenedores se puede reducir an ms. Sial presentarse un contenedor particular, los pesos del vectorde entrada son demasiado pequeos para todas las neuronas,entonces, se presume que esta pieza no es necesaria para lavaloracin o la deteccin.


16/20


CONTROL DE SOBRECARGA EN REDES DETELECOMUNICACIONES

Las redes neuronales tambin pueden ser utilizadas paracontrolar la sobrecarga en las redes de telecomunicaciones,en [Wu S] se propone el uso de un modelo de red

supervisado capaz de aprender las acciones de control enbase a registros histricos; el resultado, segn se dice, es unsistema de control simple pero robusto a la vez yaproximado al ptimo.

Para garantizar el buen rendimiento de los sistemas elcontrol de sobrecarga es fundamental; por tanto, se requierenacciones de control para proteger de cargas excesivas losrecursos de red, las cuales estn basadas en mecanismos queregulen las peticiones nuevas que lleguen.

Segn se describe en [Wu S] existen dos tipos deestrategias de control: locales y centralizadas, dependiendode la cantidad de informacin de las decisiones de controlen las que estn basadas.

Como se sabe el trfico es estocstico y la

correspondencia entre el trfico de entrada y las decisionesptimas es complejo; para resolver este problema se utilizanredes neuronales, considerando su capacidad de aprenderfunciones desconocidas a partir de un gran nmero deejemplos y su implementacin en tiempo real una vez que hasido entrenada. El primer paso es generar los ejemplosnecesarios para el entrenamiento. El segundo paso esentrenar a un grupo de neuronas en base a esos datos.Despus de entrenar, las neuronas cooperan para deducir lasdecisiones de control considerando en informacinlocalmente disponible [Wu S].

Requisitos a implementar en el control de sobrecarga

Un procesador se sobrecarga si su cantidad promedio detrabajo en un determinado perodo excede un umbralpredefinido. El control de sobrecarga puede serimplementado mediante llamadas de bloqueo. El valor delumbral, es decir, la fraccin de llamadas admitidas, seactualiza peridicamente. Un control efectivo consiste endescubrir los valores ptimos de bloqueo para cada perodo.Para medir y comparar el rendimiento de las estrategias delcontrol, se necesita considerar los objetivos del control. Unalgoritmo de control ideal debe satisfacer los siguientesrequisitos: mximo throughput, para evitar el sofocamiento

innecesario; equilibrio entre las estaciones; imparcialidad a cada nodo; robustez ante perfiles de trfico cambiantes e

interrupcin parcial de la red; y fcil implementacin [Wu S].

SOLUCIN MEDIANTE REDES NEURONALES

Un nodo procesador de una RNA recibe como entrada,los datos relacionadas a las llamadas a los procesadores y

proporciona como salida, las decisiones de control deacuerdo a los valores mximos permitidos -umbral-; lacorrespondencia entre entrada-salida es adquirida a travs deun proceso de aprendizaje aplicado sobre ejemplosgenerados por el mtodo de control centralizado, CCM -Centralized Control Method-. Es difcil entrenar una redneuronal adecuadamente usando ejemplos que incluyandiversas intensidades de trfico, pero por otra parte, alentrenarla en una intensidad fija de trfico se pueden volverinflexibles a los cambios. Por lo tanto, para cada nodoprocesador, se ha construido un grupo de redes neuronales, ycada miembro es un perceptrn de una sola capa entrenadopor CCM usando ejemplos generados en una intensidad detrfico particular.

En [Wu S] se explica el proceso de entrenamiento parauna unidad del grupo de redes neuronales -similar al procesode entrenamiento de una red retro-propagacin-, tanto paralas seales de salida como el clculo del error mediocuadrtico. Cada unidad oculta es entrenada con unacantidad de trfico particular.

La propuesta de [Wu S], compara los mtodos: CCM,LCM y RNA; para obtener resultados se realizaronsimulaciones en parte de la red metropolitana de Hong-Kong; los intentos de llamada (tasa de llegada de llamadasentre nodos) se generaron segn el proceso de Poisson, y seaceptan con la probabilidad dada por los valores de umbralcorrespondientes. Considerando limitaciones del hardware,velocidad de control y fluctuaciones estadsticas, se elige elperodo del control en 5 segundos. Las llamadas aceptadasharn cola en el buffer esperando ser servidas.

Cuando la cantidad de intentos de llamada aumentaprecipitadamente, se espera que los esquemas de controlrespondan tan rpido como sea posible para acondicionar las

caractersticas de trfico que cambian.Mediante una aproximacin basada en RedesNeuronales se aprecia que esta propuesta tiene unthroughput superior que el CCM (pero con leve compromisoen el control de error) y estos mtodos son superiores a lavez que el LCM [Wu S].

El controlador neuronal disminuye significativamente eltiempo para tomar decisiones (cerca del 10% del tiempo deCPU de CCM); Por tanto RNA puede ser implementado entiempo real.

DIAGNSTICO DE FALLAS

En Telecomunicaciones, la gestin adecuada de los

mensajes de error que se generan, puede facilitar eldiagnstico de las fallas de un sistema; por ejemplo, cuandoocurre una interrupcin de red, los mensajes de error segeneran en un gran nmero, dificultando el poder diferenciarentre las fuentes y causas del problema primarias de lassecundarias, entonces, sera de mucha utilidad contar con unclasificador de mensajes de error que sea eficiente yconfiable [Wu S].


17/20


Histricamente, las tcnicas inteligentes tales como losrboles de clasificacin fueron utilizadas para analizar losfallos de sistemas. Debido a su estructura jerrquica, losrboles de clasificacin pueden resultar demasiadoinflexibles para tratar con caractersticas de ruido yambigedad presentes en las tareas de diagnstico. Encambio, las redes neuronales pueden proporcionarcomparaciones probabilsticas ptimas entre las posiblescausas de fallos en sistemas. En [Wu S] se presenta unclasificador hbrido, compuesto por una capa de entrada, unacapa oculta que contiene R nodos que representan losvectores de reglas de clasificacin y en la salida una capa deperceptrones. La propuesta se basa en el modelo de redcompetitiva, winner-take-all, en el que slo una unidad desalida est activa en un instante determinado y las unidadesde salida compiten entre si para ser la que se activa comorespuesta a una entrada determinada.

El clasificador ha sido probado con un conjunto demensajes de error generados por una computadora deintercambio de telfono, la cual indica qu tarjeta est

funcionando incorrectamente. El aprendizaje de la red sebasa en 442 conjuntos de entrenamiento y 112 conjuntos deprueba [Wu S]. Como se ha presentado en los casosanteriores, la aproximacin basada en RNA genera mejoresresultados, que las otras opciones analizadas.

CONCLUSIONES

La Ingeniera de Trfico, IT, para cumplir su objetivo demejorar el rendimiento de una red operacional,consiguiendo minimizar la congestin de sus recursos yhaciendo un uso ms efectivo de los mismos, debe teneren cuenta; los diferentes requerimientos y mtricas derendimiento y mecanismos y polticas que mejoren laintegridad y credibilidad de la red [RFC-3272,Awduche], por tanto, la Ingeniera de Trfico cubreaspectos como; la planificacin, control y optimizacinde red.

Diferentes propuestas han demostrado una aplicacinpotencial de las Redes Neuronales Artificiales, RNA, enel rea de Telecomunicaciones; en este trabajo se hanpresentado aplicaciones en tareas especficas de laIngeniera de Trfico, como: prediccin, control,monitoreo y optimizacin de recursos. Se ha vistoalgunas aproximaciones para la prediccin de ancho debanda, control de sobrecarga, clasif icacin de trfico ydiagnstico de fallas.

Por las caractersticas propias del trfico de red:heterogeneidad y dinamismo, la aplicacin de losmtodos y tcnicas estadsticas convencionales no sonapropiados para proporcionar predicciones ptimas; encambio, los resultados experimentales provistos pormodelos de RNA para predecir el rendimiento de unared -en trminos de ancho de banda disponible ylatencia- demuestran que stas herramientasproporcionan mejores predicciones error mnimo-

comparado con otros sistemas. Los flujos de datos que circulan por una red usualmente

pertenecen a distintas aplicaciones, cada aplicacinpuede tener su propio patrn de comunicacin. Una delas ventajas de aplicar RNA para modelar el trfico dered es su gran capacidad para aprender y extraerpatrones a partir de un conjunto de datos; conociendoestos patrones o correlaciones entre los datos, se puedentomar acciones preventivas y/o correctivas encaminadasa una mejor gestin de trfico de red.

Los proyectos de aplicacin de RNA en Ingeniera deTrfico revisados tienen en comn una fase de pre-procesamiento, en la cual, los datos de entrada sonapropiadamente tratados, depurados y seleccionados,antes de ser procesados por las neuronas de la RNA;esta fase puede ser la ms amplia y determinar en granmedida el xito de la ejecucin del resto del proyecto,ayudando a controlar riesgos, a conseguir unrendimiento mximo y a evitar llegar a conclusioneserradas.

La aplicacin de las RNA en el campo de lasTelecomunicaciones es bastante promisoria, pues, comose indica en [Del Brio, M. pg. 211] las caractersticasque hacen que una situacin determinada sea candidataideal para aplicar RNA son las que se indican acontinuacin, las cuales estn presentes masivamente enlos problemas de la Ingeniera de Trfico.

No existe un mtodo que describacompletamente el problema, por tanto, elmodelarlo se vuelve una tarea compleja.

Se dispone de una gran cantidad de datos, loscuales servirn como ejemplos o patrones para elaprendizaje de la red; los datos relacionados al

problema son imprecisos o incluyen ruido; elproblema es de elevada dimensionalidad. En condiciones de trabajo cambiantes, las RNA

pueden adaptarse perfectamente gracias a sucapacidad de adaptacin (reentrenamiento).

Hoy en da, las publicaciones, estudios, aplicaciones yesfuerzos relacionados a RNA son considerables, apesar de su complejidad didctica, existen diferentesherramientas de simulacin que pueden facilitar sucomprensin y comprobacin de resultados. Segn,[Werbos 98] en [Del Brio, M., pg. 228] la aplicacin delas redes neuronales puede considerarse que haalcanzado ya su madurez.

El ancho de banda y otros recursos de red impactandirectamente en el rendimiento de las aplicaciones, portanto, las propuestas encaminadas a predecir sudisponibilidad y adaptar el trfico de acuerdo a lasnecesidades de cada aplicacin son bien acogidas. En[Eswaradass, A] se propone un mtodo para predecir elancho de banda disponible considerando la coexistenciade diferentes aplicaciones de red proporcionandomejores resultados que otros mtodos de prediccinconocidos.


18/20


Para tareas de prediccin de datos, en general, sepueden emplear diferentes modelos: deterministas,estadsticos, probabilsticos, de aprendizaje de mquinae inteligencia artificial (redes

aplicacion de redes neuronales artificiales para la ingenieria de trafico de internet

Documents