separata conexionismo

13
CONEXIONISMO I. INTRODUCCIÓN La psicología cognitiva como paradigma psicológico tiene una historia reciente: aunque algunas propuestas de finales de los años cuarenta y de la década de los cincuenta se pueden considerar como primeros esbozos de esta forma de hacer psicología, es a partir de los años sesenta cuando realmente se empieza a extender por el mundo entero, compitiendo en los centros de estudio y de investigación con el conductismo, al que finalmente parece haber desbancado como paradigma dominante. El conductismo supuso uno de los mayores esfuerzos de los psicólogos por hacer de su disciplina una ciencia. Los principios metodológicos que exigieron a la psicología (experimentación, rechazo de la introspección, empleo de categorías explicativas definidas operacionalmente, ...) supuso un adelanto y una conquista que la mayoría de los psicólogos consideran irrenunciable. Sin embargo, estos triunfos se vieron claramente empañados en cuestiones fundamentales: el conductismo es una psicología sin sujeto (psicología del organismo vacío); su pretensión teórica fundamental consiste en explicar toda la conducta a partir del aprendizaje: son los refuerzos y los estímulos presentes en la vida de los organismos los que determinan su modo de relacionarse con el medio y de resolver sus problemas adaptativos. Esta paradójica renuncia al sujeto para explicar lo que el sujeto hace se puede plantear en los términos tradicionales de cuerpo y mente: el conductismo da poca importancia al cuerpo y a las predisposiciones genéticas de la conducta; pero también rechaza la mente, prescinde de forma explícita y, en muchos casos combativa, de la mente como elemento explicativo. La psicología conductista estudia la conducta para explicar la conducta. Esta idea del ambientalismo y del organismo vacío entra en crisis en los años sesenta. Por un lado los etólogos y las investigaciones en neurociencias, y por otro los desarrollos de la propia la psicología, van a cuestionar estos principios explicativos básicos. Por parte de la psicología cognitiva, la crítica se referirá básicamente al olvido de la mente. Sabemos por qué resultó atractiva la psicología cognitiva: de nuevo se introducen en la psicología temas como el de la atención, la percepción, la memoria, el pensamiento, el lenguaje, temas que parecen irrenunciables para toda psicología que quiera ser completa y que el conductismo a duras penas pudo incluir en sus investigaciones. Y como compendio de todas estas capacidades y actividades, la mente. De nuevo la mente entra el la psicología, y, además, explicada con métodos que heredan del conductismo la pretensión de objetividad: la psicología cognitiva rechaza también la introspección como acceso privilegiado a lo psíquico favoreciendo los informes objetivos obtenidos en laboratorio. Simplificando, el mentalismo tradicional quiere estudiar la mente mirando a la mente, la psicología cognitiva quiere estudiar la mente mirando la conducta. Considera irrenunciable la referencia a la mente como causa de la conducta, pero también considera irrenunciable la observación objetiva de la conducta para el descubrimiento de las estructuras y procesos mentales supuestamente elicitadores de la conducta. Pero la diferencia con otros mentalismos no está sólo del lado del método (el conductismo metodológico del cognitivismo frente a la introspección del mentalismo tradicional), sino, más importante aún, de los conceptos y categorías fundamentales con los que intenta comprender la mente: la diferencia esencial está en la idea de mente.

Upload: luisenrique

Post on 12-Jan-2016

7 views

Category:

Documents


0 download

DESCRIPTION

acerca del conexionismo la exploracion detalla acerca de aquellobreve historia acerca de aquello que nos trasmine

TRANSCRIPT

Page 1: separata CONEXIONISMO

CONEXIONISMO

I. INTRODUCCIÓN

La psicología cognitiva como paradigma psicológico tiene una historia reciente: aunque algunas propuestas de finales de los años cuarenta y de la década de los cincuenta se pueden considerar como primeros esbozos de esta forma de hacer psicología, es a partir de los años sesenta cuando realmente se empieza a extender por el mundo entero, compitiendo en los centros de estudio y de investigación con el conductismo, al que finalmente parece haber desbancado como paradigma dominante.

El conductismo supuso uno de los mayores esfuerzos de los psicólogos por hacer de su disciplina una ciencia. Los principios metodológicos que exigieron a la psicología (experimentación, rechazo de la introspección, empleo de categorías explicativas definidas operacionalmente, ...) supuso un adelanto y una conquista que la mayoría de los psicólogos consideran irrenunciable. Sin embargo, estos triunfos se vieron claramente empañados en cuestiones fundamentales: el conductismo es una psicología sin sujeto (psicología del organismo vacío); su pretensión teórica fundamental consiste en explicar toda la conducta a partir del aprendizaje: son los refuerzos y los estímulos presentes en la vida de los organismos los que determinan su modo de relacionarse con el medio y de resolver sus problemas adaptativos. Esta paradójica renuncia al sujeto para explicar lo que el sujeto hace se puede plantear en los términos tradicionales de cuerpo y mente: el conductismo da poca importancia al cuerpo y a las predisposiciones genéticas de la conducta; pero también rechaza la mente, prescinde de forma explícita y, en muchos casos combativa, de la mente como elemento explicativo. La psicología conductista estudia la conducta para explicar la conducta.

Esta idea del ambientalismo y del organismo vacío entra en crisis en los años sesenta. Por un lado los etólogos y las investigaciones en neurociencias, y por otro los desarrollos de la propia la psicología, van a cuestionar estos principios explicativos básicos.

Por parte de la psicología cognitiva, la crítica se referirá básicamente al olvido de la mente. Sabemos por qué resultó atractiva la psicología cognitiva: de nuevo se introducen en la psicología temas como el de la atención, la percepción, la memoria, el pensamiento, el lenguaje, temas que parecen irrenunciables para toda psicología que quiera ser completa y que el conductismo a duras penas pudo incluir en sus investigaciones. Y como compendio de todas estas capacidades y actividades, la mente. De nuevo la mente entra el la psicología, y, además, explicada con métodos que heredan del conductismo la pretensión de objetividad: la psicología cognitiva rechaza también la introspección como acceso privilegiado a lo psíquico favoreciendo los informes objetivos obtenidos en laboratorio. Simplificando, el mentalismo tradicional quiere estudiar la mente mirando a la mente, la psicología cognitiva quiere estudiar la mente mirando la conducta. Considera irrenunciable la referencia a la mente como causa de la conducta, pero también considera irrenunciable la observación objetiva de la conducta para el descubrimiento de las estructuras y procesos mentales supuestamente elicitadores de la conducta.

Pero la diferencia con otros mentalismos no está sólo del lado del método (el conductismo metodológico del cognitivismo frente a la introspección del mentalismo tradicional), sino, más importante aún, de los conceptos y categorías fundamentales con los que intenta comprender la mente: la diferencia esencial está en la idea de mente.

La categoría explicativa básica que utiliza el paradigma cognitivo es la de información: la mente es una entidad capaz de recibir, almacenar y procesar de diversos modos la información, y de generar una conducta en virtud de dichas actividades. Esta tesis primordial tiene importantísimas consecuencias en la idea de mente y de psicología propuesta por este paradigma. Por ejemplo, parece claro que las actividades mentales que no son cogniciones, las actividades mentales que no consisten en informar o describir el mundo, sólo con enormes dificultades pueden entrar en el programa de investigación cognitivo: aquí hay que incluir fundamentalmente el mundo de las emociones y el de la motivación: estar triste no es tener un estado informativo determinado, desear no es tener una representación del mundo, aunque, evidentemente, la información manejada por el sujeto tiene clara influencia tanto en la emoción y el sentimiento como en el deseo y la voluntad. En términos clásicos, la psicología cognitiva estudia la dimensión intelectual de la psíque, pero no la emotiva y la volitiva.

Page 2: separata CONEXIONISMO

En la forma de entender la información y el modo de procesar la información fueron importantes tanto ciertas ideas filosóficas como los avances tecnológicos en informática. Por parte de la filosofía, la influencia más clara tiene que ver con tesis racionalistas. En primer lugar por la importancia que se le da a las representaciones: el trato con la cosas está determinado por el conocimiento que el sujeto tiene del mundo, conocimiento que ha de estar presente de algún modo en él para que su conducta resulte eficaz. A esta forma vicaria de estar el mundo se le suele llamar representación, y la investigación de su estatuto y peculiaridades es precisamente uno de los temas principales en el paradigma cognitivo. Estas entidades tienen contenido semántico, significan algo (por ejemplo, conceptos, figuras, formas, ángulos, notas o propiedades, ...) y gracias a dicho significado se refieren al mundo De este modo, las representaciones son las unidades informativas que maneja el sujeto y cuyo procesamiento determina la conducta. Pero las representaciones se combinan unas con otras siguiendo reglas y el rendimiento de cada una de las facultades mentales (percepción, memoria, lenguaje, atención, ...) se define a partir de las distintas reglas de transformación y combinación de representaciones. De este modo, reglas y representaciones son dos de los elementos conceptuales básicos del cognitivismo y dan lugar al programa de investigación característico de este paradigma.

El objetivo de la psicología cognitiva clásica es el descubrimiento de las reglas que rigen los procesos mentales y de los elementos o estructuras básicas del procesamiento humano; el del conexionismo es el descubrimiento de redes adecuadas para la simulación de tareas característicamente mentales y de reglas de aprendizaje eficientes.

Otro contraste que se suele destacar es el que se refiere al aprendizaje: los modelos clásicos rechazan el asociacionismo y tienen a defender posiciones innatistas, el conexionismo parece una vuelta al asociacionismo (las redes neuronales no son otra cosa que asociaciones entre unidades) y, puesto que las redes comienzan el aprendizaje con pesos establecidos aleatoriamente, tiende a defender la idea de la mente como una “tabula rasa” o papel en blanco”, siendo la experiencia, el ambiente en el que se desenvuelve la red, y no factores innatos, la que provoca la aparición de los pesos adecuados para el procesamiento y el almacenamiento de la información. Algunos autores consideran que estas diferencias separan al conexionismo de la psicología cognitiva y lo aproximan al conductismo pues, aunque no exactamente en el mismo sentido, éste también defiende el asociacionismo y el ambientalismo.

II. CARACTERÍSTICAS GENERALES DEL ENFOQUE CONEXIONISTA

En psicología, esta nueva forma de estudiar y explicar la mente y la conducta recibe el nombre de conexionismo (aunque otros prefieren el término “neoconexionismo”, para distinguirlo del antiguo conexionismo propuesto por Alexander Bain en la segunda mitad del siglo XIX, autor que también subrayó la importancia de las conexiones entre neuronas, y la investigación y experimentación fisiológica). Dado que para este paradigma el procesamiento y el almacenamiento de la información recae en amplios conjuntos de elementos simples (las unidades de las redes conexionistas), el modelo de procesamiento conexionista se llama también Procesamiento Distribuido en Paralelo (o PDP).

En psicología llamamos conexionismo al paradigma que utiliza redes neuronales para comprender y explicar la vida psíquica y la conducta. Las redes neuronales son conjuntos de unidades interconectadas masivamente capaces de procesar y almacenar información mediante la modificación de sus estados. Aunque la siguiente afirmación exigiría importantes precisiones, en general se puede decir que el psicólogo conexionista considera que ha explicado un fenómeno psicológico (el reconocimiento de formas, la producción de lenguaje, la memoria, ...) cuando el modelo neuronal que construye se comporta del mismo modo que los seres humanos cuando realizan la misma tarea. No hay que olvidar que el conexionismo participa de una idea común con la psicología cognitiva clásica: para la psicología cognitiva (tanto la clásica como el conexionismo) la mente es un sistema capaz de procesar información, un sistema capaz de recibir señales de entrada, almacenar información y provocar información de salida a partir la información de entrada, la información almacenada y los mecanismos de cómputo. Dada esta suposición de que los fenómenos mentales y la conducta son consecuencia de elementos internos al sujeto, el conexionismo considera adecuada la explicación cuando la red que construye es capaz de realizar, a partir del vector de entrada, los distintos cómputos que provocan el vector de salida deseado.

Los elementos característicos presentes en la mayoría de los modelos conexionistas son los siguientes:

Page 3: separata CONEXIONISMO

1. La red es un conjunto de unidades de procesamiento (neuronas) muy simples.

2. Dichas unidades interactúan entre sí mediante las conexiones que los asocian.

3. Los estímulos que afectan a las unidades de entrada se expresan en términos cuantitativos.

4. Toda unidad de la red viene definida por un nivel de activación expresado de forma cuantitativa.

5. Toda conexión viene caracterizada por un valor de fuerza del trazo o peso de la conexión, también expresado de forma cuantitativa.

6. El procesamiento y almacenamiento de la información se realiza de forma paralela y distribuida.

7. Existen reglas o funciones que computan la información en distintos niveles del procesamiento (para la modificación del nivel de activación a partir de las entradas, para la producción de la salida a partir del nivel de activación, ...).

8. Existen reglas o funciones de aprendizaje que le permiten a la red modificar los pesos de las conexiones para acomodar de modo cada vez más perfecto la información de entrada a la salida requerida.

9. La función de cada unidad es simplemente realizar cálculos con las entradas que reciben y producir la información que envían a las unidades con las que están conectadas.

10. Las señales de salida que emite la red se expresan en términos cuantitativos.

11. Dado que toda la actividad de la red no es otra cosa que cálculos o transformaciones de números, se puede afirmar que en realidad la red neural es un dispositivo para computar una función, un sistema capaz de transformar la información de entrada en información de salida. La función presente en la red y que realiza el computo es básicamente el patrón o conjunto de pesos sinápticos de las unidades.

III. DIFERENCIAS ENTRE EL CONEXIONISMO Y LOS MODELOS COGNITIVOS TRADICIONALES

III.1. INSPIRACIÓN NEURO-FISIOLÓGICA: APROXIMACIÓN A LAS CIENCIAS NEUROLÓGICAS

La psicología cognitiva clásica no daba importancia a la base orgánica de la vida mental. Cabe recordar que incluso sus propios postulados básicos le llevaron a considerar que la lógica existente en los procesos mentales se puede comprender y explicar con independencia de su realización en un sistema físico (esto es lo que afirma la tesis del funcionalismo, la teoría filosófica de la mente compartida por los psicólogos cognitivos). El conexionismo, sin embargo, toma al cerebro como modelo de procesamiento y su inspiración neurofisiológica aproxima la psicología a la biología. Si en la psicología cognitiva clásica la metáfora dominante era la metáfora del ordenador, ahora, en el conexionismo, la metáfora es el cerebro: la primera psicología clásica consideraba que podíamos entender el comportamiento de la mente comprendiendo el “comportamiento” del ordenador tipo Von Neumann, sin embargo el conexionismo afirma que podemos entender el comportamiento de la mente si comprendemos el comportamiento del cerebro humano. Con el conexionismo la Inteligencia Artificial, la Psicología y la Biología se convierten en disciplinas más próximas que lo que permitía el enfoque de la psicología cognitiva clásica. Claro está que esta aproximación es interesante desde el punto de vista de la unidad de las ciencias y la posición materialista dominante, pero también puede ser una dificultad para los que quieren defender la posibilidad de la psicología como ciencia independiente; de hecho las posiciones filosóficas de los conexionistas en el tema del estatuto de la mente tienden a ser reduccionistas o a defender el materialismo eliminativo (en lo esencial, tesis según las cuales los estados mentales no tienen auténtica realidad, son epifenómenos y, por lo mismo, no pueden ser causas de las conductas).

Aunque también existen redes neuronales que intentan ser modelos de los procesos reales de partes del cerebro, las que interesan a la psicología no intentan imitar el comportamiento del sistema nervioso sino de la mente. El conexionismo quiere ser una teoría psicológica no una teoría fisiológica. Sin embargo, sí se puede hablar de

Page 4: separata CONEXIONISMO

inspiración biológica en los modelos mentales propuestos. Las redes neuronales intentan reproducir las características principales del comportamiento del cerebro, particularmente de su estructura fisiológica básica, la neurona, y de su agrupación en estructuras complejas o redes de neuronas. A continuación vamos a fijarnos en los aspectos más elementales de las redes neuronales biológicas, aspectos que las redes conexionistas intentan emular.

Las unidades básicas del sistema nervioso son las neuronas. Estas unidades se conectan unas con otras formando redes extraordinariamente complejas. La principal función de las neuronas es recoger señales de diversas fuentes, transformarlas y producir señales de salida que transmiten a otras neuronas u otras partes del organismo. De este modo, en el cerebro el procesamiento de la información es paralelo y distribuido, paralelo en tanto que las señales recibidas las procesan simultáneamente millones de conexiones diferentes y distribuido porque la responsabilidad del almacenamiento de la información no recae sobre una unidad (una neurona) sino sobre amplios conjuntos de unidades.

Los órganos sensoriales reciben señales del exterior y mediante elementos transductores convierten las distintas energías que reciben en señales nerviosas. La información fluye desde los nervios sensoriales y, recorriendo estaciones intermedias como la médula espinal, el tronco cerebral, cerebelo, etc., llega hasta la corteza cerebral. A su vez, del cerebro parte la información por los nervios motores hasta los músculos u otros órganos y constituye la respuesta del organismo al medio.

En las neuronas cabe destacar las siguientes partes fundamentales: el cuerpo celular o soma, cuya función principal es procesar las señales que recibe la unidad y enviar la información de salida hacia otras unidades; el axón: es la fibra más gruesa y larga de todas las que se originan en el cuerpo celular; mediante los axones las neuronas se conectan unas con otras; su función es transmitir la información generada en el cuerpo celular a las otras células; las dendritas: son pequeñas extensiones del soma y su función es recibir la información.

De este modo, las dendritas son los canales receptores de la información, el soma la unidad de procesamiento y el axón el canal transmisor de la información.

La información se traslada a través del axón y las dendritas en la forma de señales eléctricas. Sin embargo, el paso de la información de una unidad a otra no tiene la forma de cambios eléctricos sino químicos. La conexión entre el axón de una neurona y las dendritas de otra recibe el nombre de sinapsis. Las neuronas no están en contacto físico completo pues existe un pequeño espacio en la sinapsis (el espacio intersináptico). Cuando el impulso eléctrico llega al final del axón, se produce la liberación de unas sustancias químicas denominadas neurotransmisores. Los neurotransmisores se difunden en el espacio intersináptico y se unen a los extremos de las dendritas en ciertos lugares denominados receptores. En estos receptores se producen cambios químicos que provocan modificaciones eléctricas en la neurona y el flujo eléctrico o impulso nervioso.

Por su importancia en las redes neuronales conexionistas, es importante recordar también dos hechos más que se dan en las redes neuronales biológicas: los efectos de los neurotransmisores sobre las dendritas pueden ser excitadores o inhibidores de forma que para calcular la influencia final del conjunto de entradas sobre una neurona es preciso sumar y restar sus estímulos. para que la neurona responda enviando una señal eléctrica a lo largo del axón (el impulso nervioso) es necesario que los estímulos que recibe de otras unidades alcancen un cierto nivel eléctrico (el umbral del impulso eléctrico o intensidad mínima del estimulo que es suficiente para provocar el impulso nervioso); de este modo, la respuesta de la célula ante los estímulos tiene la forma de todo o nada.

Cuando se habla de la inspiración biológica de los modelos conexionistas se quiere señalar que estos modelos intentan reproducir gran parte de los aspectos existentes en las redes neurológica biológicas y descritos más arriba. Sin embargo hay otros aspectos del sistema nervioso que no se intentan reproducir. Citemos algunos: Por ejemplo, el relativo al número de unidades de procesamiento: en todo el sistema nervioso central hay del orden de 1011 neuronas y de 1015 interconexiones, mientras que las redes conexionistas generalmente constan como mucho de varias centenas de unidades y de varios miles de conexiones. En las redes conexionistas los pesos entre las conexiones se establecen inicialmente de forma aleatoria y se van corrigiendo mediante el aprendizaje; esto supone, traducido a los términos tradicionales, primar el ambientalismo y el aprendizaje frente a los componentes innatos. En el cerebro la importancia del aprendizaje para el desarrollo de las sinapsis no se puede obviar, pero tampoco se puede negar la importancia de factores innatos, factores que determinan los recursos fisiológicos necesarios para el procesamiento e incluso las rutas en el establecimiento de las conexiones.

Page 5: separata CONEXIONISMO

En el caso de las redes biológicas, el aprendizaje da lugar a modificaciones en las fuerzas de conexión, pero también a modificaciones de las estructuras mismas de interconexión (por ejemplo, de las unidades conectadas y de los tipos de conexiones); en las redes conexionistas el aprendizaje actúa sobre los pesos de las conexiones pero no sobre las estructuras mismas.

IV. CONCEPTOS Y ELEMENTOS DE LA ESTRUCTURA CONEXIONISTAIV.1 Las unidades

Los elementos básicos de procesamiento de la información en el cerebro son las neuronas; dado que los modelos conexionistas son modelos de inspiración biológica, a las unidades básicas encargadas del procesamiento en las redes conexionistas se las llama habitualmente neuronas, aunque también podemos encontrar en la literatura los términos “células”, “unidades”, “neuronas artificiales”, “nodos”, elementos de procesamiento (PEs) o, simplemente, “elementos”. La función de estas unidades tiene que ver esencialmente con el la recepción y tratamiento de la información: recibir información a partir de las conexiones que mantienen con otras neuronas, elaborar o transformar la información recibida y emitir información de salida hacia otras neuronas.

Existen tres tipos de unidades:

1. Unidades de entrada: les corresponde este nombre por recibir información de fuentes externas a la propia red. Si la red dispone de sensores (por ejemplo, un scanner), la información externa es información sensorial; si la red está conectada con otras redes, las unidades de entrada reciben datos de las salidas de las otras redes; en otros casos, simplemente, las unidades de entrada reciben los datos que el usuario de la red introduce manualmente en el ordenador.

2. Unidades de salida: ofrecen las señales o información al exterior de la red; dan la respuesta del sistema. Si la red dispone de conexiones con sistemas motores (robots, por ejemplo) su respuesta será la intervención en el mundo físico; si la red está conectada con otras redes, su respuesta serán datos de entrada para éstas últimas redes; y si, simplemente, son redes que utilizamos en nuestro ordenador, las unidades de salida ofrece datos al usuario para su posterior tratamiento.

3. Unidades ocultas: aunque no todas las redes poseen este tipo de unidades, las redes mínimamente sofisticadas las incluyen. Estas unidades no tienen una relación directa ni con la información de entrada ni con la de salida, por lo que no son “visibles” al ambiente exterior a la red, de ahí su nombre. Su función es procesar la información en niveles más complejos, favorecer cómputos más eficaces.

La información que puede recibir una red, la que puede ser almacenada y la que puede emitir, está determinada en gran medida por lo que se llama el abanico de entrada (fan-in) y el abanico de salida (fan-out). El abanico de entrada es el número de elementos que excitan o inhiben una unidad dada. El abanico de salida de una unidad es el número de unidades que son afectadas directamente por dicha unidad.

Se llama capa o nivel o estrato al conjunto de neuronas que reciben información de la misma fuente (información externa, otra capa de neuronas) y ofrecen información al mismo destino (al usuario, a sistemas motores, a otra capa de neuronas).

Page 6: separata CONEXIONISMO

IV.2. Las conexiones entre unidades (las sinapsis) Las sinapsis son las conexiones entre las neuronas. En la mayor parte de redes las sinapsis

son unidireccionales: la neurona j transmite información a la neurona i y la neurona i la recibe, y nunca ocurre lo contrario. Sin embargo, en redes como las de Hopfield las sinapsis son bidireccionales.

Tipos de sinapsis:

a) sinapsis inhibidora: en este tipo de conexión el impulso transmitido por una neurona inhibe la activación de la neurona con la que está conectada: si la neurona j le transmite a la neurona i un impulso que inhibe a ésta, el nivel de activación de la neurona i decrecerá, y decrecerá en función del peso establecido para dicha conexión y de la cantidad de información que se transmite por dicha sinapsis. Se suele representar la sinapsis inhibidora mediante puntos negros;

b) sinapsis excitadora: en este tipo de conexión el impulso transmitido por una neurona excita la activación de la neurona con la que está conectada: si la neurona j está conectada mediante una sinapsis excitadora con la neurona i, el nivel de activación de la unidad i aumentará si le llega información por dicha conexión desde la neurona j, y lo hará en función del peso de la conexión y de la magnitud de la señal o información que por dicha conexión se le envía. Se suele representar este tipo de conexión mediante puntos huecos.

IV.3. Peso sináptico

O peso de la conexión. Es uno de los conceptos más importantes en las redes, y ello por varias razones: en primer lugar porque los cómputos de la red tienen que ver esencialmente con ellos; en segundo lugar, y concretando la afirmación anterior, porque los cálculos que el sistema realiza a partir de la información de entrada para dar lugar a la información de salida se basan en dichos pesos; y, en tercer lugar, porque en cierto modo (como veremos) son el análogo a las representaciones de los objetos en los modelos cognitivos tradicionales. Una sinapsis es fuerte, o tiene un gran peso de conexión, si la información por ella recibida contribuye en gran medida en el nuevo estado que se produzca en la neurona receptora, y es débil en caso contrario. Los pesos sinápticos son valores numéricos, se expresan en términos numéricos sencillos (generalmente números enteros o fraccionarios negativos o positivos) con los que “se ponderan” las señales que reciben por dicha sinapsis.

IV.4. El patrón de conexión

En los modelos conexionistas el conocimiento que la red alcanza a partir del aprendizaje se representa mediante el patrón de conexión, patrón que determinará, por lo tanto, el modo de procesamiento de las señales y la respuesta del sistema ante cualquier entrada.

V. ALGUNOS MODELOS DE REDES NEURONALES

Page 7: separata CONEXIONISMO

V.1. REDES DE McCULLOCH-PITTS O REDES DE NEURONAS FORMALES

En 1943, Warren McCulloch (neurofisiólogo) y Walter Pitts (matemático) publicaron en el Bulletin of Mathematical Biophysics "Un cálculo lógico de las ideas inmanentes en la actividad nerviosa"; en este artículo defendieron la tesis de que las actividades de las neuronas y las relaciones existentes entre ellas podían estudiarse mediante la lógica proposicional. Creyeron que las neuronas tenían un comportamiento biestable (al producir salidas todo-nada) y que, en este sentido, eran semejantes al comportamiento también biestático de los conmutadores eléctricos (abierto-cerrado). Junto con la idea relativa al comportamiento supuestamente lógico de las neuronas, presentaron también la idea de construir máquinas de computar con una arquitectura similar a las neuronas. A pesar de su conocimiento insuficiente de las neuronas y las sinapsis orgánicas, sus ideas han tenido mucha importancia en el desarrollo de la psicología cognitiva: consideraron que las leyes que gobiernan la mente tienen más que ver con las leyes que gobiernan la información que con las relativas a la materia (idea más común a la psicología cognitiva clásica que al conexionismo); pero en su comprensión del aprendizaje anticiparon también ideas conexionistas: dieron más importancia al aprendizaje que a factores innatos, consideraron que nuestro cerebro comienza con redes aleatorias, que los estímulos provocan conexiones de una determinada manera y que los estímulos posteriores, si son fuertes y constantes, llevarían a la red a manifestar una configuración determinada. Esta configuración determinaría que la respuesta de la red fuese distinta ante nuevos estímulos. En definitiva, su artículo fue importante al tratar al cerebro como un organismo computacional.

Demostraron también que redes neuronales sencillas, conectadas entre sí mediante sinapsis excitadoras o excitadoras e inhibidoras, y asignando un valor umbral para la activación de la unidad de salida, eran capaces de representar adecuadamente las leyes lógicas fundamentales. Llamaron neuronas “formales” a las neuronas que componen dichas redes. Aunque intentaron modelar aspectos elementales de las neuronas biológicas, las neuronas McCulloch-Pitts no eran otra cosa que conmutadores lógicos, semejantes a los circuitos lógicos que se pueden crear mediante simples interruptores por los que pueden fluir la corriente eléctrica.

V. 2. PERCEPTRONES

En 1958 Frank Rosenblatt escribió The Perceptron, a Probabilistc Model for Information Storage and Organization in the Brain. Rosenblatt rechazó el uso que McCulloch y Pitts hicieron de la lógica simbólica aplicada a las redes y defendió métodos probabilísticos. En esta obra llamó “perceptrones” a unas redes McCulloch-Pitts capaces de modificar los pesos de sus conexiones si las respuestas de la red no eran las correctas y demostró que estas redes se podían entrenar para clasificar ciertos patrones en iguales o distintos, por tanto que eran capaces del reconocimiento de formas sencillas.

El mecanismo de procesamiento del Perceptrón es el siguiente: el patrón a reconocer incide en la capa sensorial; cada una de las unidades sensoriales responde en forma todo o nada al patrón de entrada; las señales generadas por las unidades sensoriales se transmiten a las unidades de asociación; éstas unidades se activan si la suma de sus entradas sobrepasa algún valor umbral. Cuando una unidad de la capa asociativa se activa, provoca una señal de salida, la cual va por las sinapsis correspondientes hasta las unidades de la capa de respuesta.

V.3. EL PANDEMONIUM: UN MODELO PARA EL RECONOCIMIENTO DE PATRONES

V. 3. 1. La tarea de reconocimiento de patrones: dos explicaciones, el modelo de plantillas y el modelo de análisis de características

Una característica del sistema de procesamiento visual humano es su flexibilidad: somos capaces de identificar un patrón, un tipo de estímulo, con independencia sus posibles variaciones en tamaño, posición en el contexto y orientación espacial; e incluso cuando su forma varía en ciertos límites; fijémonos en los siguientes ejemplos:

Page 8: separata CONEXIONISMO

En todos ellos reconocemos sin dificultad la letra "E", y todos ellos pueden interpretarse como variaciones del mismo patrón, el correspondiente a dicha letra. Podemos llamar “reconocimiento de patrones” al hecho de identificar distintos estímulos como perteneciendo a la misma clase, como siendo del mismo tipo. Los psicólogos han presentado diversas teorías para comprender el modo en que nuestra mente es capaz de reconocer patrones; una de las primeras y más sencillas es la de “comparación de plantillas”. Según esta teoría en nuestra memoria debe haber un modelo o plantilla correspondiente a cada forma que podamos reconocer. Cuando vemos un objeto, la imagen que se produce en la retina se la compara con las plantillas almacenadas en nuestra memoria y aquella que mejor se ajusta a la imagen retiniana es la que identifica al objeto visto. Fácilmente se ve que esta teoría no es satisfactoria: un cambio en la posición, tamaño u orientación del objeto provocaría un desajuste que haría imposible el reconocimiento. Además no podríamos reconocer formas deterioradas pues tampoco coincidirían con las plantillas.

Podríamos modificar la teoría para superar estas dificultades: por ejemplo suponiendo que existen tantas plantillas almacenadas como variedades posibles de posición, rotación, tamaño y distorsión, pero está claro que ésta no es una buena solución pues exigiría un número tan grande de plantillas que ni siquiera el cerebro podría almacenar. Otra estrategia más razonable consistiría en suponer que antes de la comparación del input retiniano con las plantillas nuestra mente realiza un análisis preparatorio, lo que algunos autores llaman “preprocesamiento”: mediante este análisis las imágenes retinianas se someten a un proceso de normalización que los traduce a un formato estándar compatible con los formatos de las plantillas existentes en nuestra memoria (ajustando el tamaño y la orientación por ejemplo). Existen algunos resultados experimentales que parecen avalar la hipótesis de la normalización.

Algunas de las dificultades del modelo de plantillas se pueden resolver con otro modelo algo más complejo que el anterior: el modelo basado en el análisis de características. Esta teoría defiende que nuestra mente no trabaja con copias exactas de la información sino con el análisis de las características internas de cada patrón; por ejemplo, el sistema visual utilizaría un análisis de características al menos en las siguientes dimensiones: líneas y sus variantes (verticales, horizontales, oblicuas), ángulos y sus variantes y curvas. En la memoria se representa cada patrón mediante una lista de sus características geométricas y (al menos en las versiones más elaboradas) sus correspondientes pesos. Así, la letra "A" podría representarse mediante la siguiente lista de características: pesos altos: dos líneas inclinadas, una hacia la derecha y otra hacia la izquierda, una línea horizontal, un ángulo apuntando hacia arriba; pesos bajos o nulos: líneas verticales, líneas curvas discontinuas, ángulos rectos, etc. El patrón estimular activa los detectores de características, y la configuración de la activación resultante se compararía con la de los patrones almacenados en la memoria; la configuración que mejor se ajuste determinaría la interpretación perceptual del sistema.

V. 3. 2. El Pandemonium: rasgos principales

El Pandemonium propuesto por O. Selfridge en su escrito de 1959 Pandemonium: A paradigm for learning es precisamente uno de los primeros y más conocidos modelos de reconocimiento de patrones basados en el análisis de características. Originariamente el Pandemonium se concibió como un programa de ordenador para reconocer señales del código Morse, pero posteriormente se le dio una interpretación psicológica como modelo de reconocimiento alfanumérico. La exposición y comentarios que siguen se refiere precisamente a la versión más conocida del Pandemonium (la de Lindsay y Norman en su obra Introducción a la psicología cognitiva) y cuyo objetivo es el reconocimiento de letras. El Pandemonium consiste en varios conjuntos de unidades a las que

Page 9: separata CONEXIONISMO

Selfrigde dio el nombre de “demonios”, unidades que realizan distintas tareas y provocan la información de salida (la identificación de la forma presentada al sistema). El dibujo siguiente es una representación habitual del Pandemonium (tomado de Linsay y Norman, Introducción a la psicología cognitiva).

Los tipos de demonios de los que consta el modelo son los siguientes:

Demonios de la imagen: su tarea es registrar la imagen del signo externo.

Demonios de características: la tarea de las unidades de este tipo es analizar la imagen registrada; cada demonio de características está especializado en un aspecto particular de la forma (unos detectan líneas, otros ángulos, otros curvas, ...) por lo que el procesa- miento en este nivel consiste en la descomposición de la forma en sus características relevantes; cada demonio de características detecta la presencia de alguno de los rasgos para los que ha sido definido (por ejemplo el demonio correspondiente a las líneas verticales detecta la presencia y número de líneas verticales en la figura).

Demonios cognitivos: reciben y examinan la información de los demonios de características; cada demonio cognitivo está especializado en el reconocimiento de una forma (por ejemplo, uno para la letra "A" otro para la "B", ...) y busca en los datos que les ofrecen los demonios de características la presencia de los rasgos que definen la letra en la están especializados (por ejemplo el demonio cognitivo de la letra "A" buscará la presencia de una línea horizontal, dos oblicuas y tres ángulos agudos).

Demonio de decisión: cuando un demonio cognitivo encuentran una característica que buscaba empieza a gritar y cuantas más características descubre más grita; la tarea del demonio de decisión es escuchar el Pandemonium producido por los demonios cognitivos y seleccionar el que grita más fuerte; la interpretación que el sistema hace de la forma que se le presenta corresponde a la letra decidida por este demonio.

Una cuestión muy importante que tiene que decidir el diseñador de un Pandemonium es la de determinar las características de cada patrón. Se han dado distintas propuestas de los criterios más adecuados para ello, propuestas entre las que destaca la que presentó en 1969 E. J. Gibson en su obra Principles of perceptual learning and development. Los criterios que defendió se referían a la selección de la lista de características para las letras mayúsculas, y son los siguientes:

1. Las características críticas deben estar presentes en algunos miembros, pero no en otros, de modo que permitan una clara distinción entre ellos.

Page 10: separata CONEXIONISMO

2. No deben variar cuando cambia el brillo, tamaño o perspectiva.

3. Deben producir un único patrón para cada letra.

4. La lista no debe ser muy extensa.

Más explícita es la propuesta de Linsay y Norman en su libro ya clásico Introducción a la psicología cognitiva. El cuadro siguiente (tomado de dicha obra) presenta los demonios de características necesarios para la identificación de una letra y los valores que activan para cada una de las letras del alfabeto. Mediante las siete características citadas podemos identificar adecuadamente la totalidad de las letras.

Líneas verticales

Líneas horizontale

s

Líneas oblicuas

Ángulos rectos

Ángulos agudos

Curvas continuas

Curvas discontinua

s

A 1 2 3

B 1 3 4 2

C 1

D 1 2 2 1

E 1 3 4

F 1 2 3

G 1 1 1 1

H 2 1 4

I 1 2 4

J 1 1

K 1 2 1 2

L 1 1 1

M 2 2 3

N 2 1 2

O 1

P 1 2 3 1

Q 1 2 1

R 1 2 1 3 1

S 2

T 1 1 2

Page 11: separata CONEXIONISMO

U 2 1

V 2 1

W 4 3

X 2 2

Y 1 2 1

Z 2 1 2

En realidad, el modelo basado en el análisis de características es semejante al de comparación de plantillas, sólo que aquí las plantillas son las partes geométricas que componen la letra (podríamos llamar a cada característica “miniplantilla”) y en el segundo caso las letras mismas. Parece que este modelo puede explicar lo que el modelo de plantillas puede explicar (ya que las plantillas están compuestas por características) y, además, otra serie de fenómenos para los que el modelo de plantillas es ineficaz.