teoría 2 (parte b) introducción a los agentes inteligentes - universidad nacional de ... · 2019....
TRANSCRIPT
![Page 1: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/1.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Teoría 2 (Parte B)Introducción a los Agentes Inteligentes
Sistemas Inteligentes1
1Universidad Nacional de San Luis, Argentina
Carrera: Ingeniería en InformáticaCarrera: Ingeniería en Computación (Optativa)
Departamento de InformáticaAño 2019
![Page 2: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/2.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Aspectos a abordar
Agentes reflejos (o reactivos) simplesAgentes reflejos basados en modeloAgentes basados en objetivosAgentes basados en utilidadesRepresentación de estados y transicionesAgentes de Aprendizaje
Bibliografía: Capítulo 2, libro de Russell. Sección 2.4.
![Page 3: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/3.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Clases generales de programas de agentes
Agentes reflejos (o reactivos) simplesAgentes reflejos basados en modeloAgentes basados en objetivosAgentes basados en utilidades
Estos tipos de agentes pueden a su vez ser implementadoscomo agentes de aprendizaje.
![Page 4: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/4.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Clases generales de programas de agentes
Agentes reflejos (o reactivos) simplesAgentes reflejos basados en modeloAgentes basados en objetivosAgentes basados en utilidades
Estos tipos de agentes pueden a su vez ser implementadoscomo agentes de aprendizaje.
![Page 5: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/5.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Agentes reflejos simples (ARS)
También llamados agentes reactivos puros o agentestropísticos.Seleccionan una acción en base a la percepción actual,ignorando el resto de la historia perceptual (el pasado).No existe internamente ninguna representación deestado.La decisión sobre la acción a tomar se basa en unconjunto de reglas condición-acción (o situación-acción).
Ejemplo:
si auto-adelante-esta-frenando entoncescomenzar-a-frenar
![Page 6: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/6.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Agentes reflejos simples (ARS)
También llamados agentes reactivos puros o agentestropísticos.Seleccionan una acción en base a la percepción actual,ignorando el resto de la historia perceptual (el pasado).No existe internamente ninguna representación deestado.La decisión sobre la acción a tomar se basa en unconjunto de reglas condición-acción (o situación-acción).
Ejemplo:
si auto-adelante-esta-frenando entoncescomenzar-a-frenar
![Page 7: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/7.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Un ejemplo de agente reactivo
Un agente reactivo para el mundo de la aspiradora
función AG-REF-ASPIRA(p)entrada: una percepción p = [ubic,est ].salida: una acción a ∈ {Aspirar ,Derecha, Izquierda,NoOp}.
si est = Sucio entonces retornar Aspirarsino si ubic = A entonces retornar Derechasino si ubic = B entonces retornar Izquierda
fin_función
![Page 8: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/8.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Un agente reactivo genérico
función AG-REF-SIMPLE(percep) retorna una acciónestático: reglas: un conjunto de reglas condición-acción.
estado ← INTERPRETAR-ENTRADA(percep)regla← REGLA-MATCH(estado, reglas)
accion← ACCIÓN-REGLA[regla]fin_función
![Page 9: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/9.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Un robot reactivo: vehículo de Braitenberg
![Page 10: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/10.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Características de los agentes reactivos
Su comportamiento es dirigido por el principio deestímulo-respuesta característico de los reflejos de humanos,animales y plantas.
VentajasSimplicidad.Tiempo de respuesta mínimo.Reglas simples pueden producir comportamientoscolectivos complejos.Implementación directa en hardware (bueno pararobótica).
![Page 11: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/11.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Características de los agentes reactivos
Su comportamiento es dirigido por el principio deestímulo-respuesta característico de los reflejos de humanos,animales y plantas.
VentajasSimplicidad.Tiempo de respuesta mínimo.Reglas simples pueden producir comportamientoscolectivos complejos.Implementación directa en hardware (bueno pararobótica).
![Page 12: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/12.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Características de los agentes reactivos
Su comportamiento es dirigido por el principio deestímulo-respuesta característico de los reflejos de humanos,animales y plantas.
LimitacionesSólo trabajan bien si la acción correcta puededeterminarse en base a la percepción actual.Posibilidad de loops infinitos bajo observabilidad parcial.Incapacidad de analizar la consecuencia futura de lasacciones.
![Page 13: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/13.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Agentes reflejos basados en modelos (ARBM)
También llamados agentes reflejos con estado.
Cuentan con alguna estructura de datos o estado internoque registra información sobre el estado del ambiente y lahistoria perceptual.Actualizar la información de estado interno requiere unmodelo del mundo:
De que manera las acciones del agente modifican elmundo.De que manera el mundo evoluciona independientementedel agente.
El estado interno permite solucionar o aliviar losproblemas de observabilidad parcial.Si bien toma en cuenta el pasado no considera el futuro(no planifica).
![Page 14: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/14.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Agentes reflejos basados en modelos (ARBM)
También llamados agentes reflejos con estado.Cuentan con alguna estructura de datos o estado internoque registra información sobre el estado del ambiente y lahistoria perceptual.
Actualizar la información de estado interno requiere unmodelo del mundo:
De que manera las acciones del agente modifican elmundo.De que manera el mundo evoluciona independientementedel agente.
El estado interno permite solucionar o aliviar losproblemas de observabilidad parcial.Si bien toma en cuenta el pasado no considera el futuro(no planifica).
![Page 15: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/15.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Agentes reflejos basados en modelos (ARBM)
También llamados agentes reflejos con estado.Cuentan con alguna estructura de datos o estado internoque registra información sobre el estado del ambiente y lahistoria perceptual.Actualizar la información de estado interno requiere unmodelo del mundo:
De que manera las acciones del agente modifican elmundo.De que manera el mundo evoluciona independientementedel agente.
El estado interno permite solucionar o aliviar losproblemas de observabilidad parcial.Si bien toma en cuenta el pasado no considera el futuro(no planifica).
![Page 16: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/16.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Agentes reflejos basados en modelos (ARBM)
También llamados agentes reflejos con estado.Cuentan con alguna estructura de datos o estado internoque registra información sobre el estado del ambiente y lahistoria perceptual.Actualizar la información de estado interno requiere unmodelo del mundo:
De que manera las acciones del agente modifican elmundo.De que manera el mundo evoluciona independientementedel agente.
El estado interno permite solucionar o aliviar losproblemas de observabilidad parcial.
Si bien toma en cuenta el pasado no considera el futuro(no planifica).
![Page 17: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/17.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Agentes reflejos basados en modelos (ARBM)
También llamados agentes reflejos con estado.Cuentan con alguna estructura de datos o estado internoque registra información sobre el estado del ambiente y lahistoria perceptual.Actualizar la información de estado interno requiere unmodelo del mundo:
De que manera las acciones del agente modifican elmundo.De que manera el mundo evoluciona independientementedel agente.
El estado interno permite solucionar o aliviar losproblemas de observabilidad parcial.Si bien toma en cuenta el pasado no considera el futuro(no planifica).
![Page 18: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/18.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Estructura de un ARBM
función AG-REF-BAS-MODELO(percep) retorna una acciónestático: estado: una descripción del estado actual del mundo.
modelo: descripción del efecto de las acciones.reglas: un conjunto de reglas condición-acción.accion: la acción más reciente (inicial/ ninguna).
estado ← ACTUALIZAR-ESTADO(estado,accion,percep,modelo)regla← REGLA-MATCH(estado, reglas)
accion← ACCIÓN-REGLA[regla]fin_función
![Page 19: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/19.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Arquitecturas con estado: Recurrent Neural Networks
Traducción de lenguajes
![Page 20: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/20.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Deduciendo propiedades ocultas del mundo
![Page 21: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/21.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Deduciendo propiedades ocultas del mundo
![Page 22: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/22.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Deduciendo propiedades ocultas del mundo
![Page 23: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/23.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Deduciendo propiedades ocultas del mundo
![Page 24: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/24.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Deduciendo propiedades ocultas del mundo
![Page 25: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/25.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Agentes basados en objetivos (ABO)
En la selección de acciones se toma en cuentainformación sobre los objetivos (estados deseables) aalcanzar.
El logro de un objetivo puede requerir analizar lasconsecuencias futuras de secuencias completas deacciones ( planes).Dos grandes grupos de ABO
Agentes de búsqueda.Agentes de planning.
Comparación respecto a los agentes reflejos (ARS’s yARBM’s):
Son menos eficientes.Son más flexibles (cambios de objetivo y condicionescambiantes).
![Page 26: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/26.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Agentes basados en objetivos (ABO)
En la selección de acciones se toma en cuentainformación sobre los objetivos (estados deseables) aalcanzar.El logro de un objetivo puede requerir analizar lasconsecuencias futuras de secuencias completas deacciones ( planes).
Dos grandes grupos de ABOAgentes de búsqueda.Agentes de planning.
Comparación respecto a los agentes reflejos (ARS’s yARBM’s):
Son menos eficientes.Son más flexibles (cambios de objetivo y condicionescambiantes).
![Page 27: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/27.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Agentes basados en objetivos (ABO)
En la selección de acciones se toma en cuentainformación sobre los objetivos (estados deseables) aalcanzar.El logro de un objetivo puede requerir analizar lasconsecuencias futuras de secuencias completas deacciones ( planes).Dos grandes grupos de ABO
Agentes de búsqueda.Agentes de planning.
Comparación respecto a los agentes reflejos (ARS’s yARBM’s):
Son menos eficientes.Son más flexibles (cambios de objetivo y condicionescambiantes).
![Page 28: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/28.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Agentes basados en objetivos (ABO)
En la selección de acciones se toma en cuentainformación sobre los objetivos (estados deseables) aalcanzar.El logro de un objetivo puede requerir analizar lasconsecuencias futuras de secuencias completas deacciones ( planes).Dos grandes grupos de ABO
Agentes de búsqueda.Agentes de planning.
Comparación respecto a los agentes reflejos (ARS’s yARBM’s):
Son menos eficientes.Son más flexibles (cambios de objetivo y condicionescambiantes).
![Page 29: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/29.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Estructura de un ABO
![Page 30: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/30.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Agentes basados en utilidades (ABU)
Permiten realizar una distinción más fina (no binaria) entrelos estados que los ABO.
Cuentan con una función de utilidad
U : S → R
que captura las preferencias del agente por los estadosdel mundo.La utilidad de un estado cuantifica el grado de felicidad (odeseabilidad) de estar en el mismo.Un ABU es más adecuado que un ABO cuando:
Es necesario balancear objetivos conflictivos.Es necesario ponderar la importancia y probabilidad desuceso de varios objetivos para los que no existe certezade ser alcanzados.
![Page 31: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/31.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Agentes basados en utilidades (ABU)
Permiten realizar una distinción más fina (no binaria) entrelos estados que los ABO.Cuentan con una función de utilidad
U : S → R
que captura las preferencias del agente por los estadosdel mundo.
La utilidad de un estado cuantifica el grado de felicidad (odeseabilidad) de estar en el mismo.Un ABU es más adecuado que un ABO cuando:
Es necesario balancear objetivos conflictivos.Es necesario ponderar la importancia y probabilidad desuceso de varios objetivos para los que no existe certezade ser alcanzados.
![Page 32: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/32.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Agentes basados en utilidades (ABU)
Permiten realizar una distinción más fina (no binaria) entrelos estados que los ABO.Cuentan con una función de utilidad
U : S → R
que captura las preferencias del agente por los estadosdel mundo.La utilidad de un estado cuantifica el grado de felicidad (odeseabilidad) de estar en el mismo.
Un ABU es más adecuado que un ABO cuando:Es necesario balancear objetivos conflictivos.Es necesario ponderar la importancia y probabilidad desuceso de varios objetivos para los que no existe certezade ser alcanzados.
![Page 33: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/33.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Agentes basados en utilidades (ABU)
Permiten realizar una distinción más fina (no binaria) entrelos estados que los ABO.Cuentan con una función de utilidad
U : S → R
que captura las preferencias del agente por los estadosdel mundo.La utilidad de un estado cuantifica el grado de felicidad (odeseabilidad) de estar en el mismo.Un ABU es más adecuado que un ABO cuando:
Es necesario balancear objetivos conflictivos.Es necesario ponderar la importancia y probabilidad desuceso de varios objetivos para los que no existe certezade ser alcanzados.
![Page 34: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/34.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
ABU’s y el principio de la UEM
Un agente ABU sigue los principios de teoría de decisiónpara balancear la deseabilidad (utilidad) de los resultadoscon la probabilidad de que éstos ocurran.
El principo de la utilidad esperada máxima (UEM)especifica que un agente racional debería seleccionaraquella acción que maximiza su utilidad esperada.
En este caso, un agente ABUselecciona la acción a2 conutilidad esperada:
23× 9 +
16× 0 +
16× 0 = 6
![Page 35: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/35.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
ABU’s y el principio de la UEM
Un agente ABU sigue los principios de teoría de decisiónpara balancear la deseabilidad (utilidad) de los resultadoscon la probabilidad de que éstos ocurran.El principo de la utilidad esperada máxima (UEM)especifica que un agente racional debería seleccionaraquella acción que maximiza su utilidad esperada.
En este caso, un agente ABUselecciona la acción a2 conutilidad esperada:
23× 9 +
16× 0 +
16× 0 = 6
![Page 36: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/36.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
ABU’s y el principio de la UEM
Un agente ABU sigue los principios de teoría de decisiónpara balancear la deseabilidad (utilidad) de los resultadoscon la probabilidad de que éstos ocurran.El principo de la utilidad esperada máxima (UEM)especifica que un agente racional debería seleccionaraquella acción que maximiza su utilidad esperada.
En este caso, un agente ABUselecciona la acción a2 conutilidad esperada:
23× 9 +
16× 0 +
16× 0 = 6
![Page 37: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/37.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
ABU’s y Juego de dos personas - Minimax (1)
![Page 38: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/38.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
ABU’s y Juego de dos personas - Minimax (2)
![Page 39: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/39.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Algunos conceptos asociados a los ABU
Teoría de DecisiónTeoría de UtilidadTeoría de la ProbabilidadProcesos de Decición Markov (MDP’s)POMDP’sMétodos de Programación DinámicaAprendizaje por RefuerzosTeoría de JuegosEquilibrio de NashMecanismos económicos (subasta, votación, mercado,etc)
![Page 40: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/40.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Representando estados y transiciones entre los mismos
¿Cómo representaré los estados del mundo y los efectos delas acciones (modelo de transición)? Enfoques:
AtómicaFactorizadaEstructurada
![Page 41: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/41.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Representando estados y transiciones entre los mismos
Atómica: un estado es una caja negra (indivisible) sinestructura interna.Factorizada: un estado consiste de una colección devalores de atributos (reales, booleanos o de un conjuntofijo).Estructurada: cada estado incluye objetos, cada uno delos cuales puede tener atributos propios y tambiénrelaciones a otros objetos.
![Page 42: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/42.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Agentes de aprendizaje
Incorporan la capacidad de aprender y mejorar sudesempeño a partir de la experiencia.Componentes conceptuales
Elemento de performance: componente que selecciona lasacciones externas (lo que antes era el agente completo).Elemento de aprendizaje: componente encargada dehacer las mejoras (cambios) en el elemento deperformance.Crítico: informa al alemento de aprendizaje cuán bien elagente se está comportando (de acuerdo a una medida deperformance establecida).Generador de problema: sugiere al elemento deaprendizaje acciones exploratorias que conducen aexperiencias nuevas e informativas.
![Page 43: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes](https://reader035.vdocuments.mx/reader035/viewer/2022071502/612222632b56f359b44938d1/html5/thumbnails/43.jpg)
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades
Un agente de aprendizaje general