exposicion agentes inteligentes

35
CESAR ALFONSO CHARRIA IVAN MAURICIO MELO DIDIER AUGUSTO FERIA CARLOS ANDRES LOPEZ

Upload: ivanmauricio

Post on 29-Nov-2014

6.873 views

Category:

Technology


1 download

DESCRIPTION

 

TRANSCRIPT

  • 1. CESAR ALFONSO CHARRIA IVAN MAURICIO MELO DIDIER AUGUSTO FERIA CARLOS ANDRES LOPEZ
  • 2.
  • 3.
    • Determinar la forma de medir el xito.
    • Descripcin del entorno.
    • Descripcin de sensores.
    • Descripcin de actuadores del agente.
  • 4.
    • Son criterios que determinan el xito del comportamiento del agente.
    • Genera una secuencia de acciones de acuerdo con las percepciones que recibe, sta secuencia de acciones hace que su hbitat pase por una secuencia de estados.
    • Si la secuencia es deseada el agente habr actuado correctamente.
  • 5.
    • La medida de rendimiento que define el criterio de xito.
    • El conocimiento del medio en el que habita.
    • Las acciones que el agente puede llevar a cabo.
    • La secuencia de percepciones del agente hasta ese momento.
  • 6.
    • Debe emprender aquella accin que supuestamente maximice su medida de rendimiento, basndose en las evidencias aportadas por la secuencia de percepciones y en el conocimiento que el agente mantiene almacenado.
  • 7.
    • Un agente omnisciente conoce el resultado de su accin y acta de acuerdo con l, sin embargo la omnisciencia realmente no es posible.
    • La racionalidad no es lo mismo que la perfeccin.
    • La racionalidad maximiza el rendimiento esperado y la perfeccin maximiza el resultado real.
  • 8.
    • Son los problemas para los cuales los agentes racionales son las soluciones:
    • Se especifica el entorno de trabajo, ilustrando el trabajo con varios ejemplos.
    • Se evidencia que el entorno de trabajo ofrece diferentes posibilidades que influyen en el diseo del programa del agente.
  • 9.
    • El primer paso siempre debe ser especificar un entorno de trabajo de la manera mas completa posible.
    Tipo de agente Medidas de rendimiento Entorno Actuadores Sensores Taxista Seguro, rpido, legal, viaje confortable, maximizacin del beneficio. Carreteras, trafico, peatones, clientes. Direccin, acelerador, freno, seal, bocina, visualizador. Cmaras, sonar, velocmetro, GPS, tacmetro, visualizador de aceleracin, sensores del motor, teclado.
  • 10.
    • No importa entre un medio real y artificial sino la complejidad de la relacin entre:
  • 11.
    • Integran medios y funciones de gran complejidad, que en gran medida estn orientados a operar en tiempo real, que deben elegir entre un gran espectro de posibilidades de operacin la que mas se ajuste a la solucin del problema.
  • 12.
    • Los entornos de trabajo en los cuales se implementa la IA es muy amplio, en donde se pueden identificar cierto numero de dimensiones, donde se categorizan los entornos, que hasta cierto punto determinan el diseo mas adecuado para el agente y las principales tcnicas de implementacin.
  • 13.
    • Totalmente observables: cuando los sensores del agente detectan todos los aspectos relevantes del entorno en la toma de decisiones, dependientes de las medidas de rendimiento.
    • Parcialmente observables: cuando hay existencia de sensores poco exactos o porque no reciben informacin por parte del sistema.
  • 14.
    • Determinista: es cuando el siguiente estado del medio esta condicionado por el estado actual y la accin ejecutada por el agente.
    • Estocstico: si el medio es parcialmente observable; cuando se hace difcil mantener constancia de todos los aspectos observados.
    • Estratgico: si el medio es determinista excepto para las acciones de otros agentes.
  • 15.
    • Episdico: consiste en la percepcin del agente y la realizacin de una nica accin posterior que no depende de un episodio previo, ni afecta a un episodio futuro.
    • Secuencial: la decisin presente afecta las decisiones futuras. Son mas complejos que los episdicos porque hay que pensar con ciertos limites de tiempo
  • 16.
    • Esttico: cuando los medios son constantes no cambiantes son mas fciles de tratar porque el agente no necesita contemplar en todo momento el mundo mientras decide, ni el paso del tiempo.
    • Dinmico: el entorno es cambiante cuando el agente esta deliberando, en donde se esta indagando constantemente sobre el Qu hacer?
    • Semi-dinmico: cuando el entorno no cambia, mas si el rendimiento.
  • 17.
    • Discreto: cuando existe un numero finito de estados, acciones y percepciones.
    • Continuo: cuando no existe un numero finito de estados, acciones y percepciones.
    • Individual: cuando los estados, acciones y percepciones de un entorno estn dados por un solo agente.
    • Multi-agente: cuando los estados, acciones y percepciones de un entorno estn dados por dos o mas agentes. Pueden ser competitivos y cooperativos.
  • 18.
    • Cuando todas las reglas o normativas de un entorno no estn explicitas, se reduce la posibilidad de determinar que tan observable es.
    • Las dimensiones del entorno de trabajo, se definen netamente
  • 19.
    • Se hace una simulacin de la realidad para generar o proponer agentes que solventen los problemas presentados en diversos escenarios y el generador de entornos selecciona hbitats particulares.
  • 20.
    • El trabajo de la IA es disear el programa del agente que implemente la funcin del agente que proyecta las percepciones en las acciones.
    • Se asume que este programa se ejecutara en algn tipo de computador lo cual se conoce como arquitectura.
    • Agente = arquitectura + programa
  • 21.
    • Los programas de los agentes se describen con la ayuda de un sencillo lenguaje de pseudocdigo.
    • Funcin AGENTE-DIRIGIDO-MEDIANTE-TABLA(percepcin) devuelve una accin
    • variables estticas: percepciones , una secuencia, vaca inicialmente
        • tabla, una tabla de acciones, indexada por las secuencias de percepciones, totalmente definida inicialmente.
        • aadir la percepcin al final de las percepciones
        • accin CONSULTA( percepciones, tabla)
        • devolver accin
    El programa AGENTE-DIRIGIDO-MEDIANTE-TABLA se invoca con cada nueva percepcin y devuelve una accin en cada momento. Almacena la secuencia de percepciones utilizando su propia estructura de datos privada.
  • 22.
    • Para construir un agente racional de esta forma, los diseadores debe realizar una tabla que contenga las acciones apropiadas para cada secuencia posible.
    • Por esto se puede observa que esta propuesta esta condenada al fracaso porque:
      • No hay agente que tenga espacio suficiente para almacenar la tabla.
      • El diseador no tendr tiempo de crear la tabla.
      • Ningn agente podr aprender todas las entradas de la tabla a partir de su experiencia.
  • 23.
    • Es el tipo de agente mas sencillo. Basa sus acciones en las percepciones actuales, ignorando el resto de las percepciones histricas.
    • Tiene la admirable propiedad de ser simples, pero posee una inteligencia muy limitada.
  • 24. Actuadores Medio ambiente Agente Sensores Cmo es el mundo ahora Qu accin debo tomar ahora Reglas de condicin-accin Actuadores
  • 25.
    • Debe mantener algn tipo de estado interno que dependa de la historia percibida.
    • La actualizacin del estado interno requiere codificar 2 tipos de conocimiento:
      • Se necesita alguna informacin acerca de cmo evoluciona el mundo.
      • Se necesita informacin sobre como afecta al mundo las acciones del agente.
  • 26.
    • El conocimiento acerca de cmo funciona el mundo se denomina modelo del mundo.
    • Un agente que utilice estos modelos es un agente basado en modelos.
    • Este modelo nos muestra como la percepcin actual se combina con el estado interno antiguo para generar la descripcin actualizada del estado actual.
  • 27. Actuadores Estado Cmo evoluciona el mundo Qu efectos causan mis acciones Medio ambiente Agente Sensores Cmo es el mundo ahora Qu accin debo tomar ahora Reglas de condicin-accin Actuadores
  • 28.
    • El agente necesita algn tipo de informacin sobre su meta que describa las situaciones que son deseables.
    • La seleccin de acciones basadas en objetivos es directa, cuando alcanzar los objetivos es el resultado inmediato de una accin individual.
    • En otras ocasiones, puede ser mas complicado, cuando el agente tiene que considerar secuencias complejas.
  • 29. Actuadores Estado Cmo evoluciona el mundo Qu efectos causan mis acciones Qu pasar si realizo la accin A Medio ambiente Agente Sensores Cmo es el mundo ahora Qu accin debo llevar a cabo ahora Objetivos Actuadores
  • 30.
    • Una funcin de utilidad proyecta un estado(o secuencia de estados) en un numero real, que representa un nivel de felicidad.
    • Permite tomar decisiones racionales en dos tipos de casos en los que las metas son inadecuadas:
      • Cuando haya objetivos conflictivos.
      • Cuando haya varios objetivos por los que se pueda guiar el agente.
  • 31. Actuadores Estado Cmo evoluciona el mundo Qu efectos causan mis acciones Qu pasar si realizo la accin A Estar contento con este estado Medio ambiente Agente Sensores Cmo es el mundo ahora Qu accin debo llevar a cabo ahora Utilidad Actuadores
  • 32.
    • Se propone construir maquinas que aprendan y despus ensearlas.
    • El aprendizaje permite que el agente opere en medios inicialmente desconocidos y que sea mas competente que si slo utilizara un conocimiento inicial.
  • 33.
    • Se puede dividir en cuatro componentes conceptuales:
      • Elemento de aprendizaje , esta responsabilizado de hacer mejoras.
      • Elemento de actuacin , esta responsabilizado de la seleccin de acciones externas.
      • Crticas , realimenta el elemento de aprendizaje y determina como se debe modificar el elemento de actuacin para proporcionar mejores resultados en el futuro.
      • Generador de problemas , responsable de sugerir acciones que lo guiaran hacia experiencias nuevas e informativas.
  • 34. Actuadores Elemento de aprendizaje Generador de problemas Nivel de actuacin Retroalimentacin Objetivos a aprender Cambios Conocimiento Medio ambiente Agente Sensores Elemento de actuacin Crtica Actuadores
  • 35.
    • En conclusin podemos decir que:
    • Los agentes reactivos simples responden directamente a las percepciones.
    • Los agentes reactivos basados en modelos mantienen un estado interno que les permite seguir el rastro de aspectos del mundo que no son evidentes.
    • Los agentes basados en objetivos actan con la intencin de alcanzar una meta.
    • Los agentes basados en utilidad intenta maximizar su felicidad deseada.
    • Todos los agentes pueden mejorar su eficacia con la ayuda de mecanismos de aprendizaje.