dimap/ufrn agentes e sistemas especialistas zsimilaridades entre agentes e se´s zsistemas...
TRANSCRIPT
DIMAP/UFRN
Agentes e Sistemas Especialistas
Similaridades entre agentes e SE´sSistemas Especialistas
Não interagem diretamente com o ambienteNão agem neste ambiente: sugestões ao usuário
Não possuem comportamento reativo e pro-ativo Não possuem habilidade social
Agentes: evolução dos SE´s
Sistemas Multi-agentes
Agentes Intelientes
Professores: Anne Magály P Canuto
DIMAP/UFRN
Introdução
Características Fundamentais: reatividade, adaptabilidade, mobilidade e comunicabilidade
Agente
AmbienteRepresentação
internaAtuaçãoFoco
Cognitivo Reativo EstruturalComporta-
mentalIsolada Social Desktop Móvel
DIMAP/UFRN
Visão Abstrata de um Agente
Dado: S = {s1,s2, ...}: Estados de
um ambiente A = {a1,a2, ...}: Ações do
agente Agente: função S* A Fator importante: História
(sequencia de estados encontrados até então) Agente: decide que ação
executar baseado na sua história
Agentes equivalentes: histórias iguais
Agentes Reativos: Psicologia Comportamental Com ou sem referência de
sua história Baseada no presente
Respondem diretamente a seu ambiente (S* A)
Hipótese de Simon:
“A complexidade do comportamento de um
agente pode ser o reflexo do seu ambiente em vez do
seu complexo projeto interno”
DIMAP/UFRN
Visão Abstrata de um Agente
Agente com percepção Que tal dividirmos a função
de decisão em dois subsistemas?
Visão: Observar seu ambiente (câmera de vídeo, sensor,etc.)
Ação: tomada de decisão Saída do módulo Visão =
Percepção Visão: S P Ação: P* A
Agentes com estado: Esquema mais natural
Visão: S P Próximo: I x P I Ação: I A
Funcionamento Começa num estdo inicial i0 Observa o estado de seu
ambiente: gera uma percepção
O estado interno do agente é alterado
Uma ação é selecionada A ação é executada
DIMAP/UFRN
Agentes Deliberativos
Agentes Cognitivos: Hipótese: Sistemas de símbolos físicos
“Agentes mantém uma representação interna do seu mundo e que existe um estado mental explicítio que pode ser modificado por alguma forma de raciocínio
simbólico” Onde é colocada essa representação:
Estado
Formas de representação: Várias (BDI) Tipos:
Agentes de raciocínio dedutivo Agentes de raciocínio prático
DIMAP/UFRN
Arquitetura geral de um agente
Decisão: como atuar Objetivos Perfil de atuação Ambiente
Modelo de decisão: Teoria da racionalidade
Limitada do agente
Agente sabe: Identificar as alternativas,
avalia-las, ordena-las, escolher a melhor
Planejador de ações: Mundo: em termos de estados
(iniciais e finais) eum conjunto de operações que podem provocar mudanças de estado
Controlador: Cognitivos Ordem de ativação de seus
processos internos Configurador:
Objetivos: reconfiguráveis (outros agentes ou ele mesmo)
Configurador
Decisão
ConTroLador
InTerFace
DIMAP/UFRN
Agentes de Raciocínio Dedutivo
Abordagem tradicional (IA Simbólica) Comportamento inteligente: representação simbólica
de seu ambiente + seu comportamento desejadoSistematicamente manipular essa representação
Formalismo de representação: lógica Manipulação: dedução lógica ou prova de teorema
Exemplo: Ralph Robô que navega num ambiente coletando o lixo Lógica de primeira ordem
DIMAP/UFRN
Agentes de Raciocínio Dedutivo
Para a construção de Ralph, é necessário resolver: Problema de tradução: traduzir o mundo real numa descrição
simbólica que seja proveitosa Trabalhos nas áreas de: visão, PLN, aprendizagem, etc..
Problema de representação/manipulação: formas de representação e manipulação resultado seja proveitoso
Representação do conhecimento, raciocínio automático, planejamento
Agentes: provadores de teoremas Dado uma teoria de agentes (explica como um agente deveria
se comportar para otimizar algumas medidas) Provador: essa teoria é vista como uma especificação executável
Diretamente executada para produzir o comportamento do agente
DIMAP/UFRN
Agentes de Raciocínio Dedutivo Estados internos: database
de fórmulas lógicas Informações do ambiente Similar as crenças dos
humanos L: o conjunto de sentenças D = (L) o conjunto de L
databases Estado interno do agente:
elemento de D () Processo de tomada de
decisão: regras de dedução ()
: Fómula provada usando o
database e as regras
A ação de um agente: Regras de dedução D A Prova de teorema: melhor
ação para executar Caso nenhuma ação seja
prova-da: acha-se uma consistente
Cuja negação não possa ser derivada
Comportamento do agente: Regras de dedução e
database
DIMAP/UFRN
Exemplo de um agente de Raciocínio Dedutivo
Versão similar do Ralph, só que caseiro: Aspirador de pó Orientações: N, S L, O Movimentos: um passo a
frente ou rotacionar 90o
Percepções: sujeira ou limpo
Ação: Pra frente, limpe ou vire
Objetivo: Mover-se pelo ambiente buscando e removendo sujeira
Predicados: Em(x,y) Sujeira(x,y) Direcionando(d)
Função próximo: Analisa percepção Gera uma nova D, incluindo
percepção Remoção de informações
velhas Descobrir a nova posição e
orientação do agente
DIMAP/UFRN
Exemplo de um agente de Raciocínio Dedutivo
Regras de dedução: predicados(variáveis) ações(..)
Primeira regra: prioridade Em(x,y) Sujeira(x,y)
Faça(limpe) Outras regras: mover no
ambiente Exemplo:
Em(0,0) Direção(N) Faça(frente)
Em(0,1) Direção(N) Faça(frente)
Em(0,2) Direção(N) Faça(vire)
Em(0,2) Direção(L) Faça(frente)
Vantagens da abordagem Semantica clara e elegante
Desvantagens: Função Visão: representação
do ambiente em fórmulas lógicas
Ex: imagens e info temporal Complexidade da prova
Situações com restrição temporal
Tomada de decisão: racionalidade calculativa
O mundo não mudará muito do início ao fim do processo de tomada de decisão
DIMAP/UFRN
Agentes de Raciocínio PráticoLógica: tem seu papel
Maioria das vezes: impraticável
Modelo: inspiração dos processos necessários quando nós decidimos o que fazer
Raciocínio prático: Direcionado a ações (descobrir o que fazer)
Raciocínio prático X Raciocínio teórico Sócrates mortal (baseado em crenças) Pegar um onibus ou trem (baseado em ações)
DIMAP/UFRN
Agentes de Raciocínio Prático Raciocínio prático humano, dois passos:
O que deseja-se alcançar Deliberação
Como devemos alcançar Raciocínio meio-fins (means-ends)
Exemplo: um aluno recém-formado Deliberação: que carreira seguir Plano ou receita de como realizar: raciocínio
Existem limitações de tempo, com as implicações: Uso eficiente dos recursos computacionais Não é possível deliberar para sempre
Objetivos escolhidos e comprometidos: intenções
DIMAP/UFRN
Agentes de raciocínio prático
Intenções: alguns papéis no raciocínio prático Direcionam o raciocínio meio-fim (importante na produção de ações)
Ex: Se tenho o objetivo de me tornar acadêmico, tenho de planejar ações para realizar e tentar realizar
Aplicar para programas de mestrado Persistem
Não desistirei sem uma boa razão As razões para se ter as intenções desaparecerem (Vida fácil: acadêmico)
Obrigam deliberações futuras (restrigem o meu poder de escolha) Se quero ser um acadêmico, escolher intenções consistentes
Influeciam nas crenças futuras Se tenho a intenção de ser um acadêmico, Devo acreditar que tenho
chances me tornarei um acadêmico
Conseguir um bom balanceamento entre os tópicos
DIMAP/UFRN
Agentes de raciocínio prático
BDI: Beliefs, desires and intentions Estado interno dos agentes: estados mentais (BDI) Crenças: o que se sabe sobre o estado do
ambiente e dos agentes Intenções: estados do mundo que o agente quer
atingir (contraditórios) Desejos: seqüência de ações para alcançar
objetivo Base: tradição filosófica do entendimento do
raciocínio prático processo de decidir, momento a momento, que
ação executar para alcançar seus objetivos
DIMAP/UFRN
Agentes de raciocínio prático
Representação: crenças, desejos e intenções
Deliberação: Função geradora de opções Função de filtragem
Geração de opções: Novas alternativas de coisas a
serem feitas (Bel) x (Int) (Des) Deliberação: escolher a
melhor opção: o desejo do agente
Selecionar uma opção: filtragem Escolhe a melhor opção para o
agente se comprometer (Bel) x (Des) x (Int) (Int) Ele pode:
Desistir do objetivo Persistir no objetivo
Processo de alteração de crenças: Brf (belief revision function) Recebe a entrada e as crenças
do agente: novo conjunto de crenças
(Bel) x P (Bel)
DIMAP/UFRN
Raciocínio Meio-fins
Como realizar um fim (intenção) usando os meios disponíveis Planejamento
Recebe: O objetivo a ser realizado Estado atual do ambiente Ações disponíveis para o
agente Produz:
Um plano de ações Primeiro planejador real:
STRIPS
Dois componentes básicos Modelo do mundo: Lógica Esquema de ações: pre-
condições e efeito de todas as ações disponíveis
Planejamento: Achar diferença entre o estado atual e objetivo Reduzir aplicando uma ação
Exemplo: mundo dos blocos Tres blocos de mesmo
tamanho Braço: mover um bloco por
vez Mesa: blocos na mesa ou em
cima do outro
DIMAP/UFRN
Raciocínio Meio-fins (Mundo dos blocos)
Formalismo do STRIPS: lógica On(x,y); OnTable(x); Clear(x);
Holding(x), ArmEmpty
Descrição de um estado atual {Clear(A), On(A,B), OnTable(B),
OnTable(C), Clear(C)}
Descrição de um objetivo: {OnTable(A), OnTable(B),
OnTable(C) }
Ações: pré-condições, deleção, adição
Stack(x,y) Pre {Clear(y), Holding(x)} Del {Clear(y), Holding(x)} Add {ArmEmpty, On(x,y)}
Descritor de uma ação: = <P ,D ,A >
Planejamento: <, , > Plano: sequencia de ações
Sequencia de n+1 modelos do ambiente
DIMAP/UFRN
Raciocínio Meio-fins(Planejamento)
Plano (linear) aceitável: pre-condições de todas as ações são satisfeitas no modelo anterior
Plano correto: Aceitável Objetivo alcançado no final
Sistema de planejamento:Dado um problema de
planejamento, ache um plano correto ou avise que não existe
Definições: Plan: conjunto de todos os
planos
: planos Pre(), body(), empty(),
execute(..), head(), tail(), sound(,I,B)
Plan: (Bel) x (Int) x (Ac) Plan
Pode-se: Começar do nada Usar uma biblioteca de
planos
DIMAP/UFRN
Implementando un Agente de Raciocínio Prático
Estrutura básica do processo de tomada de decisão, loop: Observa o mundo, atualiza
suas crenças Decide que intenções realizar Acha um plano para realizar Executa o plano
Primeiro problema: Compromisso aos fins e meios
Compromisso persistência temporal Quão compromissado um agente deve ser?
Estratégias de compromisso: Cega: manter até a realização Single-minded: manter até a
realização ou impossibilidade de realização
Open-minded: manter en-quanto acredita-se ser possível
Compromisso aos meios Succeeded(I,B) e Impossible(I,B)
Compromisso aos fins: intenções Possibilidade: reconsiderar
sempre que realizar uma ação Pode-se tornar muito caro
DIMAP/UFRN
Implementando un Agente de Raciocínio Prático
Dilema: Nunca considerar: intenções
ultrapassadas Considerar constantemente:
nunca realizar as intenções Balanceamento:
Meta-nível: Reconsider(I,B) Situação ótima:
Base: deliberação e plano perfeitos
Custo associado ao Reconsider
Mudar as intenções todas as vezes que deliberar
Situações: Não deliberou, não modificou
as intenções e o mundo não mudou: perfeito
Não deliberou, não modificou as intenções e o mundo mudou: imperfeito
Deliberou, não modificou as intenções (o mundo não mudou): imperfeito
Deliberou, modificou as intenções (o mundo mudou): perfeito
Suposição: custo de Reconsider é menor que deliberar
DIMAP/UFRN
Implementando un Agente de Raciocínio Prático
Quando modificar as intenções durante a execução de um plano? Extremos: apenas quando o plano for executado ou após a
execução de cada ação Ambientes estáticos:
Agentes fortemente compromissados com suas intenções produzem melhores resultados
Ambientes dinâmicos: Agentes que reconsideram suas intenções podem detectar
melhor quando as intenções estão ultrapassadas Diferentes tipos de ambientes: diferentes estratégias de
reconsideração e de compromisso Exemplo: HOMER robô submarino que planeja suas ações
DIMAP/UFRN
Sistema de Raciocínio Procedural (PRS)
Primeira arquitetura que absorve as idéias de BDIs Controle de tráfego aéreo, simulação, gerenciamento de
processos
Arquitetura: Utiliza uma biblioteca de planos Diferença: o corpo do plano pode ter ações e objetivos, ter
disjunção de de objetivos ou ter loops, entre outros
Início: Objetivo de alto-nível Pilha de objetivos Busca por um plano
Caso tenha mais de um, escolha um (plano de alto-nível, utilidade) Execute plano: Caso tenha objetivos, coloque na pilha Caso um plano falhe, escolha outro
Exemplo a ser estudado: mundo dos blocos (Pág.84-85)