agentes inteligentes - valdick salesvaldick.com/facima/3iaagentes inteligentes.pdf · agente...

25
Agentes Inteligentes Módulo 02 27/02/2013 Inteligência Artificial Profª Hemilis Joyse 1

Upload: dangkhue

Post on 28-Jan-2019

225 views

Category:

Documents


0 download

TRANSCRIPT

Agentes Inteligentes

Módulo 02

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

1

Agente

• É tudo que pode ser considerado capaz de perceber seu ambiente por meio de sensores e de agir sobre esse ambiente por intermédio de atuadores.

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

2

Agente

• Tabela parcial de uma função de agente Aspirador de pó:

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

3

Sequência de percepções Ação

[A, Limpo] Direita

[A, Sujo] Aspirar

[B, Limpo] Esquerda

[B, Sujo] Aspirar

[A, Limpo], [A, Limpo]

Direita

[A, Limpo], [A, Sujo]

Aspirar

..........................

Agente

• Aspirador de pó:

• Função do agente: limpar

• Ambiente: dois quadrados A e B (mundo simples: pode-se descrever tudo o que acontece!)

• Percepção do agente: em que quadrado ele está e se existe sujeira no quadrado

• Ações do agente: mover-se para esquerda, direita, aspirar o pó ou não fazer nada;

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

4

Agente Racional

• Agente racional é aquele que faz tudo certo;

• Medida de desempenho como regra geral é melhor projetar medidas de desempenho de acordo com o resultado realmente desejado no ambiente, em vez de criá-las de acordo com o comportamento esperado do agente;

• Racionalidade

• A definição do que é racional em qualquer instante dado depende de:

• A medida de desempenho que define o critério de sucesso;

• O conhecimento anterior que o agente tem do ambiente;

• As ações que o agente pode executar;

• A sequência de percepções do agente até o momento;

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

5

Agente Racional

• Onisciência;

• Aprendizado - Aprender tanto quanto possível do que ele percebe;

• Autonomia – Embasamento em suas próprias percepções;

• Em termos matemáticos o comportamento de um agente é descrito pela função de agente.

• Mapeando qualquer sequência de percepções específicas para um ação.

• A função do agente é calculada em 3 períodos:

• Quando está sendo projetado;

• Quando está decidindo sobre sua próxima ação;

• E á medida que aprende a partir da experiência;

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

6

A natureza dos ambientes

• Ambientes de tarefas – são essencialmente os “problemas” para os quais os agentes racionais são as “soluções”;

• Especificando o ambiente de tarefa

• Medida de desempenho;

• O ambiente;

• Os atuadores ;

• E sensores do agente;

Tudo isso é inserido em um ambiente de tarefa!

• Pensar em um agente motorista de táxi...

• A tarefa de dirigir é extremante aberta.

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

7

A natureza dos ambientes

• 1º Que medidas de desempenho gostaríamos que nosso motorista automatizado tivesse como objetivo?

• Qualidades desejadas :

• Destino correto ;

• Minimizar:

• O consumo de combustível e desgaste;

• O tempo;

• Violação das leis de trânsito;

• Maximizar:

• A segurança e o conforto dos passageiros;

• Os lucros;

Alguns desses objetivos são conflitantes...

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

8

A natureza dos ambientes

• 2º Qual é o ambiente de direção que o táxi enfrentará?

• Qualquer motorista de táxi deve lidar com diversos tipos de estradas:

• Estradas rurais;

• Avenidas urbanas;

• Até rodovias com 12 pistas...

• A estrada contêm outros tipos de tráfegos:

• Pedestres ;

• Animais perdidos;

• Trabalhadores;

• Policiamento;

• Buracos;

• O táxi deve interagir com os passageiros;

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

9

A natureza dos ambientes

• 3º Os atuadores disponíveis para um táxi automatizado serão aproximadamente os mesmos disponíveis para um humano:

• Acelerador;

• Controle sobre a direção;

• Frenagem;

• .....

• ....

• .

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

10

A natureza dos ambientes

• 4º Para alcançar seus objetivos no ambiente de direção, o táxi precisará saber: • Onde está;

• O que mais existe na estrada;

• Qual a sua velocidade;

• Seus sensores: • Câmeras de TV controláveis;

• Velocímetro;

• Hodômetro;

• Acelerômetro (para controlar o veículo de forma correta, especialmente nas curvas);

• GPS;

• Teclado ou microfone (para os passageiros solicitarem um destino)

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

11

Propriedades de ambiente de tarefas

Tipo do agente

Medida de desempenho

Ambiente Atuadores Sensores

Motorista de táxi

Viagem segura, rápida, dentro da lei, confortável, maximizar lucros

Estradas, outros tipos de tráfego, Pedestres, cliente.

Direção, acelerador, freio, sinal, buzina.

Câmeras, sonar velocímetro, hodômetro, acelerômetro, sensores de motor, teclado

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

12

Propriedades de ambiente de tarefas

• Há uma variedade de ambientes de tarefas em IA;

• Completamente observável versus parcialmente observável: • Completamente observável, quando os sensores permitem acesso ao

estado completo do ambiente em cada instante.

• Parcialmente observável, exemplo, um táxi automatizado não pode saber o que outros motoristas estão pensando.

• Ex: futebol de robôs com visão global (c.o.) x visão local (p.o.)

• Determinístico versus estocástico • Determinístico, quando o próximo estado do ambiente é

completamente determinado pelo estado atual e pela ação executada pelo agente.

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

13

Propriedades de ambiente de tarefas

• Episódico x seqüencial

• O episódio seguinte depende das ações executadas nos episódios anteriores?

• Ex: Jogar um dado (ep.), dar o próximo passo (seq.)

• Estático x dinâmico

• O ambiente se altera enquanto o agente está deliberando?

• Ex: xadrez (est.), futebol de robôs (din.)

• Discreto x contínuo

• O ambiente tem um número finito de estados? Os sensores ou atuadores utilizam medidas discretas? O tempo é discreto?

• Ex: xadrez (disc. com relação aos estados e sensores), motorista de taxi (cont. com relação aos estados e sensores)

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

14

Propriedades de ambiente de tarefas

• Agente único x multiagente

• Quantos agentes existem no ambiente? No caso de multiagente, os agentes competem ou cooperam?

• Ex: palavras cruzadas (único), jogo da velha (mult.)

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

15

Programas de agentes

• O programa AGENTE-DIRIGIDO-POR-TABELA é invocado a cada

nova percepção e retorna uma ação de cada vez

• Ele mantém o controle da sequência de percepções usando sua própria estrutura de dados privada:

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

16

Desafio da I.A.

• Descobrir como escrever programas que, na medida do possível, produzam um comportamento racional a partir de uma pequena quantidade de código, e não a partir de um grande número de entradas de tabelas.

• Exemplo: Tabela de raiz quadrada x método de Newton;

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

17

Tipos de agentes

• Agentes reativos simples;

• Agentes reativos baseados em modelo;

• Agentes baseados em objetivo;

• Agentes baseados na utilidade;

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

18

Agentes reativos simples

• Selecionam ações com base na percepção atual, ignorando o restante do histórico das percepções

• Exemplo: aspirador de pó reativo

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

19

Agentes reativos simples

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

20

Agentes reativos baseados em modelo

• Agente controla a parte do mundo que ele não pode ver agora (agente mantém estado interno que depende do histórico de percepções)

• Exemplo: agente taxista vai trocar de pista e pode não ver momentaneamente alguns carros à sua volta.

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

21

Agentes baseados em objetivos

• Agente combina seu objetivo com as informações sobre os resultados de ações possíveis a fim de escolher ações que alcancem os seus objetivos.

• Exemplo: Taxi em um entroncamento de estradas: virar à esquerda, à direita ou ir em frente?

• Necessidade de busca e planejamento: subcampos da I A dedicados a encontrar I.A. sequências de ações que alcançam os objetivos do agente

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

22

Agentes baseados em utilidade

• Existem muitas sequências de ações que levam o agente ao seu objetivo. Algumas mais rápidas, mais seguras, mais econômicas, etc.

• Agentes baseados em utilidade utilizam uma medida de desempenho (função de utilidade) que permite uma comparação entre diferentes estados do mundo, permitindo selecionar a sequência de ações.

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

23

Agentes com aprendizagem

• Um elemento de aprendizado utiliza realimentação sobre como um agente está funcionando e determina de que maneira o elemento de desempenho deve ser modificado para funcionar melhor no futuro.

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

24

Referência

• RUSSELL, S. NORVIG, P. Inteligência Artificial. 2ª edição. Capítulo 2.

27

/02

/20

13

In

telig

ênci

a A

rtif

icia

l

P

rofª

Hem

ilis

Joys

e

25