seminário redes bayesianas

REDES BAYESIANAS

NELSON CAMPAGNARO JR

JOINVILLE, ABRIL DE 2011

Sumário

Introdução

Redes Bayesianas- Conceitos

Probabilidade

Estrutura de uma Rede Bayesiana

Representação do Conhecimento

Inferência usando Redes Bayesianas

Semântica

Aplicações

Construindo uma Rede Bayesiana

Conclusão

Exercícios

Referências

Introdução

As Redes Bayesianas foram desenvolvidas início dos anos 80 para facilitar a tarefa de predição e “abdução” em sistemas de Inteligência Artificial (AI) (Pearl, 2000). Em resumo, Redes Bayesianas (RB) também conhecidas como redes de opinião, redes causais, gráficos de dependência probabilística, são modelos gráficos para raciocínio (conclusões) baseado na incerteza, onde os nós representam as variáveis (discreta ou contínua), e os arcos representam a conexão direta entre eles.

Introdução

Redes Bayesianas são modelos de representação do conhecimento que trabalham com o conhecimento incerto e incompleto através da Teoria da Probabilidade Bayesiana, publicada pelo matemático Thomas Bayes em 1763.

Ela vem se tornando a metodologia padrão para a construção dos sistemas que confiam no conhecimento probabilístico e tem sido aplicada em uma variedade de atividades do mundo real.

Redes Bayesianas

São diagramas que organizam o

conhecimento numa dada área através de

um mapeamento entre causas e efeitos.

Os sistemas baseados em redes

Bayesianas são capazes de gerar

automaticamente predições ou decisões

mesmo na situação de inexistência de

algumas peças de informação.

Redes Bayesianas

Existem duas abordagens principais que

podem ser utilizadas dentro do contexto

dos sistemas que agem racionalmente:

Raciocínio Lógico

Raciocínio Probabilístico

Raciocínio Lógico e Probabilístico

Pondera sobre o conhecimento prévio a

respeito do problema e, sobre esta base

de conhecimento retira suas conclusões.

Redes bayesianas oferecem uma

abordagem para o raciocínio

probabilístico que engloba teoria de

grafos, para o estabelecimento das

relações entre sentenças e ainda, teoria

de probabilidades.

Probabilidade

A probabilidade condicional trata da probabilidade de ocorrer um evento A, tendo ocorrido um evento B, ambos do espaço amostral S, ou seja, ela é calculada sobre o evento B e não em função o espaço amostral S.

A probabilidade de ocorrência de um evento A em relação a um evento ocorrido B é expressa como:

P(A/B)

Probabilidade Fornece um meio de descrever e manipular

conhecimento incerto ou incompleto.

Associa às sentenças um grau de crença

numérico entre 0 e 1.

Cada sentença ou é verdadeira ou é falsa.

A regra de Bayes

Thomas Bayes

Probabilidade

Fórmula:

Grau da Probabilidade

Condicional: calculado de acordo com as

evidências disponíveis. Dados dois eventos

A e B, a probabilidade condicional de A

dado que ocorreu B é denotada por P(A/B)

e definida por:

Ex: P(cárie|dor de dente) = 0.5

. 0 P(B) ,P(B)

B)P(A B)|P(A

Grau de Probabilidade

Independência de Eventos: Dois eventos A

e B são independentes se a informação da

ocorrência (ou não) de B não altera a

probabilidade de ocorrência de A, isto é:

Ex: A= dor de ouvido , B= úlcera, ou seja

úlcera não causa dor de ouvido.

P(A) B)|P(A

Tabela de Probabilidades

O preenchimento das tabelas de probabilidades condicionadas é muitas vezes simples (desde que a relação entre os pais e o nó filho não seja arbitrária).

Geralmente as relações entre nós pais e nós filhos caem em categorias de distribuições canónicas (que obedecem a um padrão), sendo necessário apenas identificar qual o padrão e introduzir alguns parâmetros.


Cada linha em uma Tabelas de

probabilidade condicional contém a

probabilidade condicional de cada valor

de nó para um caso de condicionamento.

um caso de condicionamento é apenas

uma combinação possível de valores para

os nós superiores.

Um nó sem pais tem apenas uma linha.

Tabela de Probabilidades Exemplo:

Variáveis: Arrombamento, Terremoto,

Alarme, JoãoLiga, MariaLiga.


Roubos e terremotos afetam diretamente

a probabilidade do alarme tocar. Mas o

fato de João e Maria telefonarem só

depende do alarme;

Desse modo, a rede representa nossas

suposições de que eles não percebem

quaisquer roubos diretamente, não notam

os terremotos e não verificam antes de

ligar.

Estrutura de uma rede Bayesiana

Cada variável aleatória (VA) é representada por um nó da rede

Cada nó (VA) recebe conexões dos nós que têm influência direta (seus pais) sobre ele. (Tarefa fácil para o especialista)

Cada nó possui uma tabela de Probabilidades Condicionais que quantifica a influência dos seus pais sobre ele. (Difícil para o especialista)

O grafo é acíclico


Conjunto de variáveis discretas U = {A1, A2, ..., An}.

Conjunto de arestas direcionadas entre variáveis.

Não pode haver ciclos direcionados

Cada variável tem um conjunto finito de estados mutuamente exclusivos.

Representação do conhecimento

para raciocínio com incerteza

Representa 3 tipos de conhecimento do domínio:

• Relações de independência entre variáveis aleatórias (graficamente);

• Probabilidades a priori de algumas variáveis;

• Probabilidades condicionais entre variáveis dependentes.



Permite calcular eficientemente:

Probabilidades a posteriori de qualquer

variável aleatória (inferência), usando para

isso uma definição recursiva do teorema

de Bayes.



Conhecimento representado:

Pode ser aprendido a partir de exemplos,

reutilizando parte dos mecanismos de

raciocínio.

Raciocínio com Incerteza

A chance do Flamengo ganhar o próximo

jogo é de 78%.

A probabilidade de chover amanhã é de

90%.

A grande maioria dos brasileiros gosta de

futebol.

José acha que o cavalo Azulão vai ganhar

o páreo, mas Pedro acha que não.

Inferência usando Redes Bayesianas

A distribuição conjunta pode ser usada para

responder a qualquer pergunta sobre o

domínio.

Tipos:

Causal

Diagnóstico

Intercausal

Semântica

Duas semânticas:

Numérica (global)

Topológica (local)

Semântica Local

Ex. D é independente de A e B

Aplicação

Diagnóstico de doenças cardíacas: A

tecnologia de Redes Probabilísticas

(Redes Bayesianas) é ideal para o

tratamento de incerteza, muito comum na

área médica e, além disso, modela o

conhecimento do especialista do domínio

de uma forma intuitiva.


Escolher uma ordem para as variáveis aleatórias X1,… ,Xn.

Para i = 1 à n, adicione Xi à rede, selecione pais para X1, … ,Xi-1 tais que P (Xi | Pais(Xi)) = P (Xi | X1, ... Xi-1).

A ordem correta em que os nós devem ser adicionados consiste em adicionar primeiro as “causas de raiz”, depois as variáveis que elas influenciam e assim por diante, até chegarmos às folhas.


Exemplo de Aplicação

O objetivo aqui, é extrair conhecimento

de forma automática a partir de uma base

de dados hipotética contendo um número

sequencial de candidatos e mais três

variáveis: Aprovado, Cursinho e IBL

(Internet Banda Larga), contendo dois

atributos possíveis cada (Sim e Não).


APROVADO IBL CURSINHO

Sim Sim Sim

Sim Não Sim

Sim Sim Não

Não Não Não

Sim Não Sim

Sim Sim Sim

Sim Não Sim

Não Não Não

Não Sim Não

Sim Sim Sim

Não Não Não

Sim Sim Não

Sim Não Sim

Sim Sim Sim

Não Não Sim


Qual a probabilidade de um candidato

ser aprovado dado que possui internet de

banda larga em casa?

Qual a probabilidade de um candidato ser

aprovado dado que fez cursinho?

Conclusão

A maior vantagem do raciocínio

probabilístico em relação ao raciocínio

lógico é permitir ao agente chegar a

decisões racionais mesmo quando não há

informação suficiente para provar que

qualquer das ações dadas irá funcionar.

Exercícios

01)

Mobville, o roubo malabarista, frequentemente derruba as bolas que está equilibrando (ou

carregando) quando a sua bateria está baixa. Em testes anteriores, foi determinado que

a probabilidade com que ele derruba uma bola quando a bateria está baixa é de 0.9. Por

outro lado, quando a bateria não está baixa, a probabilidade com que ele derruba uma bola

é de somente 0.01. A bateria foi carregada há pouco tempo, e na nossa melhor adivinhacão,

dado seus feitos com as bolas no ar, que a bateria esteja baixa é de 10 contra 1. Um roubo

observador, com um sistema de visão não muito confiável, avisa que Mobville derrubou uma

bola. A confiabilidade do observador é dado pelas seguintes probabilidades:

1. p(observador diz que Mobville derruba | Mobville derruba) = 0.9

2. p(observador diz que Mobville derruba | Mobville não derruba) = 0.2

Desenhe uma rede de Bayes, e calcule a probabilidade de que a bateria esteja baixa dado o

relatório do observador (derrubou uma bola).

Exercícios

02)

Um comitê de admissão para um programa

de mestrado está tentando determinar a

probabilidade que um candidato admitido

seja realmente qualificado. As probabilidades

relevantes são dadas pela rede de Bayes

mostrada na figura 2.

Exercícios

Exercícios

Determine p(A|D) (a probabilidade de uma

candidato qualificado (A), dado que este

tenha sido aceito no programa de

mestrado (D)).

Referências

http://www.devmedia.com.br por

Alexandre Serra Barreto

http://saudecoletiva.ufcspa.edu.br por

Célia Flores e Charles Hoher

http://www.poli.usp.br por André Hideaki,

Rodolfo Sharovysk, Fábio Gagliardi

http://www2.joinville.udesc.br/~coca/ por

Felipe Nunes Leonel

http://www.devmedia.com.br/

http://www.devmedia.com.br/

http://saudecoletiva.ufcspa.edu.br/

http://saudecoletiva.ufcspa.edu.br/

http://www.poli.usp.br/

http://www.poli.usp.br/

http://www2.joinville.udesc.br/~coca/

http://www2.joinville.udesc.br/~coca/

seminário redes bayesianas

Education