seminário redes bayesianas
DESCRIPTION
Seminário de Redes BayesianasTRANSCRIPT
REDES BAYESIANAS
NELSON CAMPAGNARO JR
JOINVILLE, ABRIL DE 2011
Sumário
Introdução
Redes Bayesianas- Conceitos
Probabilidade
Estrutura de uma Rede Bayesiana
Representação do Conhecimento
Inferência usando Redes Bayesianas
Semântica
Aplicações
Construindo uma Rede Bayesiana
Conclusão
Exercícios
Referências
Introdução
As Redes Bayesianas foram desenvolvidas início dos anos 80 para facilitar a tarefa de predição e “abdução” em sistemas de Inteligência Artificial (AI) (Pearl, 2000). Em resumo, Redes Bayesianas (RB) também conhecidas como redes de opinião, redes causais, gráficos de dependência probabilística, são modelos gráficos para raciocínio (conclusões) baseado na incerteza, onde os nós representam as variáveis (discreta ou contínua), e os arcos representam a conexão direta entre eles.
Introdução
Redes Bayesianas são modelos de representação do conhecimento que trabalham com o conhecimento incerto e incompleto através da Teoria da Probabilidade Bayesiana, publicada pelo matemático Thomas Bayes em 1763.
Ela vem se tornando a metodologia padrão para a construção dos sistemas que confiam no conhecimento probabilístico e tem sido aplicada em uma variedade de atividades do mundo real.
Redes Bayesianas
São diagramas que organizam o
conhecimento numa dada área através de
um mapeamento entre causas e efeitos.
Os sistemas baseados em redes
Bayesianas são capazes de gerar
automaticamente predições ou decisões
mesmo na situação de inexistência de
algumas peças de informação.
Redes Bayesianas
Existem duas abordagens principais que
podem ser utilizadas dentro do contexto
dos sistemas que agem racionalmente:
Raciocínio Lógico
Raciocínio Probabilístico
Raciocínio Lógico e Probabilístico
Pondera sobre o conhecimento prévio a
respeito do problema e, sobre esta base
de conhecimento retira suas conclusões.
Redes bayesianas oferecem uma
abordagem para o raciocínio
probabilístico que engloba teoria de
grafos, para o estabelecimento das
relações entre sentenças e ainda, teoria
de probabilidades.
Probabilidade
A probabilidade condicional trata da probabilidade de ocorrer um evento A, tendo ocorrido um evento B, ambos do espaço amostral S, ou seja, ela é calculada sobre o evento B e não em função o espaço amostral S.
A probabilidade de ocorrência de um evento A em relação a um evento ocorrido B é expressa como:
P(A/B)
Probabilidade Fornece um meio de descrever e manipular
conhecimento incerto ou incompleto.
Associa às sentenças um grau de crença
numérico entre 0 e 1.
Cada sentença ou é verdadeira ou é falsa.
A regra de Bayes
Thomas Bayes
Probabilidade
Fórmula:
Grau da Probabilidade
Condicional: calculado de acordo com as
evidências disponíveis. Dados dois eventos
A e B, a probabilidade condicional de A
dado que ocorreu B é denotada por P(A/B)
e definida por:
Ex: P(cárie|dor de dente) = 0.5
. 0 P(B) ,P(B)
B)P(A B)|P(A
Grau de Probabilidade
Independência de Eventos: Dois eventos A
e B são independentes se a informação da
ocorrência (ou não) de B não altera a
probabilidade de ocorrência de A, isto é:
Ex: A= dor de ouvido , B= úlcera, ou seja
úlcera não causa dor de ouvido.
P(A) B)|P(A
Tabela de Probabilidades
O preenchimento das tabelas de probabilidades condicionadas é muitas vezes simples (desde que a relação entre os pais e o nó filho não seja arbitrária).
Geralmente as relações entre nós pais e nós filhos caem em categorias de distribuições canónicas (que obedecem a um padrão), sendo necessário apenas identificar qual o padrão e introduzir alguns parâmetros.
Tabela de Probabilidades
Cada linha em uma Tabelas de
probabilidade condicional contém a
probabilidade condicional de cada valor
de nó para um caso de condicionamento.
um caso de condicionamento é apenas
uma combinação possível de valores para
os nós superiores.
Um nó sem pais tem apenas uma linha.
Tabela de Probabilidades Exemplo:
Variáveis: Arrombamento, Terremoto,
Alarme, JoãoLiga, MariaLiga.
Tabela de Probabilidades
Roubos e terremotos afetam diretamente
a probabilidade do alarme tocar. Mas o
fato de João e Maria telefonarem só
depende do alarme;
Desse modo, a rede representa nossas
suposições de que eles não percebem
quaisquer roubos diretamente, não notam
os terremotos e não verificam antes de
ligar.
Estrutura de uma rede Bayesiana
Cada variável aleatória (VA) é representada por um nó da rede
Cada nó (VA) recebe conexões dos nós que têm influência direta (seus pais) sobre ele. (Tarefa fácil para o especialista)
Cada nó possui uma tabela de Probabilidades Condicionais que quantifica a influência dos seus pais sobre ele. (Difícil para o especialista)
O grafo é acíclico
Estrutura de uma rede Bayesiana
Conjunto de variáveis discretas U = {A1, A2, ..., An}.
Conjunto de arestas direcionadas entre variáveis.
Não pode haver ciclos direcionados
Cada variável tem um conjunto finito de estados mutuamente exclusivos.
Estrutura de uma rede Bayesiana
Representação do conhecimento
para raciocínio com incerteza
Representa 3 tipos de conhecimento do domínio:
• Relações de independência entre variáveis aleatórias (graficamente);
• Probabilidades a priori de algumas variáveis;
• Probabilidades condicionais entre variáveis dependentes.
Representação do conhecimento
para raciocínio com incerteza
Permite calcular eficientemente:
Probabilidades a posteriori de qualquer
variável aleatória (inferência), usando para
isso uma definição recursiva do teorema
de Bayes.
Representação do conhecimento
para raciocínio com incerteza
Conhecimento representado:
Pode ser aprendido a partir de exemplos,
reutilizando parte dos mecanismos de
raciocínio.
Raciocínio com Incerteza
A chance do Flamengo ganhar o próximo
jogo é de 78%.
A probabilidade de chover amanhã é de
90%.
A grande maioria dos brasileiros gosta de
futebol.
José acha que o cavalo Azulão vai ganhar
o páreo, mas Pedro acha que não.
Inferência usando Redes Bayesianas
A distribuição conjunta pode ser usada para
responder a qualquer pergunta sobre o
domínio.
Tipos:
Causal
Diagnóstico
Intercausal
Semântica
Duas semânticas:
Numérica (global)
Topológica (local)
Semântica Local
Ex. D é independente de A e B
Aplicação
Diagnóstico de doenças cardíacas: A
tecnologia de Redes Probabilísticas
(Redes Bayesianas) é ideal para o
tratamento de incerteza, muito comum na
área médica e, além disso, modela o
conhecimento do especialista do domínio
de uma forma intuitiva.
Construindo uma Rede Bayesiana
Escolher uma ordem para as variáveis aleatórias X1,… ,Xn.
Para i = 1 à n, adicione Xi à rede, selecione pais para X1, … ,Xi-1 tais que P (Xi | Pais(Xi)) = P (Xi | X1, ... Xi-1).
A ordem correta em que os nós devem ser adicionados consiste em adicionar primeiro as “causas de raiz”, depois as variáveis que elas influenciam e assim por diante, até chegarmos às folhas.
Construindo uma Rede Bayesiana
Exemplo de Aplicação
O objetivo aqui, é extrair conhecimento
de forma automática a partir de uma base
de dados hipotética contendo um número
sequencial de candidatos e mais três
variáveis: Aprovado, Cursinho e IBL
(Internet Banda Larga), contendo dois
atributos possíveis cada (Sim e Não).
Construindo uma Rede Bayesiana
APROVADO IBL CURSINHO
Sim Sim Sim
Sim Não Sim
Sim Sim Não
Não Não Não
Sim Não Sim
Sim Sim Sim
Sim Não Sim
Não Não Não
Não Sim Não
Sim Sim Sim
Não Não Não
Sim Sim Não
Sim Não Sim
Sim Sim Sim
Não Não Sim
Construindo uma Rede Bayesiana
Qual a probabilidade de um candidato
ser aprovado dado que possui internet de
banda larga em casa?
Qual a probabilidade de um candidato ser
aprovado dado que fez cursinho?
Conclusão
A maior vantagem do raciocínio
probabilístico em relação ao raciocínio
lógico é permitir ao agente chegar a
decisões racionais mesmo quando não há
informação suficiente para provar que
qualquer das ações dadas irá funcionar.
Exercícios
01)
Mobville, o roubo malabarista, frequentemente derruba as bolas que está equilibrando (ou
carregando) quando a sua bateria está baixa. Em testes anteriores, foi determinado que
a probabilidade com que ele derruba uma bola quando a bateria está baixa ´e de 0.9. Por
outro lado, quando a bateria não está baixa, a probabilidade com que ele derruba uma bola
é de somente 0.01. A bateria foi carregada há pouco tempo, e na nossa melhor adivinhacão,
dado seus feitos com as bolas no ar, que a bateria esteja baixa ´e de 10 contra 1. Um roubo
observador, com um sistema de visão não muito confiável, avisa que Mobville derrubou uma
bola. A confiabilidade do observador ´e dado pelas seguintes probabilidades:
1. p(observador diz que Mobville derruba | Mobville derruba) = 0.9
2. p(observador diz que Mobville derruba | Mobville n˜ao derruba) = 0.2
Desenhe uma rede de Bayes, e calcule a probabilidade de que a bateria esteja baixa dado o
relatório do observador (derrubou uma bola).
Exercícios
02)
Um comitê de admissão para um programa
de mestrado está tentando determinar a
probabilidade que um candidato admitido
seja realmente qualificado. As probabilidades
relevantes são dadas pela rede de Bayes
mostrada na figura 2.
Exercícios
Exercícios
Determine p(A|D) (a probabilidade de uma
candidato qualificado (A), dado que este
tenha sido aceito no programa de
mestrado (D)).
Referências
http://www.devmedia.com.br por
Alexandre Serra Barreto
http://saudecoletiva.ufcspa.edu.br por
Célia Flores e Charles Hoher
http://www.poli.usp.br por André Hideaki,
Rodolfo Sharovysk, Fábio Gagliardi
http://www2.joinville.udesc.br/~coca/ por
Felipe Nunes Leonel