reconhecimento de padrões revisão de probabilidade e estatística david menotti, ph.d. ...
TRANSCRIPT
![Page 1: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/1.jpg)
Reconhecimento de Padrões
Revisão de Probabilidade e Estatística
David Menotti, Ph.D.www.decom.ufop.br/menotti
Universidade Federal de Ouro Preto (UFOP)Programa de Pós-Graduação em Ciëncia da Computação (PPGCC)
![Page 2: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/2.jpg)
Conceitos Básicos
• Estamos realizando um evento aleatório (pegar um peixe no mar)
• Espaço amostral S– Conjunto de todas a possibilidades
• Um evento A– Um subconjunto de S
• Lei da probabilidade– Regra que atribui uma probabilidade aos eventos de um
experimento
S
A
![Page 3: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/3.jpg)
Axiomas Básicos da Probabilidade
• P(A) >= 0• P(S) = 1 • P(AUB) = P(A)+P(B) se A e B forem
mutuamente exclusivos– Eventos que não ocorrem simultaneamente,
ou seja A∩B = ø
• Caso contrário– P(AUB) = P(A)+P(B) – P(A∩B)
• P(A) + P(~A)= 1
![Page 4: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/4.jpg)
Probabilidade Condicional
• A probabilidade de ocorrer um evento, na condição de que outro evento já tenha ocorrido.
• Considere o seguinte exemplo:– 250 alunos estão matriculados no primeiro ano
• 100 homens e 150 mulheres• 110 cursam física e 140 química
)(
)()|(
BP
BAPBAP
Sexo\Discip. Física Química Total
H 40 60 100
M 70 80 150
Total 110 140 250
![Page 5: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/5.jpg)
Probabilidade Condicional
• Um aluno é sorteado ao acaso. Qual a probabilidade de que esteja cursando química dado que seja mulher.
53.0150
80
25015025080
)(
)()|(
MP
MQPMQP
![Page 6: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/6.jpg)
Probabilidade Total
• Uma sequência finita de experimentos na qual cada experimento tem um número finito de resultados com uma determinada probabilidade é chamada de processo estocástico finito.
• Árvore Bayesiana é uma boa ferramenta para visualização do problema.
• A probabilidade final é calculada pela lei da probabilidade final.
![Page 7: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/7.jpg)
Probabilidade Total: Exemplo• Considere 3 caixas
– Caixa 1 tem 10 lampadas, das quais 4 com defeito– Caixa 2 tem 6 lâmpadas, das quais 1 com defeito– Caixa 3 tem 8 lâmpadas, das quais 3 com defeito.
• O problema consiste em saber a probabilidade de uma lâmpada ser defeituosa P(A), ao selecionar uma caixa aleatoriamente e depois selecionar uma lâmpada aleatoriamente.
1
2
3
DefeitoOk
Defeito
Ok
Defeito
Ok
1/3
1/3
1/3
4/10
6/10
1/65/6
3/85/8
Baseado no conceito de probabilidade total,temos como probabilidade P(A)
31.08
3
3
1
6
1
3
1
10
4
3
1)(
AP
![Page 8: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/8.jpg)
Eventos Independentes
• Dois eventos são ditos independentes se P(A∩B) = P(A) * P(B)
• Logo, pela regra da probabilidade condicional, se A e B são independentes,
)()(
)()()|( AP
BP
BPAPBAP
![Page 9: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/9.jpg)
Exemplo
• Suponha que uma urna contenha 4 bolas brancas e 6 vermelhas. Vamos sortear duas bolas (sem reposição) em momentos distintos. Qual a probabilidade de sair uma bola branca seguida de uma vermelha
P(B) = 4/10
P(V) = 6/10
P(B) = 3/9
P(V) = 6/9
P(B) = 4/9
P(V) = 5/9
![Page 10: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/10.jpg)
Exemplo (cont)
• Agora considere o exemplo anterior com reposição, ou seja, eventos independentes.
• P(B,V) = P(B) X P(V) = 4/10 X 6/10 = 0.24
![Page 11: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/11.jpg)
Teorema de Bayes
• Basicamente o teorema de Bayes mostra como rever as crenças sempre que novas evidências são coletadas.
• Ou seja, atualizar a probabilidade a posteriori utilizando para isso a probabilidade a priori e as verossimilhanças e as evidências.
)(
)|()()|(
BP
ABPAPBAP
prioriVerosimilhanças(likelihood)
EvidênciasProb. aposteriori
)|()()( ii ABPAPBP
![Page 12: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/12.jpg)
Teorema de Bayes: Exemplo
• Um médico sabe que a meningite causa torcicolo em 50% dos casos. Porém, o médico sabe que a meningite atinge 1/50000 e também que a probabilidade de se ter torcicolo é de 1/20.
• Usando Bayes pra saber a probabilidade de uma pessoa ter meningite dado que ela está com torcicoloP(T|M) = 0.5P(M) = 1/50000P(T) = 1/20
0002.020/1
5.050000/1
)(
)|()()|(
TP
MTPMPTMP
![Page 13: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/13.jpg)
Teorema de Bayes: Exercício• Considere o sistema de classificação de peixes visto anteriormente.
Para essa época do ano, sabe-se que a probabilidade de pescar salmão é maior que pescar robalo, P(salmão) = 0.82 e P(robabo) = 0.18.
• Suponha que a única característica que você pode contar é a intensidade do peixe ou seja, se ele é claro ou escuro. Sabe-se que 49.5% dos salmões tem intensidade clara e que 85% dos robalos tem intensidade clara.
• Calcule a probabilidade de ser salmão dado que o peixe amostrado tem intensidade clara.
726.085.018.0495.082.0
495.082.0
)(
)|()()|(
CP
SCPSPCSP
Probabilidade total
![Page 14: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/14.jpg)
Variáveis Aleatórias
• Na prática, muitas vezes é mais interessante associarmos um número a um evento aleatório e calcularmos a probabilidade da ocorrência desse número do que a probabilidade do evento.
• Exemplo: Lançam-se três moedas. Seja X o numero de ocorrências da face cara. Determinar a distribuição de probabilidade de X– S = {ccc,cck,ckc,ckk,kcc,kck,kkc,kkk}– Se X é o número de caras, X assume os valores
0,1,2, e 3.
![Page 15: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/15.jpg)
Variáveis Aleatórias
• Podemos associar a esses números eventos que correspondem a ocorrência de nenhuma, uma, duas ou três caras.
• Desta forma temos– P(X=0) = 1/8 – P(X=1) = 3/8 – P(X=2) = 3/8– P(X=3) = 1/8
Distribuição de Probabilidades
1)( iXP
![Page 16: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/16.jpg)
Variáveis Aleatórias
• Portanto, podemos definir que variável aleatória é a função que associa a todo evento pertencente a uma partição do espaço amostral um único número real.
• Variáveis podem ser discretas ou contínuas
![Page 17: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/17.jpg)
Parâmetros de uma Distribuição
• Existem características numéricas que são muito importantes em uma distribuição de probabilidades. São os parâmetros da distribuição– Esperança matemática e variância.
• Esperança matemática
)()( ii XPXXE
![Page 18: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/18.jpg)
Esperança Matemática: Exemplo
• Uma seguradora paga 30000 em caso de acidente de carro e cobra franquia de 1000. Sabe-se que a probabilidade de que um carro sofra acidente é de 3%. Quanto espera a seguradora ganhar por carro segurado.
• Variável Aleatória: X
X P(X)
1000 0.97
-29000 0.03
Distribuição de Probabilidade
E(X) = 1K * .97 + -29K *.03 = 100
Esperança (lucro médio) é de 100 porcarro. Deve ser interpretada comovalor médio
![Page 19: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/19.jpg)
Variância
• Conhecendo a média (esperança) de uma distribuição de probabilidades, podemos calcular o grau de dispersão em torno da média
22 )()()( XEXPXXVAR ii
![Page 20: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/20.jpg)
Variáveis Aleatórias Contínuas
• Podemos definir uma variável aleatória contínua como sendo a variável aleatória X em R se existir uma função f(x) tal que:
![Page 21: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/21.jpg)
Calculando as probabilidades
Caso discreto: - Probabilidades - P(peixe ter 2 ou 3 nadadeiras) = - P(2) + P(3) = 0.3+0.4
Use a soma
Caso contínuo:-Densidade e não probabilidades-Probabilidade do peixe pesar entre29 e 31 kgs.- Integrar
![Page 22: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/22.jpg)
Distribuições Teóricas
• As distribuições teóricas associam uma probabilidade a cada resultado numérico de um experimento, ou seja, dá a probabilidade de cada valor de uma variável aleatória.
• Podem ter uma variedade de formas.– Simétricas e não simétricas.
• Binomial, Poisson, Exponencial, Normal
![Page 23: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/23.jpg)
Distribuição Normal (Gaussiana)
• A distribuição normal é a mais importante das distribuições pois muitas variáveis aleatórias de ocorrência natural ou de processos práticos obedecem a esta distribuição.
• Formato de sino
• Simétrica
• Unimodal
![Page 24: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/24.jpg)
Distribuição Normal
• A função densidade para esta distribuição é dada por
• Como podemos perceber, a distribuição normal inclui dois parâmetros– μ – média populacional
– σ – desvio padrão populacional.
• Denotamos N(μ, σ) a curva normal com média μ e desvio padrão σ
![Page 25: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/25.jpg)
Distribuição Normal
• A média refere-se ao centro da distribuição e o desvio padrão ao espalhamento (ou achatamento) da curva.
![Page 26: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/26.jpg)
Distribuição Normal
68.27%
95.45%
99.73%
![Page 27: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/27.jpg)
Exemplo
• O peso de recém-nascidos é uma variável aleatória contínua. A Figura abaixo mostra a distribuição de freqüências relativas 5000 pesos de recém-nascidos.
![Page 28: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/28.jpg)
Exemplo
• Considerando μ = 2800g, σ = 500g, podemos concluir que– P(2300 <= X <= 3300) = 68.3%– P(1800 <= X <= 3800) = 95.5%– P(1300 <= X <= 4300) = 99.7%
• Porém, na prática desejamos calcular probabilidades para diferentes valores de μ e σ.
![Page 29: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/29.jpg)
Distribuição Normal
• Para isso, a variável X cuja distribuição N(μ, σ) é transformada numa forma padronizada Z, com distribuição N(0,1) (distribuição normal padrão), pois tal distribuição é tabelada.
• A normalização se dá por
X
Z
![Page 30: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/30.jpg)
Utilizando a Tábua de Probabilidades
• Primeiro é necessário decompor Z em duas parcelas
• Por exemplo, Z = 1.39– Primeira parcela = 1.3– Segunda parcela = 0.09
• No cruzamento das duas parcelas encontra-se a probabilidade correspondente a área da curva entre 0 e Z.
![Page 31: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/31.jpg)
Exemplo
• Considere a seguinte distribuição– X -> N(30;4)– Calcule a probabilidade de X >= 40.
5.24
3040
Z
Da tabela, temos 0.4938Logo, P(X>=40) = 0.5 – 0.4938
2.50
![Page 32: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/32.jpg)
Exercício
• Uma fábrica de carros sabe que os motores de sua fabricação têm duração normal com média 150 mil km e desvio de 5 mil. Qual a probabilidade de que um carro escolhido ao acaso dure– a) menos de 170 mil– b) entre 140 e 165 mil
![Page 33: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/33.jpg)
Exercício
• a) P(X < 170)– Z = 4. Da tabela temos 0.4999968– Logo P(X<170) = 0.5 + 0.4999= 0.999
![Page 34: Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP)](https://reader030.vdocuments.mx/reader030/viewer/2022020122/552fc10b497959413d8c2001/html5/thumbnails/34.jpg)
Teorema Central do Limite
• A medida em que o tamanho da amostra X cresce, a distribuição de X se aproxima da distribuição normal