visão por computadorgec.di.uminho.pt/lesi/vpc0304/aula01introdução.pdfwww:...
TRANSCRIPT
Visão por Computador
WWW: gec.di.uminho.pt/lesi/vpc, gec.di.uminho.pt/mcc/vpc
LESI/LMCC - 5º Ano
Introdução
João Luís Ferreira Sobral Departamento do Informática
Universidade do Minho
Outubro 2002
Visão por Computador 2 © João Luís Sobral 2002
Programa
Introdução e objectivos
Pretende-se com esta disciplina complementar a formação dos alunos com conhecimentos da área de Visão por Computador. Designadamente, pretende-se introduzir conhecimentos relativos aos métodos de processamento de imagens, utilizados para melhorar as características de imagens, e os processos que visam a extracção automática de informação de imagens.
Para atingir estes objectivos, e sendo o processamento de imagem uma área de índole bastante experimental, existirá uma forte ligação entre a componente teórica e a componente prática: os conceitos introduzidos na componente teórica serão experimentados na aula prática seguinte, utilizando uma ferramenta de processamento de imagem, o sistema Khoros. Desta forma são experimentadas as diversas técnicas, permitindo ao aluno obter as suas próprias conclusões relativamente a cada método.
Componente Teórica
I. Processamento de Imagem o Introdução aos sistemas de processamento de imagem. o Natureza de uma imagem digital. Calibração de imagem. o Propriedades estatísticas das imagens: brilho e contraste. Histograma. o Filtros no domínio do espaço. Convolução digital. Filtros passa-alto e
passa-baixo. Suavização de imagens. Detecção e realce de contornos. Filtros não lineares.
o Filtros no domínio das frequências. Transformada de Fourier e Teorema da convolução.
o Restauração de imagem. Compressão de imagem: compressão não destrutiva e compressão destrutiva.
o Processamento de imagens a cor.
II. Análise de Imagem
o Binarização simples múltipla e adaptativa. o Operadores morfológicos: erosão, dilatação e esqueletização. o Análise de texturas: modelos estrutural, estatístico e espectral. o Segmentação de imagens em regiões. Detecção de formas: verificação de
padrões, pirâmides de resolução e transformada de Hough. o Descrição de formas: chain codes, assinaturas, polígonos e convex hull. o Reconhecimento de objectos
III. Visão por Computador em Tempo Real
o Requisitos de processamento em termos de hardware e software para efectuar visão por computador em tempo real.
Componente Prática
Sessões práticas com o sistema Khoros. Desenvolvimento de aplicações de visão.
Visão por Computador 3 © João Luís Sobral 2002
Programa
Equipa Docente
João Luís Ferreira Sobral ([email protected], ext. 4439)
Planeamento
Aula Dia Teórica Prática Bibliogr.
1 4/10 Apresentação da disciplina, caracterização da área, natureza e características de uma
imagem digitalizada
Introdução ao Khoros
LPS 1, 2, 3. GZ 1, 2
2 11/10 Propriedades estatísticas das imagens,
alteração do brilho e contraste, convolução digital
Histograma e convolução
LPS 4, 5, 6*GZ 3
3 18/10 Transformadas de imagem, transformada de Fourier, filtros no domínio das frequências,
teorema da convolução
FFT, teorema da convolução GZ 4.1-4.4
4 25/10 Restauração de imagem Restauração de imagem GZ 5.1-5.4
- 1/11 Feriado - -
5 8/11 Compressão de imagem Exemplos de compressão
GZ 7.1-7.2, GZ 8.1-8.6
6 15/11 Segmentação de imagens, binarização, operadores morfológicos Binarização
LP 7. *GZ 10.1-
10.3
7 22/11 Texturas, segmentação baseada em divisão e junção de regiões
Análise de texturas
LP 7. *GZ 10.4
8 29/11 Detecção de formas, descrição de formas Detecção de formas
LP 8, 9. *GZ 11
9 6/12 Reconhecimento de objectos, transformação de perspectivas, visão estéreo Algoritmos GZ 12, SK
10 13/12 Visão por computador em tempo real Direct X
11 20/12 Livre * Adicional
Bibliografia
LP Luís Paulo Santos. Visão por Computador, Universidade do Minho, UM-DI-TA-95-02, 1995. (Disponível na página da disciplina)
GZ2e R. Gonzalez, R. Woods. Digital Image Processing, 2ª Ed, Prentice Hall, 2002. (http://www.imageprocessingbook.com/)
SK2e M. Sonka, V. Hlavac, R. Boyle. Image Processing Analysis and Machine
Vision, 2ª edição, Prentice Hall, 1999.
Avaliação
Um exame escrito.
Visão por Computador 4 © João Luís Sobral 2002
Caracterização da área
Principais aplicações
• Realçar informação contida na imagem para facilitar a sua percepção • Obter informação da imagem para apoio a modelos de decisão
Três níveis de processamento
• Baixo nível (processamento de imagem) • Nível intermédio (análise de imagem) • Alto nível (compreensão de imagem)
Alguns exemplos de aplicações de processamento de imagem/visão
• Medidas antropométricas • Contagem de pessoas • Reconhecimento de matrículas • Vigilância remota
Visão por Computador 5 © João Luís Sobral 2002
Natureza de uma imagem digitalizada
Sistema de aquisição e processamento de imagens
O processo de digitalização
• Amostragem de uma imagem 3D numa superfície 2D • Obtenção de pixels quadrados ou rectangulares • Tipicamente obtém imagens de 256x256 a 1024x1024 pixels • Existem vários tipos de sensores (luz visível, infravermelho, etc.) • Podem existir vários tipos de sensores operando em simultâneo
Alguns problemas do processo de digitalização
• Limites dos sensores (amplitude e tempo de resposta) • Período de amostragem • Desfasamento temporal entre os vários sensores • Ruído de quantificação (aliasing)
Operações típicas a aplicar às imagens
• Remover ruído • Melhorar o contraste da imagem • Alterar o tamanho ou forma da imagem • Corrigir a distorção espacial • Retirar rastos do movimento • Corrigir focagens deficientes • Codificar imagens • Segmentar imagens para localizar objectos ou realçar atributos
Visão por Computador 6 © João Luís Sobral 2002
O nosso sistema de visão
Formação da imagem no nosso olho
• A luz proveniente do exterior é projectada na retina, depois de ter atravessado a
córnea e a lente • O olho adapta a forma da lente para focar objectos mais distantes (lente mais
plana) ou mais próximos (lente mais curva). • A distância entre a lente e a retina varia entre 14 mm e 17mm • A parte da retina responsável por detectar os detalhes da imagem tem cerca de
150 000 elementos por mm2 e uma área de 1.5mm x 1.5mm
Adaptação de brilho e discriminação • O nosso olho não utiliza um sistema de brilho proporcional à intensidade da luz
(os contornos são realçados e o brilho não depende apenas de sua intensidade)
Visão por Computador 7 © João Luís Sobral 2002
O nosso sistema de visão
Adaptação de brilho e discriminação (cont.) • O nosso olho sofre de ilusões ópticas, fenómenos que ainda não estão
completamente explicados
Visão por Computador 8 © João Luís Sobral 2002
O nosso sistema de visão
A luz e o espectro electomagnético
• O nosso olho apenas é sensível a uma parte reduzida do especto.
• O nosso olho capta as ondas (na gamas do espectro visível) reflectidas pelos objectos. Os objectos brancos reflectem de forma balanceada todas as cores visíveis.
Visão por Computador 9 © João Luís Sobral 2002
Aquisição de Imagem
Sensores
• Elementos sensíveis à energia, transformando-a numa voltagem. • Cada sensor é sensível a um determinado tipo de energia (i.é., gama do especto). • A aquisição pode ser efectuada por um único sensor, por uma linha de sensores ou
por uma matriz de sensores.
Visão por Computador 10 © João Luís Sobral 2002
Aquisição de Imagem
Sensores
• Captação de imagem com uma linha de sensores • Captação de imagem com uma matriz de sensores
Visão por Computador 11 © João Luís Sobral 2002
Aquisição de Imagem
Amostragem e discretização • A voltagem produzida pelos sensores tem que ser amostrada (i.é., detectado o seu
valor em intervalos fixos) e discretizada para valores inteiros, uma vez que a voltagem é um sinal contínuo.
• Quando são utilizados vários sensores, o número de sensores estabelece o número de
amostragens.
Visão por Computador 12 © João Luís Sobral 2002
Aquisição de Imagem
Representação de uma imagem digital • Representação de uma imagem de M linhas por N colunas: • Tipicamente o número de tons associado a cada pixel é geralmente uma potência de 2. • Resolução espacial (i.é., amostragem) • Resolução em número de tons (i.é., discretização)