visão por computadorgec.di.uminho.pt/lesi/vpc0304/aula01introdução.pdfwww:...

12
Visão por Computador WWW: gec.di.uminho.pt/lesi/vpc, gec.di.uminho.pt/mcc/vpc LESI/LMCC - 5º Ano Introdução João Luís Ferreira Sobral Departamento do Informática Universidade do Minho Outubro 2002

Upload: buibao

Post on 11-Jul-2018

222 views

Category:

Documents


0 download

TRANSCRIPT

Visão por Computador

WWW: gec.di.uminho.pt/lesi/vpc, gec.di.uminho.pt/mcc/vpc

LESI/LMCC - 5º Ano

Introdução

João Luís Ferreira Sobral Departamento do Informática

Universidade do Minho

Outubro 2002

Visão por Computador 2 © João Luís Sobral 2002

Programa

Introdução e objectivos

Pretende-se com esta disciplina complementar a formação dos alunos com conhecimentos da área de Visão por Computador. Designadamente, pretende-se introduzir conhecimentos relativos aos métodos de processamento de imagens, utilizados para melhorar as características de imagens, e os processos que visam a extracção automática de informação de imagens.

Para atingir estes objectivos, e sendo o processamento de imagem uma área de índole bastante experimental, existirá uma forte ligação entre a componente teórica e a componente prática: os conceitos introduzidos na componente teórica serão experimentados na aula prática seguinte, utilizando uma ferramenta de processamento de imagem, o sistema Khoros. Desta forma são experimentadas as diversas técnicas, permitindo ao aluno obter as suas próprias conclusões relativamente a cada método.

Componente Teórica

I. Processamento de Imagem o Introdução aos sistemas de processamento de imagem. o Natureza de uma imagem digital. Calibração de imagem. o Propriedades estatísticas das imagens: brilho e contraste. Histograma. o Filtros no domínio do espaço. Convolução digital. Filtros passa-alto e

passa-baixo. Suavização de imagens. Detecção e realce de contornos. Filtros não lineares.

o Filtros no domínio das frequências. Transformada de Fourier e Teorema da convolução.

o Restauração de imagem. Compressão de imagem: compressão não destrutiva e compressão destrutiva.

o Processamento de imagens a cor.

II. Análise de Imagem

o Binarização simples múltipla e adaptativa. o Operadores morfológicos: erosão, dilatação e esqueletização. o Análise de texturas: modelos estrutural, estatístico e espectral. o Segmentação de imagens em regiões. Detecção de formas: verificação de

padrões, pirâmides de resolução e transformada de Hough. o Descrição de formas: chain codes, assinaturas, polígonos e convex hull. o Reconhecimento de objectos

III. Visão por Computador em Tempo Real

o Requisitos de processamento em termos de hardware e software para efectuar visão por computador em tempo real.

Componente Prática

Sessões práticas com o sistema Khoros. Desenvolvimento de aplicações de visão.

Visão por Computador 3 © João Luís Sobral 2002

Programa

Equipa Docente

João Luís Ferreira Sobral ([email protected], ext. 4439)

Planeamento

Aula Dia Teórica Prática Bibliogr.

1 4/10 Apresentação da disciplina, caracterização da área, natureza e características de uma

imagem digitalizada

Introdução ao Khoros

LPS 1, 2, 3. GZ 1, 2

2 11/10 Propriedades estatísticas das imagens,

alteração do brilho e contraste, convolução digital

Histograma e convolução

LPS 4, 5, 6*GZ 3

3 18/10 Transformadas de imagem, transformada de Fourier, filtros no domínio das frequências,

teorema da convolução

FFT, teorema da convolução GZ 4.1-4.4

4 25/10 Restauração de imagem Restauração de imagem GZ 5.1-5.4

- 1/11 Feriado - -

5 8/11 Compressão de imagem Exemplos de compressão

GZ 7.1-7.2, GZ 8.1-8.6

6 15/11 Segmentação de imagens, binarização, operadores morfológicos Binarização

LP 7. *GZ 10.1-

10.3

7 22/11 Texturas, segmentação baseada em divisão e junção de regiões

Análise de texturas

LP 7. *GZ 10.4

8 29/11 Detecção de formas, descrição de formas Detecção de formas

LP 8, 9. *GZ 11

9 6/12 Reconhecimento de objectos, transformação de perspectivas, visão estéreo Algoritmos GZ 12, SK

10 13/12 Visão por computador em tempo real Direct X

11 20/12 Livre * Adicional

Bibliografia

LP Luís Paulo Santos. Visão por Computador, Universidade do Minho, UM-DI-TA-95-02, 1995. (Disponível na página da disciplina)

GZ2e R. Gonzalez, R. Woods. Digital Image Processing, 2ª Ed, Prentice Hall, 2002. (http://www.imageprocessingbook.com/)

SK2e M. Sonka, V. Hlavac, R. Boyle. Image Processing Analysis and Machine

Vision, 2ª edição, Prentice Hall, 1999.

Avaliação

Um exame escrito.

Visão por Computador 4 © João Luís Sobral 2002

Caracterização da área

Principais aplicações

• Realçar informação contida na imagem para facilitar a sua percepção • Obter informação da imagem para apoio a modelos de decisão

Três níveis de processamento

• Baixo nível (processamento de imagem) • Nível intermédio (análise de imagem) • Alto nível (compreensão de imagem)

Alguns exemplos de aplicações de processamento de imagem/visão

• Medidas antropométricas • Contagem de pessoas • Reconhecimento de matrículas • Vigilância remota

Visão por Computador 5 © João Luís Sobral 2002

Natureza de uma imagem digitalizada

Sistema de aquisição e processamento de imagens

O processo de digitalização

• Amostragem de uma imagem 3D numa superfície 2D • Obtenção de pixels quadrados ou rectangulares • Tipicamente obtém imagens de 256x256 a 1024x1024 pixels • Existem vários tipos de sensores (luz visível, infravermelho, etc.) • Podem existir vários tipos de sensores operando em simultâneo

Alguns problemas do processo de digitalização

• Limites dos sensores (amplitude e tempo de resposta) • Período de amostragem • Desfasamento temporal entre os vários sensores • Ruído de quantificação (aliasing)

Operações típicas a aplicar às imagens

• Remover ruído • Melhorar o contraste da imagem • Alterar o tamanho ou forma da imagem • Corrigir a distorção espacial • Retirar rastos do movimento • Corrigir focagens deficientes • Codificar imagens • Segmentar imagens para localizar objectos ou realçar atributos

Visão por Computador 6 © João Luís Sobral 2002

O nosso sistema de visão

Formação da imagem no nosso olho

• A luz proveniente do exterior é projectada na retina, depois de ter atravessado a

córnea e a lente • O olho adapta a forma da lente para focar objectos mais distantes (lente mais

plana) ou mais próximos (lente mais curva). • A distância entre a lente e a retina varia entre 14 mm e 17mm • A parte da retina responsável por detectar os detalhes da imagem tem cerca de

150 000 elementos por mm2 e uma área de 1.5mm x 1.5mm

Adaptação de brilho e discriminação • O nosso olho não utiliza um sistema de brilho proporcional à intensidade da luz

(os contornos são realçados e o brilho não depende apenas de sua intensidade)

Visão por Computador 7 © João Luís Sobral 2002

O nosso sistema de visão

Adaptação de brilho e discriminação (cont.) • O nosso olho sofre de ilusões ópticas, fenómenos que ainda não estão

completamente explicados

Visão por Computador 8 © João Luís Sobral 2002

O nosso sistema de visão

A luz e o espectro electomagnético

• O nosso olho apenas é sensível a uma parte reduzida do especto.

• O nosso olho capta as ondas (na gamas do espectro visível) reflectidas pelos objectos. Os objectos brancos reflectem de forma balanceada todas as cores visíveis.

Visão por Computador 9 © João Luís Sobral 2002

Aquisição de Imagem

Sensores

• Elementos sensíveis à energia, transformando-a numa voltagem. • Cada sensor é sensível a um determinado tipo de energia (i.é., gama do especto). • A aquisição pode ser efectuada por um único sensor, por uma linha de sensores ou

por uma matriz de sensores.

Visão por Computador 10 © João Luís Sobral 2002

Aquisição de Imagem

Sensores

• Captação de imagem com uma linha de sensores • Captação de imagem com uma matriz de sensores

Visão por Computador 11 © João Luís Sobral 2002

Aquisição de Imagem

Amostragem e discretização • A voltagem produzida pelos sensores tem que ser amostrada (i.é., detectado o seu

valor em intervalos fixos) e discretizada para valores inteiros, uma vez que a voltagem é um sinal contínuo.

• Quando são utilizados vários sensores, o número de sensores estabelece o número de

amostragens.

Visão por Computador 12 © João Luís Sobral 2002

Aquisição de Imagem

Representação de uma imagem digital • Representação de uma imagem de M linhas por N colunas: • Tipicamente o número de tons associado a cada pixel é geralmente uma potência de 2. • Resolução espacial (i.é., amostragem) • Resolução em número de tons (i.é., discretização)