Fundamentos de Processamento Digital de Imagens
Classificado em Tecnologia
Escrito em em
português com um tamanho de 4,11 KB
Introdução
- Imagem Digital: Figuras representadas computacionalmente por sequências de 0s e 1s, definida como uma função bidimensional f(x, y), onde x e y são coordenadas em um plano.
- PDI: Estudo de algoritmos aplicados em imagens digitais, envolvendo extração de informação através de reconhecimento de padrões, transformações geométricas, cores, brilho, contraste, redução de ruídos, entre outros.
- Visão Artificial: Percepção do ambiente ao redor através da detecção de padrões.
- Visão Computacional: Formalismo e modelagem para emular a visão real.
- Visão de Máquina: Aplicação da visão computacional na engenharia de sistemas de visão artificial.
- Visão Cognitiva:
- Entendimento: Reconhecimento de objetos.
- Conhecimento: Memória como base para representação e manutenção da informação.
- Interpretação: Reação aos modelos.
- Cor:
- Matiz: Comprimento de onda dentro do espectro visível.
- Brilho/Claridade: Intensidade percebida de um objeto refletindo luz.
- Radiância: Quantidade de energia que flui de uma fonte de luz.
- Luminância: Quantidade de energia percebida de uma fonte de luz.
- Contraste: Faixa de regiões que vão das mais escuras até as mais claras.
- Resolução:
- Resolução espacial: (Linha x coluna) número de pixels da imagem.
- Resolução temporal: (Vídeo) número de imagens capturadas em um período de tempo.
- Bit resolution: Valores de intensidade e cor que um pixel pode assumir.
Operações Aritméticas
- Ajuste de Contraste: Somar um valor positivo ao pixel aumenta o brilho; subtrair um valor positivo aumenta o contraste.
- Misturar (Blending): Soma de duas imagens para produzir uma terceira.
- Subtração: Usada para identificar diferenças entre imagens.
- Multiplicação e Divisão: Aumentar contraste em 50% (multiplicar por 1,5); diminuir contraste em 25% (dividir por 4).
Operações Lógicas
- NOT: Inverte uma imagem (pode ser colorida).
- OR/XOR: Detecção de objetos que se moveram entre frames.
- AND: Detecção de diferentes objetos.
- Limiar (Thresholding): Separar uma região de outra baseada em suas cores.
- Transformada Logarítmica: Aumenta a faixa dinâmica nas regiões escuras e diminui nas claras.
- Transformada Exponencial: Inverso da logarítmica.
- Transformada de Power-law (Gama): Cada pixel é elevado a uma potência.
- Gama > 1: Realça o contraste de regiões de valores altos (transformada exponencial).
- Gama < 1: Realça o contraste de regiões de valores baixos (transformada logarítmica).
- Histograma: Gráfico que informa a frequência de ocorrência de cada valor de pixel.
- Limiar Adaptativo (Threshold): Usa limiares diferentes para cada pixel.
- Alongamento de Contraste: Normalização usada para aumentar a faixa de valores na imagem.
Filtragem
- Extração, realce e restauro.
- Passa-Alta: Permite passar a região de alta frequência e atenua as baixas (intensifica bordas e detalhes finos).
- Passa-Baixa: Permite passar a região de baixa frequência (imagem mais homogênea) e atenua as altas (desfoque/suavização).
- Filtro Sobel: Para detecção de bordas; convolução entre duas matrizes 3x3, combinadas usando a raiz quadrada da soma dos quadrados.
- Filtro Mediana: Redução de ruídos; o valor do pixel é substituído pela mediana dos elementos vizinhos (ex: janela 3x3).
- Filtro da Média: Redução de ruídos; substitui o valor do pixel pela média de seus vizinhos.