Fundamentos de Processamento Digital de Imagens

Classificado em Tecnologia

Escrito em em português com um tamanho de 4,11 KB

Introdução

  • Imagem Digital: Figuras representadas computacionalmente por sequências de 0s e 1s, definida como uma função bidimensional f(x, y), onde x e y são coordenadas em um plano.
  • PDI: Estudo de algoritmos aplicados em imagens digitais, envolvendo extração de informação através de reconhecimento de padrões, transformações geométricas, cores, brilho, contraste, redução de ruídos, entre outros.
  • Visão Artificial: Percepção do ambiente ao redor através da detecção de padrões.
  • Visão Computacional: Formalismo e modelagem para emular a visão real.
  • Visão de Máquina: Aplicação da visão computacional na engenharia de sistemas de visão artificial.
  • Visão Cognitiva:
    • Entendimento: Reconhecimento de objetos.
    • Conhecimento: Memória como base para representação e manutenção da informação.
    • Interpretação: Reação aos modelos.
  • Cor:
    • Matiz: Comprimento de onda dentro do espectro visível.
    • Brilho/Claridade: Intensidade percebida de um objeto refletindo luz.
    • Radiância: Quantidade de energia que flui de uma fonte de luz.
    • Luminância: Quantidade de energia percebida de uma fonte de luz.
    • Contraste: Faixa de regiões que vão das mais escuras até as mais claras.
  • Resolução:
    • Resolução espacial: (Linha x coluna) número de pixels da imagem.
    • Resolução temporal: (Vídeo) número de imagens capturadas em um período de tempo.
    • Bit resolution: Valores de intensidade e cor que um pixel pode assumir.

Operações Aritméticas

  • Ajuste de Contraste: Somar um valor positivo ao pixel aumenta o brilho; subtrair um valor positivo aumenta o contraste.
  • Misturar (Blending): Soma de duas imagens para produzir uma terceira.
  • Subtração: Usada para identificar diferenças entre imagens.
  • Multiplicação e Divisão: Aumentar contraste em 50% (multiplicar por 1,5); diminuir contraste em 25% (dividir por 4).

Operações Lógicas

  • NOT: Inverte uma imagem (pode ser colorida).
  • OR/XOR: Detecção de objetos que se moveram entre frames.
  • AND: Detecção de diferentes objetos.
  • Limiar (Thresholding): Separar uma região de outra baseada em suas cores.
  • Transformada Logarítmica: Aumenta a faixa dinâmica nas regiões escuras e diminui nas claras.
  • Transformada Exponencial: Inverso da logarítmica.
  • Transformada de Power-law (Gama): Cada pixel é elevado a uma potência.
    • Gama > 1: Realça o contraste de regiões de valores altos (transformada exponencial).
    • Gama < 1: Realça o contraste de regiões de valores baixos (transformada logarítmica).
  • Histograma: Gráfico que informa a frequência de ocorrência de cada valor de pixel.
  • Limiar Adaptativo (Threshold): Usa limiares diferentes para cada pixel.
  • Alongamento de Contraste: Normalização usada para aumentar a faixa de valores na imagem.

Filtragem

  • Extração, realce e restauro.
  • Passa-Alta: Permite passar a região de alta frequência e atenua as baixas (intensifica bordas e detalhes finos).
  • Passa-Baixa: Permite passar a região de baixa frequência (imagem mais homogênea) e atenua as altas (desfoque/suavização).
  • Filtro Sobel: Para detecção de bordas; convolução entre duas matrizes 3x3, combinadas usando a raiz quadrada da soma dos quadrados.
  • Filtro Mediana: Redução de ruídos; o valor do pixel é substituído pela mediana dos elementos vizinhos (ex: janela 3x3).
  • Filtro da Média: Redução de ruídos; substitui o valor do pixel pela média de seus vizinhos.

Entradas relacionadas: