Funções e Conceitos em SIG

Classificado em Tecnologia

Escrito em em português com um tamanho de 25,57 KB.

**Funções:**

**Funções Focais:**

  • Soma Focal: Atribui a cada posição da camada de saída a soma dos valores da variável tema nas células de um ambiente dessa posição na camada de entrada. A camada de entrada deve ser um intervalo mínimo e a variável de saída é proporcional. Serve como um passo intermediário para determinar densidades locais de um fenômeno.

  • Percentil Focal: Atribui a cada célula na camada de saída a porcentagem de células no ambiente dessa posição na camada de entrada com valor menor do que o seu. Variáveis ordinais podem ser aplicadas, pelo menos. Permite localizar máximos e mínimos locais de uma variável.

  • Distância Focal: Atribui a cada célula na camada de saída o número de valores distintos da variável tema dentro de seu ambiente imediato na camada de entrada. É possível usar com todos os tipos de variáveis e se encaixa entre as funções do ambiente imediato. Pode ser usado para aproximar as fronteiras das zonas da camada de entrada.

  • Percentil Focal: Atribui a cada célula em uma camada de saída a porcentagem de células em seu ambiente imediato com valor inferior ao seu na camada de entrada. Deve ser pelo menos ordinal, pois envolve uma comparação de inferioridade. Este recurso permite localizar os máximos locais da camada de entrada.

  • Foco Próximo de: Atribui a cada célula na camada de saída a distância euclidiana para a célula mais próxima com um valor diferente de zero da camada de entrada. A variável da camada de entrada pode ser de qualquer tipo, exceto proporcional.

  • Foco no Bairro: Atribui a cada célula na camada de saída o valor da célula mais próxima com valor diferente de zero na camada de entrada. A variável tema pode pertencer a qualquer um dos quatro tipos.

  • Insularidade Focal: Atribui um identificador único para cada grupo de células adjacentes que têm o mesmo valor da variável tema em uma camada. Pode haver vários grupos de posições contíguas disjuntas entre si, mas todas com o mesmo valor da variável tema. As posições de cada um desses grupos correspondem à mesma área de partida na camada, mas a diferentes áreas na camada de chegada.

  • Gravitação Focal: Atribui em cada posição na camada de saída a média ponderada dos valores dos focos diferentes de zero da camada de entrada. O fator de ponderação é o inverso do quadrado da distância para cada foco não zero. Só se aplica a variáveis numéricas, ou seja, intervalares ou proporcionais. Não se limita às oito posições imediatamente adjacentes do ambiente, sendo assim um ambiente estendido.

**Funções Locais:**

  • Média Local: Calcula o valor de cada célula na camada de saída a partir dos valores de uma mesma célula nas camadas de entrada, usando a operação "Média". As camadas de entrada devem ser numéricas (intervalo mínimo) e a camada de saída é do mesmo tipo.

  • Máximo Local: Calcula o valor de cada célula na camada de saída a partir dos valores de uma mesma célula nas camadas de entrada, usando a operação "Valor Máximo". As camadas de entrada devem ser ordinais e a camada de saída é do mesmo tipo.

  • Moda Local: Calcula o valor de cada célula na camada de saída a partir dos valores de uma mesma célula nas camadas de entrada, usando a operação "Moda". As camadas de entrada devem ser nominais e a camada de saída é do mesmo tipo.

  • Gradiente Incremental: Calcula como o valor varia espacialmente em uma camada. Trata-se, no ambiente imediato de cada célula, os valores explícitos da variável com o tema implícito de distância ao foco.

**Funções Zonais:**

  • Soma Zonal: Todas as células em cada grupo na camada de saída recebem o valor resultante da soma dos valores da camada de entrada correspondente.

  • Média Zonal: Todas as células em cada grupo na camada de saída recebem o valor resultante da média dos valores da camada de entrada correspondente. É aplicável para camadas de valores cujas variáveis são intervalares ou proporcionais. Exemplo: Média de altitudes.

  • Moda, Mínimo e Máximo Zonal: Todas as células em cada grupo na camada de saída recebem o valor resultante de encontrar o máximo (mínimo ou moda) dos valores do grupo correspondente da camada de entrada.

**Tipos de Variáveis no Modelo Raster:**

  • Proporcionais: Valores referentes a uma escala calibrada com origem fixa, de modo que a relação entre dois valores é significativa em relação ao fenômeno considerado.

  • Intervalares: Valores referentes a uma escala calibrada, sem uma origem fixa, de modo que a diferença entre dois valores é significativa em relação ao fenômeno considerado.

  • Ordinais: Valores referentes a escalas não calibradas, de modo que a comparação de superioridade ou inferioridade entre dois valores é significativa em relação ao fenômeno considerado.

  • Nominais: Os valores representam qualidades em vez de quantidades, sem qualquer relação com a escala numérica de medição.

**Teoria:**

  • Camada de Resultados de uma Operação Zonal: A camada resultante de uma operação zonal necessariamente mantém o mesmo número de zonas que a camada de áreas utilizada como camada de entrada. O resultado das operações realizadas com os dados da camada ou camadas de dados agrupados de acordo com as zonas da camada de áreas pode combinar duas ou mais destas, de modo que o número de zonas na camada de saída é no máximo igual à camada de áreas, mas pode ser menor.

  • Papel dos Dicionários de Dados: Os dicionários de dados permitem estabelecer e construir estruturas de dados e interpretar adequadamente os arquivos de dados organizados em um ambiente SIG.

  • Soluções para o Armazenamento de Informação Espacial em Ambientes SIG:

    • Tipos de Dados: Em cada coluna, cada linha armazena o valor de uma única dimensão. Tabelas de pontos podem ser construídas, ligando tabelas relacionais associadas a entidades específicas ou tabelas poligonais, que por sua vez estão associadas a características lineares ou tabelas de polígonos, que por sua vez estão associadas a tabelas de características de área.

    • Colunas como "bitstream": A sequência completa das coordenadas correspondentes a uma entidade é armazenada em cada linha em uma coluna de dados. Isso pode ser feito na mesma tabela que registra os demais dados de uma entidade ou em tabelas especiais dedicadas exclusivamente aos dados de posição, os atributos ligados por união relacional. Conceitualmente, a posição é tratada como um todo, de modo a não violar a 1ª Forma Normal.

  • Polígonos Fictícios ou "Slivers": Polígonos que surgem devido à incompatibilidade geométrica entre as linhas que deveriam coincidir, se os níveis de topologia primitiva que os utilizam forem compartilhados. Eles coincidem exatamente quando se trabalha com nível zero de topologia. Podem aparecer ao incorporar conjuntos de dados anteriores de fontes diferentes ou por erros no processo de digitalização. São polígonos muito estreitos e alongados, de modo que a relação entre sua área e o quadrado do seu perímetro é um número pequeno. Definindo um limite para essa relação, pode-se pedir ao sistema para localizar os locais em que a relação entre sua área e o quadrado do seu perímetro seja inferior ao limite, o que indica potencialmente polígonos fictícios.

  • Definição de Operador Espacial Básico: Um operador espacial é fundamental quando compreende um conjunto completo e mínimo de operadores espaciais. Dada uma localização espacial, há um operador do conjunto e apenas um que é válido para ela.

  • Propriedades das Relações no Modelo Entidade-Relacionamento:

    • Papéis das Entidades Relacionadas: A função de cada membro no relacionamento.

    • Cardinalidade: Número máximo de entidades membro que se relacionam com cada outra entidade membro. Em virtude disso, é possível distinguir entre relações 1:1, 1:M e M:M.

    • Necessidade ou Contingência: Relacionamento para cada um de seus membros. Em virtude disso, as relações podem ser totais em ambos os lados, à direita, à esquerda ou em nenhum.

  • Índices Espaciais: Baseiam-se na construção de um revestimento celular completo (não necessariamente exclusivo) do conjunto de dados e na associação dos identificadores de cada célula do revestimento com os identificadores de cada unidade de dados de posição (geometria, primitiva...) que se sobrepõem a ela ou estão contidos nela, através de uma tabela. Seu objetivo é acelerar os processos de:

    • Localizar uma entidade pontual (Locate).

    • Localizar uma entidade em um local (Locate at).

    • Localização de uma entidade por relação espacial com outra ou outras (Link spatial relation).

  • Capacidade Discriminante de Operadores Espaciais que usam Primitivas Topológicas: Baseia-se no conjunto de entidades primitivas cuja localização espacial é analisada, levando em consideração o número de resultados considerados nas transações entre esses conjuntos.

  • Entidades Compostas: Uma entidade composta é um grupo de entidades, de forma recursiva (ou seja, os componentes de uma entidade composta podem ser entidades simples ou compostas). Razões para seu uso:

    • Representação de entidades que precisam de objetos geométricos de diferentes tipos para serem representadas.

    • Representação de entidades que precisam de vários objetos do mesmo tipo de geometria para renderização.

    • Representação de entidades em que alguns atributos têm valores constantes em sua totalidade, enquanto outros podem assumir valores variáveis.

    • Por conveniência para a construção de um modelo de usuário.

  • Unidade Mínima de Dados em uma Tabela:

    • Atualização ou Seleção: A unidade mínima de dados que pode ser atualizada ou selecionada em uma tabela é a coluna. Caso contrário, violaria a Primeira Forma Normal (valores únicos e indivisíveis).

    • Inserção ou Exclusão: A unidade mínima de dados que pode ser inserida ou excluída em uma tabela é a linha, pois a cardinalidade das linhas em uma tabela é a mesma em todas elas e igual ao número de colunas na tabela.

  • Elementos do Modelo Entidade-Relacionamento e sua Representação em Bancos de Dados Relacionais:

    • Entidade: Representação de um indivíduo ou fenômeno do mundo real.

    • Atributos: Informações sobre o item de uma entidade, o que corresponde a uma propriedade da entidade representada por ele.

    • Domínio: Um conjunto de valores que um atributo pode assumir em uma entidade.

    • Relacionamento: Qualquer associação que pode ser estabelecida entre entidades de classes diferentes ou da mesma.

    • Classe de Entidade: Conjunto de entidades que representam fenômenos da mesma natureza, com atributos e domínios comuns.

    • Representação: Cada classe de entidade é representada por uma tabela. Cada entidade é representada por uma linha da tabela para sua classe. Cada atributo considerado para uma classe é representado por uma coluna da tabela, cada linha assume o valor para o indivíduo que representa. O tipo de dados definido para cada coluna deve ser adaptado para a representação do atributo correspondente e seu domínio. Relações 1:1 e 1:M são representadas por ligação direta entre as tabelas das entidades relacionadas. Relações M:M são representadas por ligação através de outra tabela, que relaciona as tabelas das entidades.

  • Orientação da Coluna no Modelo Vetorial de Topologia 3: É usado na tabela que relaciona as entidades lineares com os arcos que as formam (linha-arco) e na tabela que relaciona as faces topológicas com os arcos que as definem (arco-face). Na primeira tabela, pode-se associar a uma entidade linear todos os arcos que compõem sua forma, de modo que a linha possa ser percorrida de forma consistente, registrando positivamente os arcos orientados cuja direção coincide com a direção de varredura da linha e negativamente os que não satisfazem essa condição. Na segunda tabela, pode-se associar a uma face topológica os arcos delimitadores de modo que as seguintes condições sejam satisfeitas: o limite externo da face deve ser percorrido no sentido horário; o limite interno da face, se houver, deve ser percorrido no sentido anti-horário.

  • Integração de Dados de Várias Fontes:

    • Conversão de formato (usando tradutores) e redução a uma classificação única, a da organização beneficiária, usando regras para decidir a qual tipo de entidade corresponde no conjunto de dados traduzidos para cada classe de entidade no conjunto ou conjunto de dados de entrada.

    • A densificação de pontos nas linhas pode ser necessária no caso de transformação de projeção.

    • Transformações do sistema de projeção, que podem incluir projeção de mapa, elipsoide e datum. Essa transformação não é linear. Afirmar que essa mudança ocorre com transformações lineares é um erro conceitual grave.

    • Transformação de coordenadas para unificar o sistema de referência. Dependendo das circunstâncias, pode ser suficiente uma transformação linear (afim, Helmert) ou uma transformação não linear. Esta última é necessária no caso de documentos digitalizados que podem ter deformação não linear.

    • As discrepâncias residuais, devido a erros acidentais em vários levantamentos e processos de digitalização, devem ser submetidas a um processo de edição geométrica.

    • Reorganização das partições horizontal e vertical.

  • Matrizes de Classificação para Situações Especiais: Os elementos que podem estar envolvidos nessas matrizes são as interseções entre os diversos subgrupos da posição espacial das entidades relacionadas: fechos, fronteiras, interiores e exteriores. Assim, na matriz de quatro interseções, são consideradas as interseções entre a fronteira e o interior de uma entidade com a fronteira e o interior de outra entidade. Na matriz de nove interseções, são consideradas as interseções entre a fronteira, o interior e o exterior de uma entidade com a fronteira, o interior e o exterior de outra. Os valores que podem ser considerados para tais interseções podem ser: distinção binária (interseção vazia ou não vazia) ou a dimensão máxima do conjunto de interseção: vazio -1, 0 contém nós, 1 contém arcos, 2 contém faces.

  • Necessidade de Registrar Valores em Todas as Células no Modelo Raster: No modelo raster, a distribuição espacial dos valores das variáveis temáticas é inferida a partir da sequência ordenada dos mesmos. Se os valores fossem omitidos, essa sequência seria impossível para tal inferência. Portanto, é necessário codificar um valor em cada posição, possivelmente nulo.

  • Exclusividade Mútua das Primitivas Topológicas no Modelo Vetorial de Topologia Completa: Significa que as primitivas topológicas (nós, arcos e faces) não se sobrepõem no espaço. Cada ponto no espaço pertence a uma e apenas uma primitiva de cada tipo.

  • Harmonização no Processo de Integração de Dados de Posição: Ao integrar vários conjuntos de dados, a mesma entidade pode ser representada em todos eles. A harmonização é o processo de localização, unificação dos dados e fusão em uma única entidade para as entidades que representam a mesma entidade. Pode ser:

    • Harmonização Vertical: Entre conjuntos de dados que se sobrepõem.

    • Harmonização Horizontal ou Ajuste de Limites: Entre conjuntos de dados correspondentes a regiões adjacentes.

  • Detecção de Erros por Critérios de Correspondência Geométrica na Harmonização Vertical (aplicado a elementos de superfície):

    • Área Comum: Comparação após dividir a área da interseção pela área da união.

    • Razão de Alongamento: Comparação entre as razões das respectivas áreas e quadrados dos perímetros. A comparação deve resultar em um número próximo a 1. [Área / Perímetro2] deve resultar em um número próximo a 1.

    • Discrepância Linear: Distância máxima permitida entre os perímetros de duas entidades de superfície (não é um item superficial).

  • Critérios de Localização Geométrica de Pares de Entidades Candidatos à Fusão na Harmonização Horizontal:

    • Ângulo: Desvio máximo da linha reta que é suportado para as seções das características da linha.

    • Distância Máxima: Separação máxima suportada entre as extremidades das linhas.

    • Duração Mínima: Percurso mínimo de cada entidade na compensação da incompatibilidade das extremidades.

  • Definição de Determinante e sua Relação com a Forma Normal: Sejam A e B dois conjuntos de colunas em uma tabela T. Se para cada valor de A em T existe um e apenas um valor de B, dizemos que A é um determinante de B. Na forma normal de Boyce-Codd, todos os determinantes da tabela devem ser chaves candidatas.

  • Conceitos de Dependência Funcional, Determinante e Dependência Funcional Completa:

    • Dependência Funcional: Sejam A e B dois conjuntos de colunas em uma tabela em um banco de dados. Diz-se que B é funcionalmente dependente de A se para cada combinação de valores de A em cada linha existe uma e apenas uma combinação de valores de B.

    • Determinante: Sejam A e B dois conjuntos de colunas em uma tabela em um banco de dados. Diz-se que A é um determinante de B se B é funcionalmente dependente de A.

    • Dependência Funcional Completa: Sejam A e B dois conjuntos de colunas em uma tabela em um banco de dados. Diz-se que B depende de A com dependência funcional completa se A é um determinante de B e nenhum subconjunto próprio de A é determinante de B.

  • Etapas Envolvidas na Eliminação de Diferenças Sistemáticas (Unificação das Coordenadas) na Integração de Dados de Posição de Diferentes Fontes:

    • Unificação do sistema de referência cartográfica: coordenadas do mapa (sistema de origem) para coordenadas geodésicas (a partir do Datum de origem); mudança de Datum: coordenadas geodésicas (no Datum de origem) para coordenadas geodésicas (no Datum de destino); coordenadas geodésicas (no Datum de destino) para coordenadas do mapa (no sistema de destino).

    • Transformação de coordenadas para eliminar as diferenças devido à materialização do sistema de referência.

  • Problemas do Modelo Vetorial de Topologia Zero e sua Solução em Modelos de Topologia de Nível Superior: No modelo vetorial de topologia zero, os dados de posição são tratados como propriedades de entidades geográficas, relacionando-os diretamente a elas. Portanto, quando há coincidência espacial, total ou parcial, entre duas ou mais entidades, há uma duplicação desnecessária de dados de posição, permitindo a introdução de inconsistências. No modelo de topologia de nível superior a zero, os dados posicionais estão diretamente associados a primitivas zero-dimensionais (nós) e unidimensionais (arcos) e indiretamente a entidades geográficas. Se várias dessas entidades compartilham posição espacial, elas compartilham algumas primitivas, tornando possível evitar a duplicação desnecessária de dados e inconsistências.

  • Formas Normais de Bancos de Dados:

    • Primeira Forma Normal:

      • Existência de pelo menos uma chave candidata: Não pode haver linhas duplicadas, ou seja, linhas em uma tabela com valores idênticos em todas as colunas.

      • Valores Atômicos: Em cada linha, cada coluna pode ter um valor atômico (um valor e apenas um, e indivisível).

      • Ordem Irrelevante: A ordem de linhas e colunas deve ser irrelevante para a pesquisa de dados do usuário em uma tabela.

    • Segunda Forma Normal:

      • A tabela está na Primeira Forma Normal.

      • Não há dependência funcional completa de qualquer coluna que não faça parte da chave primária em relação à chave primária. Se a chave primária for constituída por mais de uma coluna, qualquer coluna que não pertença à chave primária deve ser funcionalmente dependente da combinação de todas as colunas que compõem a chave primária.

    • Terceira Forma Normal:

      • A tabela está na Segunda Forma Normal.

      • A dependência funcional completa exigida pela Segunda Forma Normal é simples. Deve ser possível estabelecer uma cadeia de dependências transitivas entre a chave primária e qualquer outra coluna, através de outra coluna ou conjunto, a menos que estes últimos sejam chave candidata.

    • Forma Normal de Boyce-Codd:

      • A tabela está na Terceira Forma Normal.

      • Todos os determinantes são chaves candidatas.

  • Operadores Espaciais: Uma expressão formalizada das condições que duas entidades devem atender para estar em uma relação espacial específica. Decide se essas entidades compartilham posição espacial e, em caso afirmativo, distingue a forma como o fazem.

  • Número de Valores Diferentes da Chave Candidata em uma Tabela: Sim, o número de valores diferentes que a chave candidata assume em uma tabela pode ser igual à cardinalidade da tabela. A cardinalidade de uma tabela é o número de linhas que ela contém. Uma chave candidata permite a identificação inequívoca de cada linha de uma tabela, então uma chave candidata tem tantos valores diferentes quantas linhas existirem na tabela.

  • Necessidade de Registrar Valores em Todas as Células no Modelo Raster: No modelo raster, a distribuição espacial dos valores das variáveis temáticas é inferida a partir da sequência ordenada dos mesmos. Se os valores fossem omitidos, essa sequência seria impossível para tal inferência. Portanto, é necessário codificar um valor em cada posição, possivelmente nulo.

  • Definição de Chave Estrangeira: Coluna ou conjunto de colunas em uma tabela T1, cujo conteúdo corresponde à chave primária de outra tabela T2. São usadas para estabelecer uma conexão ou ligação entre duas tabelas relacionais T1 e T2. Representam relações como 1:1 e 1:M.

  • Formas de Implementação de um Ambiente de Unidade de SIG, Ambiente Híbrido:

    • Ambiente de Unidade: Todos os dados, tanto de posicionamento quanto descritivos, são armazenados no mesmo tipo de estrutura: arquivos ou bancos de dados.

    • Ambiente de Unidade em Arquivo: É necessário usar dicionários para definir estruturas de dados para interpretar os dados de diferentes usuários. Podem surgir, entre outros, os seguintes inconvenientes:

      • O usuário deve saber o nome e a localização de cada um dos arquivos que compõem o conjunto de dados.

      • Podem ocorrer conflitos no acesso simultâneo de vários usuários ao mesmo arquivo.

      • Se os dados crescerem, podem exceder o tamanho máximo permitido no sistema operacional.

    • Ambiente de Unidade em Bancos de Dados: Os sistemas de gerenciamento de banco de dados visam resolver os problemas identificados na forma anterior de forma eficiente. Uma desvantagem é que a maioria dos sistemas de banco de dados não são projetados levando em consideração as características dos dados de posição e o grande volume que estes podem atingir, o que pode causar degradação grave nos tempos de resposta.

    • Ambiente Híbrido: Os dados de posição das entidades são armazenados em arquivos controlados a partir do sistema operacional e geralmente tratados com pacotes gráficos, enquanto os dados descritivos são armazenados em tabelas em um banco de dados.

Entradas relacionadas: