Inteligência de Negócios: Data Warehouse, Data Mart e OLAP

Classificado em Computação

Escrito em em português com um tamanho de 3,81 KB

O que é BI

Business Intelligence (BI) representa a habilidade de estruturar, acessar e explorar informações — normalmente guardadas em data warehouse e data mart — com o objetivo de desenvolver percepções, entendimentos e conhecimentos que podem melhorar o processo de tomada de decisão. É um termo genérico para descrever o levantamento de informações sobre os ativos internos e externos da organização para tomar melhores decisões de negócio.

Data warehouse

Utilizado para armazenar informações relativas às atividades de uma organização em bancos de dados, de forma consolidada. Favorece os relatórios, a análise de grande volume de dados e a obtenção de informação estratégica que pode facilitar a tomada de decisão.

Características

  • Conjunto de dados orientado por assunto.
  • Integrado.
  • Não volátil.
  • Variável em relação ao tempo.
  • Suporta a tomada de decisão.

Top-down

Constrói-se um data warehouse (DW) para depois construir os data marts.

Vantagens

  • Herança de arquitetura.
  • Facilidade de manutenção.
  • Visão do empreendimento (visão global da empresa).
  • O DW concentra toda a empresa e seus negócios.
  • Controle e centralização de regras.
  • Único conjunto de aplicações para ETL, monitoramento e manutenção centralizada.

Desvantagens

Demora para entrar em produção, alto risco de investimento e demora no retorno do investimento.

Bottom-up

Primeiro se constroem os data marts separados; estes deverão ser entregues à medida que evoluem, dando condição para, futuramente, construir um DW.

Vantagens

  • Implementação mais rápida.
  • Retorno sobre o investimento mais rápido.
  • Manutenção do enfoque da equipe facilitada.
  • Pode existir herança incremental entre os data marts, permitindo reaproveitamento.

Desvantagens

Os data marts produzidos podem não obter perfeita coesão; a integração pode se tornar inviável e há provável repetição de esforços nas fases de ETL.

Data Mart

Apresenta as mesmas características de um data warehouse, sendo um subconjunto de dados de um data warehouse; geralmente contém dados referentes a um assunto específico.

Características

  • Menor investimento em infraestrutura.
  • Produz resultados mais rapidamente.
  • Podem ser escaláveis até um DW.

Esquemas: Star Schema e Snowflake

Star schema (Esquema estrela)

As tabelas de dimensões são diretamente relacionadas a uma tabela central, chamada tabela fato. Nesse modelo não há preocupação com economia de espaço de armazenamento nem com normalização; respeita-se o preceito de informação rápida e possui alto desempenho.

Snowflake

Nesse esquema, as dimensões são normalizadas e as hierarquias são separadas. Consultas envolverão mais tabelas, o que pode reduzir a performance.

Diferenças entre modelagem ER e dimensional

  • Dimensional: visão do negócio e visão gerencial da organização; foco na performance de resultados; menor complexidade para manipulação ad hoc dos dados por usuários.
  • ER (Entidade-Relacionamento): foca os processos operacionais do negócio; foco na eliminação de redundância; maior complexidade para manipulação ad hoc dos dados por usuários.

OLAP (Online Analytical Processing)

Voltado para a tomada de decisão, o OLAP proporciona uma visão dos dados orientada à análise, com navegação rápida e flexível. Não realiza transações, pois sua finalidade são consultas; além disso, é utilizado para geração de relatórios.

Entradas relacionadas: