Guia Completo de Business Intelligence e Data Warehouse

Classificado em Computação

Escrito em em português com um tamanho de 8,85 KB

1) O que é Business Intelligence e de que forma suas soluções agregam valor ao negócio?

R: É um conjunto de tecnologias, aplicações e processos para coletar, integrar, analisar e apresentar informações de negócios a partir de grandes volumes de dados. Dão suporte às funções associadas à execução e à concepção do negócio da empresa.

2) O que é um Data Warehouse (DW)? Quais os principais elementos que o integram?

R: É um banco de dados de suporte à decisão mantido separado dos bancos de dados operacionais.

  • Data Mart: Uma parte do Data Warehouse restrita a um único processo de negócio ou a um grupo de processos relacionados entre si, voltados para um grupo de negócio particular.
  • Metadados: São dados que fazem referência a outros dados.

3) Quando deve ser usado um Data Warehouse?

R: Um Data Warehouse deve ser usado quando surge a necessidade de tomadas de decisões rápidas, onde seja possível obter uma visão geral do negócio.

4) Qual a melhor metodologia de construção de um DW: corporativa ou setorial?

R: O melhor modelo é o setorial, que divide as áreas da empresa em setores (vendas, marketing, financeiro, administrativo). O processo é evolutivo, com foco inicial nos aspectos mais críticos, aproveitamento da estrutura operacional disponível e retorno mais rápido. O modelo de Data Warehouse corporativo tem grande abrangência, é complexo e possui alta probabilidade de insucesso.

5) Quais são os pontos de decisão a respeito de um projeto de DW, segundo R. Kimball?

  1. Os processos e, portanto, a identidade das tabelas de fatos;
  2. A granularidade (nível de detalhe) de cada tabela de fatos;
  3. As dimensões de cada tabela de fatos;
  4. Os fatos, incluindo fatos pré-calculados;
  5. Os atributos da dimensão com descrições completas e terminologia apropriada;
  6. Como rastrear dimensões de modificação lenta;
  7. Os agregados, dimensões heterogêneas, minidimensões, modos de consulta e outras decisões de armazenamento físico;
  8. A amplitude de tempo do histórico do banco de dados;
  9. Os intervalos em que os dados são extraídos e carregados no DW.

6) Explique os conceitos a seguir:

  • Modelo Dimensional: Proporciona uma representação do banco de dados consistente com o modo como o usuário visualiza e navega pelo DW, combinando tabelas com dados históricos em séries temporais. É baseado em Fatos, Dimensões e Medidas.
  • ETL: Processo destinado à extração, transformação e carga dos dados de uma ou mais bases de origem para uma ou mais bases de destino.
  • OLAP: Conceito de interface com o usuário que proporciona a capacidade de ter ideias sobre os dados, permitindo analisá-los profundamente em diversos ângulos.
  • Data Mart: Um subconjunto lógico do Data Warehouse, geralmente visto como um data warehouse setorial.

7) Quais são as camadas que podemos encontrar no Data Warehouse?

Camada de bancos de dados operacionais e fontes externas; camada de acesso à informação; camada de acesso aos dados; camada de metadados (dicionário de dados); camada de gerenciamento de processos; camada de transporte ou middleware; camada do Data Warehouse; camada de gerenciamento de replicação.

8) Explique as etapas para realizar um processo de modelagem dimensional.

  1. Selecionar o processo de negócio;
  2. Declarar o grão do processo de negócio;
  3. Escolher as dimensões;
  4. Identificar os fatos.

9) Qual é a diferença entre tabela de fatos e tabela de dimensões?

Tabelas Fato: Guardam os dados do negócio, ou seja, informações decorrentes do andamento do negócio que não são conhecidas previamente. Tabelas Dimensão: Guardam os atributos do negócio, usadas para restringir as pesquisas feitas nas tabelas Fato e servem como títulos em colunas.

10) Qual é a diferença entre o esquema Estrela e o esquema Floco de Neve?

No esquema Floco de Neve, todas as tabelas dimensão são normalizadas na terceira forma normal (3FN). No esquema Estrela, a tabela fato contém o identificador de instância, os valores das dimensões descritivas e os valores dos fatos ou medidas para aquela instância.

11) Quais as vantagens do esquema Estrela?

O modelo Estrela possui arquitetura padrão e previsível; as dimensões são equivalentes (pontos de entrada simétricos); é flexível para suportar novos elementos de dados; as tabelas podem ser alteradas adicionando colunas sem quebrar aplicações existentes; e possui um conjunto de abordagens padrão para situações comuns de negócio.

12) Quais as dimensões ou grandezas devem ser levadas em consideração ao desenvolver um Data Warehouse?

As dimensões ou grandezas são: escopo, grau de redundância e usuário-alvo.

13) Quais são os níveis de redundância em um Data Warehouse?

Data Warehouse Virtual, Data Warehouse Central e Data Warehouse Distribuído.

14) Como podem ser identificados os requisitos de um Data Warehouse?

Diferente dos sistemas operacionais (estáveis e baseados em funções), os requisitos de um DW são instáveis e dependem das necessidades de informação individuais dos usuários para a tomada de decisão.

15) Explique duas maneiras de incrementar a performance de um Data Warehouse.

  • Hardware: Dividir o trabalho entre vários processadores (o SGBD deve suportar processamento paralelo).
  • Data Marts: Distribuir os dados em pequenos Data Warehouses focados em um único assunto ou área.

16) Quais erros podem causar falhas na implementação de um Data Warehouse?

  • Começar com o tipo errado de patrocínio;
  • Gerar expectativas irreais;
  • Carregar dados apenas "porque estavam disponíveis";
  • Escolher um gerente voltado apenas para a tecnologia;
  • Ignorar dados não estruturados (texto, imagem, vídeo);
  • Fornecer definições confusas.

17) Quais etapas de desenvolvimento de um Data Warehouse podemos identificar?

Identificar entidades e processos de negócio; definir abordagem de desenvolvimento; modelar dados; definir granularidade e agregação; detalhar tabelas fato e dimensão; criar metadados; definir plano de atualização e retenção; escolher tecnologias; povoar o banco; treinar usuários e prever manutenções futuras.

18) Quais são as maneiras mais comuns de se extrair dados de um Data Warehouse?

Ferramentas de consulta e emissão de relatórios; EIS (Executive Information Systems); ferramentas OLAP; ferramentas de Data Mining.

19) Qual é a importância de hierarquias e dados agregados em um DW?

As hierarquias descrevem a lógica dos relacionamentos entre os dados e são a base para a navegação entre diferentes níveis de detalhe. Agregados são agrupamentos que otimizam a performance de consulta.

20) Explique as operações básicas de uma ferramenta OLAP.

  • Drill Down: Navegar do nível mais alto para o mais detalhado.
  • Roll Up: Navegar do nível mais detalhado para o mais alto (sumarização).
  • Slice: Cortar o cubo mantendo a perspectiva.
  • Dice: Mudar a perspectiva de visão do cubo.

21) Explique os elementos de um modelo dimensional:

  • Métricas: Aditivas (valor), Semi-aditivas (quantidade no tempo) e Não-aditivas (percentuais).
  • Fatos sem fatos: Tabelas que capturam relacionamentos muitos-para-muitos entre chaves de dimensão.
  • Surrogate Keys: Chaves substitutas para proteger o DW de mudanças no ambiente operacional.
  • Matriz de barramento: Esquema matricial que cruza processos de negócio com dimensões.
  • Minidimensões: Subconjuntos de dimensões grandes para controlar o crescimento explosivo.
  • Dimensões de atualização pequena: Dimensões com baixa taxa de alteração.

22) Quais os principais erros a serem evitados em um projeto DW?

  • Enfoque em tecnologia em vez de pessoas e processos;
  • Falta de patrocínio;
  • Escopo ambicioso ou indefinido;
  • Requisitos indefinidos;
  • Expectativas não realistas;
  • Falha na obtenção de dados de qualidade;
  • Falha ao considerar requisitos futuros;
  • Projetar ao redor de um único fornecedor;
  • Falha no armazenamento do nível correto de detalhe (grão).

Entradas relacionadas: