OLAP vs OLTP: Arquiteturas, Modelagem e Análise de Dados
Classificado em Formação e Orientação para o Emprego
Escrito em em
português com um tamanho de 4 KB
Tipos de Arquiteturas OLAP
ROLAP (Relational Online Analytical Processing)
Processamento realizado somente no servidor.
- Vantagem (V): Análise de enormes volumes de dados.
- Desvantagem (D): Quantidade limitada de usuários que podem realizar requisições.
MOLAP (Multidimensional Online Analytical Processing)
Montagem e manipulação de dados do cubo diretamente no servidor.
- Vantagem (V): Alta performance.
- Desvantagem (D): Problemas de escalabilidade e custo alto para aquisição.
DOLAP (Desktop Online Analytical Processing)
Requisita informações para servidores, normalmente SQL.
- Vantagem (V): Processamento realizado na estação do usuário.
- Desvantagem (D): Cubos pequenos e o tráfego de rede pode se tornar significativo.
HOLAP (Hybrid Online Analytical Processing)
Mistura entre ROLAP e MOLAP.
- Vantagem (V): Combina a alta performance do MOLAP com a escalabilidade do ROLAP.
Diferenças Chave entre OLAP e OLTP
| Critério | OLTP (Online Transaction Processing) | OLAP (Online Analytical Processing) |
|---|---|---|
| Tipos de Operação | Operações de criar, atualizar, excluir e consultar dados (CRUD). | Dados são analisados para suporte à decisão. |
| Granularidade | Dados atômicos, indivisíveis. | Permite visão mais global ou contextualizada. |
| Temporalidade | Precisa ser atual e refletir o estado atual da organização. O passado é impreciso ou parcial. | Conhecimento preciso da base de dados. Com base em análises ao longo do tempo, pode fazer previsões para o futuro da organização. |
| Recuperação | Cada transação ou usuário acessa poucos registros em uma consulta. | Vários registros são recuperados em consultas complexas. |
| Usuários | Entre 10 a 1000. | Máximo de 50, devido ao custo de processamento e à enorme quantidade de informações. |
| Orientação | Tupla ou registros. | Arrays (Multidimensional). |
| Consulta | Consultas pré-definidas. | Definida de acordo com a necessidade do usuário (ad-hoc). |
Funcionamento do OLAP e Cubos de Dados
- Os dados são reestruturados em cubos (consultas a partir do mesmo).
- O OLAP oferece melhor performance em consultas complexas.
- O cubo é criado a partir de esquemas de tabelas (Star ou Snowflake).
- No centro da modelagem está a Tabela Fatos, que lista fatos observados e de relevância para a pesquisa.
- As Tabelas Dimensionais são associadas à Tabela de Fatos. As Tabelas Fatos indicam como as agregações de dados relacionais podem ser analisadas.
Modelagem Dimensional
A Modelagem Dimensional sumariza e reestrutura dados, apresentando-os em visões que suportam a análise dos valores envolvidos.
- Facilita a realização de consultas por usuários não especializados.
- Aumenta o desempenho destas consultas.
- Admite redundância de informação.
Fatos
A Tabela Fatos é o centro da modelagem dimensional. Fatos são ações, eventos ou transações efetivadas e registradas.
Dimensão
As dimensões permitem agregar ou discriminar (detalhar) de forma menor ou maior um fato observado.
Exemplo: A dimensão Data pode ser detalhada em dias da semana ou mês. Fatos podem ser agregados para permitir observar padrões de vendas ou procura de serviços em determinados dias ou períodos.