Evolução dos Data Centers e Mineração de Dados
Classificado em Computação
Escrito em em
português com um tamanho de 2,72 KB
Evolução dos Data Centers
Com a proliferação das nuvens, as aplicações deixaram de ser monolíticas e passaram a habitar diferentes espaços. Por isso, uma abordagem que contempla múltiplas nuvens é fundamental. Servidores aptos a potencializar, de forma simples e automatizada, um cenário composto por diversas nuvens públicas e privadas tornaram-se uma necessidade.
Nuvem Comunitária
A infraestrutura de uma nuvem comunitária é compartilhada por várias organizações com interesses comuns, como missão, requisitos de segurança e políticas. Pode ser administrada pelas próprias organizações ou por terceiros, existindo dentro ou fora do ambiente corporativo.
Nuvem Pública e Privada
O conceito é intuitivo: as nuvens públicas são acessíveis via internet, enquanto as privadas operam em ambiente protegido (firewall), com acesso restrito a funcionários ou parceiros. A grande vantagem da nuvem privada é a segurança, sendo ideal para corporações que exigem níveis rigorosos de privacidade e garantia de disponibilidade, sem as latências da internet.
Mineração de Dados
Áreas, Tarefas e Ferramentas
A mineração de dados envolve estatística, aprendizado de máquina e bancos de dados.
- Tarefas Preditivas: Determinar o valor de um atributo com base em outros.
- Tarefas Descritivas: Derivar padrões.
- Tarefas Gerais: Descrição, classificação, estimação, predição, agrupamento e associação.
Ferramentas principais: SAS, WEKA, ODM, KXEN e MDR.
Processo KDD
Etapas: Seleção → Pré-processamento → Transformação → Mineração de Dados → Avaliação.
Fases do Processo CRISP-DM
- Entendimento de Negócios: Objetivos da mineração.
- Entendimento de Dados: Identificar problemas e dados relevantes.
- Preparação dos Dados: Filtrar, combinar e tratar dados vazios.
- Modelagem: Aplicação de algoritmos de mineração.
- Avaliação: Análise por especialistas e tomadores de decisão.
- Distribuição: Apresentação dos resultados aos envolvidos.
Preparação de Dados
- Limpeza: Remoção de dados vazios e inconsistentes.
- Integração: Centralização e consistência.
- Transformação: Padronização de bases e tipos de dados.
- Redução: Criação de cubos de dados, seleção de atributos, redução de dimensionalidade e discretização.