Conceitos de Computação em Nuvem, Big Data e Hadoop
Classificado em Computação
Escrito em em
português com um tamanho de 4,01 KB
1. Explicar detalhadamente o que vem a ser serviços on demand oferecidos em nuvem e discutir suas vantagens, conforme visto em aula. On-demand quer dizer “sob demanda“, ou seja, é algo que funciona baseado na necessidade e/ou na encomenda de alguém. (serviço baseado na demanda do cliente, visa suprir de imediato a necessidade do consumidor). Um bom exemplo disso é que antes um assinante de TV paga, só conseguia assistir aós filmes que estavam na programação dos canais. Hoje, as próprias operadoras de TV já possuem plataformas de vídeo on demand, pára que o assinante escolha o filme que deseja assistir, quando e onde quiser. Vantagem das plataformas online de serviços on demand é a facilidade de acessar ao conteúdo/serviço que você deseja, sem precisar sair de casa. Netflix é um exemplo.
2. Descrever e comparar detalhadamente os conceitos de Big Data, Business Intelligence e Data Warehouse e explicar como eles se relacionam entre si. Os 3 são usados pára a mesma finalidade.
Big data e Data werehouse: A diferença entre eles é a velocidade que as tecnologias operam e o tipo de informação que analisam.
O Big Data analisa informações em tempo real, tendo como dominantes as não-estruturadas – as quais também constituem a maioria na rede, de um modo geral – ou seja, não possuem uma estrutura definida pára a informação que contém: podem ser vídeos, e-mails, documentos de texto, áudio, postagens em redes sociais, coordenadas de GPS, etc.
Já o Data Warehouse, que, como sua própria tradução diz é um “Armazém de Dados” guarda dados já estruturados, interligados pelo ambiente de uma empresa (como os Bancos de Dados corporativos) e preza, primariamente, pela qualidade e précisão.
O Business Intelligence é um afunilamento de Data Warehouse, que consiste na captação do conteúdo do “Armazém de Dados” com a finalidade de utilizá-los da melhor forma pára as tomadas de decisão dentro de uma empresa.
3. Alternativa errada é a ‘B’ e a ‘D’
A B (O volume de dados usado na mineração, impraticável....) está errada pois não é a limpeza de dados, e sim a redução de dados que faz com que a massa de dados original seja convertida em uma massa de dados menor.
O processo de limpeza dos dados geralmente envolve filtrar, combinar e preencher valores vazios.
A D (Uma das tarefas mais comuns na mineração de dados, a descrição....) é a errada, pois a tarefa mais comum que visa identicias qual classe um determinado registro pertence é a classificação não a descrição.
4. .“Baseado no conceito de MapReduce e Google Filé System (Sistema de arquivos do Google), a Fundação Apache Software desenvolveu uma solução chamada Hadoop. É destinado a aproveitar o poder de processamento paralelo massivo pára processar Big Data, geralmente usando muitos servidores baratos, no esquema de commodities. Hadoop é projetado pára abstrair grande parte da complexidade do processamento distribuído. Isso permite que os desenvolvedores se concentrem na tarefa em mãos (dados), em vez de se perder nos detalhes técnicos de implantação de um ambiente complexo”.
Verdadeira, pois o Hadoop foi desenvolvido baseada no conceito MapReduce e Google Filé System por serem uma técnica que consegue tirar proveito do enorme volume de dados que são gerados rotineiramente e subdividem problemas em tarefas gerenciaveis e mandam pára vários servidores que não precisam ser extremamente poderosos, por isso o hadoop consegue usar servidores baratos.