A Revolução Digital no Varejo e Big Data: Oportunidades e Desafios
Classificado em Computação
Escrito em em
português com um tamanho de 12,22 KB
A Revolução Digital no Varejo
A revolução digital no varejo: Amazon - Os truques possíveis vão além. Se a Amazon conhece o padrão de compras e reconhece um cliente em sua loja, pode também oferecer produtos que ele não cogitasse comprar. Traz, para o mundo físico, habilidades que só existiam no virtual. Revoluciona o negócio.
Efeito Uber no Varejo
A Amazon está em dois ramos: um, o do e-commerce; outro, o da hospedagem e prestação de serviços para empresas, como Uber e Netflix. Talvez o plano seja vender uma solução para outros que já operam no setor.
Comércio Eletrônico
O Comércio Eletrônico: business-to-business (B2B) é caracterizado pela existência de transações entre empresas, tais como pedidos, recebimentos ou pagamentos. O Intercâmbio Eletrônico de Dados (em inglês: Electronic Data Interchange - EDI) em redes de computadores proprietárias foi uma das primeiras iniciativas utilizadas para realizar essa tarefa. O B2C corresponde ao varejo eletrônico.
Benefícios do Comércio Eletrônico
- Benefícios diretamente mensuráveis (quantitativos):
- Promoção de produtos;
- Novo canal de vendas;
- Economia direta;
- Inovação de produtos.
- Benefícios indiretos (qualitativos):
- Novas oportunidades de negócio;
- Personalização do relacionamento com os clientes;
- Imagem de marca ou corporativa.
Questões Fechadas
No contexto de Big Data, o que significa o termo variedade? R: Formas diferentes em que os dados aparecem.
No contexto de Big Data, o que significa o termo volume? R: Quantidade de dados armazenados.
Qual é o tamanho estimado de todo material impresso no mundo? R: 200 petabytes.
Campo do conhecimento cujos métodos utilizam pessoas para a geração de dados ou execução de parte do processamento dos dados, principalmente em processos em que humanos ainda são melhores que os computadores. R: Crowdsourcing.
A afirmativa “As questões éticas não são relevantes no contexto de Big Data.” é falsa ou verdadeira? R: Falso.
Considerando o diagrama acima que representa um modelo dimensional simplificado de um armazém de dados (em inglês: Data Warehouse - DW) construído no modelo estrela (em inglês: Star Model), responda: qual é o conceito que NÃO representa uma dimensão nesse modelo? R: Desempenho.
A abordagem de modelagem dimensional Floco de Neve (em inglês: Snow Flake Model) que caracteriza-se pela existência de associações entre dimensões do modelo é utilizada para modelagem e construção de: R: Data warehouse.
Que tecnologia estudada na disciplina poderia ser MELHOR empregada para responder ao questionamento: “Quando os clientes compram Guaraná Antárctica aos domingos, quais os outros produtos eles costumam levar para casa”? R: Data Mining.
A análise multidimensional estrutura os dados em formatos que podem ser explorados adequadamente pelos usuários. Qual é o formato que permite que um gerente produza um submodelo a partir de valores específicos de múltiplas dimensões? R: Dicing.
A análise multidimensional estrutura os dados em formatos que podem ser explorados adequadamente pelos usuários. Dos formatos estudados na disciplina, qual essa figura representa? R: Changing Displays.
Questões Abertas
Qual é o papel do armazém de dados, da mineração de dados e do On-line Analytic Processing (OLAP) no contexto de Inteligência de Negócios (em inglês: Business Intelligence - BI)? Sua Resposta: O armazém de dados tem um papel como de uma coleção de dados orientada por categoria, integrada, não-volátil, variante no tempo, e armazenar dados históricos para apoio às decisões da administração através do OLAP e da mineração de dados. As ferramentas de OLAP são aplicações que realizam análises dimensionais sobre dados empresariais e possibilitam a realização de cálculos complexos, análise de tendências e modelagem sofisticadas de dados.
Como um armazém de dados (em inglês: data warehouse) se difere de um banco de dados tradicional? Sua Resposta: Bancos de dados tradicionais ou operacionais são transacionais. Eles são projetados para sistemas transacionais que processam transação por transação que registram as operações diárias de uma organização, como a venda de um produto para um cliente em uma data qualquer. Um armazém de dados tem o seu foco principal em aplicações de apoio à decisões baseadas em dados históricos das organizações e não em operações pontuais de uma atividade de um processo de negócio, como médias de vendas de um produto no trimestre.
O diagrama acima representa um modelo dimensional simplificado de um armazém de dados de uma universidade qualquer. Considerando esse diagrama, responda às seguintes questões: a) Qual foi a técnica de modelagem dimensional utilizada para confeccionar o diagrama? b) Qual é a tabela que representa a tabela de fatos no diagrama? c) Quais são as tabelas que representam as dimensões no diagrama? d) Qual medida poderia ser interessante para ser colocada na tabela de fatos do diagrama? Sua Resposta:
- a) Star schema ou modelo em estrela.
- b) Desempenho.
- c) Aluno, curso, disciplina e ano_semestre.
- d) Nota da avaliação das disciplinas.
Um armazém de dados é uma coleção de dados orientada por assunto, integrada, não volátil, variante no tempo e que fornece apoio para a administração na tomada de decisões. No contexto apresentado, esse tipo de banco de dados é ajustado para R: recuperar de maneira rápida os dados necessários.
O reitor de uma grande universidade propôs um modelo de dados dimensional para um armazém de dados com o intuito de melhorar as decisões tomadas pelos seus diretores sobre a gestão acadêmica. Esse modelo contém as tabelas Desempenho, Curso, Disciplina, Semestre e Ano; sendo que as tabelas Curso, Disciplina, Semestre e Ano somente estão ligadas à tabela Desempenho que se encontra no centro do modelo e que armazena a quantidade de alunos aprovados (sem reavaliação), quantidade de aprovados (com reavaliação), quantidade de alunos reprovados e quantidade de alunos desistentes. No contexto apresentado, a técnica de modelagem dimensional empregada pelo reitor da universidade está baseada no R: Modelo estrela.
O reitor de uma grande universidade propôs um modelo de dados dimensional para um armazém de dados com o intuito de melhorar as decisões tomadas pelos seus diretores sobre a gestão acadêmica. Esse modelo contém as tabelas Desempenho, Curso, Disciplina, Semestre e Ano; sendo que as tabelas Curso, Disciplina, Semestre e Ano somente estão ligadas à tabela Desempenho que se encontra no centro do modelo e que armazena a quantidade de alunos aprovados (sem reavaliação), quantidade de aprovados (com reavaliação), quantidade de alunos reprovados e quantidade de alunos desistentes. No contexto apresentado, a tabela de fatos é representada pela tabela R: Desempenho.
Empregando as técnicas da mineração de dados, um programa de obtenção de conhecimento foi utilizado pelo Wal-Mart para examinar milhares de registros de vendas e forneceu a seguinte regra: “Ao procurar eventuais relações entre o volume de vendas e os dias da semana, o processo de mineração de dados apontou que, às sextas-feiras, as vendas de cervejas cresciam na mesma proporção que as de fraldas.” No contexto apresentado, o Wal-Mart, para obter esse conhecimento, aplicou a técnica de R: Regras de associação.
A planilha abaixo apresenta um conjunto parcial de transações financeiras de cartões de crédito registrado por uma operadora: O gerente de créditos dessa operadora aplicou uma operação de análise multidimensional para analisar as compras parceladas e obteve o seguinte resultado: No contexto apresentado, o gerente de créditos aplicou a operação multidimensional denominada de R: Slicing.
Visão do Autor sobre Big Data
1) Qual é a visão do autor sobre Big Data? O autor relata sua visão sobre o Big Data que não é apenas um termo que nos remete à percepção de coleta de grandes volumes de dados e manutenção de forma estatística, pois coletar apenas dados é uma coisa e outra é extrair informações relevantes sobre eles, não sendo um processo simples. Desta maneira, o termo Big Data deve ser entendido como uma estrutura que compõe diversas tecnologias que permitem não só o armazenamento, mas também a análise e visualização dos resultados.
2) Quais são os inconvenientes trazidos, de acordo com o autor, pelo aumento no volume de dados para a ciência de dados, inclusive para as técnicas de estatísticas tradicionais? De acordo com o autor, o grande volume de dados disponibilizados leva a menos opções na construção de modelos preditivos, pois são poucas ferramentas que dispõem de funcionalidade para o processamento de grandes volumes de dados em um período aceitável de tempo. Sendo assim, as soluções de estatísticas tradicionais geralmente se concentram em análises estáticas limitadas pelas amostras que estão congeladas no tempo, o que muitas vezes resulta em conclusões que não mais correspondem à realidade e assim gerando informações não confiáveis.
3) O que é aprendizado de máquina (em inglês: Machine Learning) na visão do autor? Na visão do autor, aprendizado de máquina é considerado base tecnológica e viabilizadora do modelo de negócios de empresas digitais, como Amazon, Netflix, Google, Airbnb e outras. Machine learning também pode ser descrito como sistemas que se propõem a construir soluções baseadas em algoritmos que podem aprender com os dados ingeridos, sem o uso de programação baseada em regras, como a programação tradicional. Um exemplo de aplicação do conceito é o sistema Watson, da IBM.
4) Quais são os exemplos de empresas, de acordo com o texto, que aplicaram com sucesso o aprendizado de máquina? Você consegue descobrir em que elas utilizarão esse conceito? Um exemplo é a startup Airbnb, que em pouco tempo e ainda bem pequena utilizou os dados a seu favor, estudando e gerando informações importantes e utilizando o aprendizado de máquinas para seu crescimento e expansão. Desde os primeiros dias, eles se reuniram com membros da comunidade para entender como tornar os seus produtos mais adequados às suas necessidades. Então, os dados se tornaram um aliado. Usaram estatísticas para entender experiências individuais e agregar essas experiências para identificar tendências em toda a comunidade; essas tendências informam decisões sobre onde dirigir o negócio. Isso abriu o caminho para mudanças na estrutura da ciência de dados no Airbnb. Outro exemplo é a empresa de games Zynga, que construiu sua própria infraestrutura de rastreamento de dados, em um momento em que essas soluções avançadas eram praticamente inéditas. A Zynga usou esses dados para otimizar e melhorar seus jogos; a equipe construiu um modelo analítico detalhado para o desempenho do jogo. O modelo levou em conta fatores como os ganchos virais embutidos no produto e os canais de aquisição do usuário. A partir desses dados, o modelo tenta prever as principais métricas, incluindo o número de novas instalações por dia e como isso se deteriorou com o tempo, fator K de viralidade ao longo do tempo, retenção no dia 1 e receita por usuário ativo diário.
5) Qual é a percepção do autor sobre a aplicação deste conceito em nosso país? O autor relata que em nosso país a aplicabilidade ainda é pouca, pois a situação econômica atual é desafiadora, mas também é rica em oportunidades para fazer o novo ou de modo diferente de como foi feito há aproximadamente dez anos. É a oportunidade da aplicação do conceito de “Destruição Criativa” de Schumpeter, e abre espaço para novos produtos, novos mercados e novos modelos de negócio.