Modrox
  • Home
  • A Predicta
  • Nossas Soluções
  • Nosso Blog
  • Webinar
  • Na Mídia
  • Contato
  • Home
  • /
  • Insights
  • /
  • Data lake x Data Warehouse: entenda a diferença
Call Us:+ 55 11 3463-5600

Data lake x Data Warehouse: entenda a diferença - Predicta

Data Lake e Data Warehouse
20 DE MARçO, 2019
  • 0 Comentários

Data lake x Data Warehouse: entenda a diferença

Agrupar arquivos e informações relevantes em um ambiente seguro e de fácil acesso. Essa é a definição de armazenamento de dados. Em um cenário onde os dados se tornam cada vez mais valiosos para as marcas, entender as melhores maneiras de armazená-los é fundamental. Dentro dessas possibilidades estão o Data Lake e o Data Warehouse.

  • – Data Driven Marketing: como tratar os dados das suas iniciativas digitais
    – 6 mitos e verdades sobre Mídia Programática
    – 15 aplicações da Inteligência Artificial no marketing


Antes de explicar melhor cada um deles, vale citar que o processo de gestão de dados se divide em 3 etapas chamadas de ETL: Extract (extração), Transform (transformação) e Load (carregamento).

>> Extração: processo de extrair dados de diferentes sistemas respeitando suas respectivas características e abrigá-las em um espaço temporário

>> Transformação: as informações passam por uma manipulação para que apresentem uma visão mais unificada e padronizada (nem sempre é uma etapa necessária. Veremos a frente o porquê).

>> Carregamento: os dados são enviados para um local seguro de acordo com a necessidade do business. É nesse momento que a decisão de migrá-los para um Data Warehouse ou Data Lake deve ser tomada.

O Data Lake

O Data Lake é o repositório perfeito para quem precisa abrigar qualquer tipo de dados em qualquer escala. Dashboards, dados em tempo real, analytics, planilhas, informações de machine learning… enfim. Não há restrições para a ferramenta.

Por isso o nome “Lago de Dados”. Para abrigar informações no Data Lake, pode-se dispensar, inclusive, a etapa de tratamento de dados, já que a proposta de quem o utiliza é abrigar e ter acesso a um número elevadíssimo de dados brutos de categorias diferentes em um só lugar. Big Data!

Principais benefícios do Data Lake

>> Abriga qualquer tipo de informações
>> Capacidade para um número elevadíssimo de dados
>> Flexibilidade na hora de acessar os dados, já que estão todos reunidos em uma só visão
>> Pode abrigar dados referentes a internet das coisas, como eletrodomésticos inteligentes
>> Dados acessíveis de forma democrática, já que estão brutos e podem ser disponibilizados para todos colaboradores de uma empresa por exemplo.
>> Utiliza a disponibilidade de grandes quantidades de dados e algoritmos de Deep Learning. Isso ajuda na análise de decisões em tempo real

O Data Warehouse

Ao contrário do aglomerado de informações de formatos e tamanhos diferentes, o Data Warehouse é um espaço dedicado a receber dados tratados, padronizados e higienizados. A proposta do DW é oferecer visões organizadas que permitam aos profissionais tomar decisões mais embasadas sobre determinada situação. Para abrigar qualquer informação em um DW, é fundamental que elas tenham passado pelo processo de tratamento, diferentemente do Data Lake.

Principais benefícios do Data Warehouse

>> integração de diferentes tipos de fonte de dados em uma visão única
>> abriga dados já higienizados, o que evita potenciais ruídos de análise
>> favorece a visão de insights
>> ideal para analisar situações específicas analisadas por profissionais de BI
>> permite a análise de dados históricos que ficam abrigados no seu espaço

Modelo Estrela VS Modelo Floco de Neve

Outra técnica muito importante a ser dita no armazenamento de dados nos Data Warehouses é a Modelagem Dimensional. É uma maneira de modelar os dados levando em consideração como as informações se relacionam, se aprofundando em cada “eixo”. Vamos entender melhor explicando o Modelo Dimensional Estrela e o Modelo Dimensional Floco de Neve.

Modelo Estrela

Por ser  focado em fatos e dimensões, este modelo permite uma fácil visualização do cenário analisado. No exemplo abaixo, o fato são os voos, centralizados no esquema. As dimensões são todas as variáveis que o rodeiam e são conectadas a ele nos chamados “joins”.  

A vantagem desse modelo é a facilidade do entendimento dos relacionamentos, reduzindo o número de joins e tem baixa manutenção de dados.

Modelo Floco de Neve

É considerado uma especialização do modelo estrela, pois é representado pela tabela fato centralizada e conectada a múltiplas dimensões, porém, permite fazer joins com tabelas individuais. Isso ajuda pois nem todas as tabelas precisam se ligar a todas as outras.

Algumas ferramentas de modelagem de banco de dados multidimensionais OLAP (Online Analytical Processing, – método de manipulação e análise de um grande volume de dados) são otimizadas para o modelo floco de neve, a normalização de atributos resulta em economia de armazenamento. Podemos citar que a desvantagem do modelo é que a normalização dos atributos adicionam complexidade aos joins de consulta, e aumenta o gerenciamento e controle de atualização e inserção para garantir a integridade dos dados.

E aí, afinal como armazenar e organizar seus dados?

Já entendemos que a extração, tratamento e organização dos dados são processos essenciais para os times de Marketing. Para isso, é fundamental contar com um parceiro certificado e capacitado para manipular os dados da sua marca de forma segura e organizada.

A Predicta é certificada não apenas para gerenciar o Google Cloud Platform, mas também o Google Marketing Platform e integrar todas as estratégias, desde o planejamento até a organização dos dados das iniciativas digitais.

Vamos agendar uma reunião? Fale conosco pelo (11) 3463-5600 ou pelo e-mail falecom@predicta.net.

Tags: análise de dados, business intelligence

    Post anterior
Próximo post    

Categorias

  • Eventos
  • Inovação
  • Insights
  • Nossos Experts
  • Notícias
  • Por Dentro da Predicta

Notícias recentes

Sleeping Giants reacende discussões sobre fake news e brand safety; saiba como a Predicta está trabalhando para preservar seus anunciantes
28 Maio, 2020
Data Lake: o que é e quais as vantagens para o Marketing?
16 mar, 2020
Data Warehouse: tudo que você precisa saber e 5 passos de como construir
12 mar, 2020
Data Layer: o que é e por que é tão importante para o marketing digital?
05 mar, 2020

Tags

adserver análise de dados brand safety business intelligence campanha digital campanhas digitais compra de mídia compra de mídia digital Dados dashboards data driven marketing dco estratégias de marketing digital formatos de anúncio Google ads google cloud google marketing live google marketing platform inteligência artificial jornada do cliente lei de proteção a dados LGPD marketing online mobile modelo de atribuição mídia digital mídia programática native planejamento de mídia digital predicta programmatic creative publicidade digital publicidade em vídeo remarketing search search ads 360 transformação digital
image

Social

  • facebook
  • instagram
  • twitter
  • linkedin
  • youtube

Páginas

  • Home
  • A Predicta
  • Nossas Soluções
  • Nosso Blog
  • Webinars
  • Predicta na Mídia
  • Política de Privacidade
  • Política de Cookies
  • Política de Proteção de Dados Pessoais
  • Código de Ética e Conduta
  • Canal de Denúncia

Copyright

© Predicta 2020 - All Rights Reserved.