Arquivo de Data Engineering - Data Universe

GA4 + Google Bigquery: Integrar dados do GA4 com o Big Query + Looker

Alexandre Polselli — Fri, 23 Aug 2024 02:12:22 +0000

Neste vídeo, guio você pelo processo completo de migração de dados do Google Analytics 4 para o BigQuery, seguido pela integração desses dados com um relatório no Looker Studio.

Com instruções detalhadas e exemplos práticos, você aprenderá como configurar a exportação de dados, criar uma conexão robusta no BigQuery e, finalmente, transformar esses dados em insights visuais poderosos usando o Looker Studio.

Ideal para profissionais que buscam otimizar a análise de dados e aprimorar a tomada de decisões com ferramentas avançadas do Google.

O post GA4 + Google Bigquery: Integrar dados do GA4 com o Big Query + Looker apareceu primeiro em Data Universe.

Processamento de dados em lote com PySpark e Docker

Alexandre Polselli — Thu, 28 Mar 2024 11:27:10 +0000

Neste projeto, compartilharei o passo a passo de um projeto de processamento de dados em lote que utilizei em meu portfolio. O objetivo era transformar um arquivo JSON em um banco SQLite, utilizando PySpark e Docker. 1. Configurando o ambiente com Docker Compose Comecei criando um cluster PySpark em Docker com três containers: um master, […]

O post Processamento de dados em lote com PySpark e Docker apareceu primeiro em Data Universe.

Processo de ETL simples utilizando datalake MinIO

Alexandre Polselli — Thu, 01 Feb 2024 02:27:40 +0000

MinIO é um armazenamento de objetos de alto desempenho compatível com S3. Ele é projetado para cargas de trabalho de inteligência artificial/aprendizado de máquina em grande escala, data lakes e bancos de dados. É definido por software e pode ser executado em qualquer infraestrutura em nuvem ou local. Aqui irei organizar os arquivos na nuvem […]

O post Processo de ETL simples utilizando datalake MinIO apareceu primeiro em Data Universe.

Automatizando Infraestrutura AWS EC2 via IaC com Terraform no Docker

Alexandre Polselli — Fri, 05 Jan 2024 22:12:18 +0000

Este artigo explora a implementação prática da integração entre DevOps e Infraestrutura como Código (IaC), com foco na automação da infraestrutura AWS EC2 utilizando a ferramenta Terraform. Destaco aqui a importância da IaC, tratando a infraestrutura como código de software demonstrando os benefícios dessa abordagem na agilidade, rastreabilidade e escalabilidade da infraestrutura em nuvem. IaC […]

O post Automatizando Infraestrutura AWS EC2 via IaC com Terraform no Docker apareceu primeiro em Data Universe.