Integração de dados em velocidade e escala
Com a proliferação de fontes de dados e dados de usuários, muitas organizações estão sobrecarregadas com o tempo necessário para preparar e servir dados para vários casos de uso. No mundo dos negócios de hoje, a velocidade é essencial, e as empresas com conhecimento digital estão encontrando sucesso ao aumentar a colaboração e divulgar insights baseados em dados em um formato que todos podem consumir e agir rapidamente.
Na Trianz, nosso objetivo é ajudar organizações a encontrar uma solução altamente escalável e econômica para transformar seus sistemas legados com o AWS Glue. Como um AWS Advanced Partner, nossos recursos do AWS Glue incluem:
Construindo e implantando pipelines de dados seguros usando as práticas recomendadas do AWS Glue
Configuração e implementação do Glue Data Catalog, Lake Formation, DataOps e segurança de dados usando Key Management Services (KMS)
Migrando cargas de trabalho ETL legadas para AWS Glue
Operacionalizar e gerenciar ambientes PaaS empresariais e seus portfólios de dados de maneira governada
Não importa o caso de uso, nossas equipes de especialistas estão aqui para capacitar sua organização com a cultura colaborativa necessária para superar as barreiras mais difíceis de dados, personas e aplicativos da atualidade.
O que é AWS Glue?
O que começou como um serviço ETL em 2017 — e evoluiu para uma ferramenta de preparação de dados — agora é um serviço de integração de dados completo usado por centenas de milhares de organizações em todo o mundo. O AWS Glue é executado em um ambiente sem servidor, o que significa que não há necessidade de provisionar, configurar ou ativar servidores, e os usuários pagam apenas pelo tempo que usam.
Com o modelo de pagamento conforme o uso e a capacidade de integrar volumes de dados na escala de petabytes, o Glue está rapidamente se tornando uma escolha popular para a construção de data lakes, warehouses, lakehouses e arquiteturas de malha de dados seguros e escaláveis.
Benefícios do AWS Glue
Sem servidor
Não há infraestrutura para manter, e o Glue aloca automaticamente o poder de computação necessário e executa os trabalhos.
Custo-efetivo
O modelo de preços completo do Glue é 55% mais barato do que outras opções de integração de dados na nuvem.
Sem bloqueio
Os usuários têm a opção de desenvolver pipelines de integração de dados em código aberto usando SparkSQL, PySpark e Scala.
Multi-interface
Os ambientes de desenvolvimento atendem a diferentes conjuntos de habilidades: desenvolvimento visual de ETL para engenheiros de dados, desenvolvimento no estilo notebook para cientistas de dados e desenvolvimento sem código para analistas de dados.
Lida com cargas de trabalho complexas
Conecte-se a mais de 200 fontes de dados e processe petabytes de dados usando modos de execução em lote, streaming, eventos e API interativa.
Estudos de caso do AWS Glue
Habilitando o aprendizado de máquina
Uma rede de varejo global líder queria adquirir análises de vendas e marketing omnicanal e análises de 360 graus do cliente para melhorar a fidelidade do cliente e aumentar as vendas digitais. Eles precisavam migrar sua plataforma de dados e análises legada para uma arquitetura de nuvem moderna na AWS.
Para saber como a Trianz usou o AWS Glue para habilitar casos de uso de aprendizado de máquina e ajudá-los a entender melhor o comportamento do cliente, leia este estudo de caso sobre Transformação de operações de marketing digital para uma rede global de varejo.
Solução de análise em nuvem
Um provedor líder global de assistência médica queria alavancar a infraestrutura de nuvem para construir uma plataforma de TI em nuvem segura, escalável e compatível com o setor. Eles precisavam de recursos de análise modernos e altamente compatíveis para gerar insights de assistência médica para suas áreas geográficas dos EUA e da UE.
Para saber como a Trianz usou o AWS Glue para criar uma plataforma de análise flexível, escalável e segura, alinhada a diretrizes e regulamentações rígidas, leia este estudo de caso sobre como criar uma plataforma de dados global na nuvem AWS.
Casos de uso do AWS Glue
ETL
O Glue como um serviço de extração, transformação e carregamento (ETL) é usado para desenvolver fluxos de trabalho ETL complexos em um ambiente baseado em UI simples. Ele fornece três interfaces visuais que permitem que engenheiros de dados, desenvolvedores ETL e analistas criem fluxos de trabalho ETL, com pouca ou nenhuma codificação adicional necessária.
Os usuários simplesmente criam trabalhos usando definições de tabela no AWS Glue Data Catalog, definem gatilhos para iniciar os trabalhos, apontam o rastreador na direção da fonte para recuperar dados, e o Glue gera automaticamente o código necessário para transformar os dados da fonte para o destino. Com o processo de três etapas do Glue, os usuários podem concluir um trabalho ETL em minutos em vez de meses.
Preparação de dados
O AWS Glue simplifica a preparação de dados com o DataBrew, uma ferramenta visual de preparação de dados que facilita para cientistas de dados limpar e normalizar dados. Os usuários podem escolher entre mais de 350 transformações pré-construídas capazes de transformar dados automaticamente em um formato pronto para análise e aprendizado de máquina. Não há compromisso inicial, e os usuários pagam apenas pelo tempo gasto usando o DataBrew.
Integração de dados
AWS Glue e AWS Lake Formation são componentes essenciais para a construção de data lakes e lakehouses. O Glue fornece o catálogo de dados e rastreadores para movimentação de dados contínua entre os serviços da AWS. O AWS Lake Formation permite que os dados sejam centralizados, curados e protegidos como um data lake ou lakehouse. Em resumo, o AWS Lake Formation fornece controles de acesso refinados para segurança e governança, e o AWS Glue simplifica os metadados e a descoberta de dados para análise de data lake. O que o usuário acaba tendo é uma solução de armazenamento de dados econômica, bem governada e altamente escalável.