O AWS Glue é uma plataforma de computação sem servidor e orientada a eventos fornecida pela Amazon como parte do Amazon Web Services. É um serviço de integração de dados completo usado por centenas de milhares de organizações no mundo todo. O AWS Glue é executado em um ambiente sem servidor, sem necessidade de provisionamento, configuração ou inicialização de servidores.
Com o modelo pay-as-you-go e a capacidade de integrar volumes de dados em escala de petabytes, o Glue está rapidamente se tornando uma escolha popular para a construção de data lakes, warehouse, lake-house e arquiteturas de malha de dados seguras e escaláveis. Com o AWS Glue, você pode descobrir e se conectar a várias fontes de dados diversas e gerenciar seus dados em um catálogo de dados centralizado. Os recursos do AWS Glue incluem descoberta de dados, ETL moderno, limpeza de dados e transformações. Sendo um serviço sem servidor, ele não requer infraestrutura para gerenciar, oferecendo suporte flexível para todos os tipos de cargas de trabalho, como ETL, ELT e streaming. Com capacidade de escalar sob demanda, ele nos ajuda a focar em atividades de alto volume que maximizam o valor dos dados.
Conectores de cola
O AWS Glue fornece suporte integrado para os armazenamentos de dados comumente usados, como Amazon Redshift, Aurora, Microsoft SQL Server usando conexão JDBC. Esses conectores permitem que você crie trabalhos do Glue com capacidade de extrair, transformar e carregar (ETL). Um conector é um pacote de código opcional que auxilia no acesso a armazenamentos de dados no AWS Glue Studio.
O AWS Glue também permite que você assine vários conectores oferecidos no AWS Marketplace. Ao criar um trabalho, podemos usar uma fonte de dados com suporte nativo ou usar um conector do AWS Marketplace com base no sistema de fonte específico que você está tentando extrair e carregar dados.