AWS Glue es una plataforma informática sin servidor basada en eventos que ofrece Amazon como parte de Amazon Web Services. Es un servicio de integración de datos completo que utilizan cientos de miles de organizaciones en todo el mundo. AWS Glue se ejecuta en un entorno sin servidor, sin necesidad de aprovisionar, configurar ni poner en marcha servidores.
Con el modelo de pago por uso y la capacidad de integrar volúmenes de datos a escala de petabytes, Glue se está convirtiendo rápidamente en una opción popular para construir lagos de datos seguros y escalables, almacenes, lagos de datos y arquitecturas de malla de datos. Con AWS Glue, puede descubrir y conectarse a diversas fuentes de datos y administrar sus datos en un catálogo de datos centralizado. Las capacidades de AWS Glue incluyen descubrimiento de datos, ETL moderno, limpieza de datos y transformaciones. Al ser un servicio sin servidor, no requiere infraestructura para administrar y ofrece soporte flexible para todo tipo de cargas de trabajo, como ETL, ELT y streaming. Con la capacidad de escalar según demanda, nos ayuda a concentrarnos en actividades de gran volumen que maximizan el valor de los datos.
Conectores de pegamento
AWS Glue ofrece compatibilidad integrada con los almacenes de datos de uso común, como Amazon Redshift, Aurora y Microsoft SQL Server, mediante una conexión JDBC. Estos conectores le permiten crear trabajos de Glue con capacidad de extracción, transformación y carga (ETL). Un conector es un paquete de código opcional que ayuda a acceder a los almacenes de datos en AWS Glue Studio.
AWS Glue también le permite suscribirse a varios conectores que ofrece AWS Marketplace. Al crear un trabajo, podemos usar una fuente de datos compatible de forma nativa o usar un conector de AWS Marketplace en función del sistema de origen específico del que está intentando extraer y cargar datos.