AWS Glue è una piattaforma di elaborazione serverless basata su eventi fornita da Amazon come parte di Amazon Web Services. È un servizio di integrazione dati completo utilizzato da centinaia di migliaia di organizzazioni in tutto il mondo. AWS Glue viene eseguito in un ambiente serverless, senza necessità di provisioning, configurazione o avvio di server.
Con il modello pay-as-you-go e la capacità di integrare volumi di dati su scala petabyte, Glue sta rapidamente diventando una scelta popolare per la creazione di data lake, warehouse, lake-house e architetture data mesh sicure e scalabili. Con AWS Glue, puoi scoprire e connetterti a diverse fonti di dati e gestire i tuoi dati in un catalogo dati centralizzato. Le capacità di AWS Glue includono data discovery, ETL moderno, pulizia dei dati e trasformazioni. Essendo un servizio serverless, non richiede alcuna infrastruttura per la gestione, offrendo un supporto flessibile per tutti i tipi di carichi di lavoro come ETL, ELT e streaming. Con la capacità di scalare su richiesta, ci aiuta a concentrarci su attività ad alto volume che massimizzano il valore dei dati.
Connettori di colla
AWS Glue fornisce supporto integrato per gli archivi dati comunemente utilizzati come Amazon Redshift, Aurora, Microsoft SQL Server tramite connessione JDBC. Questi connettori consentono di creare lavori Glue con capacità di estrazione, trasformazione e caricamento (ETL). Un connettore è un pacchetto di codice opzionale che aiuta ad accedere agli archivi dati in AWS Glue Studio.
AWS Glue consente inoltre di abbonarsi a diversi connettori offerti in AWS Marketplace. Durante la creazione di un job, possiamo utilizzare una fonte dati supportata in modo nativo o utilizzare un connettore da AWS Marketplace basato sul sistema sorgente specifico che stai tentando di estrarre e caricare dati.