AWS Glue ist eine ereignisgesteuerte, serverlose Computing-Plattform, die von Amazon als Teil von Amazon Web Services bereitgestellt wird. Es handelt sich um einen vollwertigen Datenintegrationsdienst, der von Hunderttausenden von Organisationen weltweit genutzt wird. AWS Glue läuft in einer serverlosen Umgebung, ohne dass Server bereitgestellt, konfiguriert oder hochgefahren werden müssen.
Mit seinem Pay-as-you-go-Modell und der Fähigkeit, Datenmengen im Petabyte-Bereich zu integrieren, wird Glue schnell zu einer beliebten Wahl für den Aufbau sicherer und skalierbarer Data Lakes, Warehouses, Lake-House- und Data Mesh-Architekturen. Mit AWS Glue können Sie verschiedene Datenquellen entdecken und sich mit ihnen verbinden und Ihre Daten in einem zentralen Datenkatalog verwalten. Zu den Funktionen von AWS Glue gehören Datenerkennung, modernes ETL, Datenbereinigung und Transformationen. Da es sich um einen serverlosen Dienst handelt, ist keine Infrastruktur für die Verwaltung erforderlich, und er bietet flexible Unterstützung für alle Arten von Workloads wie ETL, ELT und Streaming. Dank der Fähigkeit zur Skalierung nach Bedarf können wir uns auf Aktivitäten mit hohem Volumen konzentrieren, die den Wert der Daten maximieren.
Klebeverbinder
AWS Glue bietet integrierte Unterstützung für häufig verwendete Datenspeicher wie Amazon Redshift, Aurora und Microsoft SQL Server über eine JDBC-Verbindung. Mit diesen Konnektoren können Sie Glue-Jobs mit der Möglichkeit zum Extrahieren, Transformieren und Laden (ETL) erstellen. Ein Konnektor ist ein optionales Codepaket, das den Zugriff auf Datenspeicher in AWS Glue Studio unterstützt.
AWS Glue ermöglicht Ihnen außerdem, mehrere Konnektoren zu abonnieren, die im AWS Marketplace angeboten werden. Beim Erstellen eines Auftrags können wir eine nativ unterstützte Datenquelle verwenden oder einen Konnektor aus AWS Marketplace basierend auf dem spezifischen Quellsystem, aus dem Sie Daten extrahieren und laden möchten.