AWS Glue 是亚马逊作为 Amazon Web Services 的一部分提供的事件驱动型无服务器计算平台。它是一项成熟的数据集成服务,全球有数十万家组织在使用。AWS Glue 在无服务器环境中运行,无需预置、配置或启动服务器。
凭借按需付费模式和集成 PB 级数据量的能力,Glue 正迅速成为构建安全且可扩展的数据湖、仓库、湖屋和数据网格架构的热门选择。借助 AWS Glue,您可以发现并连接到各种不同的数据源,并在集中式数据目录中管理数据。AWS Glue 功能包括数据发现、现代 ETL、数据清理和转换。作为一项无服务器服务,它不需要管理基础设施,即可为 ETL、ELT 和流媒体等所有类型的工作负载提供灵活的支持。凭借按需扩展的能力,它帮助我们专注于可最大限度提高数据价值的大容量活动。

胶水连接器
AWS Glue 使用 JDBC 连接为常用数据存储(如 Amazon Redshift、Aurora、Microsoft SQL Server)提供内置支持。这些连接器允许您创建具有提取、转换和加载 (ETL) 功能的 Glue 作业。连接器是一个可选的代码包,可帮助访问 AWS Glue Studio 中的数据存储。
AWS Glue 还允许您订阅 AWS Marketplace 中提供的多个连接器。在创建作业时,我们可以使用本机支持的数据源,也可以根据您尝试提取和加载数据的特定源系统使用来自 AWS Marketplace 的连接器。