快速、大规模的数据集成
随着数据源和用户数据的激增,许多组织都无法承受为各种用例准备和提供数据所需的时间。在当今的商业世界中,速度至关重要,精通数字技术的企业通过增加协作并以每个人都可以快速使用和采取行动的形式推出数据驱动的见解来取得成功。
在 Trianz,我们的目标是帮助组织找到一种高度可扩展且经济高效的解决方案,以使用 AWS Glue 改造其旧系统。作为 AWS 高级合作伙伴,我们的 AWS Glue 功能包括:
使用 AWS Glue 最佳实践构建和部署安全数据管道
使用密钥管理服务 (KMS) 设置和实施 Glue 数据目录、Lake Formation、DataOps 和数据安全
将旧式 ETL 工作负载迁移到 AWS Glue
以受管控的方式运营和管理企业 PaaS 环境及其数据组合

无论使用情况如何,我们的专家团队都会为您的组织提供所需的协作文化,以克服当今最棘手的数据、角色和应用程序障碍。
什么是 AWS Glue?
2017 年,AWS Glue 最初作为一项 ETL 服务开始,后来演变为数据准备工具,如今已成为一项成熟的数据集成服务,全球数十万家组织都在使用这项服务。AWS Glue 在无服务器环境中运行,这意味着无需预置、配置或启动服务器,用户只需按使用时间付费。
Glue 采用即用即付模式,并具有集成 PB 级数据量的能力,迅速成为构建安全且可扩展的数据湖、仓库、湖屋和数据网格架构的热门选择。
AWS Glue 的优势

无服务器
无需维护基础设施,Glue 会自动分配所需的计算能力并运行作业。

经济高效
Glue 的一体化定价模式比其他云数据集成选项便宜 55%。

无锁定
用户可以选择使用 SparkSQL、PySpark 和 Scala 以开源形式开发数据集成管道。

多接口
开发环境适合不同的技能组合:针对数据工程师的可视化 ETL 开发、针对数据科学家的笔记本式开发以及针对数据分析师的无代码开发。

处理复杂的工作负载
连接到 200 多个数据源,并使用批处理、流式传输、事件和基于交互式 API 的执行模式处理 PB 级数据。
AWS Glue 案例研究

启用机器学习
一家领先的全球零售连锁店希望获得全渠道销售和营销分析以及客户 360 分析,以提高客户忠诚度并增加数字销售。他们需要将其旧数据和分析平台迁移到 AWS 上的现代云架构。
要了解 Trianz 如何使用 AWS Glue 来实现机器学习用例并帮助他们更好地了解客户行为,请阅读有关转变全球零售连锁店的数字营销运营的案例研究。

云分析解决方案
一家领先的全球医疗保健提供商希望利用云基础设施构建一个安全、可扩展且符合行业标准的云 IT 平台。他们需要现代且高度合规的分析功能来为其美国和欧盟地区提供医疗保健见解。
要了解 Trianz 如何使用 AWS Glue 构建符合严格准则和法规的灵活、可扩展且安全的分析平台,请阅读有关在 AWS 云上构建全球数据平台的案例研究。
AWS Glue 使用案例
提取和加载
Glue 是一种提取、转换、加载 (ETL) 服务,用于在基于 UI 的简单环境中开发复杂的 ETL 工作流。它提供了三个可视化界面,允许数据工程师、ETL 开发人员和分析师创建 ETL 工作流,几乎不需要任何额外的编码。
用户只需使用 AWS Glue 数据目录中的表定义创建作业,设置触发器以启动作业,将爬虫指向源方向以检索数据,然后 Glue 会自动生成将数据从源转换到目标所需的代码。借助 Glue 的三步流程,用户可以在几分钟内完成 ETL 作业,而不是几个月。

数据准备
AWS Glue使用 DataBrew 简化了数据准备工作,DataBrew是一种可视化数据准备工具,可帮助数据科学家轻松清理和规范化数据。用户可以从 350 多种预构建转换中进行选择,这些转换能够自动将数据转换为可用于分析和机器学习的格式。无需预先承诺,用户只需为使用 DataBrew 的时间付费。

数据集成
AWS Glue 和 AWS Lake Formation 是构建数据湖和 Lakehouse 的必备组件。Glue 提供数据目录和爬虫,以实现 AWS 服务之间的无缝数据移动。AWS Lake Formation 允许将数据作为数据湖或 Lakehouse 进行集中、整理和保护。简而言之,AWS Lake Formation 为安全性和治理提供了细粒度的访问控制,而 AWS Glue 简化了数据湖分析的元数据和数据发现。用户最终得到的是经济高效、管理良好且高度可扩展的数据存储解决方案。
