운영 데이터 저장소(ODS)와 데이터 웨어하우스의 차이점을 더 잘 이해하려면 ODS가 데이터 웨어하우스를 대체하거나 대체하는 것이 아니라는 점을 명확히 하는 것이 가장 좋습니다. ODS는 종종 데이터 웨어하우스의 중간 또는 스테이징 영역이지만 ODS는 데이터가 덮어쓰이고 자주 변경된다는 점에서 다릅니다. 반면 데이터 웨어하우스는 보관, 저장, 과거 분석 및 보고를 위한 정적 데이터를 포함합니다.
그러나 ODS와 데이터 웨어하우스는 서로 다른 소스에서 데이터를 가져오고 통합하기 때문에 많은 공통점이 있습니다. 이러한 소스는 분석 및 보고를 위한 핵심 기능을 제공하지만, 두 가지의 미묘한 차이를 구별하여 하나의 통합 데이터 솔루션을 배포할지 아니면 계층형 데이터 아키텍처 내에서 결합하여 조직에 가장 많은 비즈니스 인텔리전스(BI)를 제공할지 결정하는 것이 중요합니다.
미국의 Fortune 100 P&C 보험사는 느린 개발 수명 주기, 제한된 데이터 처리 기능, IT에 대한 과도한 의존성으로 인해 운영을 효율적으로 관리하는 데 어려움을 겪었습니다. 기존 애플리케이션을 이벤트 기반 아키텍처로 마이그레이션하면서 저비용 인프라 및 분석 솔루션을 찾고 있었습니다.
더 나은 방법이 있다는 것을 알고, 그들은 지능형 최첨단 ODS 및 분석 솔루션을 구축하기로 했습니다. 기존 애플리케이션을 이벤트 기반 아키텍처로 마이그레이션한 방법을 알아보려면 차세대 운영 데이터 저장소 구축에 대한 이 사례 연구를 읽어보세요.
ODS 및 데이터웨어하우스에서 데이터를 더 빠르게 쿼리할 방법을 찾고 계신가요?
Amazon Athena Federated Query Connectors를 사용하면 AWS 에코시스템 외부의 여러 데이터베이스에 연결하고 쿼리를 실행할 수 있습니다.
데이터 웨어하우스는 보고 및 데이터 분석에 사용되는 시스템으로, 다양한 소스에서 통합된 데이터의 중앙 저장소 역할을 합니다. 데이터 웨어하우스는 비정형, 정형 및 반정형 데이터를 저장하여 조직에 장기 전략적 계획을 위한 단일 진실 소스(SSOT)를 제공합니다.
대부분의 데이터웨어하우스에는 다음 요소가 포함됩니다.
고객, 주문, 제품과 관련된 대량의 비즈니스 데이터를 저장하는 관계형 데이터베이스(RDB)입니다.
통계 분석, 보고, 데이터 마이닝 기능을 위해 빅데이터를 준비하는 데 사용되는 추출, 로딩, 변환(ELT) 솔루션입니다.
비즈니스 사용자에게 데이터를 제시하기 위한 클라이언트 측 시각화 도구입니다.
고급 데이터웨어하우스에는 데이터 과학과 인공 지능(AI) 알고리즘을 적용하여 실행 가능한 정보를 생성하는 정교한 애플리케이션이 포함되는 경우가 많습니다.
데이터 웨어하우스는 온프레미스, 클라우드 또는 하이브리드 클라우드 환경에 배포할 수 있습니다. 대부분의 데이터 웨어하우스는 클라우드 서비스에서 호스팅되며, 온프레미스 인프라에 더 확장 가능하고 비용 효율적인 솔루션을 제공합니다. 가장 인기 있는 클라우드 데이터 웨어하우스 옵션은 다음과 같습니다.
1. Amazon Redshift 는 완전 관리형 AWS 클라우드 기반 데이터 웨어하우징 플랫폼입니다. Redshift는 MySQL, PostgreSQL, Oracle DB와 같은 기존 관계형 데이터베이스 관리 시스템(RDBMS)이 있는 기업에 탁월한 선택입니다.
2. Azure SQL Data Warehouse는 컴퓨팅과 스토리지를 독립적으로 관리할 수 있는 컨트롤이 있는 Microsoft 관리형 페타바이트 규모 서비스입니다. Pay-as-you-go 환경에서 운영 비용을 줄이기 위해 데이터를 유지하는 동안 컴퓨팅 계층을 일시 중지하려는 사용자에게 가장 좋습니다.
3. Google BigQuery 는 방대한 데이터 세트의 대화형 분석을 위해 설계된 서버리스, 확장성이 뛰어나고 비용 효율적인 멀티 클라우드 데이터웨어하우스입니다. Google은 고급 분석 기능을 지원하기 위해 BigQuery ML 및 BigQuery BI Engine과 같은 통합 머신 러닝 및 비즈니스 인텔리전스 도구를 제공합니다.
4. SAP Data Warehouse Cloud는 데이터 통합, 데이터베이스, 데이터웨어하우스, 분석 기능을 포함하는 SAAS 클라우드 솔루션으로, 조직이 데이터 중심 기업을 구축하는 데 도움이 됩니다.
5. Snowflake 는 빅데이터 분석을 위해 설계된 ANSI 표준 SQL 컬럼형 스토어 데이터베이스입니다. Snowflake는 복잡한 쿼리를 실행하거나, 데이터 분석을 하거나, 빅데이터 과학을 하는 조직에 가장 적합합니다.
비즈니스 의사결정을 개선하기 위한 분석 기능을 제공하는 데이터웨어하우스 외에도 DW가 기업에 주요 경쟁 우위를 제공하는 다섯 가지 방법을 소개합니다.
적절하게 포맷된 경우, 데이터 웨어하우스가 제공하는 정확한 데이터는 의사 결정권자가 과거 추세와 과제로부터 배우는 데 필수적입니다. 데이터 웨어하우스는 이전 전략을 둘러싼 모든 주요 성과 추세를 나열하여 과거 데이터에 맥락을 추가할 수 있습니다. 이는 기존 데이터베이스로는 달성할 수 없는 일입니다.
온프레미스 또는 클라우드에 있든, 데이터웨어하우스는 암호화 및 "슬레이브 읽기 전용"과 같은 특정 보호 설정을 사용하여 악성 SQL 코드를 차단하고 기밀 데이터를 보호함으로써 데이터 보안을 보장할 수 있습니다.
데이터 웨어하우스는 조직이 운영을 원활하게 유지하는 데 필요한 확장성을 제공하는 핵심 구성 요소입니다. 더 많은 쿼리를 처리하고 최대 수요 중에 확장 및 축소할 수 있는 기능은 전체 비즈니스에서 더 많은 확장성을 생성하는 데 도움이 됩니다.
재고부터 주요 판매, 제품 출시까지 모든 것에 대한 더욱 스마트하고 지표 기반의 의사 결정을 가능하게 하는 과거 데이터를 활용함으로써 조직은 직감에 의존하지 않는 경쟁 전략을 수립할 수 있습니다.
데이터 웨어하우스는 조직이 다음과 같은 중요한 질문에 답할 수 있도록 지원합니다. 사용 가능한 데이터 자산의 가치는 무엇인가? 이해 관계자가 실시간으로 데이터에 액세스할 수 있는가? 데이터 스트림을 수익화할 수 있는가? 사용 가능한 데이터 자산의 가치는 무엇인가? 이러한 질문에 답할 수 있는 능력은 조직에 2년 미만의 데이터 웨어하우스 회수 기간을 제공합니다.
데이터 웨어하우스의 주요 단점 중 하나는 비휘발성이라는 점인데, 즉 데이터가 읽기 전용이고 정리가 필요하다는 의미입니다. 이는 시간적 편차로 이어지고, 이는 데이터 웨어하우스 업데이트가 예약된 배치로 수행되어 날짜가 있는 보고가 발생할 가능성이 있음을 의미합니다.
이러한 이유로 많은 조직에서는 일상 업무를 위한 운영 데이터를 통합하는 준비 영역으로 ODS를 구현하기로 선택합니다.
운영 데이터 저장소는 데이터 웨어하우스의 비휘발성적 특성에 대한 비용 효율적인 솔루션입니다. ODS는 데이터 웨어하우스와 동일한 유형의 변환을 필요로 하지 않습니다. ODS는 구조화된 데이터만 저장할 수 있으므로 데이터는 기존 스키마에 남아 있어 스키마 온 라이트 방식을 사용하는 데이터 레이크와 더 유사합니다.
이런 의미에서 ODS는 조직의 가장 최신 데이터 스냅샷을 저장하는 저장소 역할을 하여 사용자가 구성 요소 시스템을 검색하기 전에 문제를 진단하기 쉽게 해줍니다. 예를 들어, ODS를 사용하면 서비스 담당자가 트랜잭션을 즉시 쿼리하여 다음에 답할 수 있습니다.
고객의 패키지는 현재 어디에 있습니까?
거래가 진행되지 않는 이유는 무엇인가요?
이 문제를 더 해결하려면 어떤 조치를 취할 수 있나요?
스테이징 영역은 거의 실시간으로 거래 소스에서 운영 데이터를 수신하므로, 쿼리되는 현재 데이터에만 액세스하여 거래 시스템에서 부담을 덜어줍니다. 따라서 ODS는 더 빠른 비즈니스 결정을 내리기 위해 현재 데이터 레코드에 연결된 정보에 대한 360도 뷰를 찾는 사람들에게 이상적인 솔루션입니다.
귀사의 비즈니스는 운영 데이터 저장소에서 어떤 이점을 얻을 수 있습니까? 비즈니스에 필요한 속도, 규모, 민첩성을 스냅샷으로 제공하는 ODS를 고려해야 하는 5가지 설득력 있는 이유가 있습니다.
ODS는 데이터웨어하우스와 데이터레이크보다 구축 및 구현 비용이 훨씬 저렴합니다. 가격은 운영 요구 사항과 사용 사례에 따라 크게 다르지만, ODS는 일반적으로 기업이 온프레미스 데이터웨어하우스에 지불할 것으로 예상할 수 있는 비용의 약 10분의 1입니다.
운영 데이터 저장소는 현재 데이터만 수집하므로 다중 레벨 조인에 대한 필요성을 우회하여 쿼리가 간소화됩니다. 이는 특히 긴급한 트랜잭션 질문에 즉석으로 답할 데이터를 찾을 때 유용합니다.
ODS는 스테이징 영역 역할을 하므로 데이터를 하나의 일관된 형식으로 구성할 수 있습니다. 이를 통해 데이터웨어하우스로 전송되기 전에 전반적인 데이터 품질이 향상되고, 데이터웨어하우스에서 전략적 의사 결정에 사용됩니다.
ODS는 분산된 소스 시스템에 내장되어 있을 때는 찾을 수 없는 시간에 민감한 비즈니스 데이터를 제공합니다. ODS는 실시간 운영 데이터를 추출하므로 보고 프로세스를 간소화하고 해당 정보를 스냅샷 저장소에 통합하여 효율성을 크게 개선합니다.
차세대 ODS는 수동 스키마 매핑을 단 한 번의 클릭으로 줄일 수 있습니다. 마이크로서비스 아키텍처를 통해 조직은 새로운 서비스를 더 빨리 시장에 출시할 수 있습니다.
기존 ODS 솔루션은 관계형 데이터베이스나 디스크 기반 NoSQL 데이터베이스를 기반으로 하기 때문에 일반적으로 대기 시간이 길다는 단점이 있습니다. 이러한 시스템은 단순히 대량의 데이터를 처리하고 동시에 높은 성능을 제공할 수 없습니다.
기존 시스템의 제한된 확장성은 여러 사용자가 동시에 데이터 저장소에 액세스할 때 성능 문제로 이어집니다. 따라서 기존 ODS 솔루션은 기록 시스템에 액세스하기 위한 실시간 API 서비스를 제공 할 수 없습니다.
간단히 말해서, 사용 사례와 분석되는 데이터의 양에 따라 달라집니다. 조직에서 엄청난 양의 클라이언트, 직원 및 고객 계정 정보를 예상하는 경우 ODS 솔루션을 데이터 웨어하우스 시스템과 통합해야 합니다.
합병 또는 인수는 계층형 아키텍처를 만드는 데 고려해야 할 또 다른 요소입니다. 여러 소스 시스템에서 현재 및 과거 데이터를 중앙에서 볼 수 있도록 하려면 ODS와 데이터 웨어하우스를 결합하면 전체 엔터프라이즈에 대한 가장 관련성 있는 스냅샷을 제공합니다.
클라우드가 많은 자유와 유연성을 약속하는 이러한 디지털 시대에 클라우드, 분석, 빅데이터 플랫폼을 통합한 강력한 IT 인프라는 기업의 비즈니스 우수성을 촉진할 것입니다.
Trianz의 분석 팀은 전반적인 비즈니스 프로세스를 최소한으로 방해하면서 ODS 솔루션을 개발하고 배포할 수 있습니다. AWS EC2에서 Hortonworks Data Platform(HDP), AWS Simple Storage Service(S3), Elastic Block Store(EBS), AWS EC2 Instance Store에서 Hadoop을 배포하여 차세대 운영 데이터 스토어를 배포함으로써 이 변환은 느린 개발 수명 주기, 제한된 데이터 처리 기능, IT에 대한 과도한 의존성을 해결할 것입니다.
저작권 © 2024 Trianz