OpenText 홈페이지.
기술 주제

데이터 레이크하우스란 무엇인가요?

물음표에 초점을 맞춘 IT 항목의 일러스트레이션

개요

데이터 레이크하우스를 통해 기업은 증가하는 데이터 양을 효과적으로 관리하고, 데이터 보안을 강화하고, 데이터 스토리지 비용을 절감하고, GenAI 및 비즈니스 인텔리전스를 활용할 수 있습니다. 데이터 레이크하우스의 작동 방식, 데이터 레이크하우스 아키텍처 채택의 주요 이점, 데이터 레이크하우스, 데이터 웨어하우스, 데이터 레이크 등 데이터가 저장되는 모든 곳에서 실시간 분석 및 머신 러닝에 액세스할 수 있는 방법에 대해 알아보세요.

클라우드 리포지셔닝 전환: 데이터가 알려주는 것

200개 이상의 IT 리더가 데이터 레이크하우스에 대한 클라우드 전용 전략을 재고하고 온프레미스, 프라이빗 클라우드 또는 하이브리드 배포를 선택하여 성능을 회복하는 이유를 알아보세요.

가이드 다운로드

데이터 레이크하우스

데이터 레이크하우스란 무엇인가요?

데이터 레이크하우스는 데이터 웨어하우스와 데이터 레이크의 측면을 결합하여 성능, 보안, 유연성 등의 이점을 제공하는 데이터 관리 플랫폼입니다. 데이터 레이크하우스는 기본적으로 내장된 데이터 처리 도구로 모든 유형의 데이터(정형, 비정형, 반정형)를 지원할 수 있는 고성능 데이터 웨어하우스입니다. 그 결과, AI 및 고급 분석을 위한 데이터 처리를 지원하는 강력한 단일 데이터 관리 기반이 탄생했습니다.

데이터 레이크하우스 아키텍처의 혁신은 증가하는 다양한 데이터를 보다 효율적으로 관리하고, 데이터 레이크와 데이터 웨어하우스 간의 격차를 해소하며,신뢰할 수 있는 AI 및 비즈니스 인텔리전스를 제공해야 한다는 필요성에 힘입어 도입을 촉진했습니다.


데이터 레이크, 데이터 레이크하우스, 데이터 웨어하우스는 어떻게 다른가요?

데이터 레이크하우스, 데이터 레이크, 데이터 웨어하우스는 모두 데이터 저장소이지만, 각각은 뚜렷한 차이점과 관련 사용 사례를 가지고 있습니다. 세 가지 데이터 접근 방식을 비교해 보겠습니다.

데이터 웨어하우스는 여러 소스의 데이터를 단일 위치로 통합할 수 있는 구조화된 데이터의 저장소를 중앙 집중화할 수 있는 방법을 제공합니다. 결과적으로 데이터 웨어하우스는 정보 사일로를 허물어 비즈니스 사용자에게 빠른 데이터 액세스와 데이터를 쿼리하여 보고서와 인사이트를 생성할 수 있는 기능을 제공합니다. 데이터 웨어하우스는 데이터 마이닝, 데이터 분석 및 비즈니스 인텔리전스 사용 사례를 지원하여 조직이 비즈니스 성과를 이해하고, 트렌드를 파악하며, 보다 정보에 입각한 비즈니스 의사 결정을 내릴 수 있도록 도와줍니다.

그러나 데이터 웨어하우스에는 복잡한 ETL(추출, 변환, 로드) 프로세스로 인해 관리 요구 사항이 증가하고 비용이 증가하는 등 어려움이 없는 것은 아닙니다. 또한 오프클라우드 데이터 웨어하우스는 엔터프라이즈 데이터 증가와 새로운 사용 사례를 지원하기 위해 확장하는 데 어려움을 겪을 수 있어 TCO에 더 큰 영향을 미칠 수 있습니다.

데이터 레이크는 대량의 정형 및 비정형 데이터를 저장하며, 증가하는 볼륨을 지원하기 위해 쉽게 확장할 수 있습니다. 데이터 레이크는 다양한 유형의 다양한 데이터와 형식을 지원할 수 있어 머신 러닝 및 데이터 과학과 같은 빅데이터 사용 사례에 적용할 수 있으며 데이터 웨어하우스에 비해 비용 효율적인 옵션을 제공합니다.

그러나 데이터 레이크의 복잡성과 크기로 인해 데이터가 다루기 힘들고 관리하기 어려워지지 않도록 적절한 관리가 필요하며, 일반적으로 데이터를 효과적으로 활용하려면 데이터 과학자나 데이터 엔지니어가 필요합니다.

과거에는 데이터 웨어하우스와 데이터 레이크가 개별적이고 사일로화된 아키텍처로 구축되어 두 시스템 간에 데이터를 공유해야 했습니다. 데이터 레이크하우스는 데이터 레이크 및 데이터 웨어하우스와 함께 사용할 수 있어 모든 유형의 데이터와 형식을 위한 유연하고 저렴한 스토리지 옵션을 제공하고 여러 시스템에서 여러 개의 데이터 복사본을 사용할 필요가 없습니다.

ACID 트랜잭션을 지원하므로 사용자는 다양한 사용 사례를 위해 고성능 AI 및 분석을 사용하여 정형 및 비정형 데이터에 대한 SQL 명령을 통해 쿼리를 실행할 수 있습니다. 그 결과, 조직은 분석 역량을 강화하여 더욱 지능적인 운영을 가능하게 하고, 인사이트를 적용하여 고객 경험을 개인화하고, 의사 결정을 개선하고, 제품 개발 속도를 높이고, 워크플로를 최적화하고, 매출 성장을 가속화할 수 있습니다.


조직이 데이터 레이크하우스 아키텍처로 전환하는 이유는 무엇인가요?

높은 비용과 제한된 확장성 등 기존 데이터 아키텍처의 한계로 인해 많은 조직이 데이터 레이크하우스를 도입하고 있습니다. 최근 설문조사에 따르면 200명이 넘는 IT 리더 중 87%(% )가 2년 이내에 워크로드를 국내로 이전할 계획이라고 답했습니다.

보다 현대적인 데이터 아키텍처 접근 방식으로 전환하고자 하는 데에는 다음과 같은 몇 가지 요인이 있습니다:

  • 비정형 데이터의 양적 증가: 조직은 이메일, 소셜 미디어 게시물, 제품 이미지, 동영상, 콜센터 녹취록, 채팅 메시지 등을 보다 효율적으로 저장, 관리, 활용할 수 있는 방법이 필요합니다.
  • 고객 서비스에 집중하세요: 데이터 레이크하우스 아키텍처 내의 고급 분석과 머신러닝은 고객 행동 패턴을 파악하고, 서비스 상호 작용에서 인사이트를 얻고, 보다 타깃화된 데이터 기반 경험을 창출하는 데 도움이 될 수 있습니다.
  • 비용 절감: 데이터 레이크하우스를 활용하면 스토리지 및 처리 비용을 절감하고 다양한 워크로드에서 데이터 관리를 개선할 수 있습니다.
  • 하이브리드 데이터 전략 수용: 데이터 레이크하우스 아키텍처를 통해 조직은 원하는 배포, 보안 및 규정 준수 요구 사항에 따라 클라우드 및 오프클라우드 데이터 스토리지를 모두 활용할 수 있는 유연성을 확보할 수 있습니다.

데이터 레이크하우스는 어떻게 작동하나요?

데이터 레이크하우스는 일반적으로 5개의 계층으로 구성됩니다:

  • 수집 레이어
  • 스토리지 계층
  • 메타데이터 레이어
  • API 계층
  • 소비 계층

각각의 역할을 살펴보겠습니다:

첫 번째 계층인 수집 계층은 트랜잭션 데이터베이스, NoSQL 데이터베이스, API 등 다양한 소스에서 데이터를 수집합니다. 거기서부터 데이터 레이크하우스가 저장하고 분석할 수 있는 접근 가능한 형식으로 데이터를 변환합니다.

스토리지 계층은 모든 데이터(비정형, 정형, 반정형)가 레이크하우스에 수집되어 저장되는 곳입니다. 데이터는 최적화된 분석 성능을 위해 개방형 파일 형식으로 저장됩니다.

세 번째 계층은 수집 및 저장된 데이터와 관련된 메타데이터를 분류하는 메타데이터 계층입니다.

네 번째 계층은 API를 사용하여 고급 분석을 수행함으로써 분석 도구와 타사 애플리케이션이 데이터 레이크하우스 아키텍처 내에서 데이터를 쿼리할 수 있도록 합니다. 이 계층은 실시간 데이터 처리를 지원하므로 데이터가 업데이트되고 새로 고쳐지는 동안에도 팀에서 실시간 분석을 활용할 수 있습니다.

소비 계층을 통해 애플리케이션과 도구는 레이크하우스에 저장된 모든 메타데이터와 데이터에 액세스할 수 있습니다. 이를 통해 비즈니스 사용자에게 원하는 데이터 액세스 권한을 제공하여 개인이 대시보드 만들기, 데이터 시각화, SQL 쿼리 및 머신 러닝 작업과 같은 분석 작업을 수행할 수 있습니다.


데이터 레이크하우스 아키텍처의 비즈니스 이점은 무엇인가요?

데이터 레이크하우스는 조직과 사용자에게 데이터 관리 개선, 비용 절감, 동일한 소스에서 향상된 AI 및 머신 러닝 등 많은 이점을 제공합니다. 데이터 레이크하우스가 제공하는 몇 가지 주요 이점은 다음과 같습니다:

  • 단일 데이터 소스: 데이터 관리를 통합하고 여러 소스 및 여러 형식의 데이터를 통합하여 데이터 일관성을 유지하세요.
  • 원하는 확장성: 별도의 스토리지 및 컴퓨팅 리소스를 통해 다양한 워크로드를 지원하고 확장할 수 있습니다.
  • GenAI를 위한 새로운 기회: 데이터 레이크하우스의 기능과 구조를 통해 조직은 데이터 리소스를 GenAI 애플리케이션에 활용하고 콘텐츠 제작, 인사이트, 개인화되고 신속한 대응에 사용할 수 있습니다.
  • 분석 성능: 데이터 쿼리 성능을 개선하여 결과의 속도와 정확성을 높입니다.
  • 신뢰할 수 있는 데이터 거버넌스: 데이터 품질과 보안을 강화하기 위한 강력한 데이터 거버넌스 프레임워크와 제어 기능.
  • 배포 유연성: 오프클라우드, 하이브리드 및 멀티클라우드 배포 옵션으로 비용과 성능을 최적화하세요.

데이터 레이크하우스의 이점을 활용하는 데 OpenText가 어떤 도움을 줄 수 있나요?

실시간 분석과 내장된 머신 러닝을 통해 OpenText는 조직이 데이터 레이크하우스 내에서 데이터를 원활하게 분석하여 리소스 사용을 최적화하고 총소유비용을 절감할 수 있도록 지원합니다.

OpenText는 기업이 데이터 웨어하우스와 데이터 레이크 모두에서 고성능의 확장 가능한 분석을 위해 OpenText™ Analytics Database (Vertica) 에 기반한 최신 데이터 레이크하우스 아키텍처를 최대한 활용할 수 있도록 지원합니다.

OpenText의 통합 엔진은 고성능 SQL, 고급 분석, 개방형 데이터 형식을 지원하여 웨어하우스의 속도와 호수의 규모와 개방성을 제공합니다. 온프레미스, 클라우드, 하이브리드 환경 등 어떤 환경에서든 OpenText는 조직이 데이터 환경을 통합하고 데이터가 어디에 있든 성능 저하 없이 분석을 실행할 수 있도록 지원합니다.

이러한 기능을 확장하기 위해 OpenText의 컴포저블 분석 및 AI 플랫폼을 통해 조직은 더 심층적인 인사이트를 추출하고 데이터를 보다 효과적으로 관리하며 기업 전반에 걸쳐 가치를 제공할 수 있습니다.

지식 검색은 인사이트를 향상시키기 위해 고급 AI와 머신 러닝을 도입하여 문서, 이메일, 비디오, 오디오 등 기존 레이크하우스에서 간과하기 쉬운 비정형 데이터 유형을 처리하고 분석합니다. OpenText™ Intelligent Classification 자연어 처리를 통해 이를 더욱 강화하여 방대한 양의 텍스트에서 감정, 주제, 핵심 개체를 찾아냅니다. OpenText™ Intelligence 는 대화형 대시보드와 셀프 서비스 분석을 통해 비즈니스 사용자의 역량을 강화하여 의사 결정을 가속화합니다.

OpenText는 분석 외에도 데이터 신뢰, 거버넌스 및 보안과 관련된 기업의 중요한 요구 사항을 해결합니다. OpenText™ Data Discovery 는 사일로 전반에서 데이터를 자동으로 스캔, 분류 및 매핑하여 조직에 민감한 정보와 규제 대상 정보에 대한 가시성을 제공하고 데이터가 분석 환경에 들어가기도 전에 위험을 줄입니다. 데이터 프라이버시 및 보호는 형식 보존 암호화, 토큰화, 정책 기반 개인정보 보호 제어를 통해 엔터프라이즈급 데이터 중심 보안을 추가하여 데이터의 수명 주기 내내 데이터를 보호합니다.

이러한 기능을 함께 사용하면 OpenText의 데이터 레이크하우스 제품이 속도, 인텔리전스, 보안, 신뢰를 위해 구축된 총체적인 엔터프라이즈 지원 에코시스템으로 전환됩니다.

빠르고 확장 가능한 분석 플랫폼이 어떻게 비즈니스를 지원하고 데이터가 어디에 저장되어 있든 분석할 수 있는지 알아보세요.

OpenText의 데이터 레이크하우스 및 분석에 대해 자세히 알아보기

OpenText Analytics Database 무료 평가판 시작하기


무료 체험판 시작하기

어떻게 도와드릴까요?

각주