OpenText 首頁。
技術主題

什麼是資料湖畔小屋?

以問號為重點的 IT 項目說明

概述

資料庫可讓企業有效管理不斷成長的資料量、加強資料安全性、降低資料儲存成本,以及開發 GenAI 和商業智慧。瞭解資料湖泊如何運作、採用資料湖泊架構的主要優點,以及如何在資料湖泊、資料倉庫或資料湖中儲存資料的任何地方存取即時分析和機器學習。

雲端遣返轉移:數據告訴我們什麼

了解為什麼 200 多位 IT 領導者正在重新思考他們的資料湖狀屋的雲端策略 - 選擇內部部署、私人雲端或混合部署以恢復效能。

下載指南

資料湖倉

什麼是資料湖畔小屋?

資料庫是一個資料管理平台,它結合了資料倉庫和資料湖的各個方面,並增加了效能、安全性和彈性等優點。資料庫基本上是一個高效能的資料倉庫,能夠支援所有類型的資料 (結構化、非結構化和半結構化),並內建資料處理工具。結果是一個單一、強大的資料管理基礎,為人工智能和進階分析的資料處理提供動力。

資料庫架構的創新推動了資料庫的採用,這也是由於需要更有效率地管理日益增加的各種資料、縮短資料庫與資料庫之間的距離,以及提供可信賴的人工智慧與商業智慧。


資料湖、資料湖倉庫和資料倉庫有何不同?

雖然資料湖屋、資料湖和資料倉庫都是資料庫,但每種資料庫都有明顯的差異和相關的使用個案。讓我們比較一下這三種資料處理方式。

資料倉庫提供了一種集中儲存結構化資料的方式,能夠將來自多個來源的資料整合到單一位置。因此,資料倉庫能打破資訊孤島,讓企業使用者快速存取資料,並能查詢資料以產生報告和洞察力。資料倉庫支援資料挖掘、資料分析和商業智慧用例,讓組織能夠了解業務績效、發現趨勢,並做出更明智的業務決策。

然而,資料倉庫並非沒有挑戰,複雜的 ETL (抽取、轉換及載入) 程序會增加管理需求並提高成本。此外,離雲端資料倉庫可能難以擴充以支援企業資料成長和新的使用個案,進而影響 TCO。

資料湖可儲存大量結構化和 非結構化的資料 ,並可輕鬆擴充,以支援不斷成長的 資料量 。資料湖能夠支援各種不同類型的資料和格式,因此適用於機器學習和資料科學等大型資料使用個案,而且相較於資料倉庫,資料湖提供了更具成本效益的選擇。

但資料湖的複雜性和規模需要適當的管理,以防止資料變得臃腫和難以管理,通常需要資料科學家或資料工程師才能有效利用資料。

過去,資料倉庫和資料湖都是以獨立、孤島式的架構部署,需要在兩個系統之間共用資料。資料庫可與資料湖和資料倉庫搭配使用,為所有類型和格式的資料提供彈性且低成本的儲存選擇,並消除跨不同系統多份資料的需求。

由於支援 ACID 交易,使用者可透過 SQL 指令針對結構化和非結構化資料執行查詢,使用高效能 AI 和分析來處理各種使用個案。因此,組織可以提升分析能力,實現更智慧的營運,將洞察力應用於個人化客戶體驗、改善決策、加速產品開發、優化工作流程,以及加速收入成長。


為什麼組織要轉移到資料庫架構?

傳統資料架構的限制 (例如高成本和有限的擴充性) 正驅使組織擁抱資料湖。最近的一項調查發現,在超過 200 位 IT 領導者中,有 87% 計劃在兩年內將工作負載調回原處。

有幾個因素促成了邁向更現代化資料架構方法的願望,包括

  • 非結構化資料數量不斷增加:組織需要更有效率的方式來儲存、管理及利用電子郵件、社交媒體文章、產品影像、視訊、電話中心記錄、聊天訊息等。
  • 專注於客戶服務:資料庫架構中的進階分析與機器學習可協助辨識客戶行為模式、從服務互動中獲得洞察力,並創造更具針對性、資料導向的體驗。
  • 節省成本:利用資料庫可降低儲存和處理成本,並改善不同工作負載的資料管理。
  • 採用混合資料策略:資料庫架構可讓組織依據所需的部署、安全性和法規遵循要求,彈性地利用雲端和非雲端資料儲存。

資料庫如何運作?

資料庫通常包含五層:

  • 攝取層
  • 儲存層
  • 元資料層
  • API 層
  • 消費層

讓我們來探討各種角色:

擷取層是第一層,從不同來源收集資料,例如交易資料庫、NoSQL 資料庫和 API。從那裡,資料會轉換成可存取的格式,供資料庫儲存和分析。

儲存層是將所有資料 (非結構化、結構化及半結構化) 擷取至湖畔小屋並進行儲存的地方。資料以開放檔案格式儲存,以取得最佳化的分析效能。

第三層為元資料層,可將與已擷取和儲存的資料相關的元資料分類。

第四層使用API來增加進行更先進的分析,讓分析工具和第三方應用程式能夠查詢資料湖屋架構內的資料。此層支援即時資料處理,讓團隊即使在資料更新和刷新時,也能利用即時分析。

消費層允許應用程式和工具存取儲存在湖畔小屋的所有元資料和資料。這可為企業使用者提供所需的資料存取,讓個人能夠執行分析工作,例如建立儀表板、資料視覺化、SQL 查詢和機器學習工作。


資料庫架構有哪些業務優勢?

資料庫為組織和使用者帶來許多好處,例如改善資料管理、節省成本,以及從同一來源增強人工智能和機器學習。以下是資料庫可提供的一些主要優勢:

  • 單一資料來源:統一資料管理,並整合來自多個來源及不同格式的資料,以達到資料一致性。
  • 預期的擴充能力:有了獨立的儲存和運算資源,就能支援和擴充各種不同的工作負載。
  • GenAI 的新機遇:資料庫的功能與結構可讓組織利用資料資源,進行 GenAI 應用程式,並用於內容創作、洞察力以及個人化的迅速回應。
  • 分析效能:改善資料查詢效能,以提高查詢速度和結果的準確性。
  • 可信賴的資料管理:強大的資料管理架構和控制,以強制執行資料品質和安全性。
  • 部署彈性:透過離雲、混合和多雲部署選項,最佳化成本和效能。

OpenText 如何協助您利用資料庫的優勢?

透過即時分析和內建的機器學習功能,OpenText 可讓組織無縫分析資料庫內的資料 - 優化資源使用並降低總擁有成本。

OpenText 可協助企業充分利用現代化的資料庫架構 - 以OpenText™ Analytics Database (Vertica)為基礎,跨資料倉庫和資料湖進行高效能、可擴充的分析。

OpenText 的統一引擎支援高效能 SQL、進階分析和開放式資料格式,讓您擁有倉庫的速度與湖的規模和開放性。無論是在企業內部、雲端或混合環境中,OpenText 都能讓組織統一資料架構,並在資料存在的任何地方執行分析,而不會受到影響。

為了擴展這些功能,OpenText 的可組合分析與 AI 平台可讓組織擷取更深入的洞察力、更有效地管理資料,並在整個企業中提供價值。

為了增進洞察力,Knowledge Discovery 採用先進的 AI 和機器學習來處理和分析非結構化資料,例如文件、電子郵件、視訊和音訊,這些都是傳統 Lakehouses 常常忽略的關鍵內容類型。OpenText™ Intelligent Classification透過自然語言處理,從大量文字中發掘情感、主題和關鍵實體,進一步豐富上述功能。OpenText™ Intelligence 賦予業務使用者互動式儀表板和自助式分析功能,以加速決策。

除了分析之外,OpenText 還能滿足企業在資料信賴、管理和安全性方面的重要需求。OpenText™ Data Discovery可自動掃描、分類和映射各個孤島中的資料,讓組織能夠瞭解敏感和受監管的資訊,並在資料進入分析環境之前降低風險。資料隱私與保護透過格式保留加密、標記化和政策式隱私控制,增加以資料為中心的企業級安全性,確保您的資料在整個生命週期中都受到保護。

這些功能結合起來,將 OpenText 的資料庫產品轉變為一個完整的企業就緒生態系統,以速度、智慧、安全和信賴為基礎。

探索快速、可擴充的分析平台如何支援您的業務,並分析儲存於任何地方的資料。

進一步瞭解 OpenText 的資料庫和分析功能

開始免費試用 OpenText Analytics Database


開始您的免費試用

我們能如何幫助您?

註腳