OpenText-Startseite.
Technische Themen

Was ist ein Data Lakehouse?

Illustration von IT-Elementen mit Schwerpunkt auf einem Fragezeichen

Übersicht

Ein Data Lakehouse ermöglicht es Unternehmen, wachsende Datenmengen effektiv zu verwalten, die Datensicherheit zu erhöhen, die Kosten für die Datenspeicherung zu senken und GenAI und Business Intelligence zu nutzen. Erfahren Sie, wie Data Lakehouses funktionieren, welche Vorteile die Einführung einer Data Lakehouse-Architektur mit sich bringt und wie Sie auf Echtzeit-Analysen und maschinelles Lernen zugreifen können, egal wo die Daten gespeichert sind - in einem Data Lakehouse, Data Warehouse oder Data Lake.

Die Rückverlagerung in die Cloud: Was uns die Daten sagen

Erfahren Sie, warum mehr als 200 IT-Führungskräfte reine Cloud-Strategien für ihre Data Lakehouses überdenken und sich für On-Premise-, Private Cloud- oder Hybrid-Implementierungen entscheiden, um die Leistung zu steigern.

Laden Sie den Leitfaden herunter

Data Lakehouse

Was ist ein Data Lakehouse?

Ein Data Lakehouse ist eine Datenverwaltungsplattform, die Aspekte eines Data Warehouse und eines Data Lake mit zusätzlichen Leistungs-, Sicherheits- und Flexibilitätsvorteilen vereint. Ein Data Lakehouse ist im Wesentlichen ein hochleistungsfähiges Data Warehouse, das alle Arten von Daten (strukturierte, unstrukturierte und halbstrukturierte) mit integrierten Datenverarbeitungstools unterstützen kann. Das Ergebnis ist eine einzige, leistungsstarke Datenverwaltungsgrundlage, die die Datenverarbeitung für KI und erweiterte Analysen ermöglicht.

Innovationen in der Data-Lake-House-Architektur haben die Akzeptanz vorangetrieben, auch aufgrund der Notwendigkeit, wachsende Mengen unterschiedlicher Daten effizienter zu verwalten, die Lücke zwischen einem Data-Lake und einem Data-Warehouse zu schließen und zuverlässige KI und Business Intelligence zu liefern.


Was sind die Unterschiede zwischen Data Lakes, Data Lakehouses und Data Warehouses?

Ein Data Lakehouse, ein Data Lake und ein Data Warehouse sind zwar allesamt Datenrepositorien, weisen aber jeweils deutliche Unterschiede und relevante Anwendungsfälle auf. Vergleichen wir nun die drei Datenansätze.

Ein Data Warehouse bietet eine Möglichkeit, die Speicherung strukturierter Daten zu zentralisieren und Daten aus verschiedenen Quellen an einem einzigen Ort zu konsolidieren. Folglich brechen Data Warehouses Informationssilos auf und ermöglichen Geschäftsanwendern einen schnellen Datenzugriff und die Abfrage von Daten zur Erstellung von Berichten und Einblicken. Data Warehouses unterstützen Data Mining, Datenanalyse und Business Intelligence und ermöglichen es Unternehmen, die Unternehmensleistung zu verstehen, Trends aufzudecken und fundiertere Geschäftsentscheidungen zu treffen.

Data Warehouses sind jedoch nicht unproblematisch: Komplexe ETL-Prozesse (Extrahieren, Transformieren und Laden) erhöhen die Verwaltungsanforderungen und treiben die Kosten in die Höhe. Darüber hinaus können Off-Cloud-Data-Warehouses nur schwer skaliert werden, um das Wachstum der Unternehmensdaten und neue Anwendungsfälle zu unterstützen, was sich wiederum auf die TCO auswirkt.

In einem Data Lake werden große Mengen strukturierter und unstrukturierter Daten gespeichert, die problemlos skaliert werden können, um wachsende Mengen zu unterstützen. Die Fähigkeit, verschiedene Arten von unterschiedlichen Daten und Formaten zu unterstützen, macht Data Lakes für Big-Data-Anwendungsfälle wie maschinelles Lernen und Data Science anwendbar - und bietet eine kostengünstigere Option im Vergleich zu einem Data Warehouse.

Die Komplexität und Größe von Data Lakes erfordert jedoch ein angemessenes Management, um zu verhindern, dass die Daten unübersichtlich und schwer zu verwalten werden. Außerdem sind in der Regel Data Scientists oder Data Engineers erforderlich, um die Daten effektiv zu nutzen.

In der Vergangenheit wurden Data Warehouses und Data Lakes als individuelle, isolierte Architekturen implementiert, bei denen die Daten über zwei Systeme hinweg gemeinsam genutzt werden mussten. Ein Data Lakehouse kann zusammen mit einem Data Lake und einem Data Warehouse eingesetzt werden und bietet eine flexible und kostengünstige Speicheroption für alle Arten von Daten und Formaten und macht mehrere Datenkopien in verschiedenen Systemen überflüssig.

Durch die Unterstützung von ACID-Transaktionen können Benutzer Abfragen über SQL-Befehle für strukturierte und unstrukturierte Daten ausführen und dabei leistungsstarke KI und Analysen für eine Vielzahl von Anwendungsfällen nutzen. Das Ergebnis: Unternehmen können ihre Analyseleistung steigern, um intelligentere Abläufe zu ermöglichen und Erkenntnisse zur Personalisierung von Kundenerlebnissen, zur Verbesserung der Entscheidungsfindung, zur Beschleunigung der Produktentwicklung, zur Optimierung von Arbeitsabläufen und zur Beschleunigung des Umsatzwachstums zu nutzen.


Warum stellen Unternehmen auf eine Data Lakehouse-Architektur um?

Die Einschränkungen herkömmlicher Datenarchitekturen, wie hohe Kosten und begrenzte Skalierbarkeit, treiben Unternehmen dazu, Data Lakehouses zu nutzen. Eine kürzlich durchgeführte Umfrage ergab, dass 87% von über 200 IT-Leitern planen, innerhalb von zwei Jahren Arbeitslasten zu verlagern.

Es gibt mehrere Faktoren, die zu dem Wunsch beitragen, zu einem moderneren Datenarchitekturkonzept überzugehen, unter anderem:

  • Zunehmende Mengen unstrukturierter Daten: Unternehmen benötigen eine effizientere Methode zur Speicherung, Verwaltung und Nutzung von E-Mails, Social-Media-Beiträgen, Produktbildern, Videos, Call-Center-Protokollen, Chat-Nachrichten usw.
  • Laser-Fokus auf Kundenservice: Erweiterte Analysen und maschinelles Lernen innerhalb einer Data Lakehouse-Architektur können helfen, Kundenverhaltensmuster zu erkennen, Einblicke in Service-Interaktionen zu gewinnen und gezieltere, datengesteuerte Erlebnisse zu schaffen.
  • Kosteneinsparungen: Durch den Einsatz eines Data Lakehouse können die Speicher- und Verarbeitungskosten gesenkt und die Datenverwaltung über verschiedene Arbeitslasten hinweg verbessert werden.
  • Umfassen einer hybriden Datenstrategie: Eine Data Lakehouse-Architektur bietet Unternehmen die Flexibilität, je nach den gewünschten Bereitstellungs-, Sicherheits- und Compliance-Anforderungen sowohl Cloud- als auch Off-Cloud-Datenspeicher zu nutzen.

Wie funktioniert ein Data Lakehouse?

Ein Data Lakehouse besteht in der Regel aus fünf Schichten:

  • Verschluckbare Schicht
  • Speicherschicht
  • Ebene der Metadaten
  • API-Schicht
  • Verbrauchsschicht

Untersuchen wir die Rolle der beiden:

Die Ingestion-Schicht, die erste Schicht, sammelt Daten aus verschiedenen Quellen, wie Transaktionsdatenbanken, NoSQL-Datenbanken und APIs. Von dort aus werden die Daten in ein zugängliches Format umgewandelt, damit das Data Lakehouse sie speichern und analysieren kann.

Die Speicherebene ist der Ort, an dem alle Daten (unstrukturierte, strukturierte und halbstrukturierte) in das Lakehouse eingespeist und gespeichert werden. Die Daten werden in offenen Dateiformaten gespeichert, um die Analyseleistung zu optimieren.

Die dritte Ebene ist die Metadatenebene, die die mit den aufgenommenen und gespeicherten Daten verbundenen Metadaten klassifiziert.

Die vierte Schicht verwendet APIs, um fortgeschrittene Analysen durchzuführen, die es Analysetools und Anwendungen von Drittanbietern ermöglichen, die Daten innerhalb der Data Lakehouse-Architektur abzufragen. Diese Schicht unterstützt die Datenverarbeitung in Echtzeit, so dass die Teams auf Echtzeitanalysen zurückgreifen können, selbst wenn die Daten aktualisiert und aufgefrischt werden.

Die Verbrauchsschicht ermöglicht Anwendungen und Tools den Zugriff auf alle im Lakehouse gespeicherten Metadaten und Daten. Dadurch erhalten Geschäftsanwender den gewünschten Datenzugriff und können Analyseaufgaben wie die Erstellung von Dashboards, Datenvisualisierung, SQL-Abfragen und maschinelle Lernaufgaben durchführen.


Was sind die geschäftlichen Vorteile einer Data-Lakehouse-Architektur?

Data Lakehouses bieten Unternehmen und Anwendern viele Vorteile, wie z. B. eine verbesserte Datenverwaltung, Kosteneinsparungen und verbesserte KI und maschinelles Lernen aus derselben Quelle. Hier sind einige der wichtigsten Vorteile, die ein Data Lakehouse bieten kann:

  • Eine einzige Quelle der Wahrheit: Vereinheitlichen Sie die Datenverwaltung und integrieren Sie Daten aus verschiedenen Quellen und in unterschiedlichen Formaten, um die Datenkonsistenz zu gewährleisten.
  • Gewünschte Skalierbarkeit: Mit getrennten Speicher- und Rechenressourcen kann eine Vielzahl von Arbeitslasten unterstützt und skaliert werden.
  • Neue Möglichkeiten für GenAI: Fähigkeiten und Struktur eines Data Lakehouse ermöglichen es Unternehmen, Datenressourcen für GenAI-Anwendungen zu nutzen und für die Erstellung von Inhalten, Einblicke und personalisierte, prompte Antworten zu verwenden.
  • Analyseleistung: Verbessern Sie die Leistung von Datenabfragen, um die Geschwindigkeit und Genauigkeit der Ergebnisse zu erhöhen.
  • Zuverlässige Datenverwaltung: Stabiler Data-Governance-Rahmen und Kontrollen zur Durchsetzung von Datenqualität und -sicherheit.
  • Flexibilität bei der Bereitstellung: Optimieren Sie Kosten und Leistung mit Optionen für Off-Cloud-, Hybrid- und Multi-Cloud-Bereitstellungen.

Wie kann OpenText Ihnen helfen, die Vorteile von Data Lakehouse zu nutzen?

Mit Echtzeit-Analysen und integriertem maschinellem Lernen ermöglicht OpenText Unternehmen die nahtlose Analyse von Daten innerhalb eines Data Lakehouse - das optimiert die Ressourcennutzung und reduziert die Gesamtbetriebskosten.

OpenText unterstützt Unternehmen dabei, die Vorteile einer modernen Data-Lake-House-Architektur voll auszuschöpfen - basierend auf der OpenText™ Analytics Database (Vertica) für hochleistungsfähige, skalierbare Analysen in Data Warehouses und Data Lakes.

Die Unified Engine von OpenText unterstützt High-Performance-SQL, fortschrittliche Analysen und offene Datenformate und bietet Ihnen die Geschwindigkeit eines Warehouse mit der Skalierbarkeit und Offenheit eines Lake. Ob vor Ort, in der Cloud oder in hybriden Umgebungen, OpenText ermöglicht es Unternehmen, ihre Datenlandschaft zu vereinheitlichen und Analysen dort durchzuführen, wo die Daten liegen - ohne Kompromisse.

Die Composable Analytics and AI Plattform von OpenText ermöglicht es Unternehmen, tiefere Einblicke zu gewinnen, Daten effektiver zu verwalten und einen Mehrwert für das gesamte Unternehmen zu schaffen, um diese Fähigkeiten zu erweitern.

Um den Einblick zu verbessern, nutzt Knowledge Discovery fortschrittliche KI und maschinelles Lernen, um unstrukturierte Daten wie Dokumente, E-Mails, Videos und Audiodaten zu verarbeiten und zu analysieren - kritische Inhaltstypen, die von herkömmlichen Lakehouses oft übersehen werden. OpenText™ Intelligent Classification bereichert dies durch die Verarbeitung natürlicher Sprache und deckt Stimmungen, Themen und wichtige Entitäten aus großen Textmengen auf. OpenText™ Intelligence gibt Geschäftsanwendern interaktive Dashboards und Self-Service-Analysen an die Hand, um die Entscheidungsfindung zu beschleunigen.

Über die Analytik hinaus adressiert OpenText kritische Unternehmensbedürfnisse in Bezug auf Datenvertrauen, Governance und Sicherheit. OpenText™ Data Discovery scannt, klassifiziert und ordnet Daten automatisch siloübergreifend zu. So erhalten Unternehmen Einblick in sensible und regulierte Informationen und reduzieren Risiken, noch bevor die Daten in die Analyseumgebung gelangen. Data Privacy and Protection sorgt für unternehmensgerechte, datenzentrierte Sicherheit durch formatschonende Verschlüsselung, Tokenisierung und richtlinienbasierte Datenschutzkontrollen - damit Ihre Daten während ihres gesamten Lebenszyklus geschützt bleiben.

Zusammen machen diese Funktionen das Data Lakehouse-Angebot von OpenText zu einem ganzheitlichen, unternehmenstauglichen Ökosystem, das auf Geschwindigkeit, Intelligenz, Sicherheit und Vertrauen ausgelegt ist.

Erfahren Sie, wie eine schnelle, skalierbare Analyseplattform Ihr Unternehmen unterstützen und Daten analysieren kann, egal wo sie gespeichert sind.

Erfahren Sie mehr über OpenText's Data Lakehouse und Analytik

Starten Sie Ihren kostenlosen Test von OpenText Analytics Database


Holen Sie sich Ihre kostenlose Testversion

Wie können wir behilflich sein?

Fußnoten