OpenText startsida.
Tekniska ämnen

Vad är ett data lakehouse?

Illustration av IT-objekt med fokus på ett frågetecken

Översikt

En datalagringsanläggning gör det möjligt för företag att effektivt hantera växande datavolymer, öka datasäkerheten, sänka kostnaderna för datalagring och utnyttja GenAI och affärsinformation. Upptäck hur data lakehouses fungerar, de viktigaste fördelarna med att använda en data lakehouse-arkitektur och hur du kan få tillgång till realtidsanalys och maskininlärning oavsett var data lagras - i ett data lakehouse, datalager eller en datasjö.

Skiftet till hemtagning av moln: Vad uppgifterna säger oss

Upptäck varför 200+ IT-chefer omprövar strategier som bara omfattar moln för sina datalagringsenheter - och väljer lokala, privata moln eller hybriddistributioner för att återfå prestanda.

Ladda ner guiden

Data lakehouse

Vad är ett data lakehouse?

En data lakehouse är en plattform för datahantering som förenar aspekter av ett datalager och en data lake med extra fördelar vad gäller prestanda, säkerhet och flexibilitet. En data lakehouse är i grunden ett högpresterande datalager som kan hantera alla typer av data (strukturerad, ostrukturerad och halvstrukturerad) med inbyggda databehandlingsverktyg. Resultatet är en enda, kraftfull datahanteringsgrund som driver databehandling för AI och avancerad analys.

Innovationer inom data lakehouse-arkitektur har drivit på utvecklingen, som också har drivits på av behovet av att mer effektivt hantera växande volymer av olika data, överbrygga klyftan mellan en data lake och ett data warehouse samt leverera tillförlitlig AI och business intelligence.


Hur skiljer sig datasjöar, datasjöhus och datalager åt?

Data Lakehouse, Data Lake och Data Warehouse är alla datalager, men de har olika skillnader och relevanta användningsområden. Låt oss jämföra de tre datainsamlingsmetoderna.

Ett datalager är ett sätt att centralisera lagringen av strukturerad data och kan konsolidera data från flera källor till en enda plats. Som ett resultat bryter datalager ner informationssilos, ger affärsanvändare snabb tillgång till data och möjlighet att fråga data för att generera rapporter och insikter. Datalager stöder datautvinning, dataanalys och affärsinformation, vilket gör det möjligt för organisationer att förstå affärsresultat, upptäcka trender och fatta mer välgrundade affärsbeslut.

Datalager är dock inte utan utmaningar, med komplexa ETL-processer (extrahera, transformera och ladda) som ökar hanteringskraven och driver upp kostnaderna. Dessutom kan datalager utanför molnet ha svårt att skala för att stödja företagets datatillväxt och nya användningsområden, vilket ytterligare påverkar TCO.

En datasjö lagrar stora volymer strukturerad och ostrukturerad data och kan enkelt skalas för att stödja växande volymer. Möjligheten att stödja olika typer av data och format gör att datasjöar kan användas för stora datamängder, t.ex. maskininlärning och datavetenskap - och är ett mer kostnadseffektivt alternativ jämfört med ett datalager.

Men komplexiteten och storleken på datasjöar kräver korrekt hantering för att förhindra att data blir otympliga och svåra att hantera och kräver vanligtvis dataforskare eller dataingenjörer för att effektivt utnyttja data.

Historiskt sett har datalager och datasjöar implementerats som enskilda, siloartade arkitekturer, vilket har krävt att data har delats mellan två system. En data lakehouse kan användas tillsammans med en data lake och ett data warehouse, vilket ger ett flexibelt och billigt lagringsalternativ för alla typer av data och format och eliminerar behovet av flera kopior av data i olika system.

Med stöd för ACID-transaktioner kan användare köra frågor via SQL-kommandon för strukturerad och ostrukturerad data, med högpresterande AI och analys för en mängd olika användningsområden. Som ett resultat kan organisationer öka analyskraften för att möjliggöra mer intelligenta verksamheter, tillämpa insikter för att personifiera kundupplevelser, förbättra beslutsfattandet, påskynda produktutvecklingen, optimera arbetsflöden och påskynda intäktstillväxten.


Varför går organisationer över till en data lakehouse-arkitektur?

Begränsningarna i traditionella dataarkitekturer, t.ex. höga kostnader och begränsad skalbarhet, driver organisationer att anamma data lakehouses. En nyligen genomförd undersökning visade att 87% av över 200 IT-chefer planerar att flytta arbetsuppgifter inom två år.

Det finns flera faktorer som bidrar till önskan att gå över till en mer modern strategi för dataarkitektur, bland annat

  • Ökande volymer av ostrukturerad data: Organisationer behöver ett mer effektivt sätt att lagra, hantera och använda e-postmeddelanden, inlägg på sociala medier, produktbilder, videor, utskrifter från callcenter, chattmeddelanden etc.
  • Laserfokus på kundservice: Avancerad analys och maskininlärning i en data lakehouse-arkitektur kan hjälpa till att identifiera kundbeteendemönster, få insikt i serviceinteraktioner och skapa mer riktade, datadrivna upplevelser.
  • Kostnadsbesparingar: Genom att utnyttja en datalagringsplats kan man minska lagrings- och bearbetningskostnaderna samt förbättra datahanteringen i olika arbetsbelastningar.
  • Anamma en hybrid datastrategi: En data lakehouse-arkitektur ger organisationerna flexibiliteten att utnyttja datalagring både i molnet och utanför molnet baserat på önskad driftsättning, säkerhet och efterlevnadskrav.

Hur fungerar ett data lakehouse?

Data Lakehouse består vanligtvis av fem lager:

  • Skikt för förtäring
  • Lagringslager
  • Skikt med metadata
  • API-lager
  • Förbrukningsskikt

Låt oss undersöka vilken roll de olika har:

Inmatningslagret, det första lagret, samlar in data från olika källor, till exempel transaktionsdatabaser, NoSQL-databaser och API:er. Därefter omvandlas data till ett tillgängligt format som kan lagras och analyseras i datalagret.

Det är i lagringslagret som alla data (ostrukturerade, strukturerade och halvstrukturerade) samlas in och lagras. Data lagras i öppna filformat för optimerad analysprestanda.

Det tredje skiktet är metadataskiktet som klassificerar de metadata som är kopplade till de data som har tagits in och lagrats.

I det fjärde lagret används API:er för att genomföra mer avancerade analyser, vilket gör det möjligt för analysverktyg och tredjepartsapplikationer att söka efter data inom datalagrets arkitektur. Detta lager stöder databehandling i realtid, vilket gör att teamen kan utnyttja analyser i realtid även när data uppdateras och uppdateras.

Konsumtionslagret gör det möjligt för applikationer och verktyg att få tillgång till alla metadata och data som lagras i Lakehouse. Detta ger affärsanvändare tillgång till önskad data, så att de kan utföra analysuppgifter som att skapa instrumentpaneler, datavisualisering, SQL-frågor och maskininlärningsuppgifter.


Vilka är affärsfördelarna med en data lakehouse-arkitektur?

Data lakehouses ger många fördelar för organisationer och användare, till exempel förbättrad datahantering, kostnadsbesparingar och förbättrad AI och maskininlärning från samma källa. Här är några av de främsta fördelarna som ett datahus kan ge:

  • En enda sanningskälla: Förenkla datahanteringen och integrera data från flera källor och olika format för att få konsekventa data.
  • Önskad skalbarhet: Med separata lagrings- och beräkningsresurser kan en mängd olika arbetsbelastningar stödjas och skalas.
  • Nya möjligheter för GenAI: Kapaciteten och strukturen hos ett data lakehouse gör det möjligt för organisationer att utnyttja dataresurser för GenAI-applikationer och använda dem för att skapa innehåll, insikter och personliga, snabba svar.
  • Prestanda för analys: Förbättra prestanda för datafrågor för att öka hastigheten och noggrannheten i resultaten.
  • Pålitlig datastyrning: Robust ramverk för datastyrning och kontroller för att upprätthålla datakvalitet och säkerhet.
  • Flexibilitet vid driftsättning: Optimera kostnader och prestanda med alternativ för off-cloud-, hybrid- och multi-cloud-driftsättningar.

Hur kan OpenText hjälpa dig att dra nytta av fördelarna med data lakehouse?

Med realtidsanalys och inbyggd maskininlärning tillåter OpenText organisationer att sömlöst analysera data inom ett datasjöhus - optimera resursanvändningen och minska den totala ägandekostnaden.

OpenText hjälper företag att dra full nytta av en modern datasjöhusarkitektur - förankrad av OpenText™ Analytics Database (Vertica) för högpresterande, skalbar analys över både datalager och datasjöar.

OpenTexts enhetliga motor stöder högpresterande SQL, avancerad analys och öppna dataformat, vilket ger dig hastigheten på ett lager med skalan och öppenheten i en sjö. Oavsett om det är lokalt, i molnet eller i hybridmiljöer, OpenText ger organisationer möjlighet att förena sitt datalandskap och köra analyser varhelst data lever - utan kompromisser.

För att utöka dessa funktioner, OpenText komponerbara Analytics- och AI-plattform gör det möjligt för organisationer att få djupare insikter, styra data mer effektivt och leverera värde över hela företaget.

För att förbättra insikterna använder Knowledge Discovery avancerad AI och maskininlärning för att bearbeta och analysera ostrukturerad data som dokument, e-post, video och ljud - kritiska innehållstyper som traditionella företag ofta förbiser. OpenText™ Intelligent Classification berikar detta ytterligare med bearbetning av naturligt språk, avslöjar känslor, ämnen och nyckelenheter från massiva textvolymer. OpenText™ Intelligence ger affärsanvändare möjlighet till interaktiva instrumentpaneler och självbetjäningsanalys för att påskynda beslutsfattandet.

Utöver analys, OpenText adresserar kritiska företagsbehov kring dataförtroende, styrning och säkerhet. OpenText™ Data Discovery skannar, klassificerar och kartlägger automatiskt data över silor - vilket ger organisationer synlighet för känslig och reglerad information och minskar risken innan data ens kommer in i analysmiljön. Data Privacy and Protection lägger till datacentrerad säkerhet i företagsklass genom formatbevarande kryptering, tokenisering och policybaserade sekretesskontroller - vilket säkerställer att dina data förblir skyddade under hela livscykeln.

Tillsammans förvandlar dessa funktioner OpenText's data lakehouse-erbjudande till ett holistiskt, företagsklart ekosystem byggt för hastighet, intelligens, säkerhet och förtroende.

Utforska hur en snabb, skalbar analysplattform kan stödja ditt företag och analysera data var de än lagras.

Läs mer om OpenText's data lakehouse och analys

Starta din kostnadsfria testversion av OpenText Analytics Database


Starta din kostnadsfria provperiod

Hur kan vi hjälpa till?

Fotnoter