OpenText startsida.
Tekniska ämnen

Vad är filanalys?

Illustration av IT-objekt med fokus på ett frågetecken

Översikt

Filanalys hjälper organisationer att hantera sina ökande datavolymer genom att kartlägga var deras data finns och identifiera vem som har tillgång till vilken data (inklusive fildelning, e-postdatabaser, synkronisering och delning av företagsfiler, registerhantering, innehållshantering för företag, Microsoft SharePoint och dataarkiv).

Filanalyslösningar analyserar, indexerar, söker, spårar och rapporterar om filers metadata och innehåll. Detta gör det möjligt för organisationer att visa och organisera detaljerade metadata och kontextuell information, förbättra PII-övervakning och informationsstyrning samt hantera ostrukturerade data mer effektivt.

Filanalyslösningar skyddar och säkrar även ostrukturerad data. Organisationer kan fatta bättre beslut om innehållsanalys, samtidigt som de minskar riskerna och kostnaderna i samband med data. Dessa lösningar bidrar till att säkerställa datasäkerhet, livscykelhantering, styrning av dataåtkomst, kartläggning och klassificering samtidigt som de möjliggör viktiga datainsikter och analyser som driver och skyddar verksamheten. Dessa nyckelfunktioner hjälper organisationer att hantera den digitala omvandlingens användningsområden för riskreducering, styrning och efterlevnad, effektivitet och optimering samt datainsikt.

Filanalys

Varför filanalys?

Organisationer utsätts för ett allt större tryck att omvandla sin verksamhet. Oavsett om resan börjar med att påskynda arbetet med att flytta till molnet, stödja distansarbetare eller förbereda sig för datasekretess, kan filanalyslösningar hjälpa till att optimera data och applikationer och på ett intelligent sätt identifiera, säkra och klassificera data. Filanalyslösningar kan också ge insikt i data för att säkerställa efterlevnad och möjliggöra smartare datamigreringar.

Filanalyslösningar kan skalas upp för att möta behoven hos dagens moderna arbetsbelastningar och identifiera områden där data kan optimeras och raderas på ett försvarbart sätt - vilket sänker kostnaderna, förbättrar effektiviteten och säkerställer efterlevnad. Projekt som använder filanalys kräver snabbhet för att hålla jämna steg med en ständigt föränderlig affärsmiljö. För att maximera värdet av dessa lösningar är det viktigt att de är snabba, skalbara och ger snabbt mervärde.

Filanalyslösningar ger tillgång till de vanligaste källorna till ostrukturerade data (lokalt eller i molnet) för att bedöma risker, identifiera känsliga och värdefulla data och vidta åtgärder som skyddar, säkrar och styr data under hela dess livscykel.

Hur kan filanalys bidra till effektivisering och optimering av data?

Dataeffektivitet och optimering av ostrukturerad data börjar med att förstå vilken data du har och var den är lagrad. Genom datakartläggning kan du använda filanalys för att identifiera var all din data finns och identifiera "mörk data" som är felplacerad, föräldralös, duplicerad, föråldrad eller trivial. Projekt som utnyttjar filanalys ger snabbare avkastning på investeringen genom att aktivt radera eller optimera data som inte har något värde för organisationen.

Hur kan filanalys bidra till riskreducering?

Filanalyslösningar hjälper till att minska datarisker genom att optimera, skydda och säkra data som hittas under innehållsanalysfasen. Detta ingår:

  • Upptäcka, hantera och bearbeta PII, PCI, PHI och IP.
  • Hantering av informationsflödet.
  • Hantering av känsliga uppgifter.
  • Tillhandahåller identitetsskydd, metadatarapportering, identitetsåtkomsträttigheter, datacentrerat åtkomstskydd, policykontroller och verifieringskedjor.

När dataoptimeringen är slutförd tar data som inte har något affärsvärde inte längre upp lagringsutrymme. Endast data som är mycket värdefull och som används aktivt av verksamheten finns kvar.

Det är viktigt att förstå åtkomst och behörigheter. Filanalyslösningar som tillhandahåller verktyg för att åtgärda problem hjälper till att säkerställa att korrekta kontroller tillämpas på data medan de används aktivt. Vissa lösningar innehåller ytterligare skydd, till exempel möjligheten att kryptera data vid slutpunkten för att säkerställa korrekt användning. Och slutligen kan korrekt implementerade filanalyslösningar förhindra att användare flyttar eller raderar data utan att förstå dess affärssyfte. Filanalyslösningar som använder en "manage-in-place"-modell minimerar risken för avbrott för affärsanvändarna.

Hur kan filanalys hjälpa till med styrning och efterlevnad?

En lösning för filanalys kan bidra till att säkerställa att rätt data finns tillgänglig för rätt användare vid rätt tidpunkt. Det hjälper organisationer att uppfylla sina mål för reglering, juridik och intern styrning och efterlevnad genom att:

  • Tillhandahåller metadatastyrning, lagliga innehav, karantän och upptäckt.
  • Optimering av datavolymer.
  • Styrning av lämpliga behörigheter.
  • Tilldelning av rollbaserad åtkomst.
  • Identifiering av tillgångar med högt värde.
  • Tillämpning av policyer för datalivscykel.

Hur kan filanalys hjälpa till med PII-data och efterlevnad av dataskydd?

Organisationer tävlar om att hitta, skydda och säkra personuppgifter (inklusive uppgifter om konsumenter, medborgare och anställda). Denna globala trend - som omfattar GDPR (EU), CCPA (Kalifornien), KVKK (Turkiet), PIPEDA (Kanada) och POPIA (Sydafrika) - har lett till att filanalyslösningar fått ny uppmärksamhet. Genom att utnyttja funktioner för innehållsanalys och detekteringstekniker är filanalyslösningar idealiska för att säkerställa efterlevnad och hjälpa till att svara på konsumentförfrågningar eller förfrågningar om tillgång till registrerade uppgifter.

Beredskap för datasekretess är ett exempel där lösningar för filanalys är utmärkta. Den betonar också behovet av en process där PII-filer enkelt kan identifieras, indexeras och hämtas.

Processen från början till slut bör se ut ungefär så här:

  1. Hitta repositories och identifiera filer.
  2. Extrahera alla metadata och allt innehåll från filen.
  3. Analysera filinnehållet och metadata för specifika enheter eller klassificera filen baserat på begreppsmässigt innehåll.
  4. Säkra uppgifterna genom att tillämpa affärsregler baserade på analysresultaten för att säkerställa lämpliga åtkomstnivåer och hantering av känsliga uppgifter (t.ex. kryptering). Du kan också använda en kategori eller klassificering för att hjälpa till att hantera tillgångarnas livscykel.

Vad är klassificering eller kategorisering för filer?

Filanalyslösningar använder enkla klassificeringsmetoder som baseras på metadatataggar, nyckelord eller termlistor. Vissa lösningar utnyttjar konceptuell klassificering av filinnehållet och kombinerar dessa metoder med hittade dokument, bilder eller dataenheter för att förbättra kategoriseringens noggrannhet. Andra lösningar tar det ett steg längre med maskininlärning och guidad inlärning med hjälp av exempeldokument, vilket gör att du kan definiera de klassificeringar som ska användas.

Ett dokument från personalavdelningen med hälso- eller försäkringsinformation kan t.ex. använda en policy för dataklassificering som baseras på exempeldata. För andra element, t.ex. ålder och plats, kan du tillämpa en riskpoäng och ytterligare behörigheter för att ytterligare definiera policyn.

Hur kan filanalys bidra till styrning och bevarande av data?

Filanalyslösningar erbjuder funktioner som hjälper organisationer att automatiskt vidta åtgärder på data, samt en rik uppsättning verktyg som hjälper till att styra och bevara data. Lösningarna omfattar vanligtvis följande alternativ, som styrs av företagets datastyrning:

  • Radera uppgifterna. Om det inte finns något behov av att behålla filen kan du ta bort den. Är den för gammal? Är det en kopia? Tillför det något värde till verksamheten? Har konsumenten begärt att hans eller hennes uppgifter ska förstöras? Filanalyslösningar upprätthåller en verifieringskedja av både vad du gjorde och varför du gjorde det.
  • Säkra uppgifterna. Om du behöver behålla uppgifterna ska du säkra dem. Vissa filanalyslösningar kan ändra åtkomstkontroller eller kryptera data. Ett annat alternativ är att flytta den till en säker plats, t.ex. ett dokumenthanteringsverktyg, för långsiktigt bevarande.
  • Redigera uppgifterna. Du kan behöva behålla en del av uppgifterna, men inte PII. Vissa filanalyslösningar stöder redigering för att skapa en ren kopia av originalfilen utan PII-innehåll. Originalfilen raderas eller säkras sedan enligt beskrivningen ovan.

Vad är "manage-in-place"?

Hantera på plats är ett nyckelbegrepp för hantering och styrning av datalivscykeln. Det är "hur" metadata (inklusive plats, behörigheter och innehåll) analyseras av filanalyslösningen där den finns. Det faktiska objektet flyttas inte, kopieras inte eller lagras inte på en annan plats eller i ett annat bevarandeområde under analysen.

Förstå grammatiker för enheter

Två grundläggande typer av grammatiker (regeluppsättningar) för datautvinning används för att beskriva de enheter som du försöker identifiera: kuraterade och användargenererade.

Grammatikerna omfattar:

  • PII: Personligt identifierbar information, som kan skilja sig från region till region (inklusive format, vilket kan orsaka falska positiva resultat).
  • PHI: Personlig hälsoinformation, som vanligtvis förknippas med den nordamerikanska hälsoindustrin.
  • PCI: Personlig kreditkortsinformation.
  • PSI: Personlig säkerhetsinformation, för åtkomstnycklar till kontouppgifter.

Leta efter kurerade och optimerade grammatiker som inte kan ändras av användaren. Dessa grammatiker använder sammanhang och landmärken för mer exakta resultat och ger en "förtroendepoäng" som hjälper dig att filtrera bort falska positiva resultat. Kontexten och landmärkena kan vara fraser, enstaka ord eller enskilda tecken.

Sammanhanget är avgörande. Filanalyslösningar som använder närhet till entitetskandidaten och styrkan i sammanhanget (baserat på tekniker för behandling av naturligt språk) bidrar till konfidenspoängen. Du kan få mer detaljerade poäng genom att använda omfattande listor över specifika enheter, länder eller regioner.

Stämning och flexibilitet. Om ingen av dessa grammatiker täcker ditt specifika användningsfall kan du använda en filanalyslösning som gör det möjligt att skapa anpassade grammatiker. Dessa grammatiker definieras vanligen med hjälp av formatbeskrivande RegX eller enkla listor.

Vad är falska positiva resultat?

Per definition är ett "falskt positivt" ett testresultat som felaktigt indikerar förekomsten av ett visst tillstånd eller en viss egenskap1. När det gäller filanalyslösningar innebär ett falskt positivt resultat att ett mönster, en grammatik eller ett nyckelord har identifierats felaktigt under innehållsanalysen. Filanalyslösningar som bara använder mönster- eller sökordsmatchning har vanligtvis högre andel falska positiva resultat än lösningar med kontextuellt medveten innehållsanalys.

Skannade dokument och ljudinspelningar

Filanalyslösningar kan analysera textbaserade dokument med avseende på risker, men PII kan också finnas i andra former av data. Att utföra filanalys på skannade dokument, inspelade samtal och videokonferensinspelningar blir allt vanligare. Vissa filanalyslösningar kan bearbeta dessa filer innan PII-upptäcktstekniker tillämpas.

Skannade pappersdokument som lagras som bilder (t.ex. i en PDF-fil) bör bearbetas med optisk teckenigenkänning (OCR) för att extrahera texten och helst även den tillhörande strukturinformationen. Många organisationer har skannade ID-dokument i sina register, t.ex. anställdas körkort eller pass.

Filanalyslösningar som stöder analys av ljud- eller videoinspelningar kräver bearbetning av en tal-till-text-motor som kan skapa en skriftlig utskrift för analys.

Fördelar med kontextuell, AI-driven innehållsanalys:

  • Ökar noggrannheten och upptäckten av känsliga och värdefulla data.
  • Minskar antalet falska positiva resultat.
  • Ökar effektiviteten genom AI-tränade kategoriseringar och minskar de manuella insatser som krävs för att klassificera data.

Fördelar med "manage-in-place"-modeller:

  • Data är lätta att hitta och finns där slutanvändarna förväntar sig att de ska finnas.
  • Minskar risken för dataförluster, produktivitetsförluster och störningar för slutanvändarna.
  • Ökar kostnadsbesparingarna och hastigheten genom att eliminera behovet av att överföra data över nätverket eller till molnet för att analysera dem.

Skillnaden mellan lokala lösningar och SaaS-lösningar för filanalys

Vad är en SaaS-lösning för filanalys?

Filanalys kan erbjudas via SaaS (Software as a Service), där kunden konsumerar tjänster som tillhandahålls av en leverantör av applikationssäkerhet mot en månads- eller årsavgift. Detta tillvägagångssätt kräver inte inköp av hårdvara eller traditionell evig licensiering. Den förlitar sig helt eller delvis på att SaaS-leverantören (eller i vissa fall en managed service-leverantör) ger åtkomst till applikationen för att kunna utföra innehållsanalys, sökning, styråtgärder och analys. SaaS är ett enkelt sätt att komma igång med innehållsanalys och erbjuder hög skalbarhet, snabbhet och kort tid till värde. Beroende på var SaaS-värdsmiljön är belägen kan frågor om datalagring och datasuveränitet behöva vägas mot de kommersiella fördelarna med SaaS

Vad är en lokal lösning för filanalys?

Filanalyslösningar kan också köras lokalt och driftas och underhållas av interna team. Denna metod kräver att organisationerna tillhandahåller infrastruktur och personal samt förvärvar och hanterar lösningar för applikationssäkerhet. On-premises försäkrar organisationer att deras applikationsdata inte delas med tredje part och inte lämnar lokalerna. Vanligtvis säljs lokala lösningar genom en evig licens. På senare tid har abonnemangslicenser använts för att ge större flexibilitet i hur programvaran används och faktureras.

OpenText tillhandahåller verktyg för filanalys

Voltage File Analysis Suite av OpenText™ SaaS filanalyslösning gör det möjligt för organisationer att snabbt och effektivt minska informationsrisken; säkerställa datasekretess; och analysera, optimera och säkra anställdas tillgång till kritisk data som driver och skyddar verksamheten. Vår lösning säkerställer hantering av datalivscykeln och styrning av dataåtkomst samtidigt som den minskar risken i samband med hantering av känsliga data. File Analysis ger också identitets- och åtkomststyrning, fullständig datasynlighet, minskade lagringskostnader, användbara analyser som förbättrar effektiviteten och datakvaliteten. Dessutom stöder den efterlevnad av datasekretess samtidigt som den hanterar styrning av tillgångar med högt värde (t.ex. kontrakt, immateriella rättigheter, patent etc.) och känsliga uppgifter (t.ex. PI/PII, PCI, PHI etc.).

OpenText™ File Reporter inventerar nätverksfilsystem och levererar den detaljerade fillagringsintelligensen du behöver för att optimera och säkra ditt nätverk för effektivitet och efterlevnad. Det gör att du kan identifiera åtkomstrisker när du upptäcker och analyserar filer och tillhörande behörigheter för data som lagras i hela företaget. File Reporter är utvecklad för rapportering av filsystem i företag och samlar in data om miljontals filer och mappar som finns utspridda på de olika nätverkslagringsenheterna i ditt nätverk. Flexibla rapporterings-, filtrerings- och frågealternativ presenterar sedan exakt de resultat du behöver för att visa efterlevnad eller vidta korrigerande åtgärder.

OpenText™ File Dynamics erbjuder omfattande tjänster för att möta de växande kraven på hantering av nätverksdata. Identitetsdrivna policyer automatiserar uppgifter som traditionellt utförs manuellt, vilket leder till kostnadsbesparingar och en försäkran om att uppgifterna utförs på rätt sätt. Målstyrda policyer ger skydd mot obehörig åtkomst samt migrering och rensning av data. File Dynamics skyddar också mot datakorruption och driftstopp genom säkerhetskopiering av högvärdiga mål, vilket möjliggör snabb återställning av filer och deras tillhörande behörigheter. File Dynamics levererar de rollbaserade åtkomstbegränsningar, åtgärder, riskreducering och proaktiv hantering som krävs för efterlevnad av datahanteringsregler.

OpenText™ ControlPoint är en filanalyslösning som utnyttjar OpenText™ Knowledge Discovery artificiell intelligens för ostrukturerad dataanalys. Det gör det möjligt för organisationer att identifiera och automatiskt klassificera känsliga data (t.ex. PII, PCI, PHI), rensa upp i äldre data och upptäcka risker som döljs i mörka data som ligger ohanterade i e-postarkiv, fildelningar, SharePoint-webbplatser och molnarkiv (t.ex. Office365, Google Drive och Dropbox). ControlPoint gör det också möjligt för organisationer att spara på lagringskostnader genom att minska överflödiga, föråldrade och triviala data. Detta ger bättre tillgång till värdefull information och säkerställer att data bevaras genom att tillämpa policyer som hjälper till med hantering av datalivscykeln, efterlevnad av regelverk och datasäkerhet.

Filanalys

Kom igång redan idag.

Begär en demo

Hur kan vi hjälpa till?

Fotnoter