OpenText-Startseite.
Technische Themen

Was ist eine Datei-Analyse?

Illustration von IT-Elementen mit Schwerpunkt auf einem Fragezeichen

Übersicht

Die Dateianalyse hilft Unternehmen bei der Bewältigung ihrer wachsenden Datenmengen, indem sie die Speicherorte ihrer Daten abbildet und feststellt, wer Zugriff auf welche Daten hat (einschließlich Dateifreigaben, E-Mail-Datenbanken, Synchronisierung und Freigabe von Unternehmensdateien, Records Management, Enterprise Content Management, Microsoft SharePoint und Datenarchive).

Datei-Analyse-Lösungen analysieren, indizieren, suchen, verfolgen und berichten über Datei-Metadaten und -Inhalte. Dadurch können Unternehmen detaillierte Metadaten und kontextbezogene Informationen anzeigen und organisieren, die Überwachung von personenbezogenen Daten und die Informationsverwaltung verbessern und unstrukturierte Daten effizienter verwalten.

Datei-Analyse-Lösungen schützen und sichern auch unstrukturierte Daten. Unternehmen können bessere Entscheidungen in Bezug auf die Inhaltsanalyse treffen und gleichzeitig die mit den Daten verbundenen Risiken und Kosten verringern. Diese Lösungen helfen bei der Gewährleistung von Datensicherheit, Lebenszyklusmanagement, Datenzugriffssteuerung, Mapping und Klassifizierung und ermöglichen gleichzeitig wichtige Dateneinblicke und -analysen, die das Unternehmen vorantreiben und schützen. Diese Schlüsselfunktionen unterstützen Unternehmen bei der Bewältigung von Anwendungsfällen der digitalen Transformation in den Bereichen Risikominderung, Governance und Compliance, Effizienz und Optimierung sowie Dateneinsicht.

Datei-Analyse

Warum Dateianalyse?

Unternehmen stehen zunehmend unter dem Druck, ihr Geschäft umzugestalten. Unabhängig davon, ob diese Reise mit der Beschleunigung der Umstellung auf die Cloud, der Unterstützung von Außendienstmitarbeitern oder der Vorbereitung auf den Datenschutz beginnt, können Dateianalyselösungen dabei helfen, Daten und Anwendungen zu optimieren und Daten auf intelligente Weise zu identifizieren, zu sichern und zu klassifizieren. Dateianalyselösungen können auch Einblicke in Daten gewähren, um die Einhaltung von Vorschriften zu gewährleisten und intelligentere Datenmigrationen zu ermöglichen.

Dateianalyselösungen können skaliert werden, um den Anforderungen moderner Workloads gerecht zu werden und Bereiche zu identifizieren, in denen Daten optimiert und nachweislich gelöscht werden können - das senkt die Kosten, verbessert die Effizienz und gewährleistet die Einhaltung von Vorschriften. Projekte, bei denen Dateianalysen eingesetzt werden, müssen schnell durchgeführt werden, um mit dem sich ständig ändernden Geschäftsumfeld Schritt zu halten. Schnelligkeit, Skalierbarkeit und eine kurze Zeitspanne bis zur Wertschöpfung sind entscheidend für die Maximierung des Nutzens dieser Lösungen.

Dateianalyselösungen bieten Zugriff auf die gängigsten Quellen unstrukturierter Daten (vor Ort oder in der Cloud), um Risiken zu bewerten, sensible und hochwertige Daten zu identifizieren und Maßnahmen zu ergreifen, die die Daten während ihres Lebenszyklus schützen, sichern und verwalten.

Wie hilft die Dateianalyse bei der Dateneffizienz und -optimierung?

Dateneffizienz und -optimierung bei unstrukturierten Daten beginnt damit, dass man weiß, welche Daten man hat und wo sie gespeichert sind. Mithilfe der Datenzuordnung können Sie mit Hilfe der Dateianalyse feststellen, wo sich alle Ihre Daten befinden, und "dunkle Daten" identifizieren, die falsch platziert, verwaist, doppelt vorhanden, veraltet oder trivial sind. Projekte, die Dateianalysen nutzen, sorgen für eine schnellere Kapitalrendite, da Daten, die für das Unternehmen nicht von Nutzen sind, aktiv gelöscht oder optimiert werden.

Wie hilft die Aktenanalyse bei der Risikominderung?

Dateianalyselösungen helfen bei der Minderung von Datenrisiken, indem sie die bei der Inhaltsanalyse gefundenen Daten optimieren, schützen und sichern. Dazu gehören:

  • Erkennung, Verwaltung und Verarbeitung von PII, PCI, PHI und IP.
  • Steuerung des Informationsflusses.
  • Umgang mit sensiblen Daten.
  • Bereitstellung von Identitätsschutz, Metadatenberichten, Identitätszugriffsrechten, datenzentriertem Zugriffsschutz, Richtlinienkontrollen und Prüfpfaden.

Sobald die Datenoptimierung abgeschlossen ist, verbrauchen alle Daten, die keinen Geschäftswert haben, keinen Speicherplatz mehr. Nur Daten, die von hohem Wert sind und vom Unternehmen aktiv genutzt werden, bleiben erhalten.

Das Verständnis von Zugang und Berechtigungen ist unerlässlich. Lösungen für die Dateianalyse, die Tools zur Behebung von Sicherheitslücken bereitstellen, tragen dazu bei, dass die Daten während ihrer aktiven Nutzung ordnungsgemäß kontrolliert werden. Einige Lösungen bieten zusätzliche Schutzmaßnahmen, wie z. B. die Möglichkeit, Daten am Endpunkt zu verschlüsseln, um eine ordnungsgemäße Nutzung sicherzustellen. Und schließlich können richtig eingesetzte Dateianalyselösungen verhindern, dass Benutzer Daten verschieben oder löschen, ohne deren Geschäftszweck zu kennen. Dateianalyselösungen, die ein "Manage-in-Place"-Modell einsetzen, minimieren das Risiko von Unterbrechungen für Geschäftsanwender.

Wie hilft die Dateianalyse bei Governance und Compliance?

Durch den Einsatz einer Dateianalyse-Lösung kann sichergestellt werden, dass die richtigen Daten dem richtigen Benutzer zur richtigen Zeit zur Verfügung stehen. Es unterstützt Unternehmen bei der Erfüllung ihrer gesetzlichen, rechtlichen und internen Governance- und Compliance-Ziele durch:

  • Bereitstellung von Metadaten-Governance, Legal Holds, Quarantäne und Discovery.
  • Optimierung der Datenmengen.
  • Regelung der entsprechenden Genehmigungen.
  • Gewährung eines rollenbasierten Zugriffs.
  • Identifizierung hochwertiger Vermögenswerte.
  • Anwendung von Richtlinien für den Datenlebenszyklus.

Wie hilft die Dateianalyse bei der Einhaltung von PII-Daten und des Datenschutzes?

Unternehmen befinden sich in einem Wettlauf, um persönliche Daten (einschließlich Verbraucher-, Bürger- und Mitarbeiterdaten) zu finden, zu schützen und zu sichern. Dieser globale Trend - zu dem GDPR (EU), CCPA (Kalifornien), KVKK (Türkei), PIPEDA (Kanada) und POPIA (Südafrika) gehören - hat den Lösungen für die Dateianalyse neue Aufmerksamkeit verschafft. Durch die Nutzung von Inhaltsanalysefunktionen und Erkennungstechniken sind Dateianalyselösungen ideal, um die Einhaltung von Vorschriften zu gewährleisten und bei der Beantwortung von Verbraucheranfragen oder Anträgen auf Zugang zu Daten zu helfen.

Die Vorbereitung auf den Datenschutz ist ein Beispiel dafür, wo Dateianalyse-Lösungen glänzen. Außerdem wird betont, dass ein Verfahren erforderlich ist, mit dem personenbezogene Daten leicht identifiziert, indexiert und abgerufen werden können.

Der End-to-End-Prozess sollte in etwa so aussehen:

  1. Repositories finden und Dateien identifizieren.
  2. Extrahieren Sie alle Metadaten und Inhalte aus der Datei.
  3. Analysieren Sie den Dateiinhalt und die Metadaten nach bestimmten Entitäten oder klassifizieren Sie die Datei anhand des konzeptionellen Inhalts.
  4. Sichern Sie die Daten, indem Sie auf der Grundlage der Analyseergebnisse Geschäftsregeln anwenden, um angemessene Zugriffsebenen und den Umgang mit sensiblen Daten (z. B. Verschlüsselung) sicherzustellen. Sie können auch eine Kategorie oder Klassifizierung anwenden, um die Verwaltung des Lebenszyklus der Assets zu erleichtern.

Was bedeutet Klassifizierung oder Kategorisierung von Dateien?

Dateianalyselösungen verwenden einfache Klassifizierungsmethoden auf der Grundlage von Metadaten-Tags, Schlüsselwörtern oder Begriffslisten. Einige Lösungen nutzen die konzeptionelle Klassifizierung des Dateiinhalts und kombinieren diese Methoden mit gefundenen Dokumenten, Bildern oder Dateneinheiten, um die Genauigkeit der Kategorisierung zu verbessern. Andere Lösungen gehen mit maschinellem Lernen und geführtem Lernen anhand von Beispieldokumenten, die es Ihnen ermöglichen, die zu verwendenden Klassifizierungen zu definieren, noch einen Schritt weiter.

So kann beispielsweise ein Dokument der Personalabteilung mit Gesundheits- oder Versicherungsinformationen eine Datenklassifizierungsrichtlinie verwenden, die auf Beispieldaten basiert. Für andere Elemente, wie z. B. Alter und Standort, können Sie eine Risikobewertung und zusätzliche Berechtigungen anwenden, um die Richtlinie weiter zu definieren.

Wie sorgt die Dateianalyse für Data Governance und Datenbewahrung?

Dateianalyselösungen bieten Funktionen, mit denen Unternehmen automatisch Maßnahmen für Daten ergreifen können, sowie ein umfangreiches Toolset zur Verwaltung und Aufbewahrung von Daten. Die Lösungen umfassen in der Regel die folgenden Optionen, die von der Datenverwaltung des Unternehmens bestimmt werden:

  • Löschen Sie die Daten. Wenn die Datei nicht mehr benötigt wird, entfernen Sie sie. Ist es zu alt? Ist es ein Duplikat? Bietet sie einen Mehrwert für das Unternehmen? Hat der Verbraucher beantragt, dass seine Daten vernichtet werden? Lösungen für die Dateianalyse führen einen Prüfpfad darüber, was Sie getan haben und warum Sie es getan haben.
  • Sichern Sie die Daten. Wenn Sie die Daten behalten müssen, dann sichern Sie sie. Einige Dateianalyselösungen können die Zugriffskontrollen ändern oder die Daten verschlüsseln. Eine andere Möglichkeit besteht darin, sie zur langfristigen Aufbewahrung an einen sicheren Ort zu bringen, z. B. in ein Archivverwaltungsprogramm.
  • Schwärzen Sie die Daten. Möglicherweise müssen Sie einige der Daten aufbewahren, aber nicht die personenbezogenen Daten. Einige Dateianalyselösungen unterstützen die Schwärzung, um eine saubere Kopie der Originaldatei ohne den PII-Inhalt zu erstellen. Die Originaldatei wird dann wie oben beschrieben gelöscht oder gesichert.

Was ist "Management vor Ort"?

Manage-in-Place ist ein Schlüsselkonzept des Datenlebenszyklusmanagements und der Governance. Es geht darum, wie" die Metadaten (einschließlich Speicherort, Berechtigungen und Inhalt) von der Datei-Analyse-Lösung analysiert werden, in der sie sich befinden. Das eigentliche Objekt wird während der Analyse nicht verschoben, kopiert oder an einem anderen Ort oder in einem anderen Aufbewahrungsbereich gespeichert.

Verständnis von Grammatiken für Entitäten

Zwei Grundtypen von Datenerkennungsgrammatiken (Regelsätze) werden verwendet, um die Entitäten zu beschreiben, die Sie zu identifizieren versuchen: kuratierte und nutzergenerierte.

Die Grammatiken umfassen:

  • PII: Persönlich identifizierbare Informationen, die sich von Region zu Region unterscheiden können (einschließlich des Formats, was zu Fehlalarmen führen kann).
  • PHI: Persönliche Gesundheitsinformationen, die typischerweise mit der nordamerikanischen Gesundheitsbranche in Verbindung gebracht werden.
  • PCI: Persönliche Kreditkarteninformationen.
  • PSI: Persönliche Sicherheitsinformationen, für Zugangsschlüssel zu Kontodaten.

Suchen Sie nach kuratierten und optimierten Grammatiken, die vom Benutzer nicht verändert werden können. Diese Grammatiken verwenden Kontext und Orientierungspunkte, um genauere Ergebnisse zu erzielen, und bieten eine "Vertrauensbewertung", um falsch positive Ergebnisse herauszufiltern. Kontext und Orientierungspunkte können Sätze, einzelne Wörter oder einzelne Zeichen sein.

Der Kontext ist entscheidend. Dateianalyselösungen, die die Nähe zum Entitätskandidaten und die Stärke des Kontexts (auf der Grundlage natürlichsprachlicher Verarbeitungstechniken) nutzen, tragen zur Vertrauensbewertung bei. Sie können detailliertere Ergebnisse erzielen, indem Sie umfassende Listen von bestimmten Unternehmen, Ländern oder Regionen nutzen.

Abstimmung und Flexibilität. Wenn keine dieser Grammatiken Ihren speziellen Anwendungsfall abdeckt, können Sie eine Dateianalyselösung verwenden, mit der Sie eigene Grammatiken erstellen können. Diese Grammatiken werden in der Regel durch die Verwendung von formatbeschreibenden RegX oder einfachen Listen definiert.

Was sind falsch positive Ergebnisse?

Per Definition ist ein "falsches Positiv" ein Testergebnis, das fälschlicherweise auf das Vorhandensein einer bestimmten Bedingung oder eines bestimmten Merkmals hinweist1. Im Falle von Dateianalyselösungen weist ein falsches Positiv auf ein Muster, eine Grammatik oder ein Schlüsselwort hin, das bei der Inhaltsanalyse fälschlicherweise identifiziert wurde. Dateianalyselösungen, die lediglich einen Muster- oder Schlüsselwortabgleich vornehmen, haben in der Regel eine höhere Falsch-Positiv-Rate als Lösungen mit kontextbezogenen Inhaltsanalysefunktionen.

Gescannte Dokumente und Tonaufnahmen

Dateianalyselösungen können textbasierte Dokumente auf Risiken untersuchen, aber personenbezogene Daten können auch in anderen Datenformen enthalten sein. Dateianalysen von gescannten Dokumenten, aufgezeichneten Gesprächen und Videokonferenzaufzeichnungen werden immer häufiger durchgeführt. Einige Dateianalyselösungen können diese Dateien vor der Anwendung von PII-Ermittlungstechniken verarbeiten.

Gescannte Papierdokumente, die als Bilder (z. B. in einer PDF-Datei) gespeichert sind, sollten mit optischer Zeichenerkennung (OCR) verarbeitet werden, um den Text und idealerweise auch die zugehörigen Strukturinformationen zu extrahieren. Viele Unternehmen speichern gescannte Ausweisdokumente wie Führerscheine oder Reisepässe ihrer Mitarbeiter.

Dateianalyselösungen, die die Analyse von Audio- oder Videoaufzeichnungen unterstützen, erfordern die Verarbeitung durch eine Speech-to-Text-Engine, die ein schriftliches Transkript für die Analyse erstellen kann.

Vorteile der kontextbezogenen, KI-gesteuerten Inhaltsanalyse:

  • Erhöht die Genauigkeit und Erkennung von sensiblen und hochwertigen Daten.
  • Verringert falsch-positive Ergebnisse.
  • Erhöht die Effizienz durch KI-geschulte Kategorisierung und reduziert die manuellen Eingriffe, die zur Klassifizierung von Daten erforderlich sind.

Vorteile von "Manage-in-place"-Modellen:

  • Die Daten sind leicht zu finden und befinden sich dort, wo die Endnutzer sie erwarten.
  • Reduziert die Gefahr von Datenverlusten, Produktivitätseinbußen und Unterbrechungen für den Endbenutzer.
  • Erhöht die Kosteneinsparungen und die Geschwindigkeit, da die Daten nicht mehr über das Netzwerk oder in die Cloud übertragen werden müssen, um sie zu analysieren.

Der Unterschied zwischen On-Premises- und SaaS-Lösungen für die Dateianalyse

Was ist eine SaaS-Lösung zur Dateianalyse?

Dateianalysen können als Software-as-a-Service (SaaS) angeboten werden, bei dem der Kunde die Dienste eines Anbieters von Anwendungssicherheit gegen eine monatliche oder jährliche Gebühr in Anspruch nimmt. Dieser Ansatz erfordert weder die Anschaffung von Hardware noch eine herkömmliche unbefristete Lizenzierung. Sie ist teilweise oder vollständig vom SaaS-Anbieter (oder in einigen Fällen von einem Managed Service Provider) abhängig, der den Zugang zur Anwendung bereitstellt, um Inhaltsanalysen, Suchvorgänge, Governance-Aktionen und Analysen durchzuführen. SaaS ermöglicht einen einfachen Einstieg in die Inhaltsanalyse und bietet eine hohe Skalierbarkeit, Schnelligkeit und eine kurze Wertschöpfungszeit. Je nach Standort der SaaS-Hosting-Umgebung müssen Bedenken hinsichtlich der Datenresidenz und der Datenhoheit gegen die kommerziellen Vorteile von SaaS abgewogen werden

Was ist eine Lösung zur Dateianalyse vor Ort?

Dateianalyselösungen können auch vor Ort ausgeführt und von internen Teams betrieben und gewartet werden. Bei diesem Ansatz müssen die Unternehmen die Infrastruktur und das Personal bereitstellen und Lösungen für die Anwendungssicherheit erwerben und verwalten. Die Vor-Ort-Lösung stellt sicher, dass die Anwendungsdaten nicht an Dritte weitergegeben werden und das Unternehmen nicht verlassen. In der Regel werden On-Premises-Lösungen über eine unbefristete Lizenz verkauft. In jüngerer Zeit wurde die Abonnementlizenzierung eingesetzt, um mehr Flexibilität bei der Nutzung und Abrechnung der Software zu bieten.

OpenText bietet Datei-Analyse-Tools

Voltage File Analysis Suite by OpenText™ Die SaaS-Lösung für Dateianalysen ermöglicht es Unternehmen, schnell und effizient Informationsrisiken zu reduzieren, den Datenschutz zu gewährleisten und den Zugriff von Mitarbeitern auf kritische Daten zu analysieren, zu optimieren und zu sichern, die das Unternehmen vorantreiben und schützen. Unsere Lösung gewährleistet die Verwaltung des Datenlebenszyklus und die Steuerung des Datenzugriffs und mindert gleichzeitig das mit der Verwaltung sensibler Daten verbundene Risiko. File Analysis bietet außerdem Identitäts- und Zugriffssteuerung, vollständige Datentransparenz, Reduzierung der Speicherkosten, umsetzbare Analysen zur Verbesserung der Effizienz und der Datenqualität. Darüber hinaus unterstützt die Lösung die Einhaltung des Datenschutzes, während sie gleichzeitig die Verwaltung hochwertiger Vermögenswerte (z. B. Verträge, geistiges Eigentum, Patente usw.) und sensibler Daten (z. B. PI/ PII, PCI, PHI usw.) regelt.

OpenText™ File Reporter inventarisiert Netzwerk-Dateisysteme und liefert die detaillierten Informationen zur Dateispeicherung, die Sie benötigen, um Ihr Netzwerk zu optimieren und zu sichern, um Effizienz und Compliance zu gewährleisten. Es ermöglicht Ihnen, Zugriffsrisiken zu identifizieren, wenn Sie Dateien und zugehörige Berechtigungen für Daten, die in Ihrem Unternehmen gespeichert sind, entdecken und analysieren. File Reporter wurde für die Erstellung von Berichten über das Dateisystem von Unternehmen entwickelt und sammelt Daten über Millionen von Dateien und Ordnern, die auf den verschiedenen Netzwerkspeichergeräten in Ihrem Netzwerk verstreut sind. Flexible Berichts-, Filter- und Abfrageoptionen präsentieren dann genau die Ergebnisse, die Sie benötigen, um die Einhaltung von Vorschriften nachzuweisen oder Korrekturmaßnahmen zu ergreifen.

OpenText™ File Dynamics bietet umfangreiche Services, um den wachsenden Anforderungen des Netzwerkdatenmanagements gerecht zu werden. Identitätsgesteuerte Richtlinien automatisieren Aufgaben, die traditionell manuell erledigt werden, was zu Kosteneinsparungen führt und die Sicherheit gibt, dass die Aufgaben ordnungsgemäß ausgeführt werden. Zielgerichtete Richtlinien bieten Schutz vor unbefugtem Zugriff sowie Datenmigration und -bereinigung. File Dynamics schützt außerdem vor Datenbeschädigung und Ausfallzeiten durch Nearline-Speicher-Backups von hochwertigen Zielen und ermöglicht eine schnelle Wiederherstellung von Dateien und den zugehörigen Berechtigungen. File Dynamics bietet rollenbasierte Zugriffsbeschränkungen, Abhilfemaßnahmen, Risikominderung und proaktives Management, die für die Einhaltung von Datenverwaltungsvorschriften erforderlich sind.

OpenText™ ControlPoint ist eine Lösung zur Analyse von Dateien, die die künstliche Intelligenz von OpenText™ Knowledge Discovery für die Analyse unstrukturierter Daten nutzt. Es ermöglicht Unternehmen die Identifizierung und automatische Klassifizierung sensibler Daten (z.B. PII, PCI, PHI), die Bereinigung von Altdaten und die Aufdeckung von Risiken, die in dunklen Daten verborgen sind, die unverwaltet in E-Mail-Repositories, Dateifreigaben, SharePoint-Sites und Cloud-Repositories (wie Office365, Google Drive und Dropbox) liegen. ControlPoint ermöglicht es Unternehmen außerdem, Speicherkosten zu sparen, indem redundante, veraltete und triviale Daten reduziert werden. Dies ermöglicht einen besseren Zugang zu wertvollen Informationen und sorgt für die Bewahrung von Daten durch die Anwendung von Richtlinien, die bei der Verwaltung des Lebenszyklus von Daten, der Einhaltung von Vorschriften und der Datensicherheit helfen.

Datei-Analyse

Starten Sie noch heute

Fordern Sie eine Demo an

Wie können wir behilflich sein?

Fußnoten