Page d'accueil d'OpenText.
Thèmes techniques

Qu'est-ce que l'analyse de dossier ?

Illustration des éléments informatiques avec un point d'interrogation en point de mire

Présentation

L'analyse de fichiers aide les entreprises à faire face à l'augmentation de leurs volumes de données en cartographiant l'emplacement de leurs données et en identifiant qui a accès à quelles données (y compris les partages de fichiers, les bases de données de messagerie, la synchronisation et le partage de fichiers d'entreprise, la gestion des enregistrements, la gestion du contenu d'entreprise, Microsoft SharePoint et les archives de données).

Les solutions d'analyse de fichiers analysent, indexent, recherchent, suivent et établissent des rapports sur les métadonnées et le contenu des fichiers. Cela permet aux organisations de visualiser et d'organiser des métadonnées détaillées et des informations contextuelles, d'améliorer la surveillance des IIP et la gouvernance de l'information, et de gérer plus efficacement les données non structurées.

Les solutions d'analyse de fichiers protègent et sécurisent également les données non structurées. Les entreprises peuvent prendre de meilleures décisions en matière d'analyse de contenu, tout en limitant les risques et en réduisant les coûts liés aux données. Ces solutions permettent d'assurer la sécurité des données, la gestion du cycle de vie, la gouvernance de l'accès aux données, le mappage et la classification, tout en permettant d'obtenir des informations et des analyses clés sur les données, afin d'orienter et de protéger l'activité de l'entreprise. Ces capacités clés aident les organisations à répondre aux cas d'utilisation de la transformation numérique pour l'atténuation des risques, la gouvernance et la conformité, l'efficacité et l'optimisation, et la connaissance des données.

Analyse des dossiers

Pourquoi l'analyse des dossiers ?

Les organisations sont soumises à une pression croissante pour transformer leur activité. Qu'il s'agisse d'accélérer le passage au cloud, de soutenir les travailleurs à distance ou de se préparer à la confidentialité des données, les solutions d'analyse de fichiers peuvent contribuer à optimiser les données et les applications et à identifier, sécuriser et classer les données de manière intelligente. Les solutions d'analyse de fichiers peuvent également fournir des informations sur les données afin de garantir la conformité et de permettre des migrations de données plus intelligentes.

Les solutions d'analyse de fichiers peuvent s'adapter aux besoins des charges de travail modernes et identifier les zones où les données peuvent être optimisées et supprimées de manière responsable, ce qui permet de réduire les coûts, d'améliorer l'efficacité et de garantir la conformité. Les projets qui déploient l'analyse de fichiers nécessitent de la vélocité pour rester en phase avec un environnement commercial en constante évolution. La vitesse, l'échelle et la rapidité d'obtention de la valeur ajoutée sont essentielles pour maximiser la valeur de ces solutions.

Les solutions d'analyse de fichiers permettent d'accéder aux sources les plus courantes de données non structurées (sur site ou dans le nuage) afin d'évaluer les risques, d'identifier les données sensibles et de grande valeur, et de prendre des mesures pour protéger, sécuriser et gérer les données tout au long de leur cycle de vie.

Comment l'analyse des fichiers contribue-t-elle à l'efficacité et à l'optimisation des données ?

L'efficacité et l'optimisation des données non structurées commencent par la compréhension des données dont vous disposez et de l'endroit où elles sont stockées. Grâce à la cartographie des données, vous pouvez utiliser l'analyse des fichiers pour déterminer où se trouvent toutes vos données et identifier les "données sombres" qui sont mal placées, orphelines, dupliquées, obsolètes ou insignifiantes. Les projets qui s'appuient sur l'analyse des fichiers offrent un retour sur investissement plus rapide en supprimant ou en optimisant activement les données qui n'ont aucune valeur pour l'organisation.

Comment l'analyse des fichiers permet-elle d'atténuer les risques ?

Les solutions d'analyse de fichiers contribuent à la réduction des risques liés aux données en optimisant, en protégeant et en sécurisant les données trouvées au cours de l'étape d'analyse du contenu. Il s'agit notamment de

  • Détecter, gérer et traiter les IPI, PCI, PHI et IP.
  • Gestion du flux d'informations.
  • Traitement des données sensibles.
  • Protection de l'identité, rapports sur les métadonnées, droits d'accès à l'identité, protection de l'accès centré sur les données, contrôles des politiques et pistes d'audit.

Une fois l'optimisation des données terminée, les données qui n'ont pas de valeur commerciale ne consomment plus d'espace de stockage. Seules les données de grande valeur et activement utilisées par l'entreprise sont conservées.

Il est essentiel de comprendre les accès et les permissions. Les solutions d'analyse de fichiers qui fournissent des outils de remédiation permettent de s'assurer que les contrôles appropriés sont appliqués aux données pendant leur utilisation active. Certaines solutions incluent des protections supplémentaires, telles que la possibilité de chiffrer les données au niveau du point de terminaison afin de garantir une utilisation correcte. Enfin, des solutions d'analyse de fichiers correctement déployées peuvent empêcher les utilisateurs de déplacer ou de supprimer des données sans en comprendre la finalité. Les solutions d'analyse de fichiers qui déploient un modèle de "gestion sur place" minimisent le risque d'interruption pour les utilisateurs professionnels.

Comment l'analyse des fichiers peut-elle contribuer à la gouvernance et à la conformité ?

Le déploiement d'une solution d'analyse de fichiers peut contribuer à garantir que les bonnes données sont disponibles pour le bon utilisateur au bon moment. Il aide les organisations à atteindre leurs objectifs réglementaires, juridiques et internes en matière de gouvernance et de conformité :

  • Assurer la gouvernance des métadonnées, les mises en suspens légales, la mise en quarantaine et la recherche.
  • Optimisation des volumes de données.
  • Réglementer les autorisations appropriées.
  • Octroi d'un accès basé sur les rôles.
  • Identifier les actifs de grande valeur.
  • Appliquer des politiques de cycle de vie des données.

Comment l'analyse des fichiers peut-elle contribuer à la conformité des données PII et de la confidentialité des données ?

Les organisations sont engagées dans une course pour trouver, protéger et sécuriser les données personnelles (y compris celles des consommateurs, des citoyens et des employés). Cette tendance mondiale - qui comprend le GDPR (UE), le CCPA (Californie), le KVKK (Turquie), le PIPEDA (Canada) et le POPIA (Afrique du Sud) - a attiré l'attention sur les solutions d'analyse de fichiers. En tirant parti des capacités d'analyse du contenu et des techniques de détection, les solutions d'analyse de fichiers sont idéales pour garantir la conformité et aider à répondre aux demandes des consommateurs ou aux demandes d'accès des personnes concernées.

La préparation à la confidentialité des données est un exemple de domaine dans lequel les solutions d'analyse de fichiers se distinguent. Elle souligne également la nécessité de mettre en place un processus permettant d'identifier, d'indexer et de retrouver facilement les fichiers d'informations confidentielles.

Le processus de bout en bout devrait ressembler à ceci :

  1. Trouver des dépôts et identifier des fichiers.
  2. Extraire toutes les métadonnées et le contenu du fichier.
  3. Analyser le contenu du fichier et les métadonnées pour trouver des entités spécifiques ou classer le fichier sur la base de son contenu conceptuel.
  4. Sécuriser les données en appliquant des règles de gestion basées sur les résultats de l'analyse afin de garantir des niveaux d'accès appropriés et le traitement des données sensibles (c'est-à-dire le cryptage). Vous pouvez également appliquer une catégorie ou une classification pour faciliter la gestion du cycle de vie des actifs.

Qu'est-ce que la classification ou la catégorisation des fichiers ?

Les solutions d'analyse de fichiers utilisent des méthodes de classification simples basées sur des étiquettes de métadonnées, des mots-clés ou des listes de termes. Certaines solutions s'appuient sur une classification conceptuelle du contenu des fichiers et combinent ces méthodes avec des documents, des images ou des entités de données trouvés pour améliorer la précision de la catégorisation. D'autres solutions vont plus loin avec l'apprentissage automatique et l'apprentissage guidé à l'aide d'exemples de documents, qui vous permettent de définir les classifications à utiliser.

Par exemple, un document des ressources humaines contenant des informations sur la santé ou l'assurance peut utiliser une politique de classification des données basée sur des échantillons de données. Pour d'autres éléments, tels que l'âge et le lieu, vous pouvez appliquer un score de risque et des autorisations supplémentaires afin de mieux définir la politique.

Comment l'analyse des fichiers permet-elle la gouvernance et la préservation des données ?

Les solutions d'analyse de fichiers offrent des capacités permettant aux organisations d'agir automatiquement sur les données, ainsi qu'un riche ensemble d'outils pour aider à gouverner et à préserver les données. Les solutions comprennent généralement les options suivantes, en fonction de la gouvernance des données de l'entreprise :

  • Supprimer les données. S'il n'est pas nécessaire de conserver le fichier, supprimez-le. Est-il trop vieux ? S'agit-il d'un doublon ? Apporte-t-il une valeur ajoutée à l'entreprise ? Le consommateur a-t-il demandé que ses données soient détruites ? Les solutions d'analyse de fichiers conservent une piste d'audit de ce que vous avez fait et de la raison pour laquelle vous l'avez fait.
  • Sécuriser les données. Si vous devez conserver les données, sécurisez-les. Certaines solutions d'analyse de fichiers peuvent modifier les contrôles d'accès ou crypter les données. Une autre option consiste à le transférer dans un endroit sûr, tel qu'un outil de gestion des documents, en vue d'une conservation à long terme.
  • Expurger les données. Il peut être nécessaire de conserver certaines données, mais pas les informations confidentielles. Certaines solutions d'analyse de fichiers permettent d'expurger le fichier original afin d'en créer une copie propre sans les informations confidentielles. Le fichier original est ensuite supprimé ou sécurisé comme décrit ci-dessus.

Qu'est-ce que le "management en place" ?

La gestion sur place est un concept clé de la gestion du cycle de vie des données et de la gouvernance. C'est la façon dont les métadonnées (y compris l'emplacement, les autorisations et le contenu) sont analysées par la solution d'analyse de fichiers où elles résident. L'objet réel n'est pas déplacé, copié ou stocké dans un autre lieu ou une autre zone de conservation pendant l'analyse.

Comprendre les grammaires d'entités

Deux types fondamentaux de grammaires de découverte de données (ensembles de règles) sont utilisés pour décrire les entités que vous essayez d'identifier : les grammaires curatées et les grammaires générées par l'utilisateur.

Les grammaires comprennent

  • IPI : Informations personnelles identifiables, qui peuvent varier d'une région à l'autre (y compris le format, ce qui peut entraîner des faux positifs).
  • PHI : Informations personnelles sur la santé, généralement associées à l'industrie de la santé en Amérique du Nord.
  • PCI : Informations personnelles relatives aux cartes de crédit.
  • PSI : Informations de sécurité personnelles, pour les détails du compte et les clés d'accès.

Recherchez des grammaires curées et optimisées, qui ne peuvent pas être modifiées par l'utilisateur. Ces grammaires utilisent le contexte et les points de repère pour obtenir des résultats plus précis et fournissent un "score de confiance" pour vous aider à éliminer les faux positifs. Le contexte et les points de repère peuvent être des phrases, des mots isolés ou des caractères individuels.

Le contexte est essentiel. Les solutions d'analyse de fichiers qui utilisent la proximité de l'entité candidate et la force du contexte (sur la base de techniques de traitement du langage naturel) contribuent aux scores de confiance. Vous pouvez obtenir des scores plus précis en exploitant des listes complètes d'entités, de pays ou de régions spécifiques.

Accordage et flexibilité. Si aucune de ces grammaires ne couvre votre cas d'utilisation spécifique, vous pouvez utiliser une solution d'analyse de fichiers qui permet de créer des grammaires personnalisées. Ces grammaires sont généralement définies à l'aide de RegX descriptifs de format ou de listes simples.

Qu'est-ce qu'un faux positif ?

Par définition, un "faux positif" est un résultat de test qui indique à tort la présence d'une condition ou d'un attribut particulier1. Dans le cas des solutions d'analyse de fichiers, un faux positif indique une correspondance de modèle, de grammaire ou de mot-clé incorrectement identifiée lors de l'analyse du contenu. Les solutions d'analyse de fichiers qui se contentent d'utiliser des modèles ou des mots-clés ont généralement des taux de faux positifs plus élevés que celles qui intègrent des capacités d'analyse contextuelle du contenu.

Documents numérisés et enregistrements audio

Les solutions d'analyse de fichiers peuvent analyser les documents textuels pour y déceler des risques, mais les IIP peuvent également résider dans d'autres formes de données. Il est de plus en plus courant d'analyser des documents numérisés, des conversations enregistrées et des enregistrements de vidéoconférences. Certaines solutions d'analyse de fichiers peuvent traiter ces fichiers avant d'appliquer les techniques de recherche d'IIP.

Les documents papier numérisés stockés sous forme d'images (dans un fichier PDF, par exemple) doivent être traités par reconnaissance optique de caractères (OCR) afin d'en extraire le texte et, idéalement, les informations structurelles associées. De nombreuses organisations conservent des documents d'identité numérisés, tels que les permis de conduire ou les passeports des employés.

Les solutions d'analyse de fichiers qui permettent d'analyser des enregistrements audio ou vidéo nécessitent un traitement par un moteur de conversion de la parole en texte qui peut créer une transcription écrite pour l'analyse.

Avantages de l'analyse de contenu contextuelle, pilotée par l'IA :

  • Améliore la précision et la détection des données sensibles et de grande valeur.
  • Réduit les faux positifs.
  • Augmentation de l'efficacité grâce à la catégorisation formée par l'IA et réduction de l'intervention manuelle nécessaire pour classer les données.

Avantages des modèles de "gestion en place" :

  • Les données sont faciles à trouver et se trouvent là où les utilisateurs finaux s'attendent à les trouver.
  • Réduit les risques de perte de données, de perte de productivité et d'interruption pour l'utilisateur final.
  • Augmente les économies et la rapidité en éliminant la nécessité de transférer les données sur le réseau ou dans le nuage pour les analyser.

La différence entre les solutions d'analyse de fichiers sur site et les solutions SaaS

Qu'est-ce qu'une solution SaaS d'analyse de fichiers ?

L'analyse des fichiers peut être proposée par le biais d'un logiciel en tant que service (SaaS), où le client consomme des services fournis par un fournisseur de sécurité des applications moyennant une redevance mensuelle ou annuelle. Cette approche ne nécessite pas d'acquisition de matériel ni de licence perpétuelle traditionnelle. Il s'appuie partiellement ou totalement sur le fournisseur de SaaS (ou un fournisseur de services gérés dans certains cas) pour fournir un accès à l'application afin d'effectuer des analyses de contenu, des recherches, des actions de gouvernance et des analyses. Le SaaS permet de démarrer facilement l'analyse de contenu et offre une grande évolutivité, une grande rapidité et un délai de rentabilisation rapide. En fonction de la localisation de l'environnement d'hébergement du SaaS, les problèmes de résidence et de souveraineté des données pourraient devoir être mis en balance avec les avantages commerciaux du SaaS.

Qu'est-ce qu'une solution d'analyse de fichiers sur site ?

Les solutions d'analyse de fichiers peuvent également être exécutées sur site et exploitées et maintenues par des équipes internes. Cette approche exige des organisations qu'elles fournissent l'infrastructure et le personnel et qu'elles acquièrent et gèrent des solutions de sécurité des applications. Les entreprises ont l'assurance que les données de leurs applications ne sont pas partagées avec des tiers et qu'elles ne quittent pas les locaux de l'entreprise. En règle générale, les solutions sur site sont vendues sous la forme d'une licence perpétuelle. Plus récemment, les licences d'abonnement ont été utilisées pour offrir une plus grande flexibilité dans la manière dont le logiciel est consommé et facturé.

OpenText propose des outils d'analyse de fichiers

Voltage File Analysis Suite by OpenText™ La solution SaaS d'analyse de fichiers permet aux organisations de réduire rapidement et efficacement les risques liés aux informations, de garantir la confidentialité des données et d'analyser, d'optimiser et de sécuriser l'accès des employés aux données critiques qui dirigent et protègent l'entreprise. Notre solution garantit la gestion du cycle de vie des données et la gouvernance de l'accès aux données tout en atténuant le risque associé à la gestion des données sensibles. L'analyse des fichiers offre également une gouvernance des identités et des accès, une visibilité complète des données, une réduction des coûts de stockage, des analyses exploitables qui améliorent l'efficacité et la qualité des données. En outre, il permet de respecter la confidentialité des données tout en assurant la gouvernance des actifs de grande valeur (contrats, propriété intellectuelle, brevets, etc.) et des données sensibles (PI/ PII, PCI, PHI, etc.).

OpenText™ File Reporter inventorie les systèmes de fichiers du réseau et fournit les informations détaillées sur le stockage des fichiers dont vous avez besoin pour optimiser et sécuriser votre réseau en termes d'efficacité et de conformité. Il vous permet d'identifier les risques d'accès lorsque vous découvrez et analysez les fichiers et les autorisations associées pour les données stockées dans votre entreprise. Conçu pour les rapports sur les systèmes de fichiers d'entreprise, File Reporter recueille des données sur les millions de fichiers et de dossiers dispersés sur les différents périphériques de stockage en réseau qui composent votre réseau. Des options flexibles de reporting, de filtrage et d'interrogation présentent ensuite les résultats exacts dont vous avez besoin pour démontrer la conformité ou prendre des mesures correctives.

OpenText™ File Dynamics offre des services étendus pour répondre aux exigences croissantes de la gestion des données du réseau. Les politiques basées sur l'identité automatisent les tâches traditionnellement effectuées manuellement, ce qui permet de réaliser des économies et de s'assurer que les tâches sont exécutées correctement. Des politiques ciblées assurent la protection contre les accès non autorisés, ainsi que la migration et le nettoyage des données. File Dynamics protège également contre la corruption des données et les temps d'arrêt grâce à une sauvegarde en ligne des cibles les plus importantes, ce qui permet une récupération rapide des fichiers et des autorisations qui leur sont associées. File Dynamics fournit les restrictions d'accès basées sur les rôles, la remédiation, la réduction des risques et la gestion proactive nécessaires pour se conformer aux réglementations en matière de gestion des données.

OpenText™ ControlPoint est une solution d'analyse de fichiers qui exploite l'intelligence artificielle OpenText™ Knowledge Discovery pour l'analyse de données non structurées. Il permet aux organisations d'identifier et de classer automatiquement les données sensibles (par exemple, PII, PCI, PHI), de nettoyer les données existantes et de découvrir les risques cachés dans les données non gérées dans les référentiels de messagerie, les partages de fichiers, les sites SharePoint et les référentiels en nuage (tels que Office365, Google Drive et Dropbox). ControlPoint permet également aux organisations d'économiser sur les coûts de stockage en réduisant les données redondantes, obsolètes et insignifiantes. Cela permet d'améliorer l'accès à des informations précieuses et d'assurer la préservation des données en appliquant des politiques qui contribuent à la gestion du cycle de vie des données, à la conformité réglementaire et à la sécurité des données.

Analyse des dossiers

Commencez dès maintenant.

Demander une démonstration

Comment pouvons-nous vous aider ?

Notes de bas de page