Page d'accueil d'OpenText.
Sujets techniques

Qu'est-ce que l'analyse de fichiers ?

Illustration d'éléments informatiques mettant en évidence un point d'interrogation

Aperçu

L'analyse de fichiers aide les organisations à gérer leurs volumes de données croissants en cartographiant l'emplacement de leurs données et en identifiant qui a accès à quelles données (y compris les partages de fichiers, les bases de données de messagerie, la synchronisation et le partage de fichiers d'entreprise, la gestion de documents, la gestion de contenu d'entreprise, Microsoft SharePoint et les archives de données).

Les solutions d'analyse de fichiers analysent, indexent, recherchent, suivent et génèrent des rapports sur les métadonnées et le contenu des fichiers. Cela permet aux organisations de consulter et d'organiser des métadonnées détaillées et des informations contextuelles, d'améliorer la surveillance des données personnelles et la gouvernance de l'information, et de gérer plus efficacement les données non structurées.

Les solutions d'analyse de fichiers protègent et sécurisent aussi les données non structurées. Les organisations peuvent ainsi prendre de meilleures décisions en matière d'analyse de contenu, tout en atténuant les risques et en réduisant les coûts associés aux données. Ces solutions contribuent à assurer la sécurité des données, la gestion de leur cycle de vie, la gouvernance de l'accès aux données, le mappage et la classification, tout en permettant des analyses et des informations clés sur les données qui pilotent et protègent l'entreprise. Ces capacités clés aident les organisations à répondre aux cas d'utilisation de la transformation numérique en matière d'atténuation des risques, de gouvernance et de conformité, d'efficacité et d'optimisation, et d'analyse des données.

Analyse de fichiers

Pourquoi l'analyse de fichiers ?

Les organisations subissent une pression croissante pour transformer leur activité. Que ce parcours commence par l'accélération des efforts de migration vers le nuage, le soutien aux télétravailleurs ou la préparation à la protection des données, les solutions d'analyse de fichiers peuvent contribuer à optimiser les données et les applications et à identifier, sécuriser et classer intelligemment les données. Les solutions d'analyse de fichiers peuvent également fournir des renseignements sur les données afin d'assurer la conformité et de permettre des migrations de données plus intelligentes.

Les solutions d'analyse de fichiers peuvent évoluer pour répondre aux besoins des charges de travail modernes actuelles et identifier les domaines où les données peuvent être optimisées et supprimées de manière justifiée, ce qui permet de réduire les coûts, d'améliorer l'efficacité et d'assurer la conformité. Les projets qui déploient l'analyse de fichiers nécessitent une grande rapidité pour suivre le rythme d'un environnement commercial en constante évolution. La rapidité, l'envergure et le délai de rentabilisation rapide sont essentiels pour maximiser la valeur de ces solutions.

Les solutions d'analyse de fichiers permettent d'accéder aux sources les plus courantes de données non structurées (sur place ou dans le nuage) afin d'évaluer les risques, d'identifier les données sensibles et de grande valeur, et de proposer des actions qui protègent, sécurisent et gouvernent les données tout au long de leur cycle de vie.

Comment l'analyse de fichiers contribue-t-elle à l'efficacité et à l'optimisation des données ?

L'efficacité et l'optimisation des données non structurées commencent par la compréhension des données dont vous disposez et de leur emplacement de stockage. Grâce à la cartographie des données, vous pouvez utiliser l'analyse de fichiers pour identifier l'emplacement de toutes vos données et repérer les « données dormantes » qui sont mal placées, orphelines, dupliquées, obsolètes ou insignifiantes. Les projets qui tirent parti de l'analyse de fichiers offrent un retour sur investissement plus rapide en supprimant ou en optimisant activement les données qui n'ont aucune valeur pour l'organisation.

Comment l'analyse des fichiers contribue-t-elle à l'atténuation des risques ?

Les solutions d'analyse de fichiers aident à atténuer les risques liés aux données en optimisant, protégeant et sécurisant les données identifiées lors de la phase d'analyse de contenu. Ça comprend :

  • Détection, gestion et traitement des données PII, PCI, PHI et IP.
  • Gérer le flux d'informations.
  • Gestion des données sensibles.
  • Nous assurons la protection de l'identité, la génération de rapports de métadonnées, la gestion des droits d'accès à l'identité, la protection des accès axée sur les données, les contrôles de politiques et les pistes d'audit.

Une fois l'optimisation des données terminée, les données sans valeur commerciale ne consomment plus d'espace de stockage. Seules les données à forte valeur ajoutée et activement utilisées par l'entreprise sont conservées.

Il est essentiel de comprendre les accès et les autorisations . Les solutions d'analyse de fichiers qui fournissent des outils de correction aident à s'assurer que des contrôles appropriés sont appliqués aux données pendant leur utilisation active. Certaines solutions incluent des protections supplémentaires, comme la possibilité de chiffrer les données au niveau du terminal afin d'en garantir une utilisation appropriée. Enfin, des solutions d'analyse de fichiers correctement déployées peuvent empêcher les utilisateurs de déplacer ou de supprimer des données sans en comprendre la finalité métier. Les solutions d'analyse de fichiers qui déploient un modèle de « gestion sur place » minimisent le risque de perturbation pour les utilisateurs professionnels.

Comment l'analyse des fichiers contribue-t-elle à la gouvernance et à la conformité ?

Le déploiement d'une solution d'analyse de fichiers peut aider à s'assurer que les bonnes données sont disponibles pour le bon utilisateur au bon moment. Elle aide les organisations à atteindre leurs objectifs réglementaires, juridiques et de gouvernance et de conformité internes en :

  • Fournir la gouvernance des métadonnées, la conservation légale, la mise en quarantaine et la découverte.
  • Optimisation des volumes de données.
  • Définir les autorisations appropriées.
  • Octroi d'accès basé sur les rôles.
  • Identifier les actifs de grande valeur.
  • Application des politiques de cycle de vie des données.

Comment l'analyse de fichiers contribue-t-elle à la conformité des renseignements personnels et à la protection des données ?

Les organisations sont engagées dans une course pour trouver, protéger et sécuriser les données personnelles (y compris les données des consommateurs, des citoyens et des employés). Cette tendance mondiale – qui comprend le RGPD (UE), le CCPA (Californie), le KVKK (Turquie), la PIPEDA (Canada) et le POPIA (Afrique du Sud) – a suscité un regain d’intérêt pour les solutions d’analyse de fichiers. En tirant parti des capacités d'analyse de contenu et des techniques de détection, les solutions d'analyse de fichiers sont idéales pour assurer la conformité et aider à répondre aux demandes des consommateurs ou aux demandes d'accès aux données des personnes concernées.

La préparation en matière de protection des données est un exemple de domaine où les solutions d'analyse de fichiers excellent. Il souligne également la nécessité d'un processus permettant d'identifier, d'indexer et de récupérer facilement les fichiers contenant des renseignements personnels identifiables.

Le processus de bout en bout devrait ressembler à ceci :

  1. Trouver les dépôts et identifier les fichiers.
  2. Extraire toutes les métadonnées et le contenu du fichier.
  3. Analysez le contenu et les métadonnées du fichier pour identifier des entités spécifiques ou classez le fichier en fonction de son contenu conceptuel.
  4. Sécurisez les données en appliquant des règles d'affaires basées sur les résultats de l'analyse afin d'assurer des niveaux d'accès appropriés et un traitement des données sensibles (c.-à-d. le chiffrement). Vous pouvez également appliquer une catégorie ou une classification pour faciliter la gestion du cycle de vie des actifs.

Qu'est-ce que la classification ou la catégorisation des fichiers ?

Les solutions d'analyse de fichiers utilisent des méthodes de classification simples basées sur des balises de métadonnées, des mots-clés ou des listes de termes. Certaines solutions exploitent la classification conceptuelle du contenu des fichiers et combinent ces méthodes avec des documents, des images ou des entités de données trouvés afin d'améliorer la précision de la catégorisation. D'autres solutions vont encore plus loin grâce à l'apprentissage machine et à l'apprentissage guidé à l'aide d'exemples de documents, ce qui vous permet de définir les classifications à utiliser.

Par exemple, un document de ressources humaines contenant des renseignements sur la santé ou l'assurance peut utiliser une politique de classification des données basée sur des données d'échantillon. Pour d'autres éléments, comme l'âge et l'emplacement, vous pouvez appliquer un score de risque et des autorisations supplémentaires afin de mieux définir la politique.

Comment l'analyse de fichiers assure-t-elle la gouvernance et la préservation des données ?

Les solutions d'analyse de fichiers offrent des fonctionnalités permettant aux organisations d'agir automatiquement sur leurs données, ainsi qu'un ensemble d'outils complets pour les aider à gouverner et à préserver ces données. Les solutions comprennent généralement les options suivantes, dictées par la gouvernance des données d'entreprise :

  • Supprimer les données. S'il n'est pas nécessaire de garder le fichier, supprimez-le. C'est trop vieux ? Est-ce un double ? Est-ce que ça ajoute de la valeur à l'entreprise ? Le consommateur a-t-il demandé la destruction de ses données ? Les solutions d'analyse de fichiers conservent une trace écrite de vos actions et de leurs raisons.
  • Sécuriser les données. Si vous devez conserver les données, alors sécurisez-les. Certaines solutions d'analyse de fichiers peuvent modifier les contrôles d'accès ou chiffrer les données. Une autre option est de le déplacer vers un endroit sûr, comme un outil de gestion des archives, pour une conservation à long terme.
  • Supprimer les données. Vous devrez peut-être conserver certaines données, mais pas les informations personnelles. Certaines solutions d'analyse de fichiers prennent en charge la rédaction afin de créer une copie propre du fichier original sans les renseignements personnels identifiables. Le fichier original est ensuite supprimé ou sécurisé tel que décrit ci-dessus.

Qu'est-ce que la « gestion sur place » ?

La gestion sur place est un concept clé de la gestion et de la gouvernance du cycle de vie des données. Voici comment les métadonnées (y compris l'emplacement, les autorisations et le contenu) sont analysées par la solution d'analyse de fichiers où elles se trouvent. L'objet lui-même n'est ni déplacé, ni copié, ni stocké dans un autre lieu ou zone de conservation pendant l'analyse.

Comprendre les grammaires des entités

Deux types de grammaires de découverte de données (ensembles de règles) sont utilisés pour décrire les entités que vous tentez d'identifier : les données sélectionnées et les données générées par l'utilisateur.

Les grammaires comprennent :

  • PII : Informations permettant d’identifier une personne, qui peuvent varier d’une région à l’autre (y compris le format, ce qui peut entraîner des faux positifs).
  • PHI : Renseignements personnels sur la santé, généralement associés au secteur de la santé nord-américain.
  • PCI : Renseignements personnels relatifs aux cartes de crédit.
  • PSI : Informations de sécurité personnelle, pour les clés d’accès aux détails du compte.

Recherchez des grammaires optimisées et sélectionnées, qui ne peuvent pas être modifiées par l'utilisateur. Ces grammaires utilisent le contexte et des points de repère pour des résultats plus précis et fournissent un « score de confiance » pour vous aider à filtrer les faux positifs. Le contexte et les points de repère peuvent être des phrases, des mots isolés ou des caractères individuels.

Le contexte est essentiel. Les solutions d'analyse de fichiers qui utilisent la proximité avec l'entité candidate et la force du contexte (basées sur des techniques de traitement automatique du langage naturel) contribuent aux scores de confiance. Vous pouvez obtenir des scores plus précis en exploitant des listes exhaustives d'entités, de pays ou de régions spécifiques.

Réglage et flexibilité. Si aucune de ces grammaires ne couvre votre cas d'utilisation spécifique, vous pouvez utiliser une solution d'analyse de fichiers permettant de créer des grammaires personnalisées. Ces grammaires sont généralement définies à l'aide d'expressions régulières descriptives de format ou de listes simples.

Quels sont les faux positifs ?

Par définition, un « faux positif » est un résultat de test qui indique incorrectement la présence d’une condition ou d’un attribut particulier1. Dans le cas des solutions d'analyse de fichiers, un faux positif indique une correspondance incorrecte entre un modèle, une règle grammaticale ou un mot-clé lors de l'analyse du contenu. Les solutions d'analyse de fichiers qui se contentent d'utiliser la correspondance de modèles ou de mots-clés présentent généralement des taux de faux positifs plus élevés que celles dotées de capacités d'analyse de contenu contextuelle.

Documents numérisés et enregistrements audio

Les solutions d'analyse de fichiers peuvent analyser les documents textuels pour identifier les risques, mais les renseignements personnels identifiables peuvent également se trouver dans d'autres formes de données. L'analyse de fichiers sur des documents numérisés, des conversations enregistrées et des enregistrements de vidéoconférences est une pratique de plus en plus courante. Certaines solutions d'analyse de fichiers peuvent traiter ces fichiers avant d'appliquer des techniques de découverte de données personnelles.

Les documents papier numérisés stockés sous forme d'images (dans un fichier PDF, par exemple) doivent être traités par reconnaissance optique de caractères (OCR) pour extraire le texte et, idéalement, les informations structurelles associées. De nombreuses organisations conservent dans leurs dossiers des copies numérisées de pièces d'identité, comme les permis de conduire ou les passeports de leurs employés.

Les solutions d'analyse de fichiers qui prennent en charge l'analyse d'enregistrements audio ou vidéo nécessitent un traitement par un moteur de transcription vocale capable de créer une transcription écrite pour l'analyse.

Avantages de l'analyse de contenu contextuelle pilotée par l'IA :

  • Améliore la précision et la détection des données sensibles et de grande valeur.
  • Réduit les faux positifs.
  • Augmente l'efficacité grâce à la catégorisation par IA et réduit l'intervention manuelle nécessaire à la classification des données.

Avantages des modèles de « gestion sur place » :

  • Les données sont faciles à trouver et se trouvent là où les utilisateurs finaux s'attendent à les trouver.
  • Réduit les risques de perte de données, de perte de productivité et de perturbations pour l'utilisateur final.
  • Augmente les coûts et la rapidité en éliminant le besoin de transférer des données sur le réseau ou vers le nuage pour les analyser.

Différences entre les solutions sur place et les solutions SaaS pour l'analyse de fichiers

Qu'est-ce qu'une solution SaaS d'analyse de fichiers ?

L'analyse de fichiers peut être offerte par le biais d'un logiciel en tant que service (SaaS), où le client consomme des services fournis par un fournisseur de sécurité d'applications moyennant des frais mensuels ou annuels. Cette approche ne nécessite ni l'acquisition de matériel ni les licences perpétuelles traditionnelles. Elle repose en partie ou en totalité sur le fournisseur SaaS (ou un fournisseur de services gérés dans certains cas) pour fournir l'accès à l'application afin de mener des analyses de contenu, des recherches, des actions de gouvernance et des analyses. Le SaaS offre un moyen simple de se lancer dans l'analyse de contenu et offre une grande évolutivité, une rapidité d'exécution et un retour sur investissement rapide. Selon l'emplacement de l'environnement d'hébergement SaaS, les questions de résidence et de souveraineté des données pourraient devoir être mises en balance avec les avantages commerciaux du SaaS.

Qu'est-ce qu'une solution d'analyse de fichiers sur place ?

Les solutions d'analyse de fichiers peuvent également être exécutées sur place et exploitées et entretenues par des équipes internes. Cette approche exige que les organisations fournissent l'infrastructure et le personnel nécessaires, et qu'elles acquièrent et gèrent des solutions de sécurité applicative. L'option « sur place » garantit aux organisations que les données de leurs applications ne sont pas partagées avec des tiers et ne quittent pas les locaux de l'entreprise. En règle générale, les solutions sur place sont vendues sous forme de licence perpétuelle. Plus récemment, les licences par abonnement ont été utilisées pour offrir une plus grande flexibilité dans la manière dont le logiciel est consommé et facturé.

OpenText fournit des outils d'analyse de fichiers

Suite d'analyse de fichiers Voltage OpenText™ une solution d'analyse de fichiers SaaS, permet aux organisations de réduire rapidement et efficacement les risques liés à l'information ; d'assurer la confidentialité des données ; et d'analyser, d'optimiser et de sécuriser l'accès des employés aux données critiques qui pilotent et protègent l'entreprise. Notre solution assure la gestion du cycle de vie des données et la gouvernance de l'accès aux données tout en atténuant les risques associés à la gestion des données sensibles. L'analyse de fichiers assure également la gouvernance des identités et des accès, une visibilité complète des données, une réduction des coûts de stockage, des analyses exploitables qui améliorent l'efficacité et la qualité des données. De plus, il assure la conformité en matière de protection des données tout en abordant la gouvernance des actifs de grande valeur (par exemple, les contrats, la propriété intellectuelle, les brevets, etc.) et des données sensibles (par exemple, les données personnelles/PII, PCI, PHI, etc.).

OpenText ™ File Reporter inventorie les systèmes de fichiers réseau et fournit les informations détaillées sur le stockage des fichiers dont vous avez besoin pour optimiser et sécuriser votre réseau afin d'assurer son efficacité et sa conformité. Il vous permet d'identifier les risques d'accès lorsque vous découvrez et analysez les fichiers et les permissions associés aux données stockées dans toute votre entreprise. Conçu pour la création de rapports sur les systèmes de fichiers d'entreprise, File Reporter recueille des données parmi les millions de fichiers et de dossiers éparpillés sur les différents périphériques de stockage réseau qui composent votre réseau. Des options flexibles de rapport, de filtrage et d'interrogation permettent ensuite d'obtenir les résultats précis dont vous avez besoin pour démontrer la conformité ou prendre des mesures correctives.

OpenText™ File Dynamics offre des services complets pour répondre aux besoins croissants de la gestion des données réseau. Les politiques basées sur l'identité automatisent les tâches traditionnellement effectuées manuellement, ce qui permet de réaliser des économies et de s'assurer que les tâches sont correctement exécutées. Les politiques axées sur les objectifs assurent la protection contre les accès non autorisés, ainsi que la migration et le nettoyage des données. File Dynamics protège également contre la corruption des données et les interruptions de service grâce à une sauvegarde en temps réel des cibles de grande valeur, permettant une récupération rapide des fichiers et de leurs autorisations associées. File Dynamics fournit les restrictions d'accès basées sur les rôles, la correction, l'atténuation des risques et la gestion proactive nécessaires à la conformité aux réglementations en matière de gestion des données.

OpenText ™ ControlPoint est une solution d'analyse de fichiers qui exploite l'intelligence artificielle OpenText ™ Knowledge Discovery pour l'analyse de données non structurées. Il permet aux organisations d'identifier et de classer automatiquement les données sensibles (par exemple, les données personnelles identifiables, les données de santé protégées), de nettoyer les données héritées et de découvrir les risques cachés dans les données dormantes non gérées dans les référentiels de messagerie, les partages de fichiers, les sites SharePoint et les référentiels infonuagiques (comme Office365, Google Drive et Dropbox). ControlPoint permet également aux organisations de réaliser des économies sur leurs coûts de stockage en réduisant les données redondantes, obsolètes et triviales. Cela permet un meilleur accès aux informations précieuses et assure la préservation des données grâce à l'application de politiques qui facilitent la gestion du cycle de vie des données, la conformité réglementaire et la sécurité des données.

Analyse de fichiers

Commencez dès aujourd'hui.

Demander une démonstration

Comment pouvons-nous vous aider?

Notes de bas de page