OpenText 首頁。
技術主題

什麼是檔案分析?

以問號為重點的 IT 項目說明

概述

檔案分析可透過映射資料位置並識別誰可存取哪些資料 (包括檔案共用、電子郵件資料庫、企業檔案同步與共用、記錄管理、企業內容管理、Microsoft SharePoint 及資料歸檔),協助組織處理不斷增加的資料量。

檔案分析解決方案可分析、索引、搜尋、追蹤及報告檔案元資料與內容。這可讓組織檢視和組織詳細的元資料和上下文資訊,改善 PII 監督和資訊治理,並更有效率地管理非結構化資料。

檔案分析解決方案也能保護非結構化資料,並確保其安全性。組織可針對內容分析做出更好的決策,同時降低與資料相關的風險和成本。這些解決方案有助於確保資料安全性、生命週期管理、資料存取治理、映射和分類,同時啟用關鍵資料洞察力和分析,以推動和保護業務。這些關鍵功能可協助組織解決數位轉型使用個案,以降低風險、治理與法規遵循、效率與最佳化,以及資料洞察力。

檔案分析

為什麼要進行檔案分析?

組織面臨業務轉型的壓力與日俱增。無論這段旅程的起點是加速遷移至雲端、支援遠端員工,或是為資料隱私做準備,檔案分析解決方案都能協助優化資料和應用程式,並智慧地識別、保護和分類資料。檔案分析解決方案也能提供跨資料的洞察力,以確保合規性,並實現更智慧的資料遷移。

檔案分析解決方案可擴充以符合現今工作負載的需求,並找出可最佳化及防禦性刪除資料的區域 - 降低成本、提高效率並確保合規性。部署檔案分析的專案需要快速跟上瞬息萬變的商業環境。要從這些解決方案中獲得最大的價值,速度、規模和快速實現價值的時間是不可或缺的。

檔案分析解決方案可存取最常見的非結構化資料來源 (內部部署或雲端),以評估風險、識別敏感及高價值資料,並提供在資料生命週期內保護、保全及管理資料的行動。

檔案分析如何協助資料效率與最佳化?

非結構化資料的資料效率與最佳化始於瞭解您擁有哪些資料以及這些資料的儲存位置。透過資料映射,您可以使用檔案分析來找出所有資料的位置,並找出錯置、孤兒、重複、過時或瑣碎的「黑暗資料」。透過主動刪除或優化對組織無價值的資料,利用檔案分析的專案可提供更快的投資回報。

檔案分析如何協助降低風險?

檔案分析解決方案透過優化、保護和保障在內容分析階段發現的資料,協助降低資料風險。這包括

  • 偵測、管理及處理 PII、PCI、PHI 及 IP。
  • 管理資訊流通。
  • 處理敏感資料。
  • 提供身分保護、元資料報告、身分存取權限、以資料為中心的存取保護、政策控制及稽核追蹤。

資料最佳化完成後,任何無商業價值的資料都不再消耗資料儲存空間。只有高價值且為企業所積極使用的資料才會保留。

瞭解存取權限是必要的。提供修復工具的檔案分析解決方案,有助於確保資料在使用中時,能受到適當的控制。有些解決方案包含額外的保護功能,例如在端點加密資料,以確保正確使用。最後,適當部署的檔案分析解決方案可以防止使用者在不瞭解其商業目的的情況下移動或刪除資料。部署「就地管理」模式的檔案分析解決方案可將業務使用者受到干擾的風險降至最低。

檔案分析如何協助管理與法規遵循?

部署檔案分析解決方案有助於確保在正確的時間向正確的使用者提供正確的資料。它可透過以下方式協助組織達到法規、法律及內部治理與合規目標:

  • 提供元資料管理、法律保留、檢疫及發現。
  • 優化資料量。
  • 管理適當的權限。
  • 授予基於角色的存取權。
  • 識別高價值資產。
  • 應用資料生命週期政策。

檔案分析如何協助 PII 資料和資料隱私權的遵循?

各機構都在競相尋找、保護和保障個人資料 (包括消費者、公民和員工資料)。這個全球趨勢 - 包括 GDPR (歐盟)、CCPA (加州)、KVKK (土耳其)、PIPEDA (加拿大) 和 POPIA (南非) - 為檔案分析解決方案帶來了新的關注。透過利用內容分析功能和偵測技術,檔案分析解決方案是確保合規性和協助回應消費者要求或資料當事人存取要求的理想選擇。

資料隱私防護是檔案分析解決方案發揮其優勢的範例。它也強調需要一個可以輕鬆識別、編入索引和擷取 PII 檔案的程序。

端對端流程應該是這樣的:

  1. 尋找儲存庫並識別檔案。
  2. 從檔案中擷取所有元資料和內容。
  3. 針對特定實體分析檔案內容和元資料,或根據概念內容對檔案進行分類。
  4. 根據分析結果套用業務規則,以確保適當的存取層級和敏感資料處理(即加密),從而保障資料安全。您也可以套用類別或分類,以協助管理資產的生命週期。

何謂檔案分類或分類?

檔案分析解決方案使用基於元資料標籤、關鍵字或術語清單的簡單分類方法。有些解決方案利用檔案內容的概念分類,並將這些方法與找到的文件、影像或資料實體結合,以提高分類的精確度。其他解決方案則更進一步,使用範例文件進行機器學習和指導學習,讓您能夠定義要使用的分類。

例如,包含健康或保險資訊的人力資源文件可以使用基於樣本資料的資料分類政策。對於其他元素,例如年齡和地點,您可以套用風險評分和其他權限來進一步定義政策。

檔案分析如何提供資料管理和資料保存?

檔案分析解決方案提供協助組織自動對資料採取行動的功能,以及協助管理和保存資料的豐富工具集。解決方案通常包括以下選項,由企業資料管理驅動:

  • 刪除資料。如果不需要保留檔案,請將其移除。是不是太老了?是否重複?它能為企業提供任何價值嗎?消費者是否要求銷毀其資料?檔案分析解決方案會保留稽核記錄,記錄您所做的事及原因。
  • 保護資料。如果您需要保留資料,那就保護好它。有些檔案分析解決方案可以變更存取控制或加密資料。另一個選擇是將其移至安全的位置,例如記錄管理工具,以便長期保存。
  • 刪除資料。您可能需要保留部分資料,但不需要保留 PII。某些檔案分析解決方案支援刪除功能,可建立原始檔案的乾淨副本,但不包含 PII 內容。然後,原始檔案會如上所述被刪除或保護。

何謂「就地管理」?

就地管理是資料生命週期管理與治理的重要概念。元資料(包括位置、權限和內容)所在的檔案分析解決方案會「如何」分析元資料。在分析過程中,實際物件不會被移動、複製或儲存在其他位置或保存區域。

瞭解實體的語法

有兩種基本類型的資料發現語法 (規則集) 用來描述您要識別的實體:策劃的和使用者產生的。

語法包括

  • PII:可識別個人身分的資訊,不同地區的資訊可能不同(包括格式,可能造成誤判)。
  • 個人健康資訊 (PHI):個人健康資訊,通常與北美健康產業有關。
  • PCI:個人信用卡資訊。
  • PSI:個人安全資訊,用於帳戶詳細資料存取鑰匙。

尋找經過策劃和最佳化的語法,使用者無法修改。這些語法會使用上下文和地標以獲得更精確的結果,並提供「信心分數」以協助您篩選出錯誤的結果。上下文和地標可以是短語、單字或個別字元。

上下文是關鍵。檔案分析解決方案會使用與候選實體的接近程度以及上下文的強度 (以自然語言處理技術為基礎) 來貢獻信心分數。您可以利用特定實體、國家或地區的綜合清單,獲得更仔細的評分。

調音與彈性。如果這些語法都無法涵蓋您的特定使用個案,您可以使用允許建立自訂語法的檔案分析解決方案。這些語法通常是使用格式描述的 RegX 或簡單的清單來定義的。

什麼是誤判?

根據定義,「假陽性」是指檢測結果不正確顯示存在特定條件或屬性1。就檔案分析解決方案而言,假陽性表示在內容分析過程中錯誤辨識的模式、語法或關鍵字匹配。純粹使用模式或關鍵字比對的檔案分析解決方案,其誤報率通常高於具備情境感知內容分析功能的解決方案。

掃描文件和錄音

檔案分析解決方案可以分析以文字為基礎的文件以偵測風險,但 PII 也可能存在於其他形式的資料中。對掃描的文件、錄製的對話和視訊會議錄影進行檔案分析正變得越來越普遍。某些檔案分析解決方案可以在應用 PII 發現技術之前處理這些檔案。

以影像形式儲存的掃描紙張文件(例如 PDF 檔案內)應使用光學字元識別 (OCR) 處理,以擷取文字,最好還能擷取相關的結構資訊。許多機構都會記錄掃描的身份證明文件,例如員工的駕照或護照。

支援分析音訊或視訊錄製的檔案分析解決方案需要由語音轉文字引擎進行處理,以建立書面謄本供分析之用。

情境、AI 驅動內容分析的優點:

  • 提高敏感和高價值資料的精確度和偵測能力。
  • 減少誤報。
  • 透過 AI 訓練的分類提高效率,並減少資料分類所需的手動介入。

就地管理 "模式的優點:

  • 資料很容易找到,而且在終端使用者期望的位置。
  • 降低資料遺失、生產力損失和終端使用者中斷的威脅。
  • 無需透過網路或雲端傳輸資料以進行分析,可節省成本並提高速度。

內部部署與 SaaS 解決方案在檔案分析方面的差異

什麼是檔案分析 SaaS 解決方案?

檔案分析可透過軟體即服務 (SaaS) 的方式提供,客戶只需支付月費或年費,即可使用應用程式安全供應商提供的服務。此方法不需要採購硬體或傳統的永久授權。它部分或完全依賴 SaaS 供應商 (或在某些情況下依賴管理服務供應商) 提供對應用程式的存取,以便進行內容分析、搜尋、治理行動和分析。SaaS 提供了一種簡單的方式來開始內容分析,並提供高擴充能力、速度和快速的價值實現時間。根據 SaaS 主機環境的位置,可能需要在 SaaS 的商業效益與資料居住權和資料主權問題之間進行權衡。

什麼是內部部署的檔案分析解決方案?

檔案分析解決方案也可以在內部執行,並由內部團隊操作與維護。此方法需要組織提供基礎架構和人員,並取得和管理應用程式安全解決方案。On-premises 可確保組織不會與第三方共用應用程式資料,也不會離開組織。一般而言,企業內部解決方案是以永久授權的方式銷售。最近,訂閱授權的使用方式更為靈活,讓軟體的使用和計費方式更具彈性。

OpenText 提供檔案分析工具

Voltage File Analysis Suite by OpenText™ SaaS 檔案分析解決方案可讓組織快速有效地降低資訊風險;確保資料隱私;以及分析、優化和保障員工存取重要資料的安全,以推動和保護業務。我們的解決方案可確保資料生命週期管理和資料存取治理,同時降低與管理敏感資料相關的風險。File Analysis 還提供身分與存取治理、完整的資料可視性、降低儲存成本、可提高效率的行動分析,以及資料品質。此外,它還支援資料隱私合規性,同時處理高價值資產 (如合約、智慧財產、專利等) 和敏感資料 (如 PI/PII、PCI、PHI 等) 的管理。

OpenText™ File Reporter可清查網路檔案系統,並提供您所需的詳細檔案儲存情報,以最佳化和保護您的網路,從而提高效率和合規性。當您發現和分析儲存於整個企業的資料的檔案和相關權限時,它能讓您識別存取風險。File Reporter 專為企業檔案系統報告而設計,可收集散佈在構成網路的各種網路儲存裝置中的數百萬個檔案和資料夾的資料。靈活的報告、過濾和查詢選項可呈現您所需的確切結果,以證明符合規定或採取矯正措施。

OpenText™ File Dynamics提供廣泛的服務,以滿足不斷擴展的網路資料管理需求。 身份驅動政策將傳統上需要手動完成的任務自動化,從而節省成本並確保任務正確執行。目標驅動的政策可防止未經授權的存取,以及資料遷移和清理。File Dynamics 還可透過高價值目標的近線儲存備份,防止資料損毀和停機,從而快速復原檔案及其相關權限。File Dynamics 提供符合資料管理法規所需的角色存取限制、修復、風險減緩和主動管理。

OpenText™ ControlPoint是一個檔案分析解決方案,利用 OpenText™ Knowledge Discovery 人工智慧進行非結構化資料分析。它可讓組織識別敏感資料(例如 PII、PCI、PHI)並自動分類;清理遺留資料;以及揭露隱藏在電子郵件儲存庫、檔案共用、SharePoint 網站和雲端儲存庫(例如 Office365、Google Drive 和 Dropbox)中未受管理的隱晦資料的風險。ControlPoint 還可讓組織減少多餘、過時和瑣碎的資料,從而節省儲存成本。這可提供更佳的寶貴資訊存取,並透過應用政策來協助資料生命週期管理、法規遵循及資料安全,以強化資料保存。

檔案分析

立即開始。

索取示範

我們能如何幫助您?

註腳