OpenText 主页。
技术主题

什么是数据仓库?

以问号为重点的信息技术项目图示

概述

数据仓库是一个中央存储库,旨在存储、组织和分析来自多个来源的大量数据。

它旨在支持商业智能、报告和高级分析,使组织能够做出更快、更明智的决策。无论是分析客户行为、预测库存还是跟踪财务业绩,数据仓库都能为您提供可靠的基础。

数据仓库

数据仓库在现代企业中的重要性

现代企业依赖数据仓库来统一孤立的数据,并提供准确、及时的见解。

与为日常运营而建立的传统数据库不同,数据仓库针对复杂查询、长期趋势分析以及跨部门和跨系统的高速报告进行了优化。

企业会从 ERP 系统、客户关系管理、物联网设备、电子商务平台以及市场信息和社交媒体等外部来源生成大量数据。如果没有一个集中的方法来收集和组织这些数据,那么这些数据就仍然是零散的、不一致的和未得到充分利用的。

设计精良的现代数据仓库不仅能将报告时间从数天缩短到数秒,还能提供帮助:

  • 打破各业务部门之间的数据孤岛
  • 加快从历史数据和实时数据中获得洞察力
  • 实现对可信数据的安全、受控访问
  • 支持遵守行业和地区法规

数据仓库的主要优势

在数据仓库中集中进行分析的公司可以看到明显的改进:对 TB 级数据的查询速度更快,人工对账更少,多个业务部门对关键绩效指标的信心更高。

  • 集中访问:整合来自不同系统和应用的数据。
  • 更快的性能:为复杂的大规模分析优化查询速度。
  • 准确的报告:将历史数据用于可信的指标和关键绩效指标。
  • 提高数据质量:执行验证、清理和转换规则。
  • 可扩展的决策:利用自助工具增强业务用户和分析师的能力。

数据仓库架构说明

每个分析流程都要经过五个核心层--处理、暂存、存储、查询和管理。了解每个层有助于准确定位减速、控制成本和提高查询准确性。

  • 数据摄取: 从源系统中提取、转换和加载(ETL/ELT)或加载-转换-加载数据。
  • 存储层:将数据组织到为分析优化的模式中。
  • 元数据管理:跟踪数据来源、背景和结构。
  • 查询层:与商业智能工具、应用程序接口或 SQL 引擎的接口。
  • 治理& 安全:控制访问、合规性和可审计性。

数据仓库的类型

正确的数据仓库类型取决于您需要多快地访问数据、谁在使用数据以及数据仓库为哪些决策提供支持。从集中式长期分析到快速运营报告或部门级视图,每种模式都支持不同的优先事项。

  • 企业数据仓库(EDW):跨业务部门的集中式集成存储库。
  • 运行数据存储(ODS):更灵活的存储库,可满足短期或接近实时的需求。
  • 数据集市:数据仓库的子集,为个别部门或使用案例量身定制。

数据仓库中的模式

模式定义了查询数据的结构。正确的选择会影响速度、存储效率和报告的便捷性。

  • 星形模式: 中央事实表与维度表相连,简单快捷。
  • 雪花模式: 规范化维度表可减少冗余,但会增加查询复杂性。
  • 银河模式: 有多个事实表共享维度表的模式,通常用于处理相互关联的业务流程。

您可以根据业务需求提高查询性能、加强数据分析、简化数据管理并获得灵活性。


数据仓库与数据库:有什么区别?

传统数据库处理实时交易和操作数据,而数据仓库则专门用于分析大量历史数据。了解两者的区别有助于团队为性能、规模和洞察力选择合适的平台。

特点 传统数据库 数据仓库
目的 日常交易(OLTP) 历史分析(OLAP)
数据量 较低 更高
查询复杂性 简单 复杂、多源
更新频率 恒定 定期
用户 业务团队 分析师、决策者

数据仓库、数据湖还是湖居?

决定权在于结构性和灵活性。仓库擅长管理、可重复的分析;湖泊提供原始数据自由;湖泊仓库旨在兼顾两者。

  • 数据仓库:用于分析的结构化数据。
  • 数据湖:原始、非结构化或半结构化数据,具有灵活性。
  • 湖畔小屋:结合两种模式的混合方法。

数据仓库的主要用例

从客户终身价值分析到预测供应链延误,数据仓库为分析提供了动力,从而推动实现可衡量的业务成果。

  • 客户分析:跨渠道跟踪行为、保留率和流失率
  • 销售& 营销:根据营销归因调整管道绩效
  • 财务:分析 P&L、预算、预测和合规性
  • 供应链:预测中断并优化采购
  • 运营:通过对资产和流程的深入了解提高效率

了解 GUESS 如何 使用 OpenText™ Analytics Database (Vertica),将 查询速度提高 400 倍 ,从 3 TB 扩展到 36 TB,并使全球 80% 名员工具备洞察力。


云、混合和现代部署趋势

云原生仓库按需扩展,混合设置兼顾安全性和灵活性,多云战略优化合规性和弹性。

  • 云原生平台可轻松扩展并支持实时摄取。
  • 混合部署结合了内部部署系统和云分析技术。
  • 多云架构可实现区域合规性和工作负载平衡。

如何选择合适的数据仓库

绘制当前数据源、增长预测和查询需求图。最佳选择是在不降低性能的情况下,将数据和用户数量扩展到 10-100 倍。

  • 部署模式:内部部署、云或混合部署。
  • 性能要求:并发用户、查询速度、正常运行时间。
  • 数据量:可扩展性和存储格式(列式与行式)。
  • 安全性和合规性:加密、用户角色、数据主权。
  • 集成:与商业智能工具、应用程序接口、数据源的兼容性。

OpenText 如何帮助您利用数据仓库的优势?

数据仓库的价值在于它所提供的洞察力,而这取决于数据的速度、可访问性和可信度。OpenText Analytics Database 将企业级性能与内置管理和高级分析功能相结合,可帮助您最大限度地发挥这些优势。

使用 OpenText,您可以

  • 缩短洞察时间--高性能查询执行意味着分析师可以在数秒内而不是数小时内对数十亿条记录运行复杂的报告。
  • 更快地打破孤岛- 与多种数据源(包括传统系统、应用程序接口和云平台)无缝集成,确保您的仓库反映出完整、最新的业务视图。
  • 维护可信数据--嵌入式数据质量、脉络跟踪和验证工作流程有助于确保每项决策都基于准确、经过验证的信息。
  • 在不降低性能的情况下进行扩展- 弹性扩展可支持不断增长的工作负载、更高的用户并发性和更大的数据集,而不会降低查询速度。
  • 实现高级分析- 内置人工智能、机器学习和预测建模功能,使团队能够从描述性洞察转变为规范性洞察。
  • 保持合规性和安全性- 企业级加密、访问控制和审计日志可保护敏感数据并支持监管要求。
  • 灵活部署- 根据您的需求或架构,您可以选择内部部署、混合部署或私有云部署。

通过将数据仓库与OpenText 的分析和管理工具相结合,您不仅可以获得一个存储和组织数据的平台,还可以将其转化为战略资产,随时推动可衡量的业务成果。

云遣返的转变:数据告诉我们什么

200 多位 IT 领导者正在重新考虑数据仓库的纯云战略--选择内部部署、私有云或混合部署,以重新获得性能、成本效益和控制权。

获取指南

我们能提供什么帮助?

脚注