数据仓库概述

在当今快节奏的商业环境中,组织越来越多地转向基于云的技术来进行简单的数据收集、报告和分析。这就是数据仓库作为商业智能的关键组成部分发挥作用的地方,它使企业能够提高其性能。重要的是要理解数据仓库是什么以及它为何在全球市场中出现。

数据仓库定义

数据仓库可以被定义为组织的数据收集和从外部来源提取的信息。数据定期从各种内部应用程序(如销售、市场营销和财务)、客户交互应用程序以及外部合作伙伴计划中提取。这些数据后来被数据科学家用来进行分析和预测。

关键数据库特征

数据仓库的主要特征如下:

数据库以主题为中心,因为它提供了关于主题的更智能的信息,而不是完整的业务流程。这些主题可能是市场营销、促销、术语表等。例如,如果想分析公司的销售额数据,需要构建一个专注于销售的销售数据库。这样的仓库可以提供重要信息,如“去年最佳客户是谁?”或“明年最佳客户可能是谁?”

数据仓库是通过将来自不同来源的数据组合成一个单一格式来开发的。数据应该以安全和普遍接受的名称、格式和编码存储在仓库中。这有助于有效分析数据。

一旦数据存储在数据库中,就必须保持不变。所有数据都是只读的。在输入当前数据时,不会删除先前的数据。这有助于分析发生了什么以及何时发生。

存储在数据库中的数据是分时写的,明确或隐含。数据仓库中时间差异的一个例子是主键,它必须有时间因素,如天、周或月。

数据库与数据仓库

尽管数据仓库和普通网站有一些相似之处,但它们不应该被视为相同的概念。最大的区别在于,网站上的数据收集用于许多交易目的。然而,在数据仓库中,数据是大规模收集用于分析的。数据库提供实时数据,而档案存储的数据将通过主要的分析查询访问。

数据仓库架构

通常,仓库数据的架构由三阶段结构组成。

子类别或数据仓库服务器通常代表相关的网站系统。后台工具用于在此层中清理、转换和提供数据。

中间部分代表OLAP服务器,可以以两种方式使用。

ROLAP或关系OLAP模型是扩展的网站管理系统,它将多组件数据处理显示为标准交互过程。

MOLAP或OLAP多维直接在多维数据和功能上工作。

这是前端客户端界面,从数据存储中接收数据。包含各种工具,如问卷、分析工具、报告工具和数据挖掘工具。

数据仓库的工作方式

数据存储将从多个来源收集的数据和信息合并到一个完整的数据库中。例如,数据库可能包括来自组织营销计划的客户信息、其电子邮件列表、网站和评论卡。它还可能包括有关员工、薪资信息等的机密信息。企业使用这些数据仓库的部分来分析客户。

数据挖掘是数据仓库的一个特征,包括查看大量数据中的合理数据模式,并创建新策略以增加销售和利润。

数据仓库类型

1. 企业数据仓库(EDW)

这种类型的仓库作为主要或中间网站运营,为整个业务提供决策支持服务。这种类型的档案的优势在于,它提供了各种组织的信息访问,提供了数据表示的一致方法,并允许处理复杂问题。

2. 操作数据存储(ODS)

这种类型的数据仓库实时更新。它通常被优先用于例行任务,如保持员工记录。当数据存储系统不支持业务报告要求时需要。

3. 数据集市

数据集市是数据存储的子集,旨在照顾特定部门、地区或业务单位。每个业务部门都有一个中央数据库或数据集市用于存储。数据库中的数据不时存储在ODS中。ODS然后将数据发送到EDW,在那里存储和使用。

数据仓库示例

让看看一些公司如何将数据仓库作为日常运营的不可分割的一部分。

投资和保险公司主要使用数据仓库来分析客户和市场趋势以及集成数据模式。在外汇和股票市场的子行业中,数据存储发挥着重要作用,因为一个点的差异可能导致整个板块的重大损失。

营销链使用数据仓库进行市场营销和分销,以跟踪商品、评估定价政策和分析客户购买趋势。它们使用商业智能数据和预测要求的仓库模型。

另一方面,医疗保健公司使用数据仓库概念来创建医疗报告、与保险公司和研究及医疗单位共享数据。医疗系统严重依赖商业数据档案,因为它们需要最新的、更新的医疗信息来挽救生命。

数据仓库工具

想知道什么是数据仓库工具?这些是用于在更广泛的数据集上执行多项任务的软件组件。这些工具有助于从各种来源收集、读取、写入和传输数据。数据仓库支持什么?它们被设计用来支持数据过滤、筛选、合并等任务。

仓库应用程序可以分为:

查询和报告工具

应用开发工具

数据挖掘工具

OLAP工具

其他流行的数据存储工具包括Xplenty、Amazon Redshift、Teradata、Oracle 12c、Informatica、IBM Infosphere、Cloudera和Panoply。

想知道为什么企业需要数据保留?然而,数据仓库对最终用户有一些好处。

改善数据兼容性

更好的业务决策

方便最终用户访问业务数据

更好的数据文档

降低计算机成本和高生产力

使最终用户能够提出即席查询或报告,而不会中断应用程序

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485