浅谈零售业数据仓库的建立及数据分析

时间:2022-10-24 11:05:04 来源:网友投稿

摘 要 本文简要介绍了数据仓库以及OLAP技术在零售业销售系统中的应用。主要集中于数据仓库的概念和多维分析方法。在对销售数据进行多维建模和多维分析的探讨中,主要利用了SQL Server 2005 分析服务器和商业智能开发平台。在本文内容的后一部分还提到了使用Microsoft Excel的数据透视功能对多维模型进行多种形式的可视化前端展示。使读者能够对如何结合数据仓库和OLAP技术开发切合方案的销售数据分析系统以及浏览和分析数据的方法有所了解。

关键词 零售业;数据仓库;OLAP;SQL Server2005

中图分类号TP311文献标识码A文章编号 1674-6708(2010)30-0077-02

Elementary Introduction on the data warehousing and data analysis in retail

Abstract This paper introduces the application of data warehousing and OLAP technology in the retail sales info-system, with the emphasis on the concept of data warehousing and methods of multi-dimensional analysis. In the process of the multi-dimensional modeling and analysis to sales data, we mainly use SQL Server 2005 Analysis Service and business intelligence development platform. In the latter part of this paper, we also mention the capabilities of Microsoft Excel"s PivotTable to achieve the visual desktop OLAP of multi-dimensional models in various forms. All of the above make our readers have a brief understanding upon how to develop a data analysis system in sales and upon methods for browsing and analyzing data.

Keywordsretail sales;data warehouse, OLAP;SQLServer2005,SSAS;multi-dimensional modeling;Excel

随着企业对数据管理不断提出新的要求和计算机技术的飞速发展,人们要求计算机在处理日常简单数据的同时,能够更多地参与数据分析和决策支持,由此出现了一种用于数据分析处理和决策支持的数据存储和组织技术——数据仓库技术。William H. Inmon首先将数据仓库定义为:“一个面向主题的、集成的、随时间变换的、非易失性数据的集合,用于支持管理层的决策过程”。目前该技术已成功用于电信、银行、税收、零售业中。

零售业是任何一个处于从事由生产者到消费者的产品营销活动的个人或公司,他们从批发商、中间商或者制造商处购买商品,并直接销售给消费者。高科技在产品开发、商品策划、销售预测、货源采购和精确定价等各个环节的应用已经成为经营者们不可缺少的决策依据。而支持众多决策的是其中的数据仓库技术。

为了更好地对企业销售情况进行数据分析和决策支持,数据仓库和OLAP技术应用于销售数据分析中。数据仓库和联机分析处理(OLAP)是决策支持系统的有机组成部分。数据仓库从现有的信息系统中提取有用数据,并对所提取的数据进行预处理,为决策分析提供所需数据。OLAP 则利用存储在数据仓库中的多维数据完成各种分析操作,它利用多维数据集和数据聚集技术对数据仓库中的数据进行组织和汇总,用联机分析和可视化工具对这些数据进行评价,并以直观易懂的形式将分析结果返回给决策分析人员。为了使用户达到从多个角度多个细节分析数据的目的,OLAP的多维分析过程很必要,具体是指采用切片、切块、旋转和钻探等基本操作,对多维形式组织的数据进行深入的研究。数据仓库中不是存放每个销售事物的细节,而是存放每个部门每类商品的汇总数据,或对较高层次的汇总数据。OLAP提供数据仓库中汇总数据的多视图和动态视图能力,又为成功的数据挖掘奠定了坚实的基础。

零售业中的数据仓库与数据分析可从以下几个方面具体实施:1)基于数据挖掘的数据仓库的设计与构造:由于零售数据覆盖面广,所以有许多设计数据仓库的方式。所包含的细节级别可以变化很大;2)销售、顾客、产品、时间和地区的多维分析:零售业需要的是实时的信息,因此,提供强有力的多维分析和可视化工具是是十分重要的一件事,这包括提供根据数据分析的需要构成复杂的数据立方体视图。特征数据立方体在零售数据分析中是一种有用的数据结构,因为它方便了带有复杂条件的聚集上的分析;3)促销活动的有效分析:零售商经常通过广告和各种折扣和让利的方式搞促销活动,以达到促销产品的目的。认真分析促销活动的有效性,有助于提高企业利润。多维分析可满足这方面分析的要求,方法是通过比较促销期间的销售量和交易数量与促销活动前后的有关情况;4)购买推荐和商品参照:通过从销售记录中挖掘关联信息可用于形成一定的购买推荐,购买推荐可在Web、每周传单或收据上宣传,以便改进服务,帮助顾客选择商品,增加销售额。

支持数据仓库技术的数据库管理系统平台有Oracle、SQL Server等。SQL Server 2005在商业智能方面提供了三大服务和一个工具来实现系统的整合。三大服务是SQL Server 2005 Analysis Services(SSAS )、SQL Server 2005 Integration Services(SSIS)和SQL Server 2005 Reporting Services (SSRS),一个工具是 Business Intelligence Development Studio。它具有以下完善的功能以支持数据仓库的开发:

1 多维数据集

可以在多台服务器间分散多维数据集数据以提供更大的存储容量,创建链接的多维数据集以便在不复制多维数据集数据的情况下分散最终用户对信息的访问,创建在数据更改时实时更新的多维数据集,以及使用很多其它新特性创建可满足特定业务需要的多维数据集。

2 强大的维度功能

Analysis Services 为多维分析提供了强大的维度功能,包括对建立虚拟维度、父子维度、共享维度的支持,支持自定义公式和维度的筛选。

3 多维分析

通过Analysis Services,可以对多维数据集进行旋转、切块、切片、上钻和下钻等多维分析。

4 数据挖掘

Analysis Services 提供了两种用于数据挖掘的数学模型,即决策树模型和聚类分析模型。提供了友好的用户界面向导、对话框和编辑器,并且能够把MDX 应用到数据挖掘中,增强数据挖掘功能。

5 维护OLAP数据

Analysis Services 的目的是提供对数据仓库数据的快速分析访问。为达到这一目的,Analysis Services 通过数据仓库事实数据表和维度表中的数据创建多维数据集。在多维数据集的创建过程中,数字度量值也被汇总为预聚合的值。多维数据集存储在为快速响应查询而设计的多维结构中,将预聚合的信息与原始事实数据合并以响应各种查询。

SSAS通过以下五步能够建立起一个数据仓库:1)创建新的Analysis Services项目; 2)定义数据源; 3)定义数据源视图;4)定义多维数据集及其属性;5)部署多维数据集。在抽取事实数据值和维度值从而创建数据仓库的基础之上,建立多维数据集和多维数据集的维度。

在创建好多维数据集之后根据所需设置维度属性,定义用户友好属性。在Analysis Service平台上实现多维数据的浏览和分析。在多维数据集的设计器中提供了浏览器功能,用以实现对多维数据集的浏览和分析。多维数据集浏览器由多维数据集的多个维度和度量值组成网格,筛选维度显示在浏览器的上方。使用多维数据集浏览器,可以用不同的方式浏览和分析数据:可以筛选出可见的维度数据量,可以深化以看到数据的细节,还可以浅化以看到较为概括的数据。

电子表格(如Excel)对OLAP来说依然是最引人注目的前端客户工具供我们使用。通过连接数据源,在Excel表格中出现空白数据透视表,填充数据并进行数据分析。此外还可以生成数据透视图,从而能够更加形象、直观地对数据进行分析,通过观察和分析某种趋势达到总结和预测销售数据的目的。

推荐访问:浅谈 零售业 数据仓库 建立 分析