18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 信息时代 > 中国石油数据仓库(数据库)

中国石油数据仓库(数据库)

时间:2022-12-08 00:30:01 | 来源:信息时代

时间:2022-12-08 00:30:01 来源:信息时代

    中国石油数据仓库 : 中国石油企业建立的一个集成、共享的企业级的数据仓库系统。它能集成异构数据源,按主题组织数据,对数据进行、提取、清洗、转换、规格化和质量控制,保存历史数据,发挥其价值,为企业提供多维数据分析与信息分析、数据挖掘与知识发现和动态查询及报告生成工具,为管理层提供及时有效的决策信息。
中国石油企业作为综合性特大型企业,业务领域多、信息量大,应用系统、数据库系统和服务器型号的不同导致数据类型多、结构不同、版本不统一,使信息共享成为难题。基于传统数据库的信息系统是一种操作型环境,不能进行数据分析和用于管理决策。为加快业务领域的信息化建设,中国石油于2000年11月制定了 《中国石油信息技术总体规划》(简称总体规划),提出了以石油数据仓库建设为中心的IT实施项目和解决方案。总体规划中的项目包括7条主线,共34个IT项目,基本勾画出中国石油未来几年IT和信息化发展的蓝图。IT总体规划包括以下项目:
(1)上游项目应用系统: 包括地球科学与钻井、上游生产系统、管道生产系统、地理信息系统。
(2)下游项目应用系统:包括炼油与化工运行系统、先进计划系统、CRM客户服务系统、加油站服务系统。
(3) ERP系统:包括ERP选型、勘探与生产ERP、天然气与管道ERP、炼油与化工ERP、销售与市场ERP、总部ERP、质量安全环境ERP。
(4) 电子商务: 包括电子采购、电子市场。
(5)管理信息系统:包括数据仓库、企业信息门户。
(6)基础实施改进项目: 包括企业广域网改造、局域网标准制定、电子邮件服务、数据中心标准化、办公自动化、企业系统管理、灾难恢复计划、Internet网接入改造。
(7) IT组织改造项目: 包括建立IT信息职能部门、建立帮助热线、制定安全标准、信息技术共享服务中心、信息技术专家小组。
按总体规划,中国石油数据仓库自2002年以来已分别实施了 《地球科学与钻井信息系统》、《石油上游生产系统》、《科技管理信息系统》、《石油管道生产系统》、《石油炼化运行系统》、《加油站管理系统》和《石油企业资源计划ERP系统》等项目建设,同时还开展了《广域网技术改造》 《石油财务系统》等项目。目前,中国石油数据仓库的用户可采用B/S或C/S方式,使用OLAP等多维分析工具得到财务、统计、生产过程、销售等方面的分析结果,并能按多维图像、综合报表等多种形式展现出来,同时还可采用数据挖掘技术获取有用信息为管理层做出战略决策。中国石油在IT建设上的这一重大战略举措,在于加快公司的发展,全面提升公司的价值,成为有竞争能力的跨国石油公司。
中国石油数据仓库采用分布式结构,并按二级层次构成。即总公司为一级数据仓库,其中包括中国石油KPI分析等; 各业务单元为二级数据集市,包括勘探生产分析、炼油与化工生产分析、市场分析、天然气与管道分析、财务与统计分析等六个数据集市。数据仓库与数据集市间采用了操作数据存储(operational data store,ODS)的逻辑构架方案。ODS是一种新型数据仓库结构,这是介于操作型和分析型之间的数据处理环境。ODS作为一个中间层次,既可进行全局联机操作型处理OLAP,同时它又是面向主题的、集成的数据环境,适合于辅助企业完成OLAP数据分析和管理决策。
中国石油数据仓库建设采用中国石油统一的数据规范与标准,所有数据按专业组织、统一验证,并按主题建立和集成到中国石油数据仓库。整个系统在基于TCP/IP和FTP协议的中国石油企业网下运行。数据仓库中的数据模型是多维数据模型,用于OLAP信息分析、数据挖掘、动态查询和报表制作。它与中国石油的企业门户(EIP)互联,支持信息分析与决策。中国石油数据仓库具有数据抽取、转换、清洗、加载(ETL)工具,联机分析工具OLAP,数据挖掘工具,报表生成工具等。其硬件系统包括数据仓库服务器(UNIX系统)、ODS数据服务器(UNIX系统)、数据集市服务器(UNIX系统)、大容量存储系统、报表服务器(NT系统)等。图1为按照中国石油数据仓库解决方案建立和实现的油田勘探开发数据仓库的总体结构示意图。


图1 油田勘探开发数据仓库的总体结构


大庆油田勘探开发数据仓库采用Oracle8i作为底层DBMS。Oracle8i在性能、资源管理、分析能力、鲁棒性以及伸缩性等方面都能满足建立数据仓库的需求,并易于与其他系统进行集成。Oracle8i作为多用户的DBMS,具有响应时间快、运行效率高、容错性强、系统性能可靠,能够存储大容量数据等优点。在建立油田勘探开发数据仓库时,大庆油田研制了数据仓库建立工具。该工具具有数据仓库模型构造和设计,数据的抽取、转换和加载,元数据管理,分析工具的整合等管理功能模块。
大庆油田勘探开发数据仓库的建立流程包括仓库定义、仓库生成及仓库管理三个阶段。定义阶段的主要任务是: ①根据主题确定相关的数据源、建立数据仓库的数据模型,定义维表和事实表; ②源数据的检查和整理(包括数据清洗等);③从源数据到数据仓库的映射。由于大庆油田勘探开发数据仓库的主要数据源来自各勘探部门和采油厂,数据量十分庞大,为此采用了多重粒度的分布式数据仓库结构。分布式指油田勘探开发的最新数据和细节数据存放在各勘探部门和采油厂的计算机中;多重粒度是指在每一维中都可以进行重新划分,这一点决定了数据仓库能否进行数据钻取和基于概化的挖掘,也决定数据仓库的性能和满足用户需求的程度。
在数据仓库的生成阶段,采用了面向对象(OO)及基于分布式的组件对象技术来实现配置数据仓库对象的属性。在管理阶段,数据加载十分关键,而元数据管理的质量和效率也直接影响数据仓库的可用性,为此专门开发了数据抽取、转换和加载工具。

74
73
25
news

版权所有© 亿企邦 1997-2022 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭