频 道 直 达 - 新闻 - 读书 - 培训 - 教程 - 前沿 - 组网 - 系统应用 - 安全 - 编程 - 存储 - 操作系统 - 数据库 - 服务器 - 专题 - 产品 - 案例库 - 技术圈 - 博客 - BBS
51CTO.COM_中国领先的IT技术网站
找资料:

Oracle Warehouse Builder 自动化ETL处理过程(1)

作者: cyw 出处:IT专家网 2008-05-16 10:47    砖    好    评论   进入论坛
阅读提示:本文将和大家一起探讨如何用OWB构建一个自动化的ETL处理过程。在假设你已经安装了OWB的前提下,下面会图文并茂逐步为大家讲解构建的过程。

甲骨文公司有很多功能强大但受关注程度较低的产品,Warehouse Builder(简称OWB)就是其中之一。就像甲骨文旗下其他的几个非关系数据库管理系统产品一样,OWB刚开始的版本用起来都让人感觉很不顺手,例如用户界面不够友好,经常出现错误,不易于安装和使用等等。不过,在最近的几个版本,OWB已经逐渐完善,成为一款高性能多功能的应用软件,让用户能够获得超凡的体验。

本文将和大家一起探讨如何用OWB构建一个自动化的ETL处理过程。在假设你已经安装了OWB的前提下,下面会图文并茂逐步为大家讲解构建的过程。

背景知识

Oracle Warehouse Builder,常简称为OWB,能够将无格式结构的平面文件(flat file)加载到数据库的过程自动化。许多数据库管理员对SQL*Loader工具和shell脚本的混合使用非常熟悉,再加上在各个不同的地方进行一些cron配置就可以完成数据加载的过程。OWB也能够完成这样的任务(而且还有更多的功能),通过提供一个向导驱动兼备大量断点和观查点提示及点击功能的图形用户界面来完成这一过程。通过其“设计中心”和“控制中心”界面,用户可以设计并部署ETL过程(本文重点关注其中的加载过程,也就是将分隔数值的平面文件内容加载到一个表,而且在加载的过程中数据不发生改变)。此外,ETL的部署不局限于你当前正在工作的服务器,OWB让你能够在一台服务器上设计ETL过程,然后将设计的步骤部署到另一台服务器上,如果你想要,还可以部署到更多的服务器上。

这个操作背后的整个程序是怎样一个概念呢?我们来看看要完成整个操作需要进行的步骤,也许能够帮你理清大概的框架:

1. 指定源文件,包括文件所在位置及其性质。

2. 创建一个外部表,作为数据字典的存储器。

3. 确认数据库中“真实”表,如有需要创建该表。

4. 在有计划的基础上进行整个过程,或一次性完成整个处理过程。

OWB对这个过程的处理方法是利用与这些对象相关的元数据(metadata),通过设计映射和进程流(也称为过程流)来绑定他们。事实上,可以将进程流作为一个可视化假象进行创建,也就是说,OWB实际所使用的工作流只是OWB生成的一个进程流模式图,不过这个模式图足以当作工作流来使用。

把这个过程的每一部分都当作一个对象来考虑:文件、文件的位置、外部表、真实表、将flat文件映射到外部表的过程、最后运行的作业等等。所有的这些都是对象,而这些对象都可以通过层级和依赖性将这些对象绑定起来。每个对象类型都存在一个模块当中。由于这个工具是基于Java语言的,所以面向对象的设计是可行的。一般来说,每个对象都是一个实例或者是通过某种方法实例化的对象。

过程

一个典型的ETL过程模式包括在循环的基础上加载一个平面文件(你也可以只执行其中的映射部分)。如果你将该过程分解为涉及项目树不同部分的若干步骤,那么就很容易搞清楚整个任务了。一个项目的开始,首先需要在Oracle下创建一个一个模块。提示大家,要记住几乎每一个类别都涉及到相同的两个步骤:创建模块和导入元数据。而且抽样并不总是基于同一个表。

共4页: 1 [2] [3] [4] 下一页
【内容导航】
专题
汶川大地震 IT技术人为同胞生命祈福
2007年IT技术人员最喜爱的图书奖
十大正在慢慢死去的IT技术
甲骨文85亿美元收购BEA
甲骨文Oracle 11g正式发布
我也说两句

匿名发表

(如果看不清请点击图片进行更换)


中 国 领 先 的 IT 技 术 网 站 ·
技 术 成 就 梦 想
·SQL Server入门到精通 (查看108212次)
·SQL Server 2008/2005全解 (查看88829次)
·Oracle数据库开发指南 (查看45435次)
·Oracle SQL 内置函数大全 (查看41855次)
·MySQL数据库备份 (查看41425次)
订阅技术快讯
电子杂志下载
名称:SQL Server数据库管理精品黄皮书
简介:书中文章经过精挑细选,便于用户能根据自己的实际工作和学习,快速在本书寻找到相关资料。内容涵盖了SQL Server的安装与升级、语句查询、数据备份和恢复、自动化任务、数据同步、数据字典、安全和预防、性能和优化、集群等各方面应用信息,以及DBA管理人员在数据库管理工作中
名称:2007路由技术大全
简介:《2007路由技术大全》由51CTO.com网站特别策划制作,该书包括路由器技术、路由器产品、路由器配置、安全设置、路由器故障处理、路由器密码恢复,以及广大网友在实践使用中的心得经验和技巧文章,内容注重实用性,适用于初学者入门,也适合多年从业者提高,是一本实践和理论完
名称:网络安全精品应用黄皮书
简介:《2007精品网络安全黄皮书》包括了9个大类24个小类, 800余篇文章,内容包含了熊猫烧香病毒、DDOS攻击、ARP病等热点问题的介绍及解决方案。从病毒查杀、防范、系统、数据等各方面的安全设置到黑客技术的了解、防范,涉及到了安全应用的全部领域, 由浅至深内容全面。
汶川大地震 IT技术人为同胞生命祈福
汶川大地震 IT技..
Vista SP1对决XP SP3
Vista SP1对决XP ..
IPv6协议--拓展网络无限空间
IPv6协议--拓展网..
· IPv6协议--拓展网络无..
· 全面解析35岁技术人的..
· 勇闯IT培训黑色围城
· 二手仿冒设备与思科再..
· 网络故障排除宝典
· 访问控制列表(ACL)介绍
· 视频访谈:网管员如何踏..
· 首届中国IT工程师生态..
· 华为路由器配置
· 企业数据恢复指南
· 龙芯要做中国的“奔腾”
· 2008年上半年全国软考..
· 交换机故障解决指南
· LAMP技术精解
· 微软出价446亿美元收购..
· AIX操作系统管理应用(..
ARP攻击防范与解决方案
ARP攻击防范与解..
iSCSI应用与发展
iSCSI应用与发展
SQL Server 2008/2005全解
SQL Server 2008/..
· SQL Server 2008/2005..
· SOA 面向服务架构
· SQL Server 2008/2005..
· iSCSI应用与发展
· RAID——磁盘阵列基础
· Apache技术专题
· 三层交换技术专题
· SQL Server入门到精通
· Apache技术专题
· 国际文档格式标准开战
· 路由器设置与口令恢复
· 打造安全服务器
· PHP开发应用手册
· SOA 面向服务架构
· 企业数据恢复指南
· ADSL应用面面俱到
ARP攻击防范与解决方案
ARP攻击防范与解..
SQL Server 2008/2005全解
SQL Server 2008/..
iSCSI应用与发展
iSCSI应用与发展
· iSCSI应用与发展
· SQL Server入门到精通
· SQL Server 2008/2005..
· SOA 面向服务架构
· Apache技术专题
· iSCSI应用与发展
· 三层交换技术专题
· Apache技术专题
· 企业数据恢复指南
· RAID——磁盘阵列基础
· 路由器设置与口令恢复
· SOA 面向服务架构
· ADSL应用面面俱到
· ADSL应用面面俱到
· 反垃圾邮件技术应用
· 访问控制列表(ACL)介绍