频 道 直 达 - 新闻 - 读书 - 培训 - 教程 - 前沿 - 组网 - 系统应用 - 安全 - 编程 - 存储 - 操作系统 - 数据库 - 服务器 - 专题 - 产品 - 案例库 - 技术圈 - 博客 - BBS
51CTO.COM_中国领先的IT技术网站
找资料:

SQL Server 2008集成服务详解(1)

作者: 戴羽 出处:IT专家网 2008-04-23 09:07    砖    好    评论   进入论坛
阅读提示:这篇文章讨论了依赖于数据集成技术的业务要提供有用的、可靠的信息来维护在现今世界中的竞争优势所要面临的挑战。它讨论了SQL Server 2008集成服务(SSIS)可以怎样帮助信息技术部门达到他们公司的数据集成要求。文章中包含真实案例。

将公共数据转化为有意义的、可用的信息是现今商业世界中最重要的竞争优势来源了。将数据显示得更易于理解以及找到未来的方向已经变成全球企业的企业信息技术部门最大的挑战之一了。有三个与数据集成相关的大分类:

• 技术挑战

• 公司问题

• 经济挑战

在这篇文章里,我们将详细地探讨这些挑战,并讨论怎样使用Microsoft SQL Server 2008集成服务(SSIS)来解决它们。首先,你应该在真实环境中查看下这些问题。

1.1 一个真实场景

一个大型的全球运输公司使用它的数据仓库来分析它操作的性能以及来预测它预定运输的可能变化。

1.2 数据源

公司的主要数据来源包括从它的基于DB2订单登陆系统而来得的订单数据、从它基于SQL Server的客户关系管理系统(CRM)而来的客户数据、以及从它基于Oracle的ERP系统而来的零售数据。除了从这些主要系统而来的数据之外,你可以将跟踪“特别”事件的电子数据表数据合并到数据仓库里,这些数据是由船运管理员手动输入的。目前,你可以合并延时地从多种来源的文本文件获得的外部数据,例如天气信息、交通状况、和销售细节(对于转包合同的运输)。

1.3 数据消耗

不只是这些数据来源不同,消费者在他们的需求和地理位置方面也是不同的。这个多样性导致了本地系统的扩张。信息技术部门的一个主要作用是至少为它的客户数据建立一个“真实的单一版本”。

1.4 数据集成要求

由于数据、商业需求和用户要求的多样性,信息技术部门制定了下面的数据集成要求:

• 它们必须提供从内部和外部数据源集成获得的可靠而一致的历史和最新数据。

• 为了降低数据获取方面的延迟,从供应商和零售商处获得的数据必须可以通过Web services 或一些其它的直接机制——例如FTP——来获得。

• 它们需要清理和删除重复数据,否则就加强数据质量。

• 逐渐增加的全球调整性
2、 数据集成的挑战

某一层面上,在我们实际场景中数据集成的问题是非常简单的。从多个数据源获取数据、清理和转化数据、并将这些数据加载进适当的数据存储以用于分析和生成报表。不幸的是,在一个典型的数据仓库或商业智能项目中,企业在数据集成方面花费了60–80%的可用资源。为什么它这么困难呢?

2.1 技术挑战

技术挑战始于源系统。我们正从在事务上收集数据(用户提交以获得、购买或获取某些东西)转移到在事务之前收集数据(使用像Web点击或RFID标签之类的机制跟踪客户意愿)。现在数据不只是通过传统的源和格式获得——例如数据库和文本文件,还逐渐地可从多种不同的格式(从私有文件到Microsoft Office文档到基于XML文档)以及从基于网络来源——例如Web services和RSS流中获得。最相关的挑战是:

• 不同格式的多种来源。

• 结构化的,半结构化的,以及非结构化的数据。

• 从不同来源系统而来的数据到达的时间不同。

• 数据量巨大。

在理想情况下,不管你怎样管理以获得一次所需的所有数据,都会要面临新的挑战,包括:

• 数据质量。

• 使用不同的数据格式。

• 将数据转换为业务分析可用的格式。

假设你可以神奇地获得你需要的所有数据,并且你可以将这些数据清理、转化并匹配成一个有用的格式。还有另一种从传统数据移动和集成的方法。那就是从固定长度的面向批量处理转到可变长度和更短的按需处理。大多数公司在用户没有对系统有大需求的“当机”期间执行面向批量处理。这通常是在晚上认为没有人在办公室的时候,执行一个预定义的批量窗口,大概要6-8小时。随着全球商业的规模和类型的不断增加,这不再成为可能了。现在全球有些地方几乎没有当机时间,而且办公室里总是有人。

所以你需要:

• 要尽快将数据加载的要求越来越高。

• 需要同时加载多目的地。

• 多样的目的地。

你不只需要实现所有这些结果,你还需要尽快地完成。在某些极端情况下,例如在线业务,你必须连续地集成数据。它没有真正的批量窗口,而且延迟时间不能超过几分钟。在许多这样的情况下,制定决策过程就会自动地使用连续运行的软件。

可扩展性和性能变得越来越重要,因为你面临着不能容忍任何当机的商业需求。

没有正确的技术,系统要求几乎存储进仓库和集成过程中的每一步都要分级。因为不同的数据源需要包含进提取、转换和加载(ETL)过程中,而且更复杂的操作(例如数据和文本挖掘)需要执行于数据,所以数据分级的要求越来越高了。正如图1中所显示的,随着分级的增加,“结束循环”(例如分析、对新数据执行操作)所耗费的时间也随之增加了。这些传统的ELT架构(相对于在加载之前进行的增值ETL处理)极大限制了系统响应不断出现的商业需求。


图1

图1

最后,当你需要应用程序集成的实时事务型技术以及面向批处理的大型数据集成技术来解决企业的商业问题时,关于数据集成是怎样紧密地绑定到公司的整个集成架构中去的问题就更为重要了。

2.2 公司挑战

在大型公司里,数据集成有两个大问题,就是“力量”挑战以及“舒适区域”挑战。

2.2.1 力量挑战

数据就是力量,并且通常很难使人们将数据看作公司的真实有价共享资产。要成功地进行企业数据集成,那么所有的多数据源所有者必须了解这个项目的目的和发展方向。缺乏相关部分的协作是数据集成项目失败的一个主要原因。行政赞助、构建共识和具有几个资金管理人的强大数据集成团队是可以帮助解决问题的一些成功关键因素。


共5页: 1 [2] [3] [4] [5] 下一页
【内容导航】
专题
SQL Server 2008/2005全解
Sun以10亿美元并购开源数据库厂商MySQL
甲骨文Oracle 11g正式发布
Oracle数据库开发之PL/SQL基础应用
Oracle数据库开发基础教程
我也说两句

匿名发表

(如果看不清请点击图片进行更换)


中 国 领 先 的 IT 技 术 网 站 ·
技 术 成 就 梦 想
·SQL Server入门到精通 (查看103155次)
·SQL Server 2008/2005全解 (查看85292次)
·Oracle数据库开发指南 (查看44318次)
·Oracle SQL 内置函数大全 (查看40689次)
·MySQL数据库备份 (查看39265次)
订阅技术快讯
电子杂志下载
名称:SQL Server数据库管理精品黄皮书
简介:书中文章经过精挑细选,便于用户能根据自己的实际工作和学习,快速在本书寻找到相关资料。内容涵盖了SQL Server的安装与升级、语句查询、数据备份和恢复、自动化任务、数据同步、数据字典、安全和预防、性能和优化、集群等各方面应用信息,以及DBA管理人员在数据库管理工作中
名称:2007路由技术大全
简介:《2007路由技术大全》由51CTO.com网站特别策划制作,该书包括路由器技术、路由器产品、路由器配置、安全设置、路由器故障处理、路由器密码恢复,以及广大网友在实践使用中的心得经验和技巧文章,内容注重实用性,适用于初学者入门,也适合多年从业者提高,是一本实践和理论完
名称:网络安全精品应用黄皮书
简介:《2007精品网络安全黄皮书》包括了9个大类24个小类, 800余篇文章,内容包含了熊猫烧香病毒、DDOS攻击、ARP病等热点问题的介绍及解决方案。从病毒查杀、防范、系统、数据等各方面的安全设置到黑客技术的了解、防范,涉及到了安全应用的全部领域, 由浅至深内容全面。
Linux——从菜鸟到高手
Linux——从菜鸟..
数据恢复指南
数据恢复指南
交换机故障解决指南
交换机故障解决指..
· 交换机故障解决指南
· OSPF路由协议专栏
· 勇闯IT培训黑色围城
· 见证中国网络安全二十年
· 技术人求职简历完备手册
· 华为员工自杀频频拷问..
· 视频访谈:网管员如何踏..
· 首届中国IT工程师生态..
· 思科全球CEO钱伯斯第七..
· 北漂技术人90天求职纪实
· 2007年互联网大会
· 龙芯要做中国的“奔腾”
· IPv6协议--拓展网络无..
· 国际文档格式标准开战
· 微软出价446亿美元收购..
· 贝恩资本携手华为22亿..
ARP攻击防范与解决方案
ARP攻击防范与解..
iSCSI应用与发展
iSCSI应用与发展
SQL Server 2008/2005全解
SQL Server 2008/..
· SQL Server 2008/2005..
· SOA 面向服务架构
· SQL Server 2008/2005..
· iSCSI应用与发展
· RAID——磁盘阵列基础
· 中间件应用技术专题
· SQL Server入门到精通
· 国际文档格式标准开战
· 路由器设置与口令恢复
· Linux防火墙
· 打造安全服务器
· SOA 面向服务架构
· PHP开发应用手册
· ADSL应用面面俱到
· 入侵防护系统(IPS)初探
· 数据恢复指南
ARP攻击防范与解决方案
ARP攻击防范与解..
SQL Server 2008/2005全解
SQL Server 2008/..
iSCSI应用与发展
iSCSI应用与发展
· iSCSI应用与发展
· 中间件应用技术专题
· SQL Server入门到精通
· SQL Server 2008/2005..
· SOA 面向服务架构
· iSCSI应用与发展
· RAID——磁盘阵列基础
· 数据恢复指南
· 路由器设置与口令恢复
· SOA 面向服务架构
· 了解统一威胁管理(UTM)..
· ADSL应用面面俱到
· ADSL应用面面俱到
· PHP开发应用手册
· 中间件应用技术专题
· 交换机故障解决指南