18新利最新登入数据集成的工作原理

对于普通人来说,信息技术(IT)是一个充满18luck手机登录不可破译的神秘宇宙编程语言和昂贵的硬件。偷听IT技术人员的谈话几乎就像偷听一场外语对话。但是,尽管存在这种看似不可逾越的语言障碍,但对于企业和组织的决策者来说,理解it世界是至关重要的。最重要的IT概念之一是数据集成

从表面上看,数据集成听起来像是一个简单的想法。因为许多组织将信息存储在多个18luck手机登录数据库在美国,他们需要一种方法来从不同的来源检索数据,并以统一的方式将其组装起来。例如,让我们想象一家电子公司正准备推出一种新的移动设备。的市场营销Department可能希望从销售部门数据库检索客户信息,并将其与产品部门的信息进行比18luck手机登录较,以创建目标销售列表。一个好的数据集成系统可以让营销部门以统一的方式查看来自两个来源的信息,去掉任何不适用于搜索的信息。18luck手机登录

广告

实际上,数据集成是一门复杂的学科。数据集成没有通用的方法,IT专家使用的许多技术仍在不断发展。对于组织来说,某些数据集成方法可能比其他方法效果更好,这取决于组织的需求。我们将仔细研究IT专家用于集成多个数据源并进入数据库管理领域的一些通用策略。

数据集成的基础是什么?在下一节中找到答案。

广告

数据集成基础

这个简单的表格显示了客户的购买情况。18新利最新登入"width=
这个简单的表格显示了客户的购买情况。18新利最新登入
18新利最新登入HowStuffWorks.com

数据集成主要集中在数据库.数据库是有组织的数据集合。它类似于a文件系统,这是一种文件的组织结构,因此它们很容易找到、访问和操作。

对数据库进行分类有不同的方法。有些人喜欢根据数据库存储的数据类型对它们进行分类。例如,如果存储在其中的所有信息都包含在视频或媒体数据库中,则可以将数据库分类为媒体数据库18luck手机登录声音文件

广告

另一种分类方法着眼于数据库如何组织数据。18新利最新登入数据库的组织安排称为模式.一个常见的组织技巧是使用以显示不18新利最新登入同数据点之间的关系。表格就像电子表格。列定义数据的类别,而行定义数据的类别记录.使用这种方法的数据库是关系数据库

面向对象编程OOP)数据库采用不同的方法组织数据。OOP语言背离了传统的编程方法,后者遵循将数据插入一组指令,然后产生输出的模式。相反,OOP语言侧重于将数据定义为对象然后确定不同物体之间的关系和相互作用。18新利最新登入

要创建OOP数据库,首先要定义计划存储在数据库中的所有对象。然后,定义数据库中每个对象与其他对象的关联方式。在你确定一个对象之后,你把它放进一个,或一组对象。要定义一个类,您必须确定该类中的每个对象必须具有哪些数据以及哪些数据逻辑序列,称为方法,会影响到那些对象。系统中的对象可以通过调用接口与您或其他对象通信消息

举个例子更容易理解。假设您正在构建一个包含美国体育信息的数据库。18luck手机登录您决定从定义棒球队开始。一旦创建了棒球队的定义,就可以将其泛化为数据库中的类。亚特兰大勇士将是该类的一个特定实例,也称为对象。这个班级的棒球队属于a超类美国运动队的课程,也包括其他课程,比如足球而且足球团队。

要访问数据库中的信息18luck手机登录(无论它如何组织数据),可以使用18新利最新登入查询.查询只是对信息的请求。18luck手机登录人员和应用程序可以向数据库提交查询。数据库通过发送符合原始请求参数的数据来响应查询。查询依赖于特殊的计算机语言,例如结构化查询语言SQL).如果您曾经使用过互联网搜索引擎,那么您已经提交了一个查询—您的搜索词。

此视图仅显示与查询“购18新利最新登入买超过100美元产品的客户”相关的数据。"width=
此视图仅显示与查询“购18新利最新登入买超过100美元产品的客户”相关的数据。
18新利最新登入HowStuffWorks.com

数据库通过创建对象来响应查询视图的数据。视图是显示数据的一种特定方式。在数据集成系统中,返回的视图只显示与原始查询直接相关的数据。18新利最新登入在我们的表格示例中,如果你提交了一个查询,要求所有购买价值超过100美元产品的客户,你会得到这样的结果:

此视图仅显示与查询“购18新利最新登入买超过100美元产品的客户”相关的数据。注意,它没有显示购买了什么类型的产品,也没有显示18新利最新登入购买了少于100美元产品的客户。

数据集成有哪些不同的方法?在下一节中找到答案。

广告

数据集成方法

根据前面的部分,您可能认为数据库相当复杂。这是一个合理的假设,它有助于解释为什么数据集成已经有30多年的历史,但它仍然是一个发展中的学科。数据集成的目标是从不同的来源收集数据,将其组合并以一种似乎是统一整体的方式呈现。

假设你要出门旅行,在决定走哪条路线出城之前,你想看看交通状况。下面是不同的数18新利最新登入据集成方法如何处理您的查询。

广告

手动集成这种方法会把所有的工作都留给你。首先,您必须知道在哪里查找数据。您需要知道交通报告和数据的物理位置地图为了你的小镇。您需要直接从各自的数据库中检索交通报告和地图数据,然后将这两组数据相互比较,以确定出城的最佳路线。

如果你使用常用用户界面接近时,你需要少做一点功。您可以使用诸如万维网之类的界面进行查询。查询结果将以视图的形式显示在接口上。您仍然需要将交通报告与地图进行比较,以确定最佳路线,但至少接口将负责定位和检索数据。

一些集成方法依赖于应用程序为你做所有的工作。这些应用程序是专门的电脑程序会为你定位,检索和整合信息。18luck手机登录在集成过程中,应用程序必须操作数据,以便来自一个源的信息与来自另一个源的信息兼容。18luck手机登录在我们的示例中,这意味着您将向应用程序提交一个查询,应用程序将呈现一个视图,该视图将您所在城镇的地图与来自交通报告的数据相结合。这种方法的问题是,随着数据源和格式数量的增加,应用程序变得复杂且难以编程。

然后是常用数据存储方法,也被称为数据仓库.使用此方法,来自您打算集成的各种数据库的所有数据都是提取改变了而且加载.这意味着数据仓库首先从各个数据源提取所有数据。然后,数据仓库将所有数据转换为通用格式,以便一组数据与另一组数据兼容。然后它将这些新数据加载到自己的数据库中。当您提交查询时,数据仓库将定位数据,检索数据,并在集成视图中将其呈现给您。在我们的示例中,数据仓库将定位关于您所在城镇的交通报告和地图的最新信息。18luck手机登录然后它会将两者整合在一起并将视图发回给你。这个系统有几个优点和缺点,我们将在下一节中讨论。

大多数数据集成系统设计人员认为,最终目标是为最终用户创建尽可能少的工作,因此他们倾向于关注应用程序和数据仓库技术。

数据仓库到底是做什么的?在下一节中找到答案。

广告

数据仓库

正如我们前面所看到的,数据仓库是存储来自其他数据库的信息的数据库18luck手机登录数据库使用通用格式。这是描述数据仓库时所能描述的最具体的内容。没有统一的定义来规定什么是数据仓库,或者设计师应该如何构建它们。18新利最新登入因此,有几种不同的方法来创建数据仓库,一个数据仓库的外观和行为可能与另一个数据仓库非常不同。

通常,对数据仓库的查询只需要很少的时间来解析。这是因为数据仓库已经完成了提取、转换和组合数据的主要工作。数据仓库的用户端称为数据仓库前端因此,从前端的角度来看,数据仓库是获得集成数据的有效方法。

广告

后端视角,这是另一回事。数据库管理人员必须对数据仓库系统进行大量思考,以使其有效和高效。将从不同来源收集的数据转换为通用格式可能特别困难。系统需要一致的方法来描述和编码数据。

仓库必须有一个足够大的数据库来存储从多个来源收集的数据。一些数据仓库包含一个额外的步骤,称为数据集市.数据仓库接管了聚合数据的职责,而数据集市通过从仓库检索和组合适当的数据来响应用户查询。

数据仓库的一个问题是其中的信息并不总是最新的。18luck手机登录这是因为数据仓库的工作方式——它们定期从其他数据库中提取信息。18luck手机登录如果这些数据库中的数据在提取之间发生了变化,那么对数据仓库的查询将不会得到最新和最准确的视图。如果系统中的数据很少变化,这不是什么大问题。然而,对于其他应用程序,这是有问题的。

回到我们之前关于交通报告的例子地图,你可以看到这将是一个多么大18新利最新登入的问题。虽然城镇的地图可能不需要频繁更新,但交通状况可能会在相对较短的时间内发生巨大变化。数据仓库可能不会非常频繁地提取数据,这意味着对时间敏感的信息可能不可靠。18luck手机登录对于这类应用程序,最好采用不同的数据集成方法。

数据仓库的替代方案是什么?在下一节中找到答案。

广告

网络数据库

对于依赖于频繁变化的信息的数据集成系统,数据仓库方法并不理想。18luck手机登录IT专家试图解决这个问题的一种方法是设计直接从各个数据源提取数据的系统。由于没有专门用于分析、分类和集成数据以准备用户查询的集中式数据库,因此这些责任落到了系统的其他部分。

IT专家根据以下方面定义数据集成系统图式.从处理过的查询生成的统一视图是全球模式.不同数据源的结构以及它们彼此关联的方式是源模式.全局模式和源模式相互关联的方式被调用映射.可以将源模式看作是蓝图对于系统内的所有数据,而全局模式是响应查询时所呈现的视图的蓝图。

广告

在数据集成系统中有两种主要的解决查询的方法:global-as-view而且local-as-view.每种方法都侧重于整个系统的特定部分,并有其优点和缺点。

在全局即视图方法中,重点是全局模式。只要数据源保持一致,全局视图方法就能很好地工作。更改全局模式的设置很容易。这意味着用不同的方式分析同一组数据并不难。18新利最新登入但是,向系统中添加或删除数据源是有问题的,因为这会影响整个系统中的数据。

local-as-view技术采用了相反的方法。它主要关注数据源。只要全局模式保持不变,就很容易向系统添加或删除数据源。该模式在新数据源中查找相同类型的数据和关系。在这种方法中,更改全局模式的参数是困难的。如果希望以一种新的方式分析数据源,则必须重新定义整个系统。

这就是关于数据集成的故事。下次当您查看天气图或调出经过筛选的数据时,您将意识到后台正在进行的一系列复杂过程使这一切成为可能。

要了解关于数据集成的更多信息,请转到下一页上的链接。

广告

常见问题解答

数据集成的过程是怎样的?
数据集成是将来自多个来源的数据组合到单个数据库或数据仓库中的过程。该过程通常包括从多个数据源提取数据,将数据转换为通用格式,并将数据加载到目标数据库中。
数据集成的目的是什么?
数据集成是将来自多个源的数据组合到单个存储库中的过程。数据集成的目的是提供可用于报告和分析的单一、统一的数据视图。

更多信息18luck手机登录

相关文章

更多优质链接

  • 詹姆斯·R·鲍德温。《数据仓库:概述》1997年春季。http://varietysoftworks.com/jbaldwin/Education/CS615-DataWarehouse.html
  • 哈斯,劳拉,琳,艾琳。“IBM联邦数据库技术。”IBM。2002年3月1日http://www-128.ibm.com/developerworks/db2/library/techarticle/0203haas/0203haas.html
  • Halevy, Alon Y.等。企业信息集成:成功、挑战18luck手机登录和争议数据管理国际会议。2005。
  • 科赫,克里斯托弗。针对多个不断发展的自治模式的数据集成博士论文。维也纳技术大学。2001年5月16日http://www.csd.uoc.gr/~hy562/Papers/thesis_final.pdf
  • Lenzerini,莫里吉奥。数据集成:理论视角罗马大学。ACM豆荚。2002.http://delivery.acm.org/10.1145/550000/543644/p233-lenzerini.pdf?key1=543644&key2=8368337021&coll=&dl=&CFID=15151515&CFTOKEN=6184618
  • 理查德·波杰。“简单地说,就是财政部和IT部门的整合。”2003年9月1日。http://www.allbusiness.com/management/channel-management/659425-1.html
  • SearchDataManagement。http://searchdatamanagement.techtarget.com/home/0,289692,sid91,00.html
  • 辛格,Munindar P。“因特网计算实用手册。”CRC出版社2005年出版。
  • 数据仓库信息中心。18luck手机登录http://www.dwinfocenter.org/
  • 齐格勒,帕特里克和迪特里奇,克劳斯R。“三十年的数据集成——所有问题都解决了?”苏黎世大学。第一届网络世界语义学国际IFIP会议。2004。
特色

广告

加载……
Baidu