18新利最新登入语义网的工作原理

一个写着不同文字的地球仪。"width=
万维网使用一系列命令和元数据。hh5800 /盖蒂图片社

万维网是一个有趣的悖论——它是由计算机构成的,但却是为人类服务的。你每天访问的网站使用自然语言、图像和页面布局,以一种你容易理解的方式呈现信息。18luck手机登录即使它们是创建和维护Web的核心,计算机本身也无法理解所有这些信息。18luck手机登录他们不能像你一样阅读、理解人际关系或做决定。

语义Web提议帮助计算机“阅读”和使用Web。这个想法其实很简单元数据添加到网页可以使现有的万维网机器可读。这不会赋予人工智能或使计算机具有自我意识,但它将为机器提供查找、交换信息的工具,并在一定程度上解释信息。18luck手机登录它是万维网的扩展,而不是万维网的替代品。

广告

这听起来可能有点抽象,但确实如此。虽然一些网站已经在使用语义Web概念,但许多必要的工具仍在开发中。在本文中,我们将把语义Web背后的概念和工具应用到遥远的星系中。

为什么是语义Web?

假设你想在网上买一套“星球大战三部曲”的盒装套装,你有一些基本的购买标准。首先,你想要宽屏,而不是全屏,dvd,你想要那套有额外光盘的额外材料。第二,你想要最低的价格,但你更喜欢买一套新的,而不是旧的。最后,你不想为运输和处理支付太多费用,但你也不想等待太长时间。

在网络发展的这一点上,你最好的选择是查看不同零售商的网页,比较价格、运输时间和费率。你也可以找一个网站,可以同时比较几家零售商的价格和运输选择。无论哪种方式,你都必须做大部分的虚拟跑腿工作,然后自己做出购买决定并下单。

广告

使用语义Web,您将有另一种选择。你可以把你的喜好输入电脑代理,它会在网上搜索,为您找到最佳选择,并下订单。然后,代理可以打开你电脑上的个人理财软件,记录你的消费金额,还可以在你的日历上标记你的dvd到达的日期。你的代理也会了解你的习惯和喜好,所以如果你在一个特定的网站上买东西有不好的经历,它就会知道不要再使用那个网站。

代理不会像人那样看图片和阅读描述,而是通过搜索来做到这一点元数据清楚地识别和定义代理需要知道什么。元数据只是描述其他数据的机器可读数据。在语义Web中,元数据在人们阅读页面时是不可见的,但对计算机来说却是清晰可见的。元数据还可以支持更复杂、更集中的Web搜索,并提供更准确的结果。按照万维网的发明者蒂姆·伯纳斯-李的说法,这些工具将使目前类似于一本巨大书籍的网络成为一个巨大的数据库。

接下来,我们将看看可以使文档机器可读的工具。

广告

标记:XML和RDF

RDF三元组有一个主题(Anakin Skywalker)、一个对象(Luke Skywalker)和一个将两者结合在一起的属性。"width=
RDF三元组有一个主题(Anakin Skywalker)、一个对象(Luke Skywalker)和一个将两者结合在一起的属性。

假设你想让这个句子对计算机可读:

阿纳金是卢克·天行者的父亲。

你很容易理解这句话的意思——阿纳金和卢克·天行者都是人,他们之间是有关系的。你知道父亲是父母的一种,这句话也意味着卢克是阿纳金的儿子。但如果没有帮助,计算机无法解决这些问题。为了让计算机理解这句话的意思,你需要添加机器可读的信息,描述阿纳金和卢克是谁以及他们的关系。18luck手机登录这要从两个工具开始可扩展标记语言而且资源描述框架(RDF)

广告

XML是一个标记语言就像超文本标记语言(HTML),你可能在网上冲浪时对这个词有点熟悉。HTML控制您在Web上查看的信息的外观。18luck手机登录XML通过添加补充(但不取代)HTML标签描述数据。这些标签对于阅读文档的人来说是不可见的,但是对于计算机来说是可见的。标签已经在Web上使用,并且已经存在机器人比如收集数据的机器人搜索引擎,可以阅读它们。

RDF所做的正如其名称所示——使用XML标记,它提供了一个框架来进行描述资源.在RDF术语中,世界上几乎所有东西都是资源。该框架将资源(任何名词,如阿纳金·天行者或“星球大战”三部曲)与网络上的特定项目或位置配对,以便计算机确切地知道资源是什么。清楚地识别资源可以防止计算机做一些事情,比如把阿纳金·天行者与塞巴斯蒂安·肖或海登·克里斯蒂安森混淆,或者把原始三部曲与一人“星球大战”三部曲混淆。

为此,RDF使用三元组编写为XML标记,以将此信息表示为18luck手机登录.这些三元组由a组成主题,财产而且对象,就像句子的主语、动词和直接宾语一样。(有些资料称它们为主语、谓语和宾语。)RDF已经存在于Web上——例如,它是RSS提要创建的一部分。

到目前为止,在这个例子中,计算机知道这个句子中有两个对象,并且它们之间有关系。但它不知道这些物体是什么,也不知道它们之间的关系。18新利最新登入接下来我们来看看添加这层含义的工具。

广告

知道什么是什么:uri

URI为计算机提供了三元组中每一项的特定参考点——不需要解释或潜在的误解。"width=
URI为计算机提供了三元组中每一项的特定参考点——不需要解释或潜在的误解。

即使有了XML和RDF提供的框架,计算机仍然需要一种非常直接、具体的方式来理解这些资源是谁或什么。为此,RDF使用统一资源标识符(uri)将计算机导向表示资源的文档或对象。您已经熟悉了URI的最常见形式——统一资源定位符(URL),它以http://.URI可以指向Web上的任何东西,也可以指向不属于Web的对象,比如计算机化家庭中的电器。Mailto、ftp和telnet地址是uri的其他一些例子。

在我们的示例中,我们将使用《星球大战》官方站点上的角色页面作为它们的uri。

广告

现在计算机知道了主体和客体是什么——Anakin Skywalker是由第一个URI表示的实体,Luke Skywalker是由第二个URI表示的实体。但是您会注意到,我们的三重URI中的中间URI(用于属性的URI)并没有指向Star Wars站点。相反,它指向HowStuffWorks服务器上的一个虚构文档。18新利最新登入如果那个页面真的存在,那就是我们的XML名称空间

HTML使用标准标记,如表示粗体,表示下划线,而XML没有标准标记。这很有用——它允许开发人员为特定目的创建唯一的标记。但这意味着浏览器不能自动知道标签的含义。XML名称空间基本上是一个文档,它告诉应用程序另一个文档中所有标记的含义。XML文档的创建者在文档的开头用一行代码声明名称空间。在我们的例子中,我们的命名空间声明是这样的:

< rdf: rdf xmlns: hsw = https:/18新利最新登入/www.kbsimple.com/example/RDF/relationship >

这行代码告诉计算机:“您看到的任何以‘hsw’开头的标记都使用本文档中找到的词汇表。你可以在这里查找任何以‘hsw’开头的标签。”这样,人们就可以为文档创建所需的XML标记,而不会与Web上的其他XML文档发生冲突。

XML和RDF是语义Web的“官方语言”,但仅靠它们本身还不足以使计算机能够访问整个Web。接下来我们来看看其他的图层。

广告

语言和词汇:RDFS、OWL和SKOS

一个可能在星球大战本体中找到的极少数资源和连接的例子。你可以通过看电影和上网自己弄清楚,但计算机必须有一个清晰的轮廓才能理解它。"width=
一个可能在星球大战本体中找到的极少数资源和连接的例子。你可以通过看电影和上网自己弄清楚,但计算机必须有一个清晰的轮廓才能理解它。

语义网的另一个障碍是计算机没有人拥有的那种词汇。你一生都在使用语言,所以你可能很容易看到不同单词和概念之间的联系,并根据上下文推断词义。不幸的是,人们不能仅仅给计算机一本字典,一本年鉴和一套百科全书,让计算机自己学习所有这些。为了理解单词的意思以及单词之间的关系,计算机必须具备文档描述了所有的单词和逻辑建立必要的联系。

在语义Web中,这来自于图式而且本体.这是帮助计算机理解人类词汇的两个相关工具。本体只是描述对象及其相互关系的词汇表。18新利最新登入模式是一种组织信息的方法。18luck手机登录与RDF标记一样,对模式和本体的访问作为元数据包含在文档中,文档的创建者必须在文档的开头声明引用哪些本体。

广告

语义Web上使用的模式和本体工具包括:

  • RDF词汇描述语言模式(RDFS)- RDFS为资源添加类、子类和属性,创建了一个基本的语言框架。例如,资源Dagobah类的子类吗地球.达戈巴的财产可能是沼泽
  • 简单知识组织系统(SKOS)—SKOS对资源进行分类更广泛的,允许指定首选而且备用标签和可以让人快速港口Web的同义词表和词汇表。例如,在《星球大战》术语表中,对西斯勋爵可能是达斯·西迪厄斯,更广泛的说法可能是恶棍.同样,汉·索罗的另一个标签可能是削弱牧民而且激光的大脑
  • Web本体语言(OWL)- OWL是最复杂的一层,它形式化了本体,描述了类之间的关系,并使用逻辑进行推理。它还可以基于现有信息构造新的类。18luck手机登录OWL有三个复杂度级别——精简版、描述语言(DL)和完整版。

本体的问题在于它们很难创建、实现和维护。根据它们的范围,它们可以是巨大的,定义了广泛的概念和关系。由于这些困难,一些开发人员更喜欢关注逻辑和规则,而不是本体。关于这些规则应该扮演的角色的分歧可能是语义网的一个潜在陷阱。

接下来,我们将通过看看最初的例子——《星球大战三部曲》dvd来把它们联系起来。

广告

把它们绑在一起

在我们最初的例子中,我们谈到了在网上购买《星球大战》的dvd。语义网可以让整18新利最新登入个过程变得更简单:

  • 每个网站都有文字和图片(供人阅读)和元数据(供计算机阅读),描述在他们的网站上可以购买的dvd。
  • 使用RDF三元组和XML标记的元数据将使dvd的所有属性(如条件和价格)成为机器可读的。
  • 必要时,企业将使用本体为计算机提供描述所有这些对象及其属性所需的词汇表。购物网站都可以使用相同的本体,因此所有元数据都将使用同一种语言。
  • 每个出售dvd的网站也会使用适当的安全和加密措施来保护客户的信息。18luck手机登录
  • 计算机化的应用程序或代理将读取在不同地点找到的所有元数据。应用程序还可以比较信息,验证来源是准确和可信的。18luck手机登录

当然,Web非常庞大,将所有这些元数据添加到现有页面是一项艰巨的任务。接下来我们将讨论这个问题以及语义Web的其他一些潜在障碍。

广告

W3C和语义Web的未来

语义网就像万维网一样分散的没有一个组织或机构可以控制它的所有规则和内容。18新利最新登入然而,一些人和组织已经在语义Web指南和协议的开发中发挥了领导作用。这些组织包括万维网联盟(W3C)、其负责人蒂姆·伯纳斯-李及其成员组织。W3C不是一个研究组织,所以大学、其他组织和公众也在语义Web开发中扮演着积极的角色。

万维网的一些领域已经包含了语义Web组件。这包括使用RDF的RSS提要和朋友的朋友(FOAF)项目该公司提议创建机器可读的个人网页。

广告

但是语义网的大部分功能和实用性仍在开发中,还有一些相当大的障碍需要克服。去中心化使开发人员能够自由地精确地创建他们需要的标记和本体。但是,这也意味着不同的开发人员可能会使用不同的标签来描述相同的东西,这可能会使机器比较变得困难。批评者还质疑“身份问题”——URI是表示Web页面,还是表示页面描述的概念或对象。例如,“http://www.starwars.com”是代表“星球大战”电影,还是仅仅代表Web页面?

一些开发人员不同意语义Web应该更多地依赖规则还是本体。批评人士还说,这个项目非常不切实际。首先,人们实际上并没有从RDF使用的图的角度进行思考。其次,企业和现有网站似乎不太可能真正投入时间和资源来添加所有必要的元数据。将来,现成的软件可能包括在创建新文档时添加元数据的选项,但该工具可能仍然不能使项目在更大范围内可行。

有关万维网和语义网的更多信息18luck手机登录,请查看下一页的链接。

广告

更多信息18luck手机登录

相关文章

更多优质链接

  • 亚当斯,凯瑟琳。“语义Web:区分分类法和本体”在线;7月/ 2002年8月;
  • 贝克特,戴夫。Dave Beckett的资源描述框架(RDF)资源指南http://planetrdf.com/guide/
  • 克拉克,肯德尔。“SPARQL: Web 2.0遇到语义Web”O'Reilly。http://www.oreillynet.com/pub/wlg/7823
  • 格林伯格,简等人。元数据:语义网的基本组成部分美国信息科学与技术学会公报,2003年4月/ 5月。18luck手机登录
  • 格林伯格,简。元数据生成:过程、人员和工具。美国信息科学与技术学会公报,2002年12月/ 2003年1月。18luck手机登录
  • 格林伯格,简。“语义网:不仅仅是一个愿景。”美国信息科学与技术学会公报,2003年4月/ 5月。18luck手机登录
  • 格鲁伯,汤姆。“什么是本体?”http://www-ksl.stanford.edu/kst/what-is-an-ontology.html
  • 哈丁,史蒂夫。Tim Berners-Lee:语义网——机器可处理数据的网络。美国信息科学与技术学会公报,2005年2月/ 3月18luck手机登录
  • 桑德罗·霍克。“18新利最新登入语义网如何工作”,http://www.w3.org/2002/03/semweb/
  • 亨德,詹姆斯。“科学和语义网。”科学。2003年1月24日。
  • 霍罗克斯,伊恩等人。”语义Web架构:堆栈还是双塔?”http://www.cs.man.ac.uk/~horrocks/Publications/download/2005/HPPH05.pdf
  • 雅各布,艾琳·K。“本体和语义网。”美国信息科学与技术学会公报;18luck手机登录4月/ 2003年5月。
  • 米勒,埃里克和拉尔夫·斯维克。W3C语义Web活动的概述。美国信息科学与技术学会公报,2003年4月/ 5月。18luck手机登录
  • Parsia毕扬。“语义Web服务。”美国信息科学与技术学会公报,2003年4月/ 5月。18luck手机登录
  • Shirky,粘土。“语义网,三段论和世界观”http://www.shirky.com/writings/semantic_syllogism.html
  • 斯沃茨,亚伦。“广度语义网”http://logicerror.com/semanticWeb-long
  • 范曼,杰。“从完整的同义词典导出OWL。”美国信息科学与技术学会公报,2005年10月/ 11月。18luck手机登录
  • W3C:我18新利最新登入们如何在语义Web上识别事物。http://www.w3.org/2001/03/identification-problem/
  • W3C: OWL Web本体语言指南http://www.w3.org/TR/owl-guide/
  • W3C: RDF Primer http://www.w3.org/TR/rdf-primer/
  • 语义Web活动声明。http://www.w3.org/2001/sw/Activity
  • W3C: SKOS核心指南http://www.w3.org/TR/swbp-skos-core-guide/
  • W3C:语义Web技术教程http://www.w3.org/Consortium/Offices/Presentations/RDFTutorial/
特色

广告

加载……
Baidu