死亡之网可能会被时光倒流机复活

由:内森钱德勒|
404页的"width=
回到过去,访问你一直想要访问的旧网站。Ja_inter /盖蒂图片社

如果一棵树倒在森林里,它真的会发出声音吗?如果网站一夜之间就改变了,它之前的主页真的存在过吗?由于我们的世界越来越多地数字化,而且转瞬即逝,这不仅是一个哲学问题,也是一个简单的历史问题。这就是为什么“时光机”(Wayback Machine)能让人一窥网络尘封的角落,它以网站老化和变化的快照为特色。

时光倒流机是一个巨大的数字档案,旨在保存那些可能会被时间永久丢失的网页。如果没有这些数据,每当一个页面被更新或删除时,它就会消失,就好像它从来没有存在过一样。

广告

网页的平均寿命大约是100天Wayback Machine的主管马克·格雷厄姆(Mark Graham)在2016年《企业家》(Entrepreneur)的一篇文章中指出。这些网页消失的原因有很多。网站创建者转移到其他项目。网络托管公司破产。或者页面可能被移动或替换为新的数据和内容。

18新利最新登入时光倒流机是如何启动的

机器Wayback是布鲁斯特·卡尔和布鲁斯·吉利亚特的创意,他们还创立了互联网档案馆这是一个包含网站、书籍、音频和视频记录以及软件程序的数字图书馆。这两个项目都是旧金山的非营利组织。时光倒流机是互联网档案馆的一个项目。(卡尔和吉列特还创建了Alexa Internet,用于分析网络流量模式,并出售给了亚马逊。)

“他们(Kahle和Gilliat)从1996年开始对网页进行存档,并在2001年推出了时光倒流机(Wayback Machine),以支持发现和回放这些存档的网络资源,”格雷厄姆在最近的一次电子邮件采访中说。是的,这个名字的灵感来自20世纪60年代的卡通系列《洛奇和布温克尔秀》。18新利最新登入在漫画中,WABAC机器(注意拼写差异)是一种情节装置,用于将人物皮博迪先生和谢尔曼送回人类历史上的重要事件。”

广告

在世界上有超过17亿的网站,有了这个数字每天都在急剧攀升,怎18新利最新登入么可能有人希望把这么多网页编入目录呢?Wayback Machine使用所谓的“爬虫”,这是一种自动在网络中移动的软件,在运行过程中拍摄数十亿个网站的快照。有些过程是自动化的,但许多请求是由图书管理员网络手动生成的,他们会优先考虑某些类型的网站,他们认为这些网站对子孙后代和后代的保护很重要。

爬虫程序不会捕获站点的每一次迭代。快照的频率因站点的重要性而异——非常重要的站点可能每隔几小时就会被记录一次。其他的可能每隔几周或几个月记录一次。大多数人根本没有登录过(所以不用担心,你在高中建的那个令人尴尬的粉丝网站现在可能早就消失了)。机器Wayback旨在捕捉快照重要的内容,比如由主要媒体公司创造的突发新闻标题。

此外,它不一定要重新创建整个站点,也不会以您在浏览器中体验到的方式保存数据。它可能只捕获几个页面的一些图像,而不保存链接到域外其他网站的内容。

广告

使用时光倒流机

你可能有过这样的经历:点击网页上的一个链接,得到一个“404”或“页面未找到”的提示。现在你想知道最初那页上写的是什么。这就是时光倒流机能帮上忙的地方。

要使用时光倒流机,请访问https://archive.org/web/。在“浏览历史记录”搜索栏中输入要调查的站点的URL。我们将使用我们最喜欢的网站//www.kbsimple.com/18新利最新登入作为示例。在结果中,您将看到一个按时间顺序排列的柱状图,其中显示了该站点在给定年份中被爬取(和保存)的次数。18新利最新登入

广告

时光倒流机网站的主页。"width=
时光倒流机网站的主页。
18新利最新登入HowStuffWorks

点击年份和下面,你会看到一个12个月的日历,各种日期高亮显示。蓝色高亮表示网站被正确保存;红色表示没有。点击其中一个高亮显示的日期,网站的快照就会出现。点击其中一张快照——就像那样——你就回到了那个网站的旧版本。

如果您希望确保某个特定站点被记录到存档,可以手动执行此操作。使用Save Page now选项保存一个特定页面一次,但要意识到这样做只保存一个页面(而不是整个网站),并不能保证该网站将来会被爬取。

而且,如果内容所有者希望他们的内容被Wayback Machine排除在外,他们可以通过发送电子邮件到info@archive.org提交请求。

你也可以通过点击Wayback Machine主页顶部“互联网档案”旁边的图标来搜索书籍、视频、音频记录和软件程序。这些物品可以永久下载,也可以借一段时间,这取决于物品本身。高级搜索功能也是可用的。

广告

时光倒流机的未来

格雷厄姆说,关于时光倒流机最令人惊讶的事情是它的存在,以及它能够保护多少公共网络,考虑到它有一个小团队和预算。18新利最新登入(他们做使用志愿者.)

他说:“有了更多的支持,我们可以更好地备份更多的公共网络。”“互联网档案馆的资金来自我们基于订阅的网络服务的‘收入’,Archive-It.org此外,还有来自10万多名个人捐赠者的捐款。我们喜欢能够免费提供我们的服务,而且不在我们的网页上放广告。”

广告

他确信时光倒流机在未来会变得更加重要。

他说:“随着人们交流和分享信息的本质18新利最新登入不断演变,我们将需要建立技术、流程和伙伴关系,继续尽最大努力尽可能18luck手机登录多地保存这些公共信息。”“所有这些都支持时光倒流机的使命,即‘帮助网络变得更有用、更可靠’,特别是帮助支持记者、活动家、学者、历史学家、研究人员和普通公众。”

编者按:应时光倒流机工作人员的要求,本文第13段进行了更新。

广告

常见问题解答

时光倒流机是免费的吗?
是的,时光倒流机是免费使用的。
时光倒流机之外还有别的选择吗?
Internet Archive Wayback Machine是一个开源工具,允许用户访问存档的网站。Wayback Machine还没有官方的替代品,但有其他几个工具提供类似的功能,包括谷歌Cache、WebCite和Archive.is。
18新利最新登入如何在Wayback上浏览旧网站?
要在Wayback上查看一个旧网站,请访问https://web.archive.org/,在搜索栏中输入该网站的URL,然后按回车键。
特色

广告

加载……
Baidu