在互联网存在了将近五年之后,人们进行了首次有组织的尝试来对其进行存档。 我们大部分的早期在线活动都永远消失了。

2005年,Alex Tew提出了一个一百万美元的想法。 这位20岁的笨蛋玩弄的想法旨在支付即将攻读的商业硕士学位三年课程的费用。 图特担心自己的债务难以置信地膨胀。 他在笔记本上写着:“如何成为百万富翁。”
二十分钟后,他想到了这个问题的答案。
Tew创建了一个名为The Million Dollar Homepage的网站。 该站点模型非常简单:可以看到一百万像素的广告空间,并建议以100件为单位购买,每片1美元。 当您购买它们时,它们将永远属于您。 在售出百万分之一的像素后,图成为百万富翁。 至少计划是这样的。
该网页于2005年8月26日启动,此前Tew在域名注册和托管设置上花费了50欧元。 广告商购买了像素并提供了一个链接,一个小图像和一些光标悬停在图像上方时出现的文本。
大约一个月后,由于口口相传和媒体的日益关注,该网页为Tew带来了超过25万美元的收入。 2006年1月,最后的1,000个像素在拍卖会上以38,100美元的价格售出,Tew赚了百万。
该页面仍然存在,距其出现将近十五年了。 许多客户是《泰晤士报》,英国报纸,Cheapflights.com旅行社和Yahoo!。 和摇滚二人Tenacious D-一次付款就获得了15年的广告服务。 每天仍有数千人访问该站点。 他可能是一个很好的投资项目。

如今,Tew是一款沉思冥想和正念应用程序,现已真正成为百万富翁。 但是,他创建的页面也变成了其他东西:一个早期互联网时代的活博物馆。 十五年似乎很短,但是从Internet的角度来看,这是整个地质时代。 如今,该页面中约40%的链接都指向无法访问的网站。 许多其他人都指向全新的域名,因为它们的旧网址已出售给新所有者。
百万页展示了早期互联网几乎是无形的崩溃。 在离线状态下,例如当地报纸的关闭通常被广泛报道。 但是,在线站点正在逐渐消失,通常没有任何声名狼藉,而您可能会遇到的第一个消失的迹象是,当您单击链接时,会发现一个空白页。
***
大约10年前,我将自己的一生献给了一个关于摇滚音乐的博客,并在AOL网站的音乐部分发布了帖子,这是Verizon现在拥有的庞大的互联网先驱。 我编辑或撰写了数百篇在线评论,关于音乐商店的故事,与艺术家的访谈以及列表文章。 那时,Facebook和Twitter已经吸引了相当大的受众,并且智能手机在下班回家的路上将我们连接到了互联网。 网上冲浪已经日以继夜。
得出这样的结论是合乎逻辑的:如果我要证明自己的工作证据,那么在Google上进行一次搜索就足够了。 但是事实并非如此。 2013年4月,AOL突然关闭了所有音乐网站-多年来关闭了数十位编辑和数百位作者的合作。 剩下的几乎不多了,在线档案中只保留了几座雕像,这是旧金山的一个非营利基金会,由程序员Brewster Cale于1990年代后期创立。
这是最著名的组织,他们试图保存人类在互联网上出现的头十年的残余痕迹,直到它们永远消失。
她说,南安普敦大学网络科学研究所执行主任Dame Wendy Hall展示了对档案工作的明确立场:“如果没有他们,我们将没有任何早期资料。” “如果布鲁斯特·凯恩(Brewster Kane)没有打开互联网档案并开始保存所有这些内容-未经征得任何人的许可-我们将失去一切。”

温迪夫人说,档案和国家图书馆都有保存书籍,报纸和期刊的经验,因为印刷已有很长时间了。 但是,互联网的出现-以及它很快成为一种新型的交流和表达方式-可能会让他们感到惊讶。 从那时起,人们进行了各种尝试来赶上Internet归档。 她说:“大英图书馆必须拥有每份当地报纸的副本。” 当报纸从印刷转为网络时,存档采取了另一种形式。 网站是否像之前的报纸一样有价值?
报纸档案馆也很脆弱,当出版商关闭或与他人合并时,它们就会丢失。 她说:“我认为大多数报纸都应该有某种档案库。” “但是,如果维修不当,则可能会丢失。”
尝试存档Internet的主要问题之一是它不能停滞不前。 每分钟-每秒钟显示更多照片,博客文章,视频,新闻,评论。 尽管数字媒体的价格已大大下降,但将所有这些材料存档仍然值得。 “谁来付钱? -温迪女士问。 “我们正在产生比以前更多的材料。”
在英国,大英图书馆部分负责数字保存。 她一直在管理
UK Web Archive ,该网站自2004年以来一直在获得网站许可的情况下收集信息。 杰斯·韦伯(Jace Webber)的订婚档案经理说,这个问题比大多数人想象的要大得多。

“这不仅仅是关于早期的材料。 他说,大多数互联网都没有保存。 -1996年,互联网档案馆开始维护页面档案。在第一个网页出现五年之后。 没有那个时代的复制品。”
甚至1991年创建的第一个网页也没有保存; 在WWW联盟的页面上可以看到的是一年后制作的副本。
在网络的头五年的大部分时间里,在英国出版的大多数材料都以.ac.uk结尾-这些是科学家撰写的科学文章。 仅在1996年,当商业站点开始超过科学站点时,更多通用站点才开始出现在网络上。
大英图书馆每年对每个域进行一次轮询-保留所有内容在英国发布。 “我们试图保存所有东西,但我们每年只保存一次。 但是,许多站点的最大容量设置为500 MB。 它涵盖了许多小型网站,但是只有几个视频可以放在那里,并且很快达到了极限。” BBC新闻之类的新闻站点更经常绕开存档。 韦伯说,图书馆试图完整地描绘出英国退欧,2012年伦敦奥运会和第一次世界大战100周年等事件的全貌。
韦伯说:“我认为几乎没有什么东西会消失的了解。” -数字世界非常短暂,我们看着电话,那里的一切都在变化,我们并没有真正考虑它。 但是现在人们开始更多地了解我们可能会损失多少。”
但是,韦伯说,组织有权只收集可公开获得的材料。 在人们的个人档案库中,例如,在他们的硬盘上,历史上重要的数据甚至更多。 但是我们很少有人保留它们以备后用。
“大英图书馆到处都是个人来信。 这是政治人物,爱心留言的职位,而这些事情对某些人来说非常重要。”

我们相信,我们在社交网络上发布的材料将始终存储在此处,并且只需按一下按钮即可使用。 但是,最近一个MySpace社交网站(曾经
是美国最受欢迎的社交网站)最近
损失了12年的音乐和照片,这表明即使存储在最大网站上的材料也不安全。
甚至Google服务也没有保险。 搜索巨头Google+的竞争对手Google+
已于4月2日
关闭 。 是否所有用户都备份了照片和纪念品?
韦伯说:“通过在Facebook上发布您的照片,您不会将它们存档,因为总有一天Facebook将不复存在。” 如果您怀疑网络的时空性,请花几分钟时间整理一下页面,花费一百万美元。 这证明了我们在线过去的消失速度。
数据丢失还有另一方面。 温迪夫人指出了这样一个事实,即缺乏新闻站点存档会导致对历史的选择性处理-例如,新政府可能会决定不存档使新闻陷入困境的故事。
伦敦大学数字人文科学教授简·温特斯(Jane Winters)表示:“随着政府的每一次变动或准自治非政府组织的重组,站点都将关闭。” “或者看看本质上是临时的竞选网站。”
有时,丢失的站点反映出更严重的变化。 整个国家的死亡和诞生。 “这发生在南斯拉夫。 顶级域名是.yu,在
该国崩溃后,它消失了。 她说:“一位研究人员试图恢复坍塌之前的状况。” “政治常常与技术相关联。”
在所有这些方面,也许有一个小的亮面。 “我家有历史学家,我们在历史记录中经常遇到空白-我们了解其中一些,甚至不怀疑其中一些。”
温迪·霍尔女士(Dame Wendy Hall)也在这种情况下看到了与物理世界相似的东西。 在1960年代后期15岁那年,她是BBC流行音乐Top音乐节目的观众中的客人之一。
该节目在圣诞节上映。 “电视开着,我妈妈说:'看,你在这里!” 但是我错过了那一刻。 然后我去了英国广播公司,试图从他们那里获得唱片的副本-但是他们重新录制了这个节目。 所以我没看到她。