Pourquoi nous reste-t-il si peu du début d'Internet?

Après presque cinq ans d'existence d'Internet, la première tentative organisée a été faite pour l'archiver. La plupart de nos premières activités en ligne ont disparu pour toujours.




En 2005, Alex Tew a eu une idée à un million de dollars. La tête de bloc de 20 ans a joué avec des idées conçues pour payer les études de trois ans imminentes dans une maîtrise en affaires. Tew craignait que ses dettes soient incroyablement gonflées. Il a griffonné dans son cahier: "Comment devenir millionnaire."

Vingt minutes plus tard, il a trouvé ce qu'il pensait être la réponse à cette question.

Tew a créé un site Web appelé The Million Dollar Homepage. Le modèle du site était d'une simplicité indécente: il était possible d'y voir un million de pixels d'espace publicitaire, et il était proposé de les acheter par blocs de 100 pièces, à 1 $ l'unité. Lorsque vous les avez achetés, ils vous sont restés pour toujours. Après avoir vendu le millionième pixel, Tew deviendrait millionnaire. Au moins, le plan était comme ça.

La page a été lancée le 26 août 2005, après que Tew ait dépensé 50 euros pour l'enregistrement du domaine et la configuration de l'hébergement. Les annonceurs ont acheté des pixels et fourni un lien, une petite image et du texte qui est apparu lorsque le curseur était sur l'image.

Environ un mois plus tard, grâce au bouche à oreille et à l'attention accrue des médias, la page a rapporté à Tew plus de 250 000 $. En janvier 2006, les 1 000 derniers pixels ont été vendus aux enchères pour 38 100 $. Tew a gagné son million.

La page existe toujours, près d'une décennie et demie après son apparition. De nombreux clients sont The Times, un journal britannique, l'agence de voyages Cheapflights.com et Yahoo! et le duo rock Tenacious D - a reçu 15 ans de publicité avec un seul paiement. Le site est toujours visité quotidiennement par plusieurs milliers de personnes. C'était probablement un bon projet d'investissement.



Aujourd'hui, Tew, une application de méditation et de pleine conscience, est vraiment devenue millionnaire. Cependant, la page qu'il a créée est également devenue autre chose: un musée vivant du début de l'ère Internet. Quinze ans peuvent sembler une courte période, mais du point de vue d'Internet, c'est toute une ère géologique. Environ 40% des liens de la page mènent aujourd'hui à des sites morts. De nombreux autres pointent vers de nouveaux domaines car leurs anciennes URL sont vendues à de nouveaux propriétaires.

La page d'un million montre la panne presque invisible du début d'Internet. Hors ligne, la fermeture, par exemple, d'un journal local est souvent largement couverte. Cependant, les sites en ligne meurent, souvent sans fanfare, et le premier signe de leur absence, que vous pouvez rencontrer, est que lorsque vous suivez le lien, vous trouverez une page vierge.

***

Il y a environ 10 ans, j'ai consacré quelques années de ma vie à un blog sur la musique rock et à des articles dans la section musique du site Web AOL, un pionnier tentaculaire d'Internet qui appartient maintenant à Verizon. J'ai édité ou écrit des centaines de critiques en ligne, des histoires sur les magasins de musique, des interviews d'artistes et des articles de liste. Facebook et Twitter ont déjà attiré un public assez large et les smartphones nous ont connectés à Internet sur le chemin du retour du travail; La navigation sur le Web est devenue permanente.

Il serait logique de conclure que si je devais apporter la preuve de mon travail, il suffirait d'effectuer une recherche sur Google. Mais ce n'est pas le cas. En avril 2013, AOL a soudainement fermé tous les sites de musique - et le travail collaboratif de dizaines d'éditeurs et de centaines d'auteurs sur plusieurs années. Il en reste peu, seules quelques statues sont conservées dans les archives en ligne - une fondation à but non lucratif de San Francisco, lancée à la fin des années 1990 par le programmeur Brewster Cale.

Il s'agit de la plus célèbre des organisations qui tentent de sauver les dernières traces des vestiges de la première décennie de la présence de l'humanité sur Internet, jusqu'à ce qu'elles disparaissent à jamais.

Dame Wendy Hall, directrice exécutive de l'Institute of Web Sciences de l'Université de Southampton, démontre une position claire sur le travail des archives: «Sans eux, nous n'aurions pas eu de premiers documents», dit-elle. "Si Brewster Kane n'avait pas ouvert les archives Internet et commencé à sauvegarder tout cela - sans demander la permission à personne - nous aurions tout perdu."



Dame Wendy dit que les archives et les bibliothèques nationales ont l'expérience d'économiser des livres, des journaux et des périodiques parce que l'imprimé existe depuis longtemps. Cependant, l'avènement d'Internet - et la rapidité avec laquelle il est devenu une nouvelle forme de communication et d'expression de masse - pourraient les prendre par surprise. Depuis lors, diverses tentatives ont été faites pour rattraper l’archivage Internet. «La bibliothèque britannique doit avoir un exemplaire de tous les journaux locaux jamais publiés», dit-elle. Et lorsque les journaux sont passés de l'imprimé au Web, l'archivage a pris une forme différente. Les sites Web ont-ils autant de valeur que les journaux qui les ont précédés?

Les archives des journaux sont également vulnérables, elles sont perdues lorsque l'éditeur ferme ou fusionne avec d'autres. «La plupart des journaux, je pense, devraient avoir une sorte d'archives», dit-elle. "Mais s'il n'est pas correctement entretenu, il peut être perdu."

L'un des principaux problèmes rencontrés pour essayer d'archiver Internet est qu'il ne reste pas immobile. Chaque minute - chaque seconde, plus de photos, articles de blog, vidéos, nouvelles, commentaires apparaissent. Et bien que le prix des médias numériques ait considérablement baissé, l'archivage de tout ce matériel en vaut toujours la peine. «Qui va payer pour cela? - demande Dame Wendy. «Nous produisons beaucoup plus de matériel qu'auparavant.»

En Grande-Bretagne, la British Library est en partie responsable de la conservation numérique. Elle gère les archives Web du Royaume - Uni , qui recueille des informations sur des sites avec leur permission depuis 2004. Le responsable des archives d'engagement de Jace Webber dit que le problème est beaucoup plus important que la plupart des gens ne le pensent.



«Il ne s'agit pas seulement des premiers documents. La plupart d'Internet n'est pas sauvegardé, dit-il. - Les archives Internet ont commencé à conserver des archives de pages en 1996. Cinq ans après l'apparition des premières pages Web. Rien n'a été copié de cette époque. »

Même la première page Web, créée en 1991, n'a pas été conservée; ce que vous pouvez voir sur la page du consortium WWW est une copie réalisée un an plus tard.

Pendant la plupart des cinq premières années du Web, la plupart des documents publiés en Grande-Bretagne se terminaient en .ac.uk - il s'agissait d'articles scientifiques rédigés par des scientifiques. Ce n'est qu'en 1996 que des sites plus polyvalents ont commencé à apparaître sur le Web lorsque les sites commerciaux ont commencé à dépasser les sites scientifiques.

La British Library interroge chaque domaine une fois par an - gardant tout publié en Grande-Bretagne. «Nous essayons de tout sauver, mais nous ne le faisons qu'une fois par an. Toutefois, le volume maximal pour de nombreux sites est défini sur 500 Mo; il couvre un grand nombre de petits sites, mais seules quelques vidéos peuvent y tenir et cela arrive assez rapidement à une limite. » Les sites d'actualités tels que BBC News contournent plus souvent les archives. Webber dit que la bibliothèque a essayé de créer une image aussi complète des événements que le Brexit, les Jeux olympiques de Londres 2012 et le 100e anniversaire de la Première Guerre mondiale.

«Je pense qu'il y a très peu de compréhension que quelque chose a disparu», explique Webber. - Le monde numérique est très éphémère, nous regardons le téléphone, tout y change, et nous n'y pensons pas vraiment. Mais maintenant, les gens commencent à en savoir plus sur ce que nous pouvons perdre. »

Cependant, dit Webber, les organisations ont le droit de collecter uniquement du matériel accessible au public; une quantité encore plus importante de données historiquement importantes réside dans les archives personnelles de personnes, par exemple sur leurs disques durs. Mais peu d'entre nous les conservent pour la postérité.

«La bibliothèque britannique regorge de lettres de correspondance personnelle. C'est le poste des politiciens, des messages d'amour - et de telles choses sont très importantes pour certains. »



Nous pensons que le contenu que nous publions sur les réseaux sociaux y sera toujours stocké et sera disponible sur simple pression d'un bouton. Cependant, la récente perte de 12 ans de musique et de photographies par l' un des premiers sites sociaux MySpace - qui était autrefois le plus populaire aux États - Unis - montre que même le matériel stocké sur les plus grands sites n'est pas sûr.

Et même les services Google ne sont pas assurés. Google+, la tentative du géant de la recherche de lancer un rival sur Facebook, a pris fin le 2 avril . Tous ses utilisateurs ont-ils sauvegardé des photos et des souvenirs?

"En publiant vos photos sur Facebook, vous ne les archivez pas car un jour Facebook cessera d'exister", explique Webber. Si vous doutez de la nature temporelle du Web, passez quelques minutes et peignez la page pour un million de dollars. C'est la preuve de la rapidité avec laquelle notre passé en ligne disparaît.

Il y a un autre côté à la perte de données. Dame Wendy souligne que le manque d'archives de sites d'actualités peut conduire à une approche sélective de l'histoire - par exemple, de nouveaux gouvernements peuvent décider de ne pas archiver les histoires qui les mettent sous un mauvais jour.

«À chaque changement de gouvernement ou restructuration d'organisations non gouvernementales quasi autonomes, les sites sont fermés», a déclaré Jane Winters, professeur de sciences humaines numériques à l'Université de Londres. "Ou regardez les sites de campagne qui sont de nature temporaire."

Parfois, les sites perdus font écho à des changements plus graves; mort et naissance de nations entières. «C'est arrivé avec la Yougoslavie. Le domaine de premier niveau était .yu, et après l' effondrement du pays, il a disparu. Une chercheuse tente de restaurer ce qui était là avant l'effondrement », dit-elle. «La politique est si souvent associée à la technologie.»

Dans tout cela, peut-être, il y a un petit côté brillant. "J'ai des historiens dans ma famille, et nous avons toujours rencontré des lacunes dans les documents historiques - nous connaissons certains d'entre eux, et nous ne soupçonnons même pas certains d'entre eux."

Dame Wendy Hall voit également dans cette situation des parallèles avec le monde physique. À l'âge de 15 ans, à la fin des années 1960, elle était l'une des invités du public de l'émission musicale Top of the Pops de la BBC.

Le spectacle a été montré à Noël. "La télévision était allumée, et ma mère a dit: 'Regardez, vous y êtes!" Mais j'ai raté ce moment. Ensuite, je suis allé à la BBC et j'ai essayé d'obtenir d'eux une copie du disque - mais ils ont réenregistré cette émission. Je ne l'ai donc pas vue. "

Source: https://habr.com/ru/post/fr451026/


All Articles