Quand l'archive en ligne oublie



Il existe sur Internet certaines organisations dont nous avons l'habitude de compter quotidiennement sur le travail dans l'espoir d'empêcher la transformation de la vérité en une substance élastique ou indéfinie. Pas nécessairement la méthode pour laquelle des projets stupides comme Verrit s'efforcent , mais au moins la façon dont vous pouvez confirmer que vous n'êtes pas fou que l'ancien article ou article que vous semblez lire existe vraiment. Cela peut être une action superficielle telle que la lecture d'un tweet rapidement supprimé via le cache Google, ou une plongée aussi profonde dans le contenu que l'étude des archives du site aujourd'hui décédé via Wayback Machine. Mais que se passe-t-il si les archives deviennent moins fiables et, pour des raisons prétendument convaincantes, décident de plier et de supprimer le matériel controversé qui est entré dans les archives?

Il y a quelques semaines, lors de l'enregistrement d'un podcast, il s'agissait d'une ancienne paternité de blog par The Ultimate Warrior [The Last Warrior] - un bodybuilder qui est devenu chiropracteur, est devenu journaliste professionnel, est devenu un orateur politique, sujet à des délires, parlant sous son vrai nom - oui, Warrior. Comme Barry Petesky l'a décrit sur le blog Deadspin après la mort du guerrier en 2014, il était une «chèvre folle», des blogs et des campus étudiants sur les personnes handicapées, les homosexuels, la Nouvelle-Orléans, etc. Cependant, lorsque j'ai décidé de rechercher une entrée de blog spécifique, j'ai vu qu'ils n'étaient pas simplement supprimés - le site n'était même pas dans les archives Internet Archive, au lieu de cela, il y avait un message d'erreur: "Cette URL a été exclue de la Wayback Machine."

Il s'est avéré que le site de Warrior avait déjà été retiré des archives depuis plusieurs mois - cela s'est produit peu de temps après que Rob Russo l'ait lu dans un article pour Vice Sports, accusant la WWE d'hypocrisie en relation avec l'utilisation de la photo de Warrior pour la publicité "Mois du cancer du sein" . La campagne a exhorté les femmes à «libérer leur guerrière intérieure», mais comme Warrior voulait la mort des survivants du cancer sur ses blogs, la situation semblait mauvaise. Rousseau a été surpris de voir comment les archives ont supprimé ce site «presque immédiatement après la publication de mon article, littéralement dans une semaine» - c'est ainsi qu'il en a parlé à Gizmodo.

Rousseau soupçonnait la WWE d'être à l'origine de cela, mais un porte-parole de la société a déclaré à Gizmodo qu'ils n'avaient rien à voir avec cela. Steve Wilton, directeur général d'Ultimate Creations, a également rejeté son implication dans ce dossier. Un porte-parole d'Internet Archive a déclaré à Gizmodo que l'archive avait été supprimée à la demande de DMC auprès du directeur commercial de Wilton le 29 octobre 2017, deux jours après la publication de l'article dans Vice.

Au cours des dernières années, la perception de Wayback Machine a changé sous l'influence du sentiment politique. Pendant longtemps, ce site est resté un outil utile pour trouver le contenu des liens rompus, et maintenant il est considéré comme l' arbitre de la vérité et le rempart de l'opposition à l'effacement de l'histoire.

Le fait que les sites dans les archives montrent une empreinte numérique et l'origine du contenu est non seulement utile pour les journalistes, mais également efficace pour presque tous ceux qui tentent de suivre les pages Web disparues. Dans cette optique, le fait qu'Internet Archive n'essaie pratiquement pas de traiter les demandes de suppression de contenu devient un problème. Et ce n'est pas le seul exemple: lorsque l'administrateur du site décide de bloquer le robot Wayback en utilisant les paramètres du fichier robots.txt, l'archive arrête non seulement d'explorer le site, mais supprime également l'intégralité de son historique de l'accès public.

En d'autres termes, si vous publiez du contenu controversé et que vous souhaitez éviter toute responsabilité, il existe au moins deux façons standard de le supprimer des archives Web tierces les plus fiables sur Internet public.

Pour Internet Archive, une réponse rapide aux demandes de suppression de contenu qui semblent être utilisées de bonne foi par des copies de sites Web, ainsi que les pratiques de traitement de robots.txt, réduisent légèrement les risques, mais vont en même temps à l'encontre de l'esprit de ses activités. Et si quelqu'un décidait de poursuivre le service en raison de la désobéissance aux exigences, même les méthodes toutes faites de protection juridique disponibles pour les archives pouvaient être extrêmement coûteuses. Et peu importe que l'utilisation de matériaux ne viole rien par aucune norme. Si le titulaire du droit d'auteur fait une telle tentative, vous devez toujours vous défendre en justice.

«Dans ce contexte, personne n'a encore tenté de contester l'utilisation équitable», a déclaré Annamaria Brady, professeure de droit à l'Université de l'Idaho et boursière indépendante à la Stanford School of Internet and Society. «Internet Archive est une organisation à but non lucratif, il comporte donc de grands risques associés à d'éventuels litiges. Étant donné l'ampleur de leur travail, le fait qu'ils archivent presque tout ce qui est accessible au public sur Internet, leurs risques sont phénoménaux. Vous pouvez comprendre pourquoi ils se comportent avec prudence, même si cela va à l'encontre de leur mission principale - créer des archives historiques précises de tout ce qui était sur Internet et empêcher les gens d'effacer les preuves de leur histoire. »

Internet Archive n'a pas répondu aux questions spécifiques liées au traitement de robots.txt, à sa volonté de se conformer aux demandes de suppression et à savoir s'il a eu la possibilité d'utiliser l'argument de l'utilisation équitable des documents devant les tribunaux. Cependant, le représentant du service a envoyé le message suivant:

Quelques mois après le lancement de Wayback Machine en 2001, nous avons participé à un groupe d'archivistes, de bibliothécaires et d'avocats tiers qui ont rédigé un ensemble de recommandations pour répondre aux demandes de suppression de contenu, qu'Internet Archive a par conséquent accepté comme ensemble d'instructions de comportement, et les a suivies dans les dix premières années d'existence.

Cette année, nous avons tenu une réunion avec un groupe de composition similaire pour examiner ces recommandations et explorer la valeur possible de leur version mise à jour. Nous discutons toujours de certains problèmes et espérons que très bientôt, nous serons en mesure de soumettre des informations mises à jour sur notre site Web pour aider le public à mieux comprendre comment nous sommes liés aux demandes de suppression. Certaines de nos réflexions sur robots.txt sont décrites dans un article séparé .

En fait, nous essayons de trouver un équilibre entre les préoccupations des propriétaires de sites et des titulaires de droits d'auteur et l'intérêt du public, qui mérite un accès gratuit à l'histoire la plus complète possible d'Internet.

Compte tenu de tout cela, rappelez-vous qu'Internet Archive s'est toujours positionné comme une bibliothèque - cela ne devrait-il pas être important?

"Dans la loi actuelle sur le droit d'auteur, bien qu'il existe des cas particuliers qui accordent certains droits aux bibliothèques, il n'y a pas de définition d'une bibliothèque", a déclaré Brandon Butler, directeur de la politique de l'information à la University of Virginia Library. «Les titulaires de droits d'auteur se sont toujours indignés à ce sujet, ainsi qu'à propos d'organisations telles que Internet Archive, qui ne sont pas des bibliothèques publiques ou universitaires vieilles de 200 ans. Ils affirment souvent qu'ils ont peur de l'apparition de fausses bibliothèques, qui s'appelleront elles-mêmes des bibliothèques et qui servent en fait de refuge aux pirates. » La seule exception dont Butler pouvait se souvenir était le cas de la bibliothèque de texte bouddhiste en ligne sans but lucratif du Bouddha américain, qui a découvert que Penguin le poursuivait en raison de plusieurs livres auxquels il avait droit. «Le tribunal ne se souciait pas que cet endroit s’appelle une bibliothèque; cela ne les a pas protégés contre les allégations de violation des droits. » Butler note que même si le statut de la bibliothèque ne protégera pas Internet Archive comme cela serait possible, «le droit de créer des copies pour le stockage», comme l'appelle Butler, parle en leur faveur.

"Habituellement, ils ne poursuivent pas les bibliothèques, c'est une mauvaise publicité", explique Butler. Par conséquent, il n'y a pas de montagne de précédents juridiques modernes liés aux bibliothèques à l'ère numérique, à l'exception de quelques cas liés aux affaires de Google Books.

Comme le note Bridy, aux États-Unis, le droit d'auteur est une «loi commerciale». Il ne s'agit pas de nuire à la réputation, mais de protéger la valeur du travail et, plus précisément, la capacité de gagner constamment de l'argent dessus. "Nous justifions cela en disant que nous voulons encourager les artistes et autres créateurs à publier et vendre leur travail", a-t-elle déclaré. "L'utilisation du droit d'auteur pour tenter de contrôler la vie privée ou la réputation ... Il peut, bien sûr, être utilisé de toute façon, mais on peut dire qu'il s'agit d'une utilisation illégale du droit d'auteur qui dépasse sa portée de responsabilité."

Nous tenons beaucoup de choses pour acquises, surtout parce que nous comptons de plus en plus sur la technologie. «Internet est éternel» - ce refrain peut souvent être trouvé dans les médias, et la sagesse cachée dans cette déclaration sur la nécessité de se comporter avec prudence est probablement justifiée, mais cela ne doit pas être pris à la lettre. Les gens suppriment les messages. Les sites Web et les plates-formes entières disparaissent pour des raisons commerciales et autres. Les riches, les célébrités et les personnes au pouvoir n'hésitent pas à intimider les petites organisations à but non lucratif. C'est bien d'avoir une protection au cas où, mais il y a des frontières à la constance d'Internet - et là où il y a des frontières, il y a des solutions de contournement.

Source: https://habr.com/ru/post/fr433806/


All Articles