😶 👨🏼‍🔧 😜 Cuando el archivo en línea se olvida 🎐 🥨 ⛑️

Hay ciertas organizaciones en Internet en cuyo trabajo estamos acostumbrados a confiar todos los días con la esperanza de evitar la transformación de la verdad en una sustancia elástica o indefinida. No necesariamente el método por el que luchan los estúpidos proyectos como Verrit , pero al menos la forma en que puedes confirmar que no estás loco de que la publicación o artículo antiguo que pareces estar leyendo realmente exista. Puede ser una acción tan superficial como leer un tweet eliminado rápidamente a través del caché de Google, o una inmersión tan profunda en el contenido, como estudiar el archivo del sitio ahora fallecido a través de la Máquina Wayback. Pero, ¿qué sucede si el archivo se vuelve menos confiable y, por razones supuestamente convincentes, decide doblar y eliminar el material controvertido que se ha introducido en el archivo?

Hace unas semanas, cuando grababa un podcast, se trataba de una antigua autoría de blog de The Ultimate Warrior [The Last Warrior]: un culturista que se convirtió en quiropráctico, se convirtió en un reportero profesional, se convirtió en un orador político, propenso a las protestas, hablando bajo su verdadero nombre: sí, Warrior. Como Barry Petesky describió en el blog de Deadspin después de que el Guerrero muriera en 2014, era una "cabra loca", que despotricaba sobre blogs y campus estudiantiles sobre personas con discapacidades, homosexuales, Nueva Orleans y más. Sin embargo, cuando decidí buscar una entrada de blog específica, vi que no solo se habían eliminado: el sitio ni siquiera estaba en el archivo de Internet Archive, en su lugar había un mensaje de error: "Esta URL ha sido excluida de Wayback Machine".

Resultó que el sitio de Warrior ya había sido eliminado del archivo durante varios meses; esto sucedió poco después de que Rob Russo lo revisó en un artículo para Vice Sports, acusando a WWE de hipocresía en relación con el uso de la foto de Warrior para anunciar el "Mes del Cáncer de Mama" . La campaña instó a las mujeres a "liberar a su guerrero interno", pero como Warrior quería la muerte de los sobrevivientes de cáncer en sus blogs, la situación se veía mal. Rousseau se sorprendió de cómo el archivo eliminó este sitio "casi inmediatamente después del lanzamiento de mi artículo, literalmente dentro de una semana", así es como le contó a Gizmodo sobre esto.

Rousseau sospechaba que WWE estaba detrás de esto, pero un portavoz de la compañía le dijo a Gizmodo que no tenían nada que ver con eso. Steve Wilton, director gerente de Ultimate Creations, también rechazó su participación en esto. Un portavoz de Internet Archive le dijo a Gizmodo que el archivo fue eliminado a petición de DMC al gerente comercial de Wilton el 29 de octubre de 2017, dos días después de que el artículo fuera publicado en Vice.

En los últimos años, la percepción de Wayback Machine ha cambiado bajo la influencia del sentimiento político. Durante mucho tiempo, este sitio ha seguido siendo una herramienta útil para encontrar el contenido de los enlaces rotos, y ahora se lo considera el árbitro de la verdad y el baluarte de la oposición para borrar la historia.

El hecho de que los sitios en el archivo muestren una huella digital y el origen del contenido no solo es útil para los periodistas, sino también efectivo para casi cualquier persona que intente rastrear páginas web que desaparecen. Con esto en mente, el hecho de que Internet Archive prácticamente no esté tratando de atender las solicitudes de eliminación de contenido se está convirtiendo en un problema. Y este no es el único ejemplo: cuando el administrador del sitio decide bloquear el robot Wayback usando la configuración en el archivo robots.txt, el archivo no solo deja de rastrear el sitio, sino que también elimina todo su historial del acceso público.

En otras palabras, si está publicando contenido controvertido y desea evitar responsabilidades, existen al menos dos formas estándar de eliminarlo del archivo web de terceros más confiable en Internet público.

Para Internet Archive, una respuesta rápida a las solicitudes de eliminación de contenido que parecen ser utilizadas de buena fe por copias de sitios web, así como la práctica de procesar robots.txt, reducen ligeramente los riesgos, pero al mismo tiempo van en contra del espíritu de sus actividades. Y si alguien decidiera demandar el servicio debido a la desobediencia a los requisitos, incluso los métodos ya preparados de protección legal disponibles para el archivo podrían ser increíblemente caros. Y no importa que el uso de materiales no viole nada por ningún estándar. Si el titular de los derechos de autor hace tal intento, aún tiene que defenderse en el tribunal.

"En este contexto, nadie ha tratado de cuestionar el uso justo", dijo Annamaria Brady, profesora de derecho en la Universidad de Idaho y miembro independiente de la Escuela de Internet y Sociedad de Stanford. “Internet Archive es una organización sin fines de lucro, por lo tanto conlleva grandes riesgos asociados con posibles litigios. Dado el alcance de su trabajo, el hecho de que archivan casi todo lo que está disponible públicamente en Internet, sus riesgos son fenomenales. Puedes entender por qué son cautelosos, incluso si esto va en contra de su misión principal: crear un archivo histórico preciso de todo lo que estaba en Internet y evitar que las personas borren evidencia de su historia ".

Internet Archive no respondió a preguntas específicas relacionadas con el procesamiento de robots.txt, su disposición a cumplir con las solicitudes de eliminación y si tuvo la oportunidad de utilizar el argumento sobre el uso justo de los materiales en los tribunales. Sin embargo, el representante de servicio envió el siguiente mensaje:

Unos meses después del lanzamiento de Wayback Machine en 2001, participamos en un grupo de archiveros, bibliotecarios y abogados de terceros que elaboraron un conjunto de recomendaciones para responder a las solicitudes de eliminación de contenido, que Internet Archive aceptó como un conjunto de instrucciones de comportamiento, y las seguimos en Los primeros diez años de existencia.

Este año celebramos una reunión con un grupo de composición similar para revisar estas recomendaciones y explorar el posible valor de su versión actualizada. Todavía estamos discutiendo algunos problemas y esperamos que pronto podamos enviar información actualizada en nuestro sitio web para ayudar al público a comprender mejor cómo nos relacionamos con las solicitudes de eliminación. Algunos de nuestros pensamientos sobre robots.txt se describen en un artículo separado .

De hecho, estamos tratando de encontrar un equilibrio entre la preocupación de los propietarios del sitio y los titulares de los derechos de autor, y el interés del público, que merece el libre acceso a la historia más completa posible de Internet.

Dado todo esto, recuerde que Internet Archive siempre se ha posicionado como una biblioteca, ¿no debería importar eso?

"En la ley de derechos de autor actual, aunque hay casos especiales que otorgan ciertos derechos a las bibliotecas, no existe una definición de biblioteca", dijo Brandon Butler, director de política de información de la Biblioteca de la Universidad de Virginia. “Los titulares de los derechos de autor siempre han estado indignados por esto, así como por organizaciones como Internet Archive, que no son bibliotecas públicas o universitarias de hace 200 años. A menudo afirman que tienen miedo de la aparición de bibliotecas falsas, que se llamarán bibliotecas, y de hecho sirven como refugio para los piratas ”. La única excepción que Butler pudo recordar fue el caso de la biblioteca de texto budista en línea sin fines de lucro de American Buddha, que descubrió que Penguin la estaba demandando debido a varios libros a los que tenía derecho. "Al tribunal no le importó que este lugar se llamara a sí mismo una biblioteca; esto no los protegió de acusaciones de violación de derechos ". Butler señala que si bien el estado de la biblioteca no protegerá Internet Archive como sería posible, "el derecho a crear copias para el almacenamiento", como lo llama Butler, habla a su favor.

"Por lo general, no demandan a las bibliotecas, es una mala publicidad", dice Butler. Por lo tanto, no hay una montaña de precedentes legales modernos relacionados con las bibliotecas en la era digital, con la excepción de algunos casos relacionados con los asuntos de Google Books.

Como señala Bridy, en los Estados Unidos, los derechos de autor son "leyes comerciales". No se trata de dañar la reputación, sino de proteger el valor del trabajo y, más específicamente, la capacidad de ganar dinero constantemente con él. "Justificamos esto diciendo que queremos alentar a los artistas y otras personas creativas a publicar y vender su trabajo", dijo. "El uso de los derechos de autor para intentar controlar la privacidad o la reputación ... Por supuesto, se puede usar de todos modos, pero se puede afirmar que este es un uso ilegal de los derechos de autor que va más allá de su alcance de responsabilidad".

Damos muchas cosas por sentado, especialmente porque confiamos cada vez más en la tecnología. "Internet es para siempre": este refrán a menudo se puede encontrar en los medios de comunicación, y la sabiduría oculta en esta declaración sobre la necesidad de comportarse con cuidado probablemente esté justificada, pero esto no debe tomarse literalmente. La gente elimina publicaciones. Los sitios web y las plataformas completas están desapareciendo debido a razones comerciales y de otro tipo. Los ricos, famosos y los que están en el poder no dudan en intimidar a las pequeñas organizaciones sin fines de lucro. Es bueno tener protección por si acaso, pero existen límites para la constancia de Internet, y donde hay límites, hay soluciones.

Cuando el archivo en línea se olvida

More articles: