"بعض الناس يسموننا" بليوشكينز "- أود أن أقول إننا محفوظات".
يحدد مدير آلة Wayback Mark Graham حجم الأرشيف المفضل للجميع
شاهد آلة Wayback في جمعية الأخبار عبر الإنترنت 2018أوستن ، تكساس. بغض النظر عن مدى عدم رغبة خدمات المشترك في إقناعك بذلك ، ولكن لا يمكن العثور على كل شيء على Amazon أو Netflix. هل تريد ، على سبيل المثال ،
قراءة كتاب القاضي بريت كافانو (أو حتى كتابهم
السنوي سيئ السمعة )؟ فضولي لرؤية مجموعة من
الملصقات الإعلانية التدخين خمر ؟ ماذا عن عرض
أكبر مجموعة من الأدب البوذي التبتي في العالم ؟ يوجد اليوم مكان واحد يمكنك من خلاله فعل كل هذا ، وليس Google أو بعض مواقع القراصنة التي تزورها (غالبًا).
يقول مارك جراهام ، مدير Wayback Machine في أرشيف الإنترنت: "لدي فيديو حكومي حول كيفية غسل أيدينا أو الاستعداد لحرب نووية ". "يمكننا بسهولة إنشاء قائمة بملفات .ppt على جميع المواقع باستخدام نطاق .mil ، مجمع PowerPoint الصناعي العسكري."
تحدث جراهام مؤخرًا مع عدة مجموعات صغيرة من المشاركين في مؤتمر Online News Association 2018 وكان Ars Technica محظوظًا لوجوده. قدم في وقت لاحق عرضًا كاملًا للمؤتمر ، والذي
يتوفر الآن
بتنسيق صوتي . والفكرة الأساسية هي أن حجم أرشيف الإنترنت اليوم قد يكون من الصعب فهمه مثل حجم الإنترنت نفسه.
لا يزال من السهل فهم الفضاء المادي غير الربحي ، على الأقل هذا ما قصده غراهام أن يكون. اليوم ، يتم تنفيذ جميع أنشطة أرشيف الإنترنت من كنيسة قديمة واحدة (حتى لم يتم إزالة المقاعد) في سان فرانسيسكو بحوالي مائتي شخص. يحتوي الأرشيف أيضًا على أقرب مستودع لتخزين الوسائط المادية ، ليس فقط الكتب ، ولكن أيضًا أشياء مثل تسجيلات الفينيل. نكت غراهام أن هناك وحدة قياس رئيسية هي "حاوية التسليم". يتلقى الأرشيف هذه الكمية من المواد كل أسبوعين.
تعد الشركة حاليًا ثاني أكبر ماسح ضوئي للكتب في العالم بعد Google. أكد غراهام أن العدد الحالي من عمليات المسح بلغ أكثر من أربعة ملايين. يحتوي الأرشيف أيضًا على قائمة أمنيات لمسح 1.5 مليون التالي ، بما في ذلك كل ما يتم الاستشهاد به على ويكيبيديا. تحاول Wayback Machine حمايتك من ظهور
خطأ 404 عند النقر على الروابط من ويكيبيديا (أخبر جراهام بي بي سي مؤخرًا أن برامج Wayback استردت ما يقرب من ستة ملايين صفحة تم فقدها بسبب فشل الارتباط لهذا). اليوم ، يمكن تنزيل الكتب المنشورة قبل عام 1923 مجانًا عبر أرشيف الإنترنت ، ويمكنك لاحقًا استعارة نسخة رقمية من العديد من هذه الكتب.
ترجمة Tweet:
أرشيف الإنترنت: تم إصلاح أكثر من 9 مليون ويكيبيديا روابط غير صحيحة
WikiResearch: ممتن للغاية للعمل الاستثنائي الذي يقوم به أصدقاؤنا فيinternetarchive للتعامل مع خطأ 404 وحفظ ملايين الروابط للمواقع والمصادر التي نقلها Wikipedians رقميًا أثناء قيامهم بإنشاء أكبر موسوعة في العالم.
بالطبع ، يقدم أرشيف الإنترنت هذه الأيام أكثر من مجرد نص. تغطي مجموعته الإخبارية أكثر من 1.6 مليون برنامج إخباري بأدوات مثل القدرة على البحث عن الكلمات في التسميات التوضيحية والوصول إلى آخر الأخبار (تتوفر عمليات البث بعد 24 ساعة ، ثم يتم توفيرها للزوار في شكل مقاطع دقيقة قابلة للبحث لمدة دقيقتين). يغطي الجزء المتزايد من الصوت والموسيقى من أرشيف الإنترنت الأخبار الإذاعية والبودكاست والوسائط المادية (على سبيل المثال ، مجموعة من
200000 نسخة من 78 نسخة تبرعت بها مكتبة بوسطن مؤخرًا). وكما يكتب آرس ، تفتخر المنظمة بمجموعة
كلاسيكية شاملة من ألعاب الفيديو التي يمكن لأي شخص تحميلها على محاكي يعتمد على المتصفح للبحث أو الترفيه. رسميًا ، يتضمن هذا القسم أكثر من 300000 عنوان ، "حتى تتمكن من تشغيل لعبة Oregon Trail على كمبيوتر Apple C القديم في متصفحك في الوقت الحالي - لا توجد إعلانات ، ولا تتبع للمستخدم" ، يقول غراهام.
يقول: "قد يطلق علينا البعض بليوشكينز". "أود أن أقول إننا أرشيفيون".
بشكل عام ، يقول جراهام أنه تتم إضافة أربعة بيتابايت من المعلومات سنويًا إلى أرشيف الإنترنت (أي أربعة ملايين غيغابايت للسياق). بيانات المؤسسة الحالية هي 22 بيتابايت ، لكن أرشيف الإنترنت يمتلك بالفعل 44 بيتابايت. يقول جراهام: "لأننا مصابون بجنون العظمة". "يمكن أن تفشل السيارات ، ولدينا سمعة".
ساعدت هذه العقيدة المستوحاة من
وكالة ناسا منظمة غير ربحية على النجاة من الأضرار الناجمة عن الحريق ، والتي
كلفت ما يقرب من 600000 دولار - كل ذلك دون فقدان بيانات الأرشيف.
30،000 مدخل؟ ليس سيئًا ، ويبدو أن روبوتات آلة Wayback زادت بالتأكيد من حبها لآرس.
مع آلة Wayback ، يمكنك تذكر والتفكير في كيفية إخفاء Ars لوفاة ستيف جوبز في أكتوبر 2011.
حسنًا ... ربما لا يزال لدي فرصة لأن أصبح أرسيًا / أرسيًا لتنزيل ملف PDF رقم 1000 الذي تم التقاطه بواسطة أرشيف الإنترنت.وصول الجميع إلى المعرفة (وإلى الحقائق ، إلى عدد كبير من الحقائق)
كان المفهوم العام لأرشيف الإنترنت على مدى 22 عامًا بسيطًا:
"الوصول الشامل إلى جميع المعارف" . في عصر الإنترنت ، هذا يعني بالطبع إدخال جيش صغير من الروبوتات ، ويلاحظ غراهام أن أرشيف الإنترنت يحتوي دائمًا على برامج تجمع المحتوى. ما يقرب من 7000 عملية متزامنة تمتد عبر الشبكة بأكملها لتستقبل في نهاية المطاف 1.5 مليار عنصر مختلف في الأسبوع. يمكن مشاهدة بعض الأشياء ، مثل صفحة Google الرئيسية أو The New York Times ، عدة مرات في اليوم ؛ يمكن مشاهدة الآخرين بشكل أقل.
"نحن نحاول الحصول على كل شيء ، لكن الأمر صعب" ، يلاحظ غراهام. "يدمج ، جافا سكريبت ، تطبيقات تفاعلية - لا يمكننا الحصول على بعض هذه المواد ، لكننا نعمل على ذلك."
تتضمن ذاكرة التخزين المؤقت للأشياء التي نعمل عليها وسائط سريعة الزوال مثل مجموعات Snapchat أو Telegram العامة ، وتحتفظ آلة Wayback بجهات الاتصال المحلية في الأماكن التي قد تتعرض فيها بعض أرشيفات أو خوادم الوسائط للخطر (يشير Graham مؤخرًا إلى شركاء في مصر ، على سبيل المثال).
نتيجة كل هذا هو أن آلة Wayback. تحولت إلى شيء أكثر فائدة من مجرد الرحلات الماضية الممتعة إلى LiveJournals. استخدمه آرس عدة مرات لمجموعة متنوعة من الأغراض ، بدءًا من
التقاط التغييرات في حيادية Comcast إلى حقيقة أن الوصف التنظيمي الموزع للدفاع قد تطور. ويشير غراهام إلى
الجدل الأخير
في عام 2018 عندما غرد الرئيس ترامب بأن جوجل لا تروج لعلاقات جيدة مع الولايات المتحدة الأمريكية على صفحتها الرئيسية (كما كانت في الماضي). قبل أن تتمكن Google من الإجابة على ذلك ، لجأت الشركة إلى أرشيف الإنترنت بسؤال بسيط - هل هناك نسخة؟
يقول جراهام: "أنا أحب Google ، لكن وظيفتهم لا تتمثل في عمل نسخ من الصفحة الرئيسية كل 10 دقائق". "هذه هي وظيفتنا."
شارك غراهام أن آلة Wayback استولت فعليًا على 835 نسخة من صفحة Google الرئيسية في يناير 2018. "لذا تمكنا من المساعدة في التقاط الملاحظات. نحن لا نتحيز ، لكننا من أجل الحقيقة ".
لعب الموقع دورًا مشابهًا عندما
حذف البيت الأبيض مؤخرًا
جميع أرشيفات رسائله الإخبارية ، واحتاج إليها عدد من المنظمات (ليس فقط المنظمات الإخبارية ، ولكن أيضًا المنظمات البيئية أو ACLUs). والمواد التي تم الحصول عليها من آلة Wayback
تم استخدامها كدليل في المحكمة . ويضيف: "هناك العديد من الأحداث التي تحدث من حيث الوقت". بصفته نائبًا سابقًا لرئيس NBC News (وبالتالي رغبته في حضور ONA ، ربما) ، يشير غراهام بفخر أيضًا إلى أن الموقع تتم الإشارة إليه حوالي خمس مرات في اليوم من قبل وسائل الإعلام.
يقول غراهام إن Wayback Machine تعمل بجد لتحسين أدوات المستخدم لتحسين الموقع. في الجزء السفلي الأيسر من الصفحة الرئيسية لـ Wayback Machine ، ستجد ، على سبيل المثال ،
واجهات برمجة التطبيقات العامة . يشير غراهام إلى أن الناس يستخدمونها لإنشاء أشياء مثل
المفاضل ، حيث يمكنك إجراء مسحين ضوئيًا ووضعهما جنبًا إلى جنب ورؤية التغييرات. أداة أخرى أنشأها المستخدم ، والتي جذبت انتباهه ، تتيح لك إلقاء نظرة على الموقع وعمل
مخطط شجرة شعاعي لمعرفة كيف يتغير هيكله بمرور الوقت .
على الرغم من أن الأداة الأسهل والأكثر فاعلية للجميع هي التكنولوجيا مباشرة من Wayback Machine - يسمح الموقع لشخص ما بإرسال رابط إلى أرشيف الإنترنت يدويًا للأرشفة مباشرة من صفحته الرئيسية. "إذا مشيت قطتي في الحديقة ورأيت قصة على أخبار Google ، يمكنك طباعتها. ولكن اليوم يمكنك أيضًا إرسالها إلى أرشيف الإنترنت. وفقًا لتقديراته ، قد تكون النتيجة حوالي مليون طلقة في الأسبوع.
يقول: "نسعى للحصول على معلومات حول شبكة كبيرة حقًا دون خداع". وبغض النظر عما إذا تم العثور على شيء بواسطة الروبوتات ، أو مستخدم هاوي مخصص للأرشيف ، يمكن لأي شخص آخر أن يقدر فقط القدرة على العثور على المحتوى ، وهو بالمناسبة
المهمة الأصلية لـ Ars Technica . (لحسن الحظ ، بعد 20 عامًا ، لم يبلغنا أحد بعد "
بأشياء سيئة للغاية مثل محتوى NT و Linux و BeOS تحت سقف واحد.")
ترجمة: ديانا شيريميوفا

حول #philtech#philtech (تقنيات + أعمال خيرية) هي
تقنيات مفتوحة موصوفة علنًا
ترفع مستوى معيشة أكبر عدد ممكن من الأشخاص من خلال إنشاء منصات شفافة للتفاعل والوصول إلى البيانات والمعرفة. واستيفاء مبادئ filtech:
1. الانفتاح والتكرار وليس الملكية التنافسية.
2. مبني على مبادئ التنظيم الذاتي والتفاعل الأفقي.
3. مستدامة وموجهة نحو المنظور ، بدلاً من السعي وراء الفوائد المحلية.
4. مبنية على البيانات [المفتوحة] ، وليس التقاليد والمعتقدات
5. اللاعنفية واللاعنف.
6. الشمولية ، وعدم العمل لمجموعة واحدة من الناس على حساب الآخرين.
PhilTech Accelerator لـ Social Technology Startups هو برنامج للتطوير المكثف لمشاريع المرحلة المبكرة التي تهدف إلى تحقيق المساواة في الوصول إلى المعلومات والموارد والفرص. التيار الثاني: مارس - يونيو 2018.
الدردشة في Telegramمجتمع من الأشخاص الذين يطورون مشاريع filtech أو يهتمون ببساطة بموضوع التكنولوجيا للقطاع الاجتماعي.
أخبار #filtechقناة Telegram مع أخبار عن المشاريع في #philtech أيديولوجية وروابط لمواد مفيدة.
اشترك في النشرة الإخبارية الأسبوعية