"Ada yang memanggil kami Plyushkins - Saya suka mengatakan bahwa kami adalah pengarsip."
Direktur Wayback Machine Mark Graham menguraikan skala arsip favorit semua orang
Saksikan Wayback Machine di Asosiasi Berita Online 2018Austin, Texas. Tidak peduli berapa banyak layanan pelanggan tidak ingin meyakinkan Anda tentang hal ini, tetapi tidak semuanya dapat ditemukan di Amazon atau Netflix. Ingin, misalnya,
membaca buku Hakim Brett Cavanaugh (atau bahkan
tahunan terkenal mereka)? Penasaran ingin melihat banyak
poster iklan merokok antik ? Bagaimana dengan melihat
koleksi literatur Buddha Tibet terbesar di dunia ? Saat ini ada satu tempat di mana Anda dapat melakukan semua ini, dan itu bukan Google atau beberapa situs bajak laut yang mungkin (sering) Anda kunjungi.
"Saya punya video pemerintah tentang cara mencuci tangan atau mempersiapkan perang nuklir ," kata Mark Graham, direktur Wayback Machine di Internet Archive. "Kita dapat dengan mudah membuat daftar file .ppt di semua situs dengan domain .mil, Kompleks Industri PowerPoint Militer."
Graham baru-baru ini berbicara dengan beberapa kelompok kecil peserta dalam konferensi Asosiasi Berita Online 2018 dan Ars Technica beruntung berada di sana. Dia kemudian membuat presentasi lengkap konferensi, yang sekarang
tersedia dalam format audio . Dan ide dasarnya adalah bahwa skala Internet Archive saat ini dapat sama sulitnya dengan skala Internet itu sendiri.
Ruang fisik nirlaba masih mudah dipahami, setidaknya itulah yang dimaksudkan oleh Graham. Saat ini, semua kegiatan Internet Archive dilakukan dari satu gereja tua (bahkan bangku-bangku tidak dihilangkan) di San Francisco oleh sekitar dua ratus orang. Arsip ini juga berisi gudang terdekat untuk menyimpan media fisik, tidak hanya buku, tetapi juga benda-benda seperti kaset. Graham bercanda bahwa ada satuan ukuran utama adalah "wadah untuk pengiriman." Arsip menerima jumlah materi ini setiap dua minggu.
Perusahaan saat ini adalah pemindai buku terbesar kedua di dunia, setelah Google. Graham telah memastikan bahwa jumlah pemindaian saat ini berjumlah lebih dari empat juta. Arsip itu bahkan memiliki daftar keinginan untuk 1,5 juta pemindaian berikutnya, termasuk semua yang dikutip di Wikipedia. Mesin Wayback sedang berusaha melindungi Anda dari
kesalahan 404 yang muncul ketika mengklik tautan dari Wikipedia (Graham baru-baru ini mengatakan kepada BBC bahwa bot Wayback memulihkan hampir enam juta halaman yang hilang karena kegagalan tautan untuk ini). Saat ini, buku-buku yang diterbitkan sebelum tahun 1923 dapat diunduh secara gratis melalui Internet Archive, dan Anda kemudian dapat meminjam salinan digital dari banyak buku-buku ini.
Terjemahan Tweet:
Internet Archive: Lebih dari 9 Juta Wikipedia Tautan Tidak Diperbaiki
WikiResearch: Sangat bersyukur atas kerja luar biasa yang dilakukan teman-teman kami di @internetarchive untuk menangani kesalahan 404 dan secara digital menyimpan jutaan tautan ke situs dan sumber yang dikutip oleh Wikipediawan saat mereka menciptakan ensiklopedia terbesar di dunia.
Tentu saja, akhir-akhir ini Internet Archive menawarkan lebih dari sekadar teks. Koleksi berita-Nya mencakup lebih dari 1,6 juta program berita dengan alat-alat seperti kemampuan untuk mencari kata-kata dalam keterangan dan akses ke berita terbaru (siaran tersedia setelah 24 jam, dan kemudian diberikan kepada pengunjung dalam bentuk dua menit bagian yang dapat dicari). Bagian audio dan musik yang tumbuh dari Internet Archive mencakup berita radio, podcasting, dan media fisik (misalnya, koleksi
200.000 salinan dari 78an yang baru-baru ini disumbangkan oleh perpustakaan Boston). Dan, seperti yang ditulis Ars, organisasi ini menawarkan
koleksi klasik permainan video yang luas yang dapat diunggah siapa saja ke emulator berbasis browser untuk penelitian atau relaksasi. Secara resmi, bagian ini mencakup sekitar 300.000 judul, "sehingga Anda benar-benar dapat memainkan Oregon Trail di komputer Apple C lama di peramban Anda sekarang - tanpa iklan, tanpa pelacakan pengguna," kata Graham.
"Beberapa orang mungkin memanggil kita Plyushkins," katanya. "Aku suka mengatakan bahwa kita adalah pengarsip."
Secara umum, Graham mengatakan bahwa empat petabyte informasi per tahun ditambahkan ke Internet Archive (itu empat juta gigabytes untuk konteks). Data organisasi saat ini adalah 22 petabyte, tetapi Internet Archive sebenarnya memiliki 44 petabyte. "Karena kita paranoid," kata Graham. "Mobil bisa gagal, dan kita punya reputasi." Kredo yang diilhami oleh
NASA ini membantu organisasi nirlaba bertahan dari kerusakan yang disebabkan oleh api, yang
menelan biaya hampir $ 600.000 - semuanya tanpa kehilangan data arsip.
30.000 input? Tidak buruk, dan tampaknya bot Wayback Machine telah meningkatkan kasih sayang mereka untuk Ars.
Dengan Mesin Wayback, Anda dapat mengingat dan berpikir tentang bagaimana Ars menyembunyikan kematian Steve Jobs pada Oktober 2011.
Hmm ... mungkin saya masih punya kesempatan untuk menjadi Arsian / Arsian untuk mengunduh 1000th PDF yang ditangkap oleh Internet Archive.Akses universal ke pengetahuan (dan ke fakta, ke sejumlah besar fakta)
Konsep umum Internet Archive selama 22 tahun terakhir sederhana:
"akses universal ke semua pengetahuan .
" Di era Internet, ini berarti, tentu saja, pengenalan pasukan kecil bot, dan Graham mencatat bahwa Internet Archive selalu memiliki perangkat lunak yang mengumpulkan konten. Sekitar 7.000 proses bersamaan menjangkau seluruh jaringan untuk akhirnya menerima 1,5 miliar item berbeda per minggu. Beberapa hal, seperti beranda Google atau The New York Times, dapat dilihat berkali-kali sehari; yang lain lebih jarang dilihat.
"Kami mencoba untuk mendapatkan semuanya, tetapi sulit," catat Graham. "Sematan, Javascripts, aplikasi interaktif - kami tidak bisa mendapatkan beberapa materi ini, tetapi kami sedang mengusahakannya."
Cache dari hal-hal yang sedang kami kerjakan meliputi media sementara seperti kelompok publik Snapchat atau Telegram, dan Mesin Wayback memelihara kontak lokal di tempat-tempat di mana beberapa arsip media atau server mungkin berisiko (Graham baru-baru ini mencatat mitra di Mesir, misalnya).
Hasil dari semua ini adalah bahwa Mesin Wayback telah berubah menjadi sesuatu yang jauh lebih berguna daripada sekadar perjalanan masa lalu yang menyenangkan ke LiveJournals. Ars telah menggunakannya berkali-kali untuk berbagai tujuan, mulai dari
menangkap perubahan dalam netralitas bersih Comcast hingga fakta bahwa deskripsi organisasi Terdistribusi Pertahanan telah berevolusi. Dan Graham menunjuk ke sebuah
kontroversi baru-baru ini
pada tahun 2018 ketika Presiden Trump tweeted bahwa Google tidak mempromosikan hubungan baik dengan Amerika Serikat di beranda (seperti di masa lalu). Sebelum Google dapat menjawab ini, perusahaan beralih ke Internet Archive dengan pertanyaan sederhana - apakah ada salinannya?
"Saya suka Google, tetapi tugas mereka bukan membuat salinan halaman beranda setiap 10 menit," kata Graham. "Ini pekerjaan kita."
Graham membagikan bahwa Wayback Machine sebenarnya menyita 835 salinan beranda Google pada Januari 2018. “Dengan cara ini, kami dapat membantu mengambil catatan. Kami tidak memihak, tetapi kami demi kebenaran. ”
Situs ini memainkan peran yang sama ketika Gedung Putih baru-baru ini
menghapus semua arsip buletinnya , dan sejumlah organisasi (tidak hanya organisasi berita, tetapi juga organisasi lingkungan atau ACLU) membutuhkannya. Dan bahan yang diperoleh dari Wayback Machine
digunakan sebagai bukti di pengadilan . "Ada banyak peristiwa yang terjadi dalam hal waktu," tambahnya. Sebagai mantan wakil presiden NBC News (karena itu keinginannya untuk menghadiri ONA, mungkin), Graham juga dengan bangga menunjukkan bahwa situs tersebut dirujuk sekitar lima kali sehari oleh media.
Graham mengatakan Wayback Machine bekerja keras untuk meningkatkan alat penggunanya untuk meningkatkan situs. Di kiri bawah halaman beranda Wayback Machine, Anda akan menemukan, misalnya,
API publik . Graham menunjukkan bahwa orang menggunakannya untuk membuat sesuatu seperti
pembeda , di mana Anda dapat mengambil dua pindaian, menempatkannya berdampingan dan melihat perubahannya. Alat lain yang dibuat oleh pengguna, yang menarik perhatiannya, memungkinkan Anda untuk melihat situs dan membuat
bagan pohon radial untuk melihat bagaimana strukturnya berubah dari waktu ke waktu .
Meskipun mungkin alat yang paling mudah dan paling efektif untuk semua orang adalah teknologi langsung dari Wayback Machine - situs ini memungkinkan seseorang mengirim tautan ke Internet Archive secara manual untuk pengarsipan langsung dari halaman beranda mereka. “Jika saya mengantarkan kucing saya di taman dan saya melihat sebuah cerita di Google News, Anda dapat mencetaknya. Tetapi hari ini Anda juga dapat mengirimkannya ke Internet Archive, ”kata Graham. Menurut perkiraannya, hasilnya mungkin sekitar satu juta tembakan per minggu.
"Kami mencari informasi di jaringan yang sangat besar tanpa curang," katanya. Dan terlepas dari apakah sesuatu ditemukan oleh bot, atau pengguna arsip amatir yang berdedikasi, semua orang hanya dapat menghargai kemampuan untuk menemukan konten, yang omong-omong adalah
misi asli Ars Technica . (Untungnya, setelah 20 tahun, belum ada yang memberi tahu kami tentang "
hal -
hal yang sangat buruk seperti konten NT, Linux, dan BeOS dalam satu atap.")
Terjemahan: Diana Sheremyova

Tentang #philtech#philtech (teknologi + filantropi) adalah teknologi terbuka dan dideskripsikan secara publik yang menyelaraskan standar hidup sebanyak mungkin orang dengan menciptakan platform transparan untuk interaksi dan akses ke data dan pengetahuan. Dan memenuhi prinsip-prinsip filtech:
1. Buka dan direplikasi, bukan kepemilikan secara kompetitif.
2. Dibangun di atas prinsip pengorganisasian diri dan interaksi horizontal.
3. Berkelanjutan dan berorientasi pada perspektif, daripada mengejar manfaat lokal.
4. Dibangun di atas data [terbuka], bukan tradisi dan kepercayaan
5. Non-kekerasan dan non-manipulatif.
6. Termasuk, dan tidak bekerja untuk satu kelompok orang dengan mengorbankan orang lain.
PhilTech Accelerator dari Startup Teknologi Sosial adalah sebuah program untuk pengembangan intensif proyek-proyek tahap awal yang bertujuan untuk menyamakan akses ke informasi, sumber daya dan peluang. Aliran kedua: Maret - Juni 2018.
Obrolan di TelegramKomunitas orang yang mengembangkan proyek filtech atau hanya tertarik pada topik teknologi untuk sektor sosial.
Berita #philtechSaluran Telegram dengan berita tentang proyek-proyek di #philtech ideologi dan tautan ke materi yang bermanfaat.
Berlangganan newsletter mingguan