المباحث هبرا: ضاعت صورتك


هل تساءلت يوما عن مقدار المعلومات المفقودة تماما؟ بعد كل شيء ، المعلومات هي ما هابر موجود ل. هل تعرف ما يحدث في معظم الأحيان مع الموارد القائمة على منشورات المستخدم؟ يقوم المؤلفون بإدراج الصور والصور ومقاطع الفيديو من مواقع الجهات الخارجية وبعد مرور بعض الوقت لم تعد متوفرة. هذا هو بالضبط ما تم إنشاؤه من قبل Habrastorage . أظهرت الممارسة أنه لا يوجد أحد (باستثناء المحررين وعدد قليل من المتحمسين) يقومون بتحميل الصور هناك بمفردهم. لذلك ، في مرحلة ما ، جعلت إدارة Habr هذه الوظيفة تلقائيًا - كل صورة تظهر في المنشور يتم تحميلها تلقائيًا إلى المستودع ولن تختفي من هناك أثناء وجود Habr نفسه. بالطبع ، هناك استثناءات وقد يحدث خطأ ما ، لكن الآن لا يتعلق بها.


حدثت أكبر مشكلة في هذا المخطط بأكمله مع تحميل الصور في Habrastorage أثناء تنفيذه. بحلول ذلك الوقت ، كانت بعض المنشورات القديمة بالفعل بدون رسومات ، وبالتالي ظلت كذلك. اليوم سنحاول معرفة مقدار المعلومات الرسومية التي فقدها هبر منذ ولادته. بالإضافة إلى ذلك ، هل يمكننا أن نجد شيئًا من المفقودين؟ بعد كل شيء ، هذا كعب "لا يمكن تحميل الصورة" مزعج ، أليس كذلك؟ المباحث اليوم مكرس لذلك. لنبدأ!


ربما ذكرتم في تعقب في هذه المقالة؟ ربما ، في أحد منشوراتك القديمة اختفت الصورة ، لكنني وجدتها. إذا كنت لا ترغب في قراءة المنشور بالكامل ، يمكنك ببساطة التمرير إلى المفسد في النهاية (قسم النتائج ) ، والذي يسرد جميع المنشورات والصور التي تم العثور عليها. شكرا لك

مقدمة وطرق


سيبدأ المحقق الخاص بنا من البداية (منطقيا ، أليس كذلك؟). من بداية هبر. بعد كل شيء ، كلما تم نشر أي منشور سابقًا ، زاد احتمال فقدان الصور منه في مكان ما في التاريخ. هذا هو السبب في أننا سوف نبدأ في عام 2006 والمضي قدما قليلا.


جميع المنشورات من 40 محور ، والتي هي حاليا في بداية التقييم ، تشارك في المراجعة. يتم تقديم قائمة كاملة من هذه المحاور تحت المفسد. في الواقع ، لم يكن الكثير منها موجودًا ، ومع ذلك ، عندما تم إضافة مراكز جديدة ، تم نقل المنشورات هناك.



تم جمع المعلومات باستخدام مجموعة من البرامج النصية PHP. تم تحميل كل منشور ، وتم تحديد محتوى العلامة <div id = "post-content-body"> ، وتم التحقق من وجود علامات <img> . لكل صورة ، يتم تخزين روابط للصور مع الإشارة إلى معرف المنشور على Habré. في المستقبل ، يتم تحليل هذه المعلومات.


ماذا ومتى نشروا


2006


في بداية هبر ، لم يكن هناك الكثير من المنشورات كما هو الحال الآن ، ولكن هناك عدد أقل من الصور فيها. في المجموع ، في عام 2006 (ابتداءً من 5 يونيو 2006) تم نشر 221 مشاركة في المحاور المدرجة. 53 من هذه الوظائف تحتوي على ما مجموعه 75 صورة. الحد الأقصى للصور (10 أجزاء) في منشور " الأدوات العشرة التي غيرت العالم ". 50 رسومات موجودة بالفعل على Habrastorage. آخر 25 فقدت. كلها فريدة ولا تتكرر.


حقيقة مثيرة للاهتمام: اثنان من الصور تؤدي إلى هبر نفسه ، ولكن في الوقت نفسه ، لم تكن متاحة لفترة طويلة. هذه هي الصور http://www.habrahabr.ru/tmp/sup_blogs_preview.gif و http://www.habrahabr.ru/tmp/upgrade-chart.gif.

لذلك ، في عام 2006 ، فقدت 33.3 ٪ من الصور في المنشورات.


2007


في عام 2007 ، زاد عدد المنشورات بشكل كبير ، وكذلك عدد الصور - تم نشر 1713 منشورًا. 599 منشورات تحتوي على 1467 صورة. تم نقل 1،229 صورة إلى Habrastorage ، وفقدت 238 ( 16.2 ٪ ).


حقيقة مثيرة للاهتمام: يحتوي نشر أفضل 100 تطبيق Mac OS على الحد الأقصى لعام 2007 - 100 صورة ولا يحتوي على نص حقوق الطبع والنشر.

بالإضافة إلى ذلك ، يتم تكرار بعض هذه الصور المفقودة. لذلك ، واحد منهم يحدث 6 مرات في منشور واحد مع 6 صور فقط. أيضًا ، يتم تكرار الصورة "Up.gif" 21 مرة ، 16 - "Down.gif" و 8 - "Same.gif" من مجال واحد. وجميع هذه الصور 45 من وظيفة واحدة ، فيها 47 صورة فقط.


لا يزال هناك 191 فريدة <img>.


2008


منذ عام إلى عام ، زاد عدد المنشورات حول Habré فقط ، في عام 2008 ، سينظر المخبر في 2520 منشورًا بالإضافة إلى 2969 صورة. لقد لاحظنا أنه في عام 2008 يتجاوز عدد الصور في المنشورات أخيرًا عدد المنشورات. في الوقت نفسه ، هناك 1207 مشاركة فقط تحتوي على صور ، ويتم عرض 42 عنصرًا كحد أقصى من معلومات الرسوم في المنشور " History of Google Holiday Logos ". تم تخزين 1943 صورة بالفعل على Habrastorage ، وفقد 1026 ( 34.6٪ ).


حقيقة مثيرة للاهتمام: الصورة الأكثر غير متوقعة (أو بالأحرى ، مشكلة في تصميم المنشور) هنا . نتيجة لذلك ، يحاول Habr تحميل الصورة على http: // # /.


التين. 1. مراجعة الإحصاءات العامة


هل من الممكن استعادة شيء على الأقل؟


الانتعاش الجزئي ليس بالأمر الصعب. على سبيل المثال ، تتمثل الطريقة الأكثر "كسولة" في استخدام " أرشيف الإنترنت" في محاولة لتحميل صفحات المنشورات المحفوظة. بالإضافة إلى ذلك ، يمكنك محاولة "العثور" في الأرشيف على الصور نفسها من خلال روابط مباشرة.


Lifehack: تحتاج إلى التحقق من توفر الصور في جميع إصدارات الصفحة في الأرشيف ، وليس فقط الأقدم والأحدث.

لسوء الحظ ، على الرغم من أن هذه الطريقة تعمل في بعض الحالات ، إلا أنه من الصعب للغاية استعادة نصف الصور على الأقل. لذلك ، فإن الخطوة التالية هي التحقق من الاستضافة المتقاطعة والترجمات الأصلية ، وبطبيعة الحال ، النسخ الأرشيفية للصفحات الأصلية.


بالإضافة إلى ذلك ، يمكنك محاولة العثور على الصورة المطلوبة باستخدام أحد مرايا Habrir غير الرسمية التي كانت تعمل وما زالت تخزن بعض المعلومات المنسوخة.


الخيار الأخير والأكثر صعوبة هو استخدام محركات البحث. إذا كنت تعرف بالضبط ما يجب أن يكون في الصورة (يوجد وصف وسياق) ، فهناك فرصة للبحث عن الملفات التي تحمل الاسم نفسه إذا تم نسخها من قبل شخص ما إلى مورد آخر.


بطبيعة الحال ، كل خطوة تالية تزيد من وقت البحث بشكل غير خطي.


ما تمكنت من العثور عليها


قد لا تتأثر كثيرًا بعدد الصور التي تم العثور عليها حتى الآن - فهناك 300 صورة منها (تحتوي على 140 منشورًا من 81 مؤلفًا). إذا أخذنا في الاعتبار عدد "الخسائر" (1،242) ، تكون النتيجة حوالي 24.2 ٪ . لماذا هناك عدد أقل من الصور المفقودة من قبل؟ تتم إزالة جميع الصور عديمة الفائدة (مثل عدادات العرض) والصور غير الموجودة (مثل http: // # / المذكورة بالفعل ، وكذلك http: //fig.jpg/ ، وما إلى ذلك) من الاعتبار.


كيف جاء هذا العدد المستدير؟ والحقيقة هي أن حوالي 300 انتهت يوم البحث. في البداية ، كنت سأصل إلى 333 ، ولكن 300 تبدو جيدة جدًا. بالإضافة إلى ذلك ، في الوقت الحالي ، يظل حوالي 33٪ من "ضحايا البحث" غير مؤكدين تمامًا.



التين. 2. عمليات البحث الحالية


تم تحميل جميع الصور التي تم العثور عليها (باستثناء ملف واحد .bmp ، سيكون 301) على hsto.org ، وترد روابط لها ومنشورات ، وكذلك مؤشرات الصور فيها ، في القسم التالي.


النتائج


لذلك ، تحت المفسد هي الصور التي تم العثور عليها بنجاح ، بالإضافة إلى معرف المنشور ، وفهرس الصورة داخل نص المنشور (يبدأ من 1 ، وليس من 0) ومؤلف المنشور. إذا كنت مؤلف المنشورات المذكورة ، والأرقام التي عثر عليها صحيحة ، يرجى تصحيح مشاركاتك. شكرا لك


بالمناسبة ، لا تزال بعض الصور متاحة للعرض في المنشورات ، ولكن لم يتم نقلها إلى Habrastorage ، وبالتالي قد يتعذر الوصول إليها في مرحلة ما.


300 صورة
المؤلفمعرف النشرالفهارس والمراجعمثال
0x62ash271491
0xa8111051
2Bad6071
10971
11061 ، 2 ، 3 ، 5 ، 24
138362
4eese308201 ، 2 ، 3 ، 5
8cinq418531
464981
Adam_B125821
عينو395011
alardus26281
ألاسكا234471 ، 2
aleks_raiden244792
305943
390371
403121 ، 2 ، 3 ، 4
441521 ، 2 ، 3
462941
467411
477821 ، 2 ، 3 ، 4 ، 5
alfsoft427821 ، 2 ، 3 ، 4 ، 5
alizar377791 ، 2
altblog446771
arestov379211
artch197261
badlittleduck162921 ، 2 ، 3 ، 4 ، 5
Barkov263351
BBSoD85051
bO_oblik221501 ، 2 ، 3 ، 4 ، 5
221861
222151
223221 ، 2 ، 3 ، 4 ، 5 ، 6
223341 ، 2
223751 ، 2 ، 3
225101 ، 2
226141
228361 ، 2
261811 ، 2 ، 3 ، 4 ، 6
281961 ، 2 ، 3 ، 4 ، 5 ، 6 ، 7 ، 8
297061 ، 2 ، 3 ، 4
314901 ، 2 ، 3 ، 4
367131
371801
372491
373061 ، 2
380131
383891 ، 2
411041 ، 2
416471
418211 ، 2
chisto_v127831
chulak457831 ، 2 ، 3 ، 4 ، 5 ، 6 ، 7
Cosss310691
CurlyBrace110101
119411
141571
373031
dreikanter313201 ، 2 ، 4
entze407671
Fenniks208432
239021
391091
firstbyte383141
freetonik265931
frujo409871
garbuz296941
gorinich120271
Gravitality288401
أ href469081 ، 2
iljava309022 ، 3
Imposeren265661
invladis429041
كارلسون8971Down.gif ، Same.gif ، tpci_trends.png ، Up.gif
310421
310501
311411 ، 3 ، 4 ، 5 ، 6 ، 7 ، 8 ، 9 ، 10 ، 11 ، 12 ، 13 ، 14 ، 15 ، 16 ، 17
كلاوس157751 ، 2 ، 3 ، 4 ، 5 ، 6 ، 7 ، 8
Lain_13168912
le0pard383911
LukaSafonov435371
meako267051
مدكارد314192 ، 3 ، 4
ميو3961
7531
9361
موزايك7441
Mr_Floppy283431
صفر444761
ضابط1101
oleg_bunin72071
72261
86791
127681
olegafx439341 ، 2 ، 3 ، 4 ، 5 ، 6 ، 7 ، 8-9 ، 10 ، 11 ، 12 ، 13 ، 14 ، 15 ، 16 ، 17 ، 18 ، 19
ostrovityanin371462 ، 3
ponomar141411
porchini218501 ، 2
Pure_BY84161
RAF8511 ، 2
ramber436931
روست443801
ruskar425783 ، 5 ، 8
saintd7021
SamDark301041
سكالا378044
Shapelez232601
443791 ، 2
461131
465991
475361
slaff81341 ، 2
smartov171603
smitana303751
spanasik4475517
spiritus_sancti411291 ، 2
SummerDream38011
sunnybear312111 ، 2
تحول90951
Taoorus375071
Thoggen387331
450241
451701
tsepelev366111
VadimUA469221
فيتول260731 ، 2 ، 3 ، 4 ، 5 ، 6 ، 7 ، 8 ، 9 ، 10 ، 11 ، 12 ، 13 ، 14 ، 15 ، 16 ، 17 ، 18 ، 19 ، 20 ، 21
301711 ، 2 ، 3
XaocCPS400361
2843901
2843921
2843941
2843961
yaneblog390071 ، 6
406213
yesutin94531
96451
310781 ، 2 ، 3 ، 4 ، 5 ، 6 ، 7 ، 8 ، 9 ، 10 ، 11 ، 12
yshilyaev55561 ، 2 ، 3
زاده311232
متعرج154921

بدلا من الاستنتاج


ربما سيجد شخص ما أن استعادة هذه المعلومات القديمة لا معنى لها. وإلى جانب ذلك ، فإن بعض الصور التي تم العثور عليها كانت بلا معنى عندما تم نشرها. بالتأكيد ، هو عليه.


أي معلومات مهمة. على الأقل من وجهة نظر التحليل التاريخي. ناهيك عن حقيقة أنه في بعض المواد المحمية بحقوق الطبع والنشر لها دور رئيسي. نعم ، في الوقت الحالي ، لا يبلغ عمر هبر 15 عامًا ولا تزال بعض المصادر متاحة ، ولكن بمرور الوقت ستصبح أقل وأقل ، وبالتالي يجب أن تفكر في وقت مبكر ما إذا كان سيكون هناك شيء في وقت لاحق أو ستكون هناك "صورة أبدية" متاح. "


حسنًا ، لا تنس أن سدادات الصور التي يتعذر الوصول إليها مزعجة بكل بساطة. بالطبع ، سوف يقرأ القليل من الناس "بعض الأشياء القديمة" ، ولكن سيتم العثور على هؤلاء الأشخاص. لذلك ، نظرًا لأن هذه المنشورات حول حبري ما زالت موجودة ، يجب أن يكون محتواها كاملًا قدر الإمكان.


لسوء الحظ ، على الرغم من أن Habrastorage لا يدعم التحميل مباشرةً لجميع تنسيقات الصور ، فقد يتم إصلاحه في يوم من الأيام.


المشكلة الأخيرة التي أود ذكرها والتي ربما فكرت بها هي "ماذا لو لم يستخدم المؤلف هبر لفترة طويلة ولم يكن مهتمًا بتصحيح الأشياء القديمة؟" لقد طرحت هذا السؤال في ذهني أكثر من مرة ، لكن الحل هنا ليس صعباً للغاية. يمكن دائمًا إصلاح الأجسام الغريبة بواسطة الأجسام الغريبة التي يمثلها المشرفون (هل يمكنك ، Exosphere ؟) أو الإدارة ( Boomburum يمكن أن تمنح شخص ما مهمة).


وما رأيك ، هل يستحق محاولة استعادة شيء على الأقل؟


هذا كل شيء لهذا اليوم. شكرًا لك على اهتمامك ودع جميع صورك ترفع إلى Habrastorage دون أي مشاكل! فليكن مثل هذا





ملاحظة: إذا وجدت أخطاء أو أخطاء في النص ، فيرجى إخبارنا بذلك. يمكن القيام بذلك عن طريق تمييز جزء من النص والضغط على " Ctrl / ⌘ + Enter " ، إذا كان لديك Ctrl / ⌘ ، أو من خلال الرسائل الخاصة . إذا كان كلا الخيارين غير متاحين ، فاكتب عن الأخطاء في التعليقات. شكرا لك


PPS ربما تكون مهتمًا أيضًا بدراساتي الأخرى لـ Habr أو قد ترغب في اقتراح موضوعك للنشر التالي ، أو ربما حتى سلسلة جديدة من المنشورات.


أين تجد القائمة وكيفية تقديم عرض

جميع المعلومات يمكن العثور عليها في مستودع هبرا المخبر الخاص. هناك يمكنك معرفة المقترحات التي تم التعبير عنها بالفعل ، وما الذي يجري بالفعل.


بالإضافة إلى ذلك ، يمكنك ذكر لي (عن طريق كتابة VaskivskyiYe ) في التعليقات على المنشور التي تجدها مثيرة للاهتمام للبحث أو التحليل.

Source: https://habr.com/ru/post/ar484454/


All Articles