برنامج تعليمي للعمل مع البطاقات المثقبة (أو قصة كيفية معالجة "البيانات الضخمة" من 1890 إلى 1970)

في الفترة 1890-1970 ، تم تنفيذ جميع عمليات معالجة البيانات الضخمة من خلال بطاقات الثقب. بدورها ، تم تجهيز البطاقات المثقوبة باستخدام ما يسمى ب "معدات التسجيل" ، وكان الرابط المركزي منها "فارز بطاقة المثقاب" الكهروميكانيكية. تم استخدام البطاقات المثقوبة والمعدات ذات الصلة لحل مجموعة متنوعة من المهام: التعداد والمحاسبة والمخزون وكشوف المرتبات وما إلى ذلك.


كيف عمل الناس مع بطاقات اللكم؟ ما الخوارزمية التي اتبعها فارز بطاقة المثقاب الكهروميكانيكية؟ كيف تم الفرز حسب حقول البيانات الرقمية؟ وعلى الخيط؟ عن كل هذا - أدناه.



  • ميزة لافتة لمعدات التسجيل في أوقات ما قبل الكمبيوتر: كانت في الأصل كهروميكانيكية بالكامل. لم يكن هناك حتى مصباح إلكترونيات فيه حتى الآن. تم بناء "ذكاء" معدات التسجيل من فرش سلكية (للتعرف على الثقوب في البطاقات المثقبة) ، ومرحل كهروميكانيكي ، وعجلات ميكانيكية (لتلخيص القيم). على الرغم من بدائها التكنولوجي ، أحدثت "معدات التسجيل" ثورة في معالجة البيانات الضخمة.

كيف عمل الناس مع بطاقات اللكم؟


  • قامت كل بطاقة مثقوبة بتخزين سجل بيانات واحد (حتى 80 رقمًا أو حرفًا). يتألف كل سجل بيانات من عدة حقول. قام فارز بطاقة الثقب بترتيب البطاقات بالترتيب اللازم للعامل (وفقًا لأحد حقول البيانات) ، وبعدها تقوم الآلة ، المسماة "أداة الجدولة" ، بقراءة بطاقات الثقب المصنفة ، واستخراج الحقول اللازمة منها (مرة أخرى ، يحددها عامل التشغيل) ، وطبع التقرير.
  • كمثال ، ضع في اعتبارك كيفية استخدام بطاقات الثقب لمعالجة الفواتير. كان لدى الشركات بطاقة ثقب منفصلة لكل فاتورة تم إصدارها للدفع (انظر المثال في الشكل أدناه). تم توضيح حقول البيانات مثل رقم المورد وتاريخ الدفع ومبلغ الدفع وما إلى ذلك على بطاقة المثقاب.
  • عملية معالجة البيانات الآلية المقابلة هي كما يلي. يتم توجيه فارز بطاقة الثقب لفرز بطاقات الثقب حسب رقم البائع. بعد اكتمال الفرز ، يتم تمرير بطاقات اللكم إلى جهاز الجدولة ، الذي يقوم بإنشاء تقرير عن طريق قراءة السطر المطلوب من كل بطاقة لكمة. يقوم عداد ميكانيكي مدمج في الجدولة بضرب المبلغ الإجمالي تلقائيًا.
  • تم تنفيذ العديد من العمليات التجارية الأخرى ، مثل كشوف المرتبات والمخزون والفواتير ، في أوقات ما قبل الكمبيوتر بطريقة مماثلة.

مبدأ تشغيل فارز بطاقة لكمة الكهروميكانيكية


  • يأخذ الفارز مجموعة من البطاقات المثقوبة ويقوم بفرزها وفقًا لحقل البيانات المحدد بواسطة عامل التشغيل. على سبيل المثال ، من خلال انتساب الموظفين إلى قسم معين. لماذا؟ كخيار ، بحيث ، بعد تجميع الموظفين سابقًا حسب الأقسام ، قم بإنشاء تقرير عن تنفيذ خطة المبيعات من قبل كل قسم من أقسام الشركة.
  • لحل هذه المشكلة ، يتم فرز بطاقات الثقب أولاً بناءً على حقل "القسم" ، ثم يتم نقلها إلى أداة الجدولة ، التي تلخص حقل "المبيعات" ، وطباعة النتائج المؤقتة لكل قسم في التقرير.
  • يقوم المشغل بوضع مجموعة من البطاقات المثقبة التي يجب فرزها في درج خاص ، حيث يتم دفعها واحدًا تلو الآخر عبر الفارز. يقرأ الفارز بطاقات اللكم ويوزعها في 13 جيوب: عشرة جيوب رقمية ، واثنان "منطقة" (لمعالجة قيم السلسلة) ؛ وواحدة للبطاقات المثقوبة المهملة (التي لا تحدد القيمة التي تم من خلالها إجراء الفرز).
  • الخوارزمية المستخدمة من قبل فارز بطاقة اللكمة مختلفة تمامًا عن الخوارزميات المقبولة بشكل عام اليوم. والفرق الرئيسي هو أن البطاقات المثقوبة لا تقارن مع بعضها البعض.

خوارزمية فرز Bitwise


فكيف يتمكن فارز بطاقة المثقاب من القيام بعمله؟ يطبق خوارزمية "فرز أحادي". خلاصة القول: يقوم فارز بطاقة المثقاب بمعالجة رقم واحد من حقل البيانات في كل مرة ؛ للفرز حسب حقل مكون من ثلاثة أرقام ، يجب تمرير حزمة من البطاقات المثقبة من خلال الفارز ثلاث مرات. إذن الخوارزمية:


  1. يقوم فرز البطاقات المثقوبة وفقًا لحقل بيانات رقمي يحدده عامل التشغيل ، والفرز ، أثناء التشغيل الأول ، بمعالجة الجزء الأقل أهمية فقط من هذا الحقل. ووفقًا لقيمة هذه الفئة ، يقرر مكان إسقاط بطاقة الثقب الحالية: أي من الجيوب الرقمية العشرة (من صفر إلى التاسع).
  2. بعد أن ينتهي الفارز من توزيع البطاقات المثقوبة في جيوب ، يخرجها عامل الهاتف ويضعها في حزمة مشتركة. بالترتيب: بدءًا من الجيب صفر وانتهاءً بالتاسع.
  3. يقوم المشغل بوضع مجموعة البطاقات المثقبة في جهاز الفرز ، ويكرر الخطوتين 1 و 2 بالتسلسل لكل فئة.
  4. يتم فرز كل شيء ، الآن بطاقات لكمة.


مزايا خوارزمية فرز البتات


  • خوارزمية الفرز على شكل البتات أنيقة وسريعة. تعقيدها الحسابي هو O (n log n). بمعنى آخر ، مع زيادة عدد البطاقات ، تزداد مدة الخوارزمية بشكل خطي وليس بشكل أسي.
  • يمكن تنفيذ خوارزمية الفرز bitwise تقنيًا كتصميم كهروميكانيكي بسيط.
  • على الرغم من حقيقة أنه لا يتم وضع أكثر من 3600 بطاقة في درج الإدخال لماكينة فرز البطاقات المثقبة ، فإنه يمكن فرز عدد أكبر بكثير من بطاقات الثقب إذا قام المشغل بتنفيذ الإجراءين التاليين في الوقت المناسب: (1) تحميل حزم جديدة من بطاقات الثقب في الدرج في الوقت المناسب ؛ (2) إفراغ الجيوب الرقمية في الوقت المناسب (حتى لا تفيض).

كيف يتم ترميز بيانات السلسلة


  • كما لوحظ أعلاه ، يتم ترميز القيم العددية على البطاقة المثقبة مع الثقوب. ثقب واحد في العمود. لقد قمنا بفرزها بالفعل. الآن يبقى أن نفهم كيف يتم ترميز السلاسل على بطاقة اللكمة وكيف يقوم فارز بطاقة اللكمات بتنظيمها.
  • للعمل مع الأوتار في فارز بطاقة المثقاب ، هناك جيبان "منطقيان" (11 و 12) ، بالإضافة إلى 10 جيوب رقمية. مبدأ ترميز الحروف الأبجدية كما يلي (انظر الشكل أدناه). يتم ترميز كل حرف بثقبين على البطاقة المثقبة: فتحة على الرقم (من 1 إلى 9) وفتحة على "المنطقة" (0 أو 11 أو 12).
  • يرجى ملاحظة ما يلي: يتم رقمنة سلسلة مع الأصفار عند معالجة حقول البيانات الرقمية ، و "المنطقة" عند معالجة حقول بيانات السلسلة.

خوارزمية فرز سلسلة الأحرف


بفضل هذا الترميز ، يمكن للفرز فرز حقول بيانات السلسلة أبجديًا. للقيام بذلك ، يحتاج إلى ركضين. الخوارزمية هي كما يلي:


  1. في التشغيل الأول ، يقوم فارز بطاقة المثقاب بتنظيم البطاقات بنفس الطريقة تقريبًا عند فرز حقول البيانات الرقمية. الفرق هو أنه مع الفرز الأبجدي ، تشارك تسعة جيوب فقط: من الأول إلى التاسع.
  2. عند الانتهاء من الفرز ، يزيل العامل البطاقات المثقبة من الجيوب الرقمية. مرة أخرى ، بالترتيب (كما في حالة الطلب بواسطة حقل بيانات رقمي): بدءًا من الجيب الأول وتنتهي بالجزء التاسع. يرسل عامل الهاتف مجموعة البطاقات المجمعة للفرز مرة ثانية.
  3. في الجولة الثانية ، يقرأ فارز البطاقات المثقوبة فقط خطوط "المناطق" (0 و 11 و 12) ، ويتجاهل الخطوط ذات الأرقام.
  4. ونتيجة لذلك ، يقوم فارز بتوزيع بطاقات اللكمات المرتبة في ثلاثة جيوب "منطقية": من الأول إلى الأول يتم وضعها في الجيب الثاني عشر ؛ من J إلى R - في الحادي عشر ؛ من S إلى Z - في المرتبة 0.
  5. إذا كنت بحاجة إلى الفرز ليس بحرف أول واحد ، ولكن بحرفين أو ثلاثة أحرف أولى ، على سبيل المثال ، فإن العملية الموضحة أعلاه (الخطوات من الأول إلى الرابع) يتم إجراؤها بالتسلسل لكل حرف. على سبيل المثال لكل رمز ، يتم تشغيل اثنين من خلال فارز بطاقة المثقاب.


لذلك ، عندما لم يكن هناك أجهزة كمبيوتر بعد ، عالجت الشركات البيانات الكبيرة باستخدام بطاقات اللكم. على الرغم من حقيقة أن بطاقات اللكم قديمة بشكل لا رجعة فيه ، ما زلنا نواجه تأثيرها على الحالة الحالية لتقنية الكمبيوتر - كلما اضطررنا إلى تنسيق النص مع 80 حرفًا. لوحظ شيء مماثل ، على سبيل المثال ، عند العمل مع Far Manager.

Source: https://habr.com/ru/post/ar426499/


All Articles