تحسين لغتك الإنجليزية: إعادة اختراع الترجمة

1. مقدمة




- تاتيانا ليونيدوفنا ، هل يمكننا مشاهدة هذا الفيلم مع ترجمة؟
- لا ، نقار الخشب الأحداث ، نقوم بتدريب إدراكك السمعي ، لذلك ستشاهد فيلمًا بدونهم! مع الترجمة ، ستقرأ النص فقط ولن تستمع.
- تاتيانا ليونيدوفنا ، لكننا لا نفهم أكثر من النصف بدون ترجمة!
- ولكن هذه هي مشاكلك.

بداية عام 2000 ، حوار مع مدرس في مدرسة فرنسية خاصة ، سان بطرسبرغ.



2. ما الأمر؟


البرامج التلفزيونية والأفلام رائعة لتحسين اللغة الإنجليزية. أنت تعرف القواعد بالفعل ، وتملك مجموعة كبيرة من الكلمات. من السابق لأوانه إجراء محادثة مجانية مع متحدث أصلي ، ومن الممل بالفعل ممارسة الاختبارات والتمارين. تبدأ مشاهدة الأفلام والبرامج التلفزيونية.

تنظر إلى نفسك وتنظر. يبدو أن كل شيء واضح ، ولكن هنا يبدأ حوار سريع بين اثنين من الأبطال ، حيث تفهم فقط حروف الجر. حسنًا ، قم بتشغيل الغواصات. وهم يحلون المشكلة - تبدأ بفهم ما يحدث.

ومع ذلك ، بعد مشاهدة عدة مقاطع فيديو باستخدام مضخم صوت ، غالبًا ما يلاحظ الناس شيئين.
  • . , , . , , . , — « » .
  • لا تزال بعض أقسام الفيلم غير مفهومة تمامًا نظرًا لاحتوائها على كلمات صعبة. "لا يمكنني تعريض نجاح شركتي للخطرماذا آسف؟ تعرض للخطر؟ . Ok Google ، سأوقف الفيلم مؤقتًا ، وستقول ما يعنيه ذلك.
    هناك رجال يعرضون مشاهدة الأفلام مع ترجمة بلغتين في وقت واحد - الإنجليزية والروسية. مما يجعلك سريعًا بالفعل بطلًا مطلقًا في القراءة عالية السرعة لمضخمات الصوت الفرعية بلغتين ، ولكنه لا يساهم كثيرًا في الإدراك السمعي وتنمية التفكير اللغوي.


بدون مضخمات الصوت ، لا يوجد شيء يمكن فهمه ، ولكن مع وجود مضخمات الصوت ، يتم منع التقدم في الإدراك السمعي و ... لا يزال غير مفهوم.

3. الآن ماذا؟




على هذه الشاشة من "South Park" يمكنك أن ترى 7 كلمات. 6 منهم مألوفين لكل شخص يتعلم اللغة الإنجليزية تقريبًا. ويمكن التعرف عليها وفهمها ، حتى لو تم نطقها بسرعة ولهجة. وتبقى كلمة واحدة (مع احتمال كبير) ستكون هناك مشاكل. كلمة مرهقة متعبة ، مرهقة.

  • هذه الكلمة ليست شائعة جدا. فرصة عظيمة أنك لن تتعرف عليه عن طريق الأذن.
  • سيكون من الجيد عرض الترجمة مباشرة على الشاشة. خلاف ذلك ، سيكون عليك إما أن تشتت انتباهك وترجمها بقاموس ، أو مجرد تسجيل وإلقاء نظرة أبعد.


ويمكن التخلص من الكلمات المتبقية. إنها مألوفة للجميع تقريبًا ولا تحتاج أبدًا إلى عرضها على الشاشة. إذا طبقنا هذا المنطق على بقية المشاهد ، فسوف نحصل على الغواصات ، التي تظهر فيها كلمات صعبة فقط ، والباقي علينا الاستماع إليها وفهمها.

كما اتضح ، هذه الفكرة ليست جديدة على الإطلاق. أظهر googling سريعًا أن عددًا قليلاً على الأقل من المدونين كتبوا مقالات بفكرة مماثلة ، لكنهم عرضوا تكييف الترجمات يدويًا. وسنقوم نحن المهووسون بالتكيف التلقائي لمضخمات الصوت برمجياً!

4. بناء دراجة


المهمة هي البحث عن الكلمات المعقدة في النص التي تحتاج إلى ترجمة.

الفكرة الرئيسية هي أنه يمكنك تحليل الكثير من النصوص باللغة الإنجليزية ، وحساب الإحصائيات حول استخدام الكلمات وفهم أن بعض الكلمات تستخدم أقل كثيرًا من غيرها. هذه الكلمات النادرة تندرج تحت مفهوم "الكلمة المركبة" - فهي نادرة ، لذلك لا تعرف ترجمتها وهجائها.

لقد فعلت كل هذا بالفعل كهواية بعد العمل (بالمناسبة ، هنا مقال حول كيف بدأ كل شيء). كل هذا أدى إلى مشروع Bamboo Ninja ، الذي يسمح لك بتحليل الكتب باللغة الإنجليزية ، والعثور على الكلمات المعقدة فيها ، وإدراج ترجمة وجمع الكتاب مرة أخرى. الترجمة أيضًا نصية ، لذا سأخذها من هناك وأطبقها على الترجمة.

نفتح الغواصات ، ونقسمها إلى أجزاء ، ثم إلى كلمات منفصلة ونبدأ التحليل. لكل كلمة ، نحتاج إلى حل مشكلة التصنيف الثنائي - تمرير الكلمة من خلال خوارزمية ترجع 1 أو 0 عند الإخراج - سواء كانت الكلمة بسيطة لطالب اللغة الإنجليزية أو معقد. يتخذ المصنف قراره على أساس البيانات الإحصائية التي تم الحصول عليها من تحليل ~ 40 غيغابايت من البيانات النصية من مصادر مختلفة (بشكل عام ، كان من الجدير حقًا جمع البيانات من مصادر مختلفة جدًا: أحصل على سجلات الدردشة والأخبار وكلمات الأغاني) ، لكنني كنت كسولًا جدًا واستخدمت نصوص الكتاب بشكل أساسي ، ولكن المزيد عن ذلك لاحقًا).

ثم هناك قدر معين من الضجة مع قاعدة البيانات ، وكتابة التعليمات البرمجية ، وستحصل على الغواصات التي تبدو مثل هذا


5. نحن نركب دراجة بنيت


قمت بتشغيل 3-4 عشرات الغواصات من خلال البرنامج ، وقدرت قيم المقاييس التي أصدرها المحلل. حاولت مشاهدة الأفلام بما حدث. أظهر للأصدقاء والمعارف وزوار الموقع.

لتقييم النتائج ، استخدمت مقياسين كلاسيكيين لمهام تعلُم الآلة:
  • الدقة - القدرة على تصنيف كلمة بشكل صحيح
  • اكتمال (استدعاء) - القدرة على العثور على جميع الكلمات التي تتطلب الترجمة

اتضح أن القيم المترية تميل إلى القفز من فيلم إلى آخر. في بعض الأفلام ، أظهر الامتلاء والدقة 85 ٪ -90 ٪ من المطلوبين ، وفي البعض الآخر - حوالي 55 ٪. خلال البحث عن المشكلة ، وجدت السبب - جمعت معظم البيانات للتحليل الإحصائي من كتب الخيال على مدى الـ 300 عام الماضية وبعض الكلمات فيها أكثر شيوعًا من اللغة الإنجليزية الحديثة. على سبيل المثال ، كانت كلمة bayonet (bayonet) أكثر شيوعًا في تلك الأيام من الآن ، لكن المصنف الخاص بنا يعتبر هذه الكلمة ليست نادرة جدًا.

على الرغم من أن كولين ، صديقي من بريطانيا ، ضحك لفترة طويلة وقال إن عبارة "حربة اللحم" ( حربة اللحم ) أصبحت الآن شائعة جدًا بين الجيش ، لكننا لن نفكر في هذه الحالة.

قررت الرجوع إلى الإصدار القديم من المصنف الذي استخدمته قبل بضعة أشهر. تم بناؤه في الصيف باستخدام 500 كتاب كبير فقط ، ولكن الكتب في هذه العينة كانت أكثر تنوعًا: Harry Potter ، Song of Ice and Fire ، وثائق فنية للمبرمجين ، كتب عن علم النفس ، الطب ، وأكثر من ذلك بكثير. تبين أن المصنف الذي يحتوي على كمية أصغر ولكن أكثر تنوعًا من البيانات هو ترتيب من حيث الحجم أفضل من المصنف القائم على الخيال الإنجليزي فقط. بدأت خوارزمية التعرف على الكلمات في ارتكاب أخطاء أقل كثيرًا.

النتيجة التي تم الحصول عليها تلبي الهدف بشكل عام ، لكن الخوارزمية لا تزال تنتج غواصات مناسبة لشخص لديه خبرة قوية في استخدام اللغة الإنجليزية. تحتاج إلى أن يكون لديك مهارة معينة في التعرف على الكلام عن طريق الأذن ومفردات ملموسة من عدة آلاف من الكلمات الأساسية. في هذه الحالة ، ستعمل الغواصات بشكل جيد في تحسين اللغة الإنجليزية.

لقد أضفت طابعًا رسميًا على جميع خبراتي في الخدمة وقمت بتثبيتها على موقع هوايتي وأضفت مكتبة صغيرة من مضخمات الصوت لأولئك الذين يريدون اختبار هذا الشيء دون مغادرة مكتب النقدية.

6. Outro


يبدو أن تحويل مشاهدة البرامج التلفزيونية إلى عملية تعلم بدلاً من قراءة الشاشة البكم مهمة جديرة بالاهتمام. وسيسمح تحسين تشغيل الخوارزمية لقضاء المزيد من الأمسيات مع الاستفادة.

شكرا لكم جميعا! الأفلام الجيدة والنجاح في اللغة الإنجليزية.

Source: https://habr.com/ru/post/ar390677/


All Articles