يستخدم البرنامج تقنيات الذكاء الاصطناعي المتقدمة ، ولكن أبسط الاختبارات تشير إلى أنه لا يزال بعيدًا عن الفهم الحقيقي
مؤلف المقالة هو دوغلاس ريتشارد هوفستادتر - الفيزيائي الأمريكي وعالم الكمبيوتر ؛ نجل الحائز على جائزة نوبل في الفيزياء روبرت هوفستادتر. اكتسب شهرة عالمية بفضل كتاب "Godel ، Escher ، Bach: This Endless Garland" ، الذي نشر في عام 1979 وفي عام 1980 حصل على جائزة بوليتزر في فئة "غير روائي".في أحد أيام الأحد في
جلسة صلصة أسبوعية
، أحضر صديقي فرانك ضيفًا من الدنمارك معه. كنت أعلم أن فرانك يتحدث الدنماركية جيدًا ، لأن والدته من هناك وعاش كطفل في الدنمارك. تحدثت صديقته الإنجليزية بطلاقة ، والتي تعتبر القاعدة للدول الاسكندنافية. ومع ذلك ، لدهشتي ، في عملية الاتصال ، اتضح أن هذا الزوجين يتبادلان عادة رسائل البريد الإلكتروني المترجمة بواسطة Google Translate (GT). يكتب فرانك رسالة باللغة الإنجليزية ، يمر عبر GT للحصول على نص دنمركي. على العكس من ذلك ، تكتب باللغة الدنماركية ، ثم تسمح لـ GT بترجمة النص إلى الإنجليزية. كم هذا غريب! لماذا يفعل شخصان ذكيان يتحدثان لغة بعضهما البعض هذه الأشياء؟ لقد دفعتني تجربتي في استخدام برامج الترجمة الآلية دائمًا إلى تقييمات متشككة لقدراتها. ولكن من الواضح أن هذين الاثنين لم يشاركا شكوكي. إن العديد من الأشخاص الأذكياء مفتونون بقدرات برامج الترجمة ، ولا يجدون سبباً كافياً لانتقادهم. يذهلني.
أحب اللغات وأقوم بالترجمات بكل شغفي. أنا متخصص في العلوم المعرفية وكنت مهتمًا بتعقيدات عمل العقل البشري طوال حياتي ، لذلك كنت أتابع منذ عقود ميكنة الترجمة. لقد أصبحت مهتمًا بهذه المسألة لأول مرة في منتصف السبعينيات ، عندما صادفت رسالة من عام 1947 كتبها عالم الرياضيات
وارن ويفر ، مؤيد مبكر للترجمات الآلية ، موجهة إلى مؤسس علم التحكم الآلي ،
نوربرت وينر ، حيث أدلى ويفر ببيان مثير للاهتمام ، مشهور جدًا اليوم:
عندما ألقي نظرة على مقال روسي ، أقول: "إنه مكتوب بالفعل باللغة الإنجليزية ، مشفرًا بشخصيات غريبة. والآن سأشرع في فك التشفير ".
بعد بضع سنوات ، اقترح وجهة نظر مختلفة: "لا يعتقد أي شخص عاقل أن الترجمة الآلية ستكون قادرة على تحقيق الأناقة والأناقة. لا يجب أن يخاف بوشكين ". أتذكر سنة واحدة لا تنسى من حياتي قضيتها في ترجمة رواية رائعة في قصائد ألكسندر بوشكين "يوجين أونيجين" إلى لغتي الأم (أعدت جذريًا أعظم عمل روسي ، وأحولته إلى قصة إنجليزية في القصائد) ، وأجد ملاحظة ويفر أكثر من ذلك بكثير صحيح من النظرة الأولى والغريبة المبسطة للغات. ومع ذلك ، أصبحت وجهة نظره عام 1947 في الترجمة على أنها فك التشفير الشعار الذي وجه منذ فترة طويلة مجال الترجمة الآلية.
منذ ذلك الحين ، تم تحسين الترجمة الآلية تدريجيًا ، ومؤخراً استخدام ما يسمى حتى أن "الشبكات العصبية العميقة" دفعت بعض المراقبين إلى التفكير (انظر مقالات "
الصحوة الكبرى للذكاء الاصطناعي " و "
الترجمة الآلية: ما بعد بابل ") بأن المترجمين من البشر هم من الأنواع المهددة بالانقراض. مع هذا التطور للأحداث ، سيتحول الأشخاص الذين يعملون كمترجمين إلى وحدات تحكم بسيطة في الجودة ومراجعين للأخطاء الصغيرة في بضع سنوات ، ولن ينتجوا نصوصًا جديدة بالكامل.
مثل هذا السيناريو كان سيسبب لي ثورة روحية ساحقة. على الرغم من أنني أتفهم الرغبة في تعليم الآلات كيفية ترجمة النصوص جيدًا ، إلا أنني لا أريد أن أرى كيف سيحل القتلى محل المترجمين من البشر. هذه الفكرة تخيفني وتشعرني بالاشمئزاز. في رأيي ، الترجمة هي فن راقي بشكل لا يصدق ، وتتطلب باستمرار سنوات عديدة من الخبرة والخيال الإبداعي. إذا أصبح المترجمون البشريون في أحد الأيام "الجميلة" بقايا من الماضي ، فإن اهتزازي لعقل الإنسان سيتزعزع ، وهذه الصدمة ستتركني في حيرة وحزن لا يصدق.
في كل مرة أقرأ فيها مقالًا حول كيف ستضطر نقابة المترجمين البشريين إلى الانحناء لرأسهم على السيف السريع الرهيب لتكنولوجيا جديدة ، أشعر بالحاجة إلى التحقق من هذه التصريحات بنفسي ، خاصة بسبب الخوف من أن هذا الكابوس قد ظهر بالفعل قريبًا ، وأيضًا بسبب الأمل والرغبة في إقناع نفسي بأنه ليس قريبًا جدًا ، وأخيرًا ، بسبب إيماني الراسخ بضرورة مكافحة المبالغة في إنجازات الذكاء الاصطناعي. لذلك ، بعد أن قرأت كيف أن الفكرة القديمة للشبكات العصبية الاصطناعية ، التي اعتمدها مؤخرًا قسم Google تسمى Google Brain ، وتم تحسينها بمساعدة "التدريب المتعمق" ، أدت إلى ظهور نوع جديد من البرامج يفترض أنه أحدث "ثورة" في الترجمات الآلية ، أدركت أنني بحاجة للتحقق من أحدث إصدار من GT. هل صحيح أنها غيرت مجال الترجمة بالطريقة التي تمكن بها Deep Blue و AlphaGo من القيام بذلك في مجال الألعاب الجليلة مثل الشطرنج والذهاب؟
اكتشفت أنه على الرغم من أن الإصدار القديم من GT عمل مع مجموعة كبيرة جدًا من اللغات ، إلا أن الإصدار الجديد كان يعمل أولاً مع تسعة فقط - صحيح ، ثم قام بتوسيع المجموعة إلى 96. اقتصرت بحثي على اللغات المدعومة مثل الإنجليزية والفرنسية والألمانية والصينية [
سنضيفها للمتعة واللغة الروسية / تقريبا. perev. ]
قبل عرض الاكتشافات ، تجدر الإشارة إلى غموض كلمة "عميق". عندما يسمع الشخص عن كيفية شراء Google لشركة DeepMind ، التي أنتجت "شبكات عصبية عميقة" مع "التعلم العميق" ، فإنه يدرك على الفور هذه الأسماء في معانيها "المعلقة" و "قادرة على الكثير" و "البصيرة" و "الحكيمة". علاوة على ذلك ، تعني كلمة "عميق" فقط حقيقة أن هذه الشبكات العصبية لها طبقات أكثر (على سبيل المثال ، 12) من الإصدارات القديمة ، والتي يمكن أن تحتوي على طبقتين أو ثلاث. هل يترتب على هذا العمق أن مثل هذه الشبكة لديها أي نوع من الحكمة؟ بالكاد. هذا هو PR اللفظي.
أنا متشكك للغاية في سيارة GT ، خاصة بسبب الضجيج المحيط بها. ولكن ، على الرغم من العداء ، أعترف بوجود حقائق مذهلة تتعلق بهذا المنتج لا أحبها. وهو متاح لأي شخص على وجه الأرض مجانًا ، ويمكنه تحويل النص بأي لغة من مائة لغة تقريبًا إلى نص بأي لغة أخرى. إنه يستحق الاحترام. إذا أطلقت على نفسي بكل فخر اسم "pi-lingual" (أي أن إجمالي عدد اللغات التي أعرفها يزيد قليلاً عن ثلاث لغات هي طريقتي الفكاهية للإجابة على السؤال ، "كم عدد اللغات التي تعرفها") ، ثم كم يمكن أن تفخر GT بنفسها ، إذا كان يستطيع أن يطلق على نفسه "شراء لغوي" ("شراء" بلغة الماندرين يعني 100). الرجل الوثني معجب جدا بالبايزية. علاوة على ذلك ، إذا قمت بنسخ صفحة باللغة A إلى GT ، فلن يستغرق الأمر سوى بضع ثوانٍ للحصول على صفحة من الكلمات باللغة B. وكل هذا يحدث طوال الوقت ، على شاشات حول الكوكب ، بعشرات اللغات.
لا يمكن إنكار الفوائد العملية لـ GT والتقنيات المشابهة ، وهي من حيث المبدأ تفيدنا ، ولكن في هذا النهج ، هناك شيء غير كافٍ بوضوح ، ويمكن وصف ذلك في كلمة واحدة: الفهم. لم تركز الترجمة الآلية أبدًا على فهم اللغة. وبدلاً من ذلك ، فقد حاولوا دائمًا "فك التشفير" في هذا المجال - أي للتعامل مع المهمة ، وعدم الاهتمام بما هو الفهم والمعنى. هل يمكن أن يكون الفهم ليس ضروريًا للترجمة الجيدة؟ هل يمكن لشخص أو شخص أو آلة إصدار ترجمة عالية الجودة دون الانتباه إلى معنى اللغة؟ لإلقاء الضوء على هذه القضية ، ننتقل إلى التجارب التي قمت بها.
* * *
سأبدأ بحثي بأمثلة متواضعة - بملاحظة قصيرة ، والتي تسبب على الفور فكرة واضحة لدى الشخص:
في منزلهم ، يأتي كل شيء في أزواج. هناك سيارته وسيارتها ، ومناشفه ومناشفها ، ومكتبته وصندوقها.
ترجمة GT:
في منزلهم ، يأتي كل شيء في أزواج. هناك سيارته وسيارتها ، ومناشفها ومناشفها ، بالإضافة إلى مكتبته وراتبتها.
ترجمة بشرية:
في منزلهم ، كل شيء له زوجان خاصان به. هناك سيارته وسيارتها ومناشفه ومناشفها ومكتبته وهي.
تبدو مهمة الترجمة لا لبس فيها ، ولكن في الفرنسية (
ولغات رومانسية أخرى) ، لا يتم وضع الكلمتين "له" و "لها" ، مما يشير إلى الأشياء ، في نوع المالك ، ولكن في نوع الشيء نفسه. إليك ما أعطاني GT:
لا تزل في المنزل ، أزواج tout vient en. Il ya sa voiture et sa voiture، ses serviettes et ses serviettes، sa bibliothèque et les siennes.
وقع البرنامج في فخّي ، ولم أفهم كيف يمكن لأي شخص أن يفهم أنني قد وصفت زوجًا كان لديه كل شيء من بين أشياءه. على سبيل المثال ، استخدمت شبكة عصبية ذات تعلم عميق كلمة sa لكل من آليتها وجهازها ، لذلك لا يمكننا قول أي شيء عن مجال مالك الجهاز. بنفس الطريقة ، استخدمت الكلمة اللاجنسية بصيغة ses لجمع "مناشفه" و "مناشفها" ، وفي الحالة الأخيرة ، مع المكتبات ، تم الخلط بينها بواسطة الحرف الأخير في نفسها ، وقررت بطريقة أو بأخرى ما يرمز إلى الجمع (les siennes). الاقتراح ، الذي ترجمته GT إلى الفرنسية ، فقد معناه.
ثم قمت بنفسي بترجمة هذه العبارة إلى الفرنسية ، بحيث تحتفظ بمعناها الأصلي. هنا هو الإصدار الخاص بي:
Chez eux، ils ont tout en double. Il ya sa voiture à elle et sa voiture à lui، ses serviettes à elle et ses serviettes à lui، sa bibliothèque à elle et sa bibliothèque à lui.
عبارة sa voiture à elle تعني "سيارتها" ، و sa voiture à lui تعني سيارته. بعد ذلك ، قررت أن ترجمة الترجمة الفرنسية إلى الإنجليزية والحصول على النسخة الإنجليزية الصحيحة ستكون مهمة تافهة ، لكني كنت مخطئًا بشكل خطير. إليكم ما أعطاني:
في المنزل ، لديهم كل شيء في ضعف. هناك سيارته الخاصة وسيارته ومناشفه ومناشفه ومكتبته الخاصة ومكتبته الخاصة.
ماذا آسف؟ على الرغم من أن جملة الإدخال تنص صراحة على جنس المالكين ، فقد تجاهلت آلة الترجمة هذه الادعاءات ونسبت كل شيء إلى جنس الذكر. لماذا تخلصت من أهم المعلومات من الاقتراح؟
يعرف الناس الكثير من الأشياء عن الأزواج ، والمنازل ، والمتعلقات الشخصية ، والفخر ، والتنافس ، والغيرة ، والحياة الشخصية ، والعديد من الأشياء غير الملموسة الأخرى التي تؤدي إلى تقلبات مثل المناشف المطرزات "له" و "لها". GT مثل هذه التفاصيل الدقيقة غير معروفة. الخفايا الدقيقة غير معروفة بشكل عام. إنه يعرف فقط الأسطر المكونة من الكلمات المكونة من حروف. هو منخرط في معالجة فائقة السرعة لقطعة من النص ، لا يعتقد ، لا يمثل ، لا يتذكر ، لا يفهم. إنه لا يعرف حتى أن الكلمات تعني أشياء. أسارع إلى إعلان أنه من حيث المبدأ ، يمكن لبرنامج الكمبيوتر معرفة سبب الحاجة إلى لغة ، ويمكن أن يكون لديه أفكار وذاكرة وخبرة ، ويمكن استخدامها - ولكن لم يتم تصميم GT لذلك. لم تكن هذه الأهداف في خطط مطوريها.
بشكل عام ، ضحكت من النتائج ، مرتاحًا لرؤية أننا لم نقترب من استبدال المترجمين بالآلات. ولكن مع ذلك بدا لي أنه يستحق دراسة السيارة بمزيد من التفصيل. رشف واحد من العطش لا يطفئ.
وبالمناسبة ، ماذا عن هذه العبارة - "العطش لا يطفئ العطش" (ملمحًا بالطبع إلى القول "
ابتلاع واحد لا يصنع الصيف" - تُترجم كلمة ابتلاع أيضًا على أنها "رشفة" ، ومثل "ابتلاع". في النسخة الإنجليزية ، ابتلاع واحد لا يجعل فصل الصيف. / تقريبًا. ] لا يسعني إلا التحقق من ذلك. وإليك ما أعطته GT: "Une hirondelle n'aspire pas la soif" [
أعطت GT الروسية "ابتلاع واحد لا يطفئ العطش" / تقريبًا الترجمة. ]. هذه الجملة نحوية الفرنسية ، لكن من الصعب فهمها. أولاً ، تذكر طائرًا (une hirondelle - ابتلاع) أ) ، ثم يقال أن الطائر لا يستنشق أو لا يمتص (n'aspire pas) ، وأخيرًا ، يشار إلى أن ما لا يمتصه الطائر هو العطش (la soif). من الواضح أن GT لم تفهم معنى العبارة - لقد أصدرت ببساطة حفنة من القرف الثور. "Il sortait simplement avec un tas de taureaux". "لقد خرج للتو مع كومة من الثيران". "Il vient de sortir avec un tas de taureaux". سامح لغتي الفرنسية - أو بالأحرى شبه الفرنسية GT.
* * *
من النار الفرنسية نقفز إلى النار الألمانية. لقد انغمست مؤخرًا في كتاب Sie nannten sich der Wiener Kreis (أطلقوا على أنفسهم اسم دائرة فيينا) لعالم الرياضيات النمساوي كارل سيجموند. تصف
مجموعة من المثقفين المثاليين من فيينا في عشرينيات وثلاثينيات القرن العشرين الذين أثروا بشكل خطير على الفلسفة والعلوم في النصف الثاني من القرن العشرين. اخترت جملة صغيرة من كتاب سيجموند وأعطيتها لـ GT. ها هي ، أولاً باللغة الألمانية ، ثم تأتي ترجمتي ، ثم GT. (بالمناسبة ، راجعت ترجمتي مع اثنين من متحدثي اللغة الألمانية الأصليين ، بما في ذلك كارل سيجموند - حتى يمكن اعتبارها دقيقة).
سيغموند:
Nach dem verlorenen Krieg sahen es viele deutschnationale Professoren، inzwischen die Mehrheit in der Fakultät، gewissermaßen als ihre Pflicht an، die Hochschulen vor den "Ungeraden" zu bewahren؛ am schutzlosesten waren junge Wissenschaftler vor ihrer Habilitation. Und wissenschaftlerinnen kamen sowieso nicht in frage؛ über wenig war man sich einiger.
هوفستاتر:
بعد الهزيمة ، اعتبر العديد من الأساتذة الذين لديهم ميول عموم الجرمانية ، الذين شكلوا في ذلك الوقت غالبية أعضاء هيئة التدريس ، أنه من واجبهم إلى حد كبير حماية مؤسسات التعليم العالي من "غير المرغوب فيهم". وكان من الأرجح أن يتم فصلهم من العلماء الشباب الذين لم يحصلوا بعد على الحق في تدريس صفوف الجامعة. أما الباحثات فلم يكن لهن مكان في النظام على الإطلاق. لم يكن هناك شيء أوضح من ذلك.
ترجمة جوجل:
بعد الحرب الضائعة ، رأى العديد من الأساتذة الألمان-الوطنيين ، في الوقت نفسه الأغلبية في الكلية ، أنفسهم واجبهم في الحفاظ على الجامعات من "الغريب". كان العلماء الشباب هم الأكثر ضعفاً قبل تأهيلهم. ولم يتساءل العلماء على أي حال. كان هناك القليل منهم.
GT ، الروسية:
بعد الحرب الضائعة ، اعتبر العديد من الأساتذة الألمان -الوطنيين ، الأغلبية في الكلية الآن ، أنه من واجبهم حماية الجامعات من "الغريب" ؛ كان العلماء الشباب هم الأكثر ضعفاً قبل تأهيلهم. وما زالت العالمات من النساء موضع شك ؛ كان هناك العديد منهم.
الروسية البشرية:
بعد الهزيمة ، اعتبر العديد من الأساتذة المعرضين للقومية الألمانية (وفي ذلك الوقت كانت الأغلبية في قيادة الكلية) من واجبهم حماية مؤسسات التعليم العالي من "العناصر غير المرغوب فيها". على الأرجح ، يمكن رفض العلماء الشباب الذين لم يكتسبوا بعد الحق في التدريس. بالنسبة للعالمات ، لم يكن هناك مكان في هذا النظام على الإطلاق. كان أكثر وضوحا من الواضح.
تتكون ترجمة GT من الكلمات الإنجليزية (لسبب غير معروف ، يبدأ اثنان منهم لسبب ما بحرف كبير). جيد حتى الآن! ولكن سرعان ما تبدأ الترجمة بأكملها في التعتيم ، وكلما ذهبت ، كلما أصبحت أكثر ضبابية.
خذ أولاً "الغريب" غريب - غريب ، غريب ، بدون إقران]. هذا يتوافق مع الألمانية "Ungeraden" ، وتعني "الأشخاص غير المرغوب فيهم لأسباب سياسية". ولكن كان لدى GT سبب - إحصائيات خالصة - لاستخدام كلمة "غريب". وهي: في قاعدة البيانات الضخمة ثنائية اللغة ، تترجم كلمة ungerade دائمًا على أنها غريبة. على الرغم من أن السيارة لا تفهم لماذا ، يمكنني أن أشرح. وذلك لأن ungerade - بمعنى حرفي "غير مباشر" أو "غير متساوٍ" - يعني دائمًا "غريبًا". واختيار الكلمة غير المرغوب فيها [العناصر غير المرغوب فيها] ليس له علاقة بإحصاءات الكلمات ، ولكنه يأتي من فهمي للوضع - فهم فكرة لم يتم الإشارة إليها مباشرة في النص وليست موجودة في قائمة خيارات الترجمة لكلمة ungerade في أي من القواميس الألمانية.
دعنا ننتقل إلى التأهيل ، الذي يشير إلى حالة المعلم ، يشبه أحد أعضاء هيئة التدريس في المعهد. إن تأهيل الورق باللغة الإنجليزية [مؤهل] موجود ، ولكن نادرًا ما يتم استخدامه ، وبالتأكيد لا يذكر الموظفين بدوام كامل. لذلك ، شرحت هذه الفكرة لفترة وجيزة ، ولم أستخدم كلمة نادرة فقط ، لأن مثل هذا النهج الميكانيكي لن يعطي أي شيء للقراء الناطقين باللغة الإنجليزية. بالطبع ، لن تفعل GT ذلك أبدًا ؛ ليس لديها نموذج معرفة لقرائها.
توضح الجملتان الأخيرتان بوضوح الأهمية الحاسمة لفهم الترجمة الصحيحة. الكلمة الألمانية المكونة من 15 حرفًا Wissenschaftler تعني "عالم" أو "عالم" ["عالم" / "عالم"]. لقد اخترت الخيار الأخير ، لأنه يشير إلى جميع المثقفين بشكل عام. لم تتعرف GT على هذه التفاصيل الدقيقة. كلمة Wissenschaftlerin ذات 17 حرفًا في الجملة الأخيرة ، الجمع ، Wissenschaftlerinnen هي نتيجة لاستخدام الولادة في الأسماء الألمانية. يشير الاسم القصير نحويًا إلى الجنس المذكر ، وبالتالي فهو يعني عالما ذكرا ، والاسم الطويل يشير إلى الأنثى ، ولا ينطبق إلا على النساء. لذلك كتبت "عالمات". في غضون ذلك ، لم يفهم جي تي أن لاحقة الإناث - كانت هي الحلقة الرئيسية في الجملة. نظرًا لأنه لم يفهم أنه تم استبعاد النساء من النظر ، فقد استخدمت الآلة ببساطة كلمة "عالمة" ، وفقدت تمامًا نقطة الجملة بالكامل [من
المثير للاهتمام أن GT قامت بترجمتها إلى اللغة الروسية بشكل صحيح / تقريبي. perev. ]. كما كان الحال مع الفرنسيين ، لم يكن لدى GT فكرة عن أن الغرض الوحيد من الاقتراح الألماني هو إظهار التباين بين الرجال والنساء.
حسنًا ، إلى جانب هذا الخطأ ، فإن ما تبقى من الجملة الأخيرة هو كابوس كامل. خذ الجزء الأول. هل "لم يشكك العلماء على أي حال" حقًا في ترجمة "Wissenschaftlerinnen kamen sowieso nicht in frage"؟ إنهم لا يتطابقون على الإطلاق في المعنى. تتكون الجملة ببساطة من الكلمات الإنجليزية التي يتم إتقانها على أساس الألمانية. وماذا يكفي هذا لوصف نص إخراج معين بأنه "ترجمة"؟ [
في نسخة الترجمة إلى اللغة الروسية ، استمر الكابوس / تقريبًا. perev. ]
الجزء الثاني خاطئ بنفس القدر. الكلمات الست الأخيرة بالألمانية تعني حرفيًا "القليل كان أكثر اتحادًا" ، أو ، بسلاسة أكبر ، "كان هناك القليل الذي كانت موافقة الناس عليه أقوى" ["على القليل كان أكثر اتحادًا" / "لم يكن هناك الكثير حول أي الأشخاص كانوا متفقين أكثر "] - ومع ذلك ، حولت GT هذه الفكرة الواضحة إلى" كان هناك العديد "[
تقريبًا نفس اللغة الإنجليزية والروسية / تقريبًا. perev. ]. قد يسأل الحائرون "من كانوا عدة؟" ، ولكن بالنسبة لمستمع ميكانيكي ، فإن هذا السؤال لن يكون له معنى. ليس لدى GT أي فكرة عما يحدث وراء الكواليس ، ولم يكن بإمكانه الإجابة على سؤال يبدو بسيطًا.
لم يتخيل برنامج الترجمة كميات أو أعداد أو أشياء كبيرة أو صغيرة. لقد قامت برمي الرموز فقط ، دون أدنى فكرة أنها يمكن أن ترمز إلى شيء ما.* * *
من الصعب جدًا على الشخص الذي اكتسب الخبرة والفهم واستخدام الكلمات بشكل هادف طوال حياته أن يدرك مدى خلو محتويات الكلمة من الشاشة بواسطة آلة GT. يكاد يكون من المستحيل على الناس مقاومة الافتراض القائل بأن البرامج التي تعمل بشكل جيد مع الكلمات يجب أن تفهم معناها. يُطلق على هذا الوهم الكلاسيكي المرتبط بالذكاء الاصطناعي " تأثير إليزا " ، حيث إن أحد البرامج الأولى التي جعلت الناس يعتقدون أنها تبدو وكأنها تفهم اللغة الإنجليزية هو معالج العبارات العديم الفائدة ELIZA الذي تظاهر بأنه معالج نفسي في الستينيات. خلق العديد من الأشخاص الذين تفاعلوا مع البرنامج شعورًا خارقًا للطبيعة أنها فهمت مشاعرهم العميقة.على مدى عقود ، أصبح الأشخاص الأذكياء - حتى باحثو الذكاء الاصطناعي - تحت تأثير تأثير إليزا. لمنع قرائي من الوقوع في هذا الفخ ، اسمحوا لي أن أقتبس بعض العبارات من النص أعلاه - "لم يفهم GT" ، "لم يدرك" ، "GT ليس لديه فكرة". من السخرية أنه على الرغم من أن هذه العبارات تصر على عدم الفهم ، إلا أنها تشير تقريبًا إلى حقيقة أن GT يمكن ، في بعض الأحيان على الأقل ، فهم معنى كلمة أو عبارة أو جملة. لكن الأمر ليس كذلك.
تتخطى GT ببساطة مسألة فهم اللغة.بالنسبة لي ، فإن كلمة "ترجمة" لها هالة غامضة تثير الذكريات. إنه يشير إلى شكل فني بشري للغاية يحول بأمان الأفكار الواضحة للغة أ إلى أفكار واضحة للغة ب. يجب ألا تحافظ هذه الشبكة على الوضوح فحسب ، بل تنقل أيضًا الظلال والفروق الدقيقة والسمات المميزة لأسلوب الكتابة للمؤلف الأصلي. عندما أقوم بالترجمة ، أقرأ النص الأصلي بعناية أولاً ، وأتعلم الأفكار بوضوح قدر الإمكان ، وأدعها تتسكع في ذهني. ليست الكلمات تتخبط في العقل - الأفكار التي تثير جميع أنواع الأفكار ذات الصلة ، مما يخلق هالة غنية من السيناريوهات المصاحبة في رأسي. معظم هذه الهالة بالطبع في اللاوعي. فقط عندما تستيقظ الهالة في وعيني بما فيه الكفاية ، أبدأ في محاولة التعبير عنها - "الضغط" - في لغة ثانية.أحاول أن أقول في اللغة ب ما يبدو لي من الطبيعي أن تتحدث اللغة ب عن مثل هذه المواقف التي تشكل هالة المعنى التي يتم مناقشتها.بشكل عام ، لا أتنقل من كلمات وعبارات اللغة أ إلى كلمات وعبارات اللغة ب. وبدلاً من ذلك ، أتصل بلا وعي بالصور والمشاهد والأفكار وتجربتي (أو التجربة التي قرأتها وشاهدتها في الأفلام وسمعتها من الأصدقاء ) ، وفقط عندما تكون "هالة" غير لفظية أو مجازية أو عقلية - عندها فقط أبدأ عملية صياغة الكلمات والعبارات في اللغة الهدف ، ثم أعدلها ، وأعدلها ، وأعدلها. قد تبدو هذه العملية ، التي يتوسطها المعنى ، بطيئة - وبالطبع ، مقارنة بثانيتين لكل صفحة على GT ، هذا ما هو عليه - ولكن أي مترجم جاد يستخدمه. أتخيل شيئًا كهذا عندما أسمع عبارة "عقل عميق".* * *
بالنظر إلى كل هذا ، سأنتقل إلى اللغة الصينية ، وهي لغة أكثر إزعاجًا ببرامج التعلم العميق من اللغتين الأوروبيتين. للتحقق ، اخترت المذكرات المؤثرة لـ Women Sa ("الثلاثة منا") - الكاتب المسرحي الصيني والمترجم يانغ جيانغ ، الذي توفي مؤخرًا عن عمر يناهز 104 أعوام. وتتذكر في الكتاب التداخل بين حياة نفسها وزوجها تشيان زونغشو (وهي أيضًا كاتبة ومترجمة) وابنتهما. لم يتم كتابتها بشكل معقد للغاية ، ولكنها تستخدم لغة صينية حية وذات تعليم عالٍ. اخترت ممر صغير وقمت بتعيين GT عليه. فيما يلي النتائج ، إلى جانب ترجمتي::
锺书到清华工作一年后,调任毛选翻译委员会的工作,住在城里,周末回校。 他仍兼管研究生。
毛选翻译委员会的领导是徐永煐同志。介绍锺书做这份工作的是清华同学乔冠华同志。
事定之日,晚饭后,有一位旧友特雇黄包车从城里赶来祝贺。客去后,锺书惶恐地对我说:
他以为我要做“南书房行走”了。这件事不是好做的,不求有功,但求无过。
:
After Zhongshu had worked at Tsinghua University for a year, he was transferred to the committee that was translating selected works of Chairman Mao. He lived in the city, but each weekend he would return to school. He also was still supervising his graduate students.
The leader of the translation committee of Mao's works was Comrade Xu Yongying, and the person who had arranged for Zhongshu to do this work was his old Tsinghua schoolmate, Comrade Qiao Guanhua.
On the day this appointment was decided, after dinner, an old friend specially hired a rickshaw and came all the way from the city just to congratulate Zhongshu. After our guest had left, Zhongshu turned to me uneasily and said:
“He thought I was going to become a 'South Study special aide.' This kind of work is not easy. You can't hope for glory; all you can hope for is to do it without errors.”
Google Translate:
After a year of work at Tsinghua, he was transferred to the Mao Translating Committee to live in the city and back to school on weekends. He is still a graduate student.
The leadership of the Mao Tse Translation Committee is Comrade Xu Yongjian. Introduction to the book to do this work is Tsinghua students Qiao Guanhua comrades.
On the day of the event, after dinner, an old friend hired a rickshaw from the city to congratulate. Guest to go, the book of fear in the book said to me:
He thought I had to do “South study walking.” This is not a good thing to do, not for meritorious service, but for nothing.
GT, :
, . - .
. , , .
, , , , . , , :
, « ». .
:
, , . , . , .
, , .
في اليوم الذي تمت فيه الموافقة على هذا التعيين ، بعد العشاء ، قام صديق قديم بتوظيف عربة وعاد من المدينة فقط لتهنئة Zhongshu شخصيًا. بعد أن غادر الضيف ، التفت لي Zhongshu ، وقال بقلق:
لقد اعتقد أنني سأصبح "مساعدًا خاصًا من حكومة الجنوب". هذا عمل شاق. الأمل في الشهرة ليس ضروريًا ؛ يمكن للمرء أن يأمل فقط في غياب الأخطاء.
صف بإيجاز الشذوذ. أولاً ، لم تذكر GT أبدًا Zhongshu بالاسم ، على الرغم من أن اسمها ("锺 书") يظهر ثلاث مرات في الأصل. أولاً ، تستخدم الآلة ضمير "هو" ، في المرة الثانية التي يكتب فيها الكتاب [كتاب] ، وفي المرة الثالثة كتاب الخوف في الكتاب [كتاب الخوف في كتاب]. تخمين! [ في النسخة الروسية يظهر "الكتاب" الغامض مرة واحدة / تقريبًا. perev. ]
الغريب الثاني - في الفقرة الأولى يشار بوضوح إلى أن Zhongshu يقود طلاب الدراسات العليا ، ولكن GT نفسه جعله طالب دراسات عليا.الغريب الثالث - في عبارة Mao Tse Translation Committee [لجنة ترجمة Mao Zedong] ثلث اسم الرئيس Mao [Mao Tse Tung] سقط في مكان ما.الغرابة الرابعة - تم استبدال اسم Yongying بـ Yongjian.الغريب الخامس - بعد أن غادر ضيفنا [بعد مغادرة ضيفنا] تم استبداله ببساطة بالضيف للذهاب [الضيف للذهاب].الغرابة السادسة - الجملة الأخيرة لا معنى لها على الإطلاق.ستة من هذه الشذوذات تكفي بالفعل لعار GT ، ولكن سامحها ونسيانها. من الأفضل التركيز على العبارة المربكة التي صادفتها في النص - عبارة من خمسة أحرف مضمنة بين علامتي اقتباس من الفقرة الأخيرة ("南 书房 行走"). يمكن ترجمته بشكل رمزي على أنه "غرفة الكتب الجنوبية للذهاب في نزهة" ، ولكن من الواضح أن هذا غير مقبول ، خاصةً لأنه يجب أن يكون اسمًا في السياق. اخترعت جي تي "المكتب الجنوبي للمشي" ، ولم يساعد ذلك.أعترف أن العبارة الصينية كانت غير مفهومة تمامًا بالنسبة لي. حرفياً ، كان ذلك يعني شيئًا مثل المشي في مكتب على الجانب الجنوبي من مبنى ، لكنني كنت أعلم أن هذا خطأ - في السياق لا معنى له. للترجمة ، كنت بحاجة إلى العثور على شيء غير معروف بالنسبة لي في الثقافة الصينية. وأين ذهبت للمساعدة؟ انتقل إلى google! (ولكن ليس لترجمة جوجل). لقد أدخلت الأحرف الصينية ، محاطة بعلامات اقتباس ، وبدأت البحث عن تطابق تام. وظهرت مجموعة من صفحات الويب الصينية بشكل مباشر في الشاشة ، وبعد ذلك خاضت بألم من خلال الفقرات الأولى من زوجين من المواقع الأولى ، في محاولة لفهم معنى العبارة.اكتشفت أن هذا المصطلح يعود إلى عهد أسرة تشينغ(1644–1911) ، ويشير إلى عاملة نفسية ساعدت الإمبراطور في تكوين اتصالات رسمية أنيقة ، وعملت في المكتب الجنوبي للقصر الإمبراطوري. شخصان ، يفترض أنهما يشيران إلى "اذهب في نزهة" ، يعنيان بالفعل مساعدًا. لذلك ، باستخدام معلومات من بحث Google ، توصلت إلى عبارة "مساعد خاص من المكتب الجنوبي".من المؤسف أن GT نفسها لا يمكنها استخدام خدمة بحث Google ، كما فعلت. ولكن مرة أخرى ، لا تستطيع GT فهم صفحات الويب ، على الرغم من أنها يمكن أن تترجمها إلى غمضة عين. أو ربما؟ بعد ذلك ، أعطي نصًا رائعًا ألقته GT على الفور على شاشتي بعد أن أطعمته بداية الموقع الإلكتروني الذي حصلت منه على المعلومات الضرورية:إن "دراسة الجنوب للمشي" ليست موقفًا رسميًا ، فقبل عصر تشينغ كان هذا مجرد "رسول" ، بشكل عام من قبل المفكرين الإمبراطوريين آنذاك هانلين للعمل. دراسة الجنوب في المسؤولين هانلين في "اختيار السلع chencai فقط وممتازة" في القيمة ، ودعا "دراسة الجنوب المشي". بسبب قرب الإمبراطور ، قرار الإمبراطور أن يكون له تأثير معين. أنشأ يونغ تشنغ في وقت لاحق "طائرة عسكرية" ، وزير الآلة العسكرية ، بدوام كامل ، على الرغم من أن الدراسة لا تزال هانلين في القيمة ، ولكن ليس لها مشاركة في الشؤون الحكومية. فخور العلماء في أسرة تشينغ بقيمة دراسة الجنوب. العديد من العلماء والعلماء في أوائل عهد أسرة تشينغ في الجنوب من خلال الدراسة.
هل هي اللغة الإنجليزية بشكل عام؟ بالطبع ، يمكننا أن نتفق جميعًا على أن النص يتكون من كلمات إنجليزية (في الغالب) ، ولكن هل يتبع ذلك أنه نص إنجليزي؟ في رأيي ، بما أن هذه الفقرة لا معنى لها ، فهي ليست الإنجليزية ؛ إنها مجرد مكونات إنجليزية يتم وضعها بشكل عشوائي - سلطة كلمات عشوائية ، تجزئة متعرجة.
في حال كنت مهتمًا ، فإليك نسختي من هذا المقطع (لقد بحثت عنه لعدة ساعات):
لم يكن موقف Nan Shu Fan Xiaon Zu (مساعد خاص من مجلس الوزراء الجنوبي) رسميًا ، ولكن في أوائل عهد أسرة تشينغ كان دورًا خاصًا عادة ما يلعبه عالم المحكمة الحالي. اختارت مجموعة من العلماء العاملين في المكتب الجنوبي للقصر الإمبراطوري من بين مواهبهم مواهب عظيمة وسمعة طيبة ، حتى أنه كتب خطابات للإمبراطور وكان دائمًا في مقره ؛ لذلك أطلق على هذا الدور "المساعد الخاص من حكومة الجنوب". كان المساعد ، كونه قريبًا من الإمبراطور ، قادرًا بوضوح على التأثير في قراراته السياسية. ومع ذلك ، بعد أن أسس الإمبراطور يونغ تشنغ وزارة الحرب ، مع الوزير ومرؤوسيه المختلفين ، توقف مساعد وزارة الجنوب ، على الرغم من خدمة الإمبراطور ، عن لعب دور رئيسي في اتخاذ القرارات الحكومية. ومع ذلك ، ناضل علماء سلالة كينغ من أجل مجد هذا المنصب ، وفي السنوات الأولى من السلالة كان العديد من العلماء المشهورين مساعدين خاصين.
قد يشك بعض القراء في أنه من أجل انتقاد GT بشدة ، اخترت بشكل خاص مثل هذه المقاطع التي تعثر فيها بنشاط ، وأنه في الواقع يتعامل مع معظم النصوص بشكل أفضل. يبدو قابل للتصديق ، لكنه ليس كذلك. تقريبا كل فقرة قمت باختيارها من الكتب التي أقرأها الآن أدت إلى أخطاء في الترجمة بجميع أنواعها وخطوطها ، بما في ذلك عبارات لا معنى لها وغير مفهومة كما ورد أعلاه.
بالطبع ، أعترف أنه في بعض الأحيان يعطي GT بعض الجمل التي تبدو جيدة جدًا (على الرغم من أنها قد تكون مضللة أو خاطئة فقط). قد يحدث أن تعمل فقرة أو فقرتان بشكل مثالي ، مما يخلق الوهم بأن GT تفهم ما تفعله ، وتفهم ما يعنيه القراءة. في مثل هذه الحالات ، تبدو سيارة GT مثيرة للإعجاب - تكاد تكون بشرية! وجميع الإشادة تتعلق بوضوح بمبدعيها وعملهم الشاق. ولكن في الوقت نفسه ، لا تنسى ما فعلته GT مع هذين المقطعين الصينيين ، وفي وقت سابق مع كل من الفرنسية والألمانية. لفهم هذه الأخطاء ، يجب ألا تنسى "تأثير إليزا". آلة لغة بيان لا تقرأ أي شيء - ليس بالمعنى الإنساني لفعل "اقرأ". إنها تعالج النص. الشخصيات المعالجة لا تتعلق بالتجربة الدنيوية. ليس لديها ذاكرة تستمد منها أي شيء ، ولا خيال ، ولا فهم ، ولا معنى مخفي وراء الكلمات التي تعمل بها بهذه السرعة.
* * *
سألني أحد الأصدقاء عما إذا كان يمكن اعتبار مهارات GT وظيفة قاعدة بيانات بسيطة. اكتشف أنه إذا قمت بزيادة قاعدة البيانات مليون أو مليار مرة ، في النهاية ، من حيث المبدأ ، فستكون قادرة على ترجمة كل ما يقدمونه ، وفي جوهره مثالي. لا أعتقد ذلك. إن زيادة كمية "البيانات الضخمة" لن تقربك من الفهم ، لأن الفهم يعتمد على توفر الأفكار ، وغياب الأفكار هو أصل جميع مشاكل الترجمة الآلية الحديثة. لذلك أنا متأكد من أن قواعد البيانات الأكبر حجمًا - حتى تلك الأكبر حجمًا - لن تساعد هنا.
سؤال طبيعي آخر: هل استخدام الشبكات العصبية في GT - تقليد الدماغ - يجعلنا أقرب إلى الفهم الحقيقي بواسطة آلات اللغة. يبدو هذا في البداية معقولاً ، ولكن حتى الآن لم يقم أي شخص بأية محاولات لتجاوز المستوى السطحي للكلمات والعبارات. يتم تضمين جميع أنواع الإحصائيات حول قواعد البيانات الضخمة في الشبكة العصبية ، ولكن هذه الإحصائيات ببساطة تربط بعض الكلمات مع غيرها ، وليس الأفكار. لا توجد محاولات لإنشاء هياكل داخلية تمثل الأفكار أو الصور أو الذكريات أو الخبرة. هذه التراكيب العقلية هي مراوغة للغاية بالنسبة للطرق الحسابية ، وبالتالي ، بدلاً من استخدامها ، يتم استخدام خوارزميات سريعة ومعقدة للتراكم الإحصائي للكلمات. لكن نتائج هذه التقنيات لا تقارن مع وجود أفكار تظهر بالفعل عندما يقرأ شخص ما ويفهم ويخلق ويعدل ويحكم على النص.
ولكن على الرغم من سلبياتي ، فإن GT تقدم خدمة يقدرها الكثيرون: فهي تحول الجمل ذات المعنى المكتوبة باللغة الطبيعية A إلى سطور من الكلمات ذات معنى في اللغة B. الناس راضون تماما عن النتيجة. إذا استطاعوا الحصول على "الفكرة الأساسية" لاقتراح مكتوب بلغة غير مألوفة ، فإنهم سعداء. بالنسبة لي ، ليس هذا على الإطلاق ما تعنيه كلمة "الترجمة" ، ولكن بالنسبة لبعض الناس إنها خدمة رائعة ، وبالنسبة لهم هي ترجمة. حسنًا ، يمكنني أن أفهم ما يحتاجون إليه وما يسعدهم. محظوظ لهم!
لقد شاهدت مؤخرًا المخططات الشريطية التي رسمها محبو التكنولوجيا الذين يدعون أنهم يمثلون جودة الترجمة التي يقوم بها الأشخاص وأجهزة الكمبيوتر ، وأن هذه الرسوم البيانية توضح مدى قرب الترجمة الآلية من الإنسان. من وجهة نظري ، مثل هذا التحديد الكمي للمفاهيم التي لا يمكن التعبير عنها صفات كمية من العلوم الزائفة ، أو ، إذا كنت ترغب ، المهووسين الذين يحاولون إحضار الرياضيات إلى تلك الأشياء ذات الطبيعة الفنية غير الملموسة والدقيقة التي تستعصي عليهم. في رأيي ، فإن استنتاج GT اليوم يتراوح من ممتاز إلى غريب ، ولكن لا يمكنني تقييم مشاعري حول هذا العدد. تذكر المثال الأول ، باستخدام مفهومي "له" و "لها". ترجم البرنامج الخالي من التفكير جميع الكلمات بشكل صحيح تقريبًا ، ولكن على الرغم من هذا النجاح ، إلا أنه لم يفهم المعنى تمامًا. وكيف يعبر عن جودة العمل عدديًا؟ إن استخدام المخططات العمودية الزائفة لتمثيل جودة الترجمة هو ببساطة إساءة للسمات الخارجية للعلوم.
دعونا نعود إلى الصورة المحزنة ، التي سيُترَك فيها المترجمون من الناس قريباً ، وستصبح من الطراز القديم ، وفي النهاية سوف ينخرطون في التدقيق اللغوي. في أفضل الأحوال ، ستكون النتيجة بعض المتوسط. لا يبدأ الفنان الجاد بالعمل مع القمامة المليئة بالأخطاء من أجل عمل فني عن طريق إجراء بعض التغييرات. هذه ليست طبيعة الفن. والترجمة فن.
في كتاباتي على مر السنين ، كنت أؤيد دائمًا الرأي القائل بأن دماغ الإنسان هو آلة. سيارة معقدة للغاية وجادلت بقوة مع أولئك الذين قالوا إن الآلات كانت في الأساس غير قادرة على الفهم. حتى أن هناك مدرسة فلسفة تنص على أن أجهزة الكمبيوتر لن "تمتلك دلالات" أبدًا لأنها تتكون من "المادة الخاطئة" (السيليكون). بالنسبة لي ، هذا هراء سطحي. هنا لن أخوض في النقاش ، لكني لا أريد أن أبهر القارئ بأنني أعتقد أن الذكاء والفهم لن يكونا متاحين أبدًا لأجهزة الكمبيوتر. إذا كان هذا المقال يثير مثل هذه الأفكار ، فذلك فقط لأن التقنيات التي أناقشها لا تبذل أي محاولات لإعادة إنتاج الذكاء البشري. بل على العكس: إنهم يحاولون التحايل على العقل ، والمقاطع الناتجة تظهر هذه الفجوات الفاصلة.
من وجهة نظري ، لا يوجد حظر أساسي على أن الآلات ، من حيث المبدأ ، تبدأ يومًا ما في التفكير ، والإبداع ، والمرح ، والحنين ، والفرح ، والخوف ، والحماس ، والخنوع ، والمليئة بالأمل ، ونتيجة لذلك ، يمكن أن تحقق نجاحًا الترجمات بين اللغات. لا توجد أسباب أساسية لعدم تمكنهم يومًا ما من ترجمة النكات والتورية والنصوص والروايات والقصائد والمقالات بنجاح. لكن كل هذا سيظهر فقط عندما تكون السيارات مليئة بالأفكار والعواطف والخبرة مثل الناس. لكن هذا ليس مرئيًا بعد. أعتقد أن هذا لا يزال بعيدًا جدًا. على الأقل ، يأمل هذا الشخص بشدة في ذلك ، طوال حياته وهو معجب بأعماق العقل البشري.
عندما ، في أحد الأيام الجميلة ، يقوم المترجم الميكانيكي بتأليف رواية آية بارعة باللغة الإنجليزية ، باستخدام إيامبي إيقاعي واضح وإيقاعي غني بالأفكار والحسية والخطوط الحية ، وسأفهم أن الوقت قد حان لي أن أغادر.