الصورة: ألكسندر كورولكوف / WGفي 3 يونيو ، في اليوم الأخير من مهرجان موسكو للكتاب في الساحة الحمراء ، تحدث اللغوي
ألكسندر بيبرسكي عن لغويات الكمبيوتر. تحدث عن الترجمات الآلية ، والشبكات العصبية ، ورسم خرائط متجهية للكلمات ، وطرح أسئلة حول حدود الذكاء الاصطناعي.
استمع مختلف الناس إلى المحاضرة. على يميني ، على سبيل المثال ، قطعت سائحة صينية أنفها. ألكسندر ، بالتأكيد ، فهم أيضًا - زوجان من الأرقام الإضافية والصيغ والكلمات حول الخوارزميات ، وسيهرب الناس إلى الخيمة التالية للاستماع إلى كتاب الخيال العلمي.
طلبت من ألكسندر أن يعد لـ "هبر" نسخة من المحاضرة ، حيث لم يتم قطع أي شيء يمكن أن يهدئ السائحين العشوائيين. بعد كل شيء ، افتقر معظم العرض التقديمي إلى الجمهور بأسئلة معقولة ومناقشة جيدة بشكل عام. أعتقد أنه يمكننا تطويره هنا.
من أين يبدأ الذكاء الاصطناعي؟
منذ الآونة الأخيرة ، نتواصل باستمرار مع أجهزة الكمبيوتر بالصوت ، وتجيبنا جميع أنواع صوت Alice و Alexa و Siri. إذا نظرت من الجانب ، يبدو أن الكمبيوتر يفهمنا ، ويقدم قوائم بالمواقع ذات الصلة ، ويبلغ عن عنوان أقرب مطعم ، ويشير إلى كيفية الوصول إليه.
يبدو أننا نتعامل مع جهاز ذكي للغاية. يمكنك حتى أن تقول أن هذا الجهاز يحتوي على ما يسمى بالذكاء الاصطناعي (AI). على الرغم من أن لا أحد يفهم حقًا ما يعنيه هذا وأين تذهب الحدود.
عندما يقال لنا ، "إن الذكاء الاصطناعي يؤدي وظائف إبداعية تعتبر من صلاحيات الإنسان" - ماذا يعني ذلك؟ ما هي الميزات الإبداعية؟ ما هي الوظيفة الإبداعية وأيها ليست كذلك؟ يعد اختيار أقرب مطعم صيني ميزة إبداعية؟ الآن يبدو أنه على الأرجح لا.
نميل باستمرار إلى حرمان الذكاء الاصطناعي من جهاز الكمبيوتر. بمجرد أن نعتاد على المظاهر الفكرية التي يصنعها الكمبيوتر ، نقول ، "هذا ليس ذكاء اصطناعي ، هذا هراء كامل ، مهام نموذجية ، لا شيء مثير للاهتمام."
مثال بسيط - من وجهة نظرنا ، لا يوجد شيء أكثر غباء من آلة حاسبة الجيب. يباع في أي كشك مقابل 50 روبل. خذ الآلة الحاسبة العادية ذات الثماني بتات ، واضغط على الأزرار واحصل على النتيجة في ثوانٍ. حسنًا ، تعتقد ، إنه يعتقد بعض الأشياء. هذه ليست ذكاء.
وتخيل مثل هذه الآلة في القرن الثامن عشر. قد تبدو معجزة ، لأن الحساب كان من اختصاص الإنسان.
يحدث الشيء نفسه مع اللغويات الحاسوبية. نميل إلى احتقار جميع إنجازاتها. أدخلت في Google طلب بحث "آيات بوشكين" ، فوجد صفحة تقول "A.S. بوشكين - قصائد ". يبدو أن هذا؟ سلوك طبيعي تمامًا. ولكن كان على لغويي الكمبيوتر أن يقضوا عشرات السنين لكي يتم العثور على كلمة قصيدة في كلمة قصائد ، ولكي تجد كلمة بوشكين في كلمة بوشكين ولا توجد في بوشكين.
شطرنج الكمبيوتر والترجمة الآلية
ولدت اللغويات الحاسوبية في نفس الوقت الذي تولد فيه شطرنج الكمبيوتر - وكان الشطرنج أيضًا حقًا من حقوق الإنسان. كتب كلود شانون ، أحد مؤسسي علوم الكمبيوتر ،
مقالة في عام 1950
حول كيفية برمجة جهاز كمبيوتر للعب الشطرنج. وفقا له ، يمكننا تطوير نوعين من الاستراتيجيات.
أ - مع بحث شامل عن التكملة. من الضروري اختبار جميع التحركات الممكنة في كل مرحلة.
ب - التكرار فقط على تلك الامتدادات التي يتم تقييمها على أنها واعدة.
من الواضح أن الشخص يستخدم الاستراتيجية ب. فالأكبر ، على الأرجح ، يمر فقط بالخيارات المعقولة في رأيه ، وفي وقت سريع إلى حد ما يعطي خطوة جيدة.
من الصعب تنفيذ الاستراتيجية "أ". وفقًا لحسابات شانون ، لحساب ثلاث حركات ، تحتاج إلى فرز 10
9 خيارات ، وإذا تم تقدير الموضع بميكروثانية واحدة (والتي كانت متفائلة للغاية في منتصف القرن العشرين) ، فسيستغرق الأمر 17 دقيقة لإجراء خطوة واحدة. وثلاث خطوات إلى الأمام هي عمق غير مهم للتنبؤ.
يتألف تاريخ الشطرنج اللاحق بأكمله من تطوير تقنيات تسمح لنا بعدم فرز كل شيء ، ولكن لفهم ما يجب تسويته وما هو غير مطلوب. والنصر على الإنسان قد تحقق ، أخيرًا وبلا رجعة. تجاوز الكمبيوتر بطل العالم في لعبة الشطرنج منذ حوالي 20 عامًا ، ومنذ ذلك الحين تحسن فقط.
اعتبر أفضل برنامج ستوكفيش. في العام الماضي ، لعبت AlphaZero 100 مباراة معها.
بياض | أسود | انتصار أبيض | ارسم | انتصار بلاك |
---|
AlphaZero | ستوكفيش | 25 | 25 | 0 |
ستوكفيش | AlphaZero | 0 | 47 | 3 |
AlphaZero هي شبكة عصبية اصطناعية لعبت الشطرنج لمدة أربع ساعات فقط مع نفسها. وتعلمت أن تلعب بشكل أفضل من جميع البرامج التي أمامها.
يحدث شيء مماثل في لغويات الكمبيوتر الآن - طفرة في نمذجة الشبكة العصبية. بدأوا العمل على الشطرنج الآلي في وقت واحد مع الترجمة الآلية - في منتصف القرن الماضي. ومنذ ذلك الحين ، تم تمييز ثلاث مراحل من التطور.
- الترجمة الآلية القائمة على القواعدتم تصميمه ببساطة شديدة - مثل شيء في دروس القواعد ، يختار الكمبيوتر الموضوع ، المسند ، الإضافة. إنه يفهم ما هي الكلمات التي تُترجم كل هذا إلى لغة أخرى ، ويتعلم كيفية التعبير عن الموضوع ، والمسند ، والإضافة ، وكل شيء.
تطورت هذه الترجمة على مدى 30 عامًا ، ولم تحقق نجاحًا كبيرًا.
- ترجمة إحصائية (جملة)يعتمد الكمبيوتر على قاعدة بيانات كبيرة من النصوص المترجمة من قبل الإنسان. يختار الكلمات والعبارات التي تتوافق مع الكلمات والعبارات الأصلية ، ويجمعها في جمل باللغة الهدف ويعطي النتيجة.
عندما يكتبون على الإنترنت عن "أكثر 20 ترجمة آلية غبية" تالية - على الأرجح ، يتعلق الأمر بترجمة العبارات. على الرغم من أنه حقق بعض النجاح.
- ترجمة الشبكة العصبيةسنتحدث عنه أكثر. دخلت حيز الاستخدام الشامل أمام أعيننا: قامت Google بتشغيل ترجمة الشبكة العصبية في نهاية عام 2016. بالنسبة للروسية ، ظهر في مارس 2017. أطلقت Yandex في نهاية عام 2017 نظامًا هجينًا يعتمد على الشبكات والإحصاءات العصبية.
الشبكات العصبية
تعتمد ترجمة الشبكة العصبية على الفكرة التالية: إذا محاكاة رياضيًا وإعادة إنتاج عمل الخلايا العصبية في رأس الشخص ، يمكن افتراض أن الكمبيوتر سيتعلم كيفية العمل بلغة مثل الشخص تمامًا.
للقيام بذلك ، ألق نظرة على خلايا دماغ الإنسان.

هنا عصبون طبيعي. تنطلق عملية طويلة ، محوار ، من النواة. يعلق على العمليات من الخلايا الأخرى - نقاط الاشتباك العصبي. وفقًا للمحاور ، يتم نقل المعلومات حول بعض العمليات الكهروكيميائية إلى المشابك العصبية لخلايا الخلية. يظهر محوار واحد فقط من كل خلية ، ويمكن دخول العديد من نقاط الاشتباك العصبي. تنتشر الإشارات ، وهذه هي الطريقة التي يتم بها نقل المعلومات.
ترتبط بعض الخلايا بالعالم الخارجي. يتلقون إشارات تتم معالجتها بشكل أكبر بواسطة الشبكة العصبية.
وهنا أبسط نموذج رياضي لما يمكننا القيام به هنا. وجهت تسع دوائر متصلة. هذه هي الخلايا العصبية.

الخلايا العصبية الستة على اليسار هي طبقة الإدخال ، التي تتلقى إشارة من البيئة الخارجية. لا تلمس الخلايا العصبية من الطبقة الثانية والثالثة البيئة ، ولكن فقط مع الخلايا العصبية الأخرى. نقدم القاعدة - إذا دخل سهمان على الأقل من الخلايا العصبية النشطة إلى العصبون ، فعندئذٍ يتم تنشيط هذا العصبون أيضًا.
تعالج الشبكة العصبية الإشارة المستقبلة عند الإدخال ، وفي النهاية ، الإخراج الصحيح - يضيء العصبون أو لا يضيء. مع هذه العمارة ، لتنشيط العصبون الأيمن ، تحتاج على الأقل إلى أربعة خلايا عصبية نشطة في الصف الأيسر. إذا تم إضاءة 6 أو 5 ، فسيضيء بالتأكيد ، إذا كان من 0 إلى 3 ، فلن يضيء بالتأكيد. ولكن إذا تم حرق أربعة ، فسوف تضيء فقط إذا تم توزيعها بالتساوي: 2 في النصف العلوي و 2 في الأسفل.

اتضح أن أبسط مخطط من تسع دوائر يؤدي إلى حجة متفرعة إلى حد ما.
تعمل الشبكات العصبية الاصطناعية بنفس الطريقة تقريبًا ، ولكن عادة لا تعمل مع أشياء بسيطة مثل "مضاءة / غير مضاءة" (أي 1 أو 0) ، ولكن بأرقام حقيقية.
خذ على سبيل المثال شبكة من 5 عصبونات - اثنان في طبقة الإدخال واثنان في الوسط (مخفي) وواحد في الإخراج. بين جميع الخلايا العصبية للطبقات المجاورة هناك اتصالات يتم تعيين الأرقام لها - الأوزان. لمعرفة ما يحدث في خلية عصبية فارغة حتى الآن ، لنفعل شيئًا بسيطًا للغاية: لنر ما هي الروابط التي تؤدي إليه ، وضرب وزن كل اتصال بالرقم المكتوب في عصبون الطبقة السابقة التي يأتي منها هذا الاتصال ، وسنلخص كل هذا. في العصبون الأخضر العلوي في الرسم البياني ، يتم الحصول على 50 × 1 + 3 × 10 = 80 ، وفي الجزء السفلي - 50 × 0.5 - 3 × 10 = −5.

صحيح ، إذا قمت بذلك بالضبط ، فإن الناتج سيكون ببساطة نتيجة حساب دالة خطية لقيم الإدخال (في مثالنا ، سيخرج 25 Y - 0.5 X ، حيث X هو الرقم في الخلايا العصبية الصفراء العليا و Y في الأسفل) ، لذلك سنتفق شيء آخر يحدث داخل العصبون. أبسط وظيفة تعطي نتائج جيدة في نفس الوقت هي ReLU (الوحدة الخطية المصححة): إذا تم الحصول على رقم سالب في عصبون ، خرج 0 ، وإذا كان غير سالب ، فقم بإخراجها دون تغيير.
لذا ، في مخططنا ، يتحول −5 عند الخروج من العصبون الأخضر السفلي إلى 0 ، وهذا الرقم هو الذي يستخدم في الحسابات الإضافية. بالطبع ، إن بنية الشبكات العصبية الحقيقية المستخدمة في الممارسة أكثر تعقيدًا بكثير من أمثلة لعبتنا ، ولا يتم أخذ الأوزان من السقف ، ولكن يتم اختيارها عن طريق التدريب ، ولكن المبدأ نفسه مهم.
ما علاقة ذلك باللغة؟
الأكثر مباشرة ، شريطة أن نمثل اللغة في شكل أرقام. نقوم بتشفير كل كلمة ونواجه مثل هذه الشبكة العصبية.
هنا يأتي الإنجاز المهم للغاية في علم اللغة الكمبيوتر لإنقاذه ، والذي ظهر من حيث الأفكار قبل 50 عامًا ، ومن حيث التنفيذ ، تم تطوير السنوات العشر الماضية بنشاط: تمثيل الكلمات.
هذا والصورتان التاليتان مأخوذتان من عرض تقديمي قدمه ستيفان إيفرتهذا تمثيل للكلمات كمجموعة من الأرقام بناءً على اعتبار بسيط للغاية. لمعرفة معنى كلمة ما ، فإننا لا ننظر إلى القاموس ، ولكن إلى مصفوفات ضخمة من النص وننظر بعد ذلك في الكلمة الأكثر شيوعًا.
على سبيل المثال ، هل تعرف كلمة كاتم صوت؟ إذا لم يكن الأمر كذلك ، فحاول أن تخمن من خلال النظر إلى النصوص التي تم فيها تكويم الكلمة.
- معطف أسود وغطاء أبيض. حسنًا ، ولا يزال بعض كاتم الصوت الذي لا غنى عنه ...
بجانبه عناصر من الملابس ومعطف وقبعة ، وربما كاتم صوت من بينها. إنه بالكاد غذاء ، ولا يكاد يكون عنصرًا في الهندسة المعمارية.
- لسبب ما ، على عنقه في ليلة خانقة ، تم رش كاتم صوت مخطط قديم.
على الرقبة - هذا يعني أنهم ليسوا جوارب. يمكنك التقاطه - على ما يبدو ، إنه مرن ، مصنوع من القماش ، وليس ، على سبيل المثال ، من الخشب أو الحجر.
- منشفة Waffle wutle Nerzhin معلقة على رقبته مثل كاتم للصوت.
نحن نقوم بتجديد وتجديد مجموعة الأمثلة ، وبالنظر إليها ، سوف نفهم تدريجياً ما هو مكتوم - ما يشبه الوشاح. يقوم الكمبيوتر بنفس الشيء تمامًا ، حيث ينظر إلى النص ويفعل شيئًا بسيطًا - فهو يلتقط الكلمات التي تقف في مكان قريب.
هنا الهيروغليفية المصرية.

افترض أنك تعرف معاني ستة منهم ، وتريد أن تفهم ما هو نوع الكلمة المميزة باللون الأحمر. يوضح هذا الجدول عدد المرات التي تم العثور فيها على هذه الكلمات بجانب الهيروغليفية المصرية الأخرى.
تحدث الكلمة الحمراء مع الكلمة السادسة - تمامًا مثل الكلمات
القط والخنزير . وبعبارة أخرى لا تحدث معه على الإطلاق.
تم العثور على الكلمة الحمراء مع الكلمة الثانية في كثير من الأحيان أكثر من الكلمة الثالثة ، على عكس الكلمات
السكين والموز . تتصرف الكلمات
القط ، القارب ، الخنزير والكأس بنفس الطريقة.
استنادًا إلى هذا المنطق ، يمكننا القول أن الكلمة الحمراء تشبه إلى حد كبير كلمات
القط والخنزير - فقط يلتقون مع الكلمة السادسة ، لديهم نسبة مماثلة من الثانية والثالثة.
ولن نكون مخطئين ، لأن الكلمة الحمراء هي كلمة
كلب .

في الواقع ، هذه ليست الهيروغليفية المصرية ، ولكن الأسماء والأفعال الإنجليزية ، والتي يشار إليها كم عدد المرات التي تظهر فيها معًا في مجموعة كبيرة من النصوص الإنجليزية. تلك الكلمة السادسة هي
قتل الفعل.
غالبًا ما يتم العثور على كلمات
القط والكلب والخنزير على يمين كلمة
قتل . نادرًا ما تُقتل السكاكين والقوارب والموز. على الرغم من أنه في روسيا ، إذا أردت ، يمكنك القول ، "لقد قتلت قاربي" ، لكن هذا أمر نادر.
بالضبط ما يفعله الكمبيوتر عندما يعالج النص. فهو يعتقد ببساطة أنه يلتقي بشيء ما ، ولم يعد من روائع الفهم.
علاوة على ذلك ، يقدم الكمبيوتر الكلمات في شكل مجموعة معينة من الأرقام: في المثال أعلاه ، تتطابق كلمة
الكلب مع الأرقام (115 ، 83 ، 10 ، 42 ، 33 ، 17). في الواقع ، يجب أن نحسب عدد المرات التي لا يحدث فيها ست كلمات ، ولكن مع جميع الكلمات الموجودة في نصوصنا: إذا كان لدينا جميعًا 100000 كلمة مختلفة ، فإننا نربط كلمة
كلب بمجموعة من 100000 رقم. هذا ليس مناسبًا جدًا في الممارسة العملية ، لذلك ، عادةً ما يتم استخدام طرق تقليل البعد لتحويل نتائج كل كلمة إلى مجموعة من عدة مئات من العناصر في الطول (يمكن العثور على المزيد حول هذا
هنا ).
هناك مكتبات جاهزة للغات البرمجة التي تسمح لك بذلك: على سبيل المثال ،
gensim لـ Python. من خلال تقديمها لهيئة
اللغة الإنجليزية البراونية بحجم يصل إلى مليون كلمة تقريبًا ، يمكنني في غضون ثوان قليلة بناء نموذج تبدو فيه كلمة
القط كما يلي:

نحن نمثل حيوانًا بشعر وذيل ومواء. جهاز الكمبيوتر الخاص بي ، الذي قمت بتدريس اللغة الإنجليزية ، يمثل كلمة
قطة على شكل مائة رقم جاءت من الكلمات المجاورة لها.
هنا مثال في المواد الروسية من موقع
RusVectōres . أخذت كلمة
raven وطلبت من الكمبيوتر أن يخبرني عن الكلمات الأكثر تشابهًا معها - أو بعبارة أخرى ، مجموعات الأرقام التي تشبه الكلمات مجموعة الكلمات الخاصة بكلمة
raven .

تحولت 8 من أصل 10 كلمات إلى أسماء الطيور. بدون معرفة شيء ، حقق الكمبيوتر نتيجة ممتازة - أدركت أن الطيور تبدو مثل الغراب. لكن من أين أتت الكلمتان الأحمر والروكنكا؟
يمكنك تخمينمع الثلاثة ، غالبًا ما تستخدم كلمة أبيض: للحرارة البيضاء ، تحت المقابض البيضاء ، الغراب الأبيض.
تلقي شبكات من الأرقام وتمريرها من خلال أنفسهم ، الشبكات العصبية تعطي نتيجة جيدة بشكل مدهش. إليكم نصًا فلسفيًا معقدًا إلى حد ما من خطاب الأكاديمي أندريه زاليزينياك حول وضع العلم في العالم الحديث. تمت ترجمته إلى الإنجليزية من قبل مترجم قبل شهر ، ويتطلب الحد الأدنى من التدخل التحريري.

هنا يبرز السؤال الفلسفي العالمي.
هذه هي مشكلة ما يسمى الغرفة الصينية - تجربة فكرية على حدود الذكاء الاصطناعي. صاغها الفيلسوف جون سيرل عام 1980.
في الغرفة يجلس رجل لا يعرف الصينية. حصل على تعليمات ولديه كتب وقواميس ونافذتان. في إحدى النوافذ ، يتم تدوين ملاحظاته باللغة الصينية ، وفي نافذة أخرى يعطي إجابات - أيضًا باللغة الصينية ، ويتصرف بشكل حصري وفقًا للتعليمات.
على سبيل المثال ، قد تقول التعليمات ، "هنا لديك ملاحظة ، ابحث عن الحرف في القاموس. إذا كانت الهيروغليفية رقم 518 ، فقم بإعطاء الهيروغليفية رقم 409 إلى النافذة اليمنى ؛ إذا وصل الهيروغليفية رقم 711 ، فقم بإعطاء الهيروغليفية رقم 35 إلى النافذة اليمنى وهكذا. " إذا اتبع الشخص الموجود في الغرفة التعليمات جيدًا وإذا كانت هذه التعليمات مكتوبة بشكل جيد ، فيمكن للشخص في الشارع الذي يعطي ويستلم الملاحظات أن يفترض أن الغرفة أو الشخص الموجود فيها يعرف اللغة الصينية. بعد كل شيء ، لا يمكن رؤية ما يحدث من الداخل من الخارج.
نعلم جميعًا أن هذا الرجل تم إعطاؤه ببساطة تعليمات غبية. يقوم ببعض العمليات عليها ، لكنه لا يعرف الصينية على الإطلاق. على الرغم من أن من وجهة نظر المراقب هو معرفة اللغة.
السؤال الفلسفي - كيف نتعامل مع هذا؟ هل الغرفة تتحدث الصينية؟ ربما يعرف مؤلف هذه التعليمات اللغة الصينية؟ وربما لا ، لأنه يمكنك إصدار تعليمات استنادًا إلى مجموعة من الأسئلة والإجابات الجاهزة.
من ناحية أخرى ، ما الذي يعرفه الصينيون؟ هنا تعرف اللغة الروسية. ماذا يمكنك ان تفعل؟ ماذا يحدث في رأسك؟ نوع من التفاعل البيوكيميائي. تتلقى الآذان أو العيون إشارة معينة ، وتسبب نوعًا من رد الفعل ، وتفهم شيئًا ما. ولكن ماذا يعني "فهم"؟ ماذا تفعل عندما تفهم؟
وسؤال أكثر تعقيدًا - هل تفعل ذلك بطريقة مثلى؟ هل صحيح أنك تعمل مع اللغة بشكل أفضل من أي جهاز يعمل مع اللغة؟ هل يمكنك أن تتخيل أنك سوف تتحدث الروسية أسوأ من أي جهاز كمبيوتر؟ نحن دائما نقارن سيري ، أليس بالطريقة التي نتكلم بها أنفسنا ، ونضحك إذا كانوا يتحدثون بشكل غير صحيح من وجهة نظرنا. من ناحية أخرى ، أعطيت أنت وأنا الكمبيوتر الكثير مما كان يُعتبر في السابق من اختصاص الإنسان. الآن أصبحت السيارات أفضل بكثير في العد ولعب الشطرنج ، ولكن قبل أن تتمكن من ذلك. ربما تحدث أشياء مشابهة مع أجهزة الكمبيوتر المتحدثة: في 100 أو 10 أو حتى 5 سنوات ، ندرك أن الآلة أتقنت اللغة بشكل أفضل ، وتفهم أكثر بكثير ، وبشكل عام هي اللغة الأم أفضل بكثير مما نحن عليه.
ثم ماذا تفعل مع حقيقة أن الشخص يستخدم لتعريف نفسه من خلال اللغة؟ بعد كل شيء ، يقولون أن الشخص فقط هو الذي يتحدث اللغة. ماذا سيحدث إذا عرفنا النصر على الكمبيوتر في هذا المجال؟
اترك أسئلتك في التعليقات. ربما بعد ذلك بقليل يمكننا إجراء مقابلة مع ألكسندر. أو ربما سيأتي هو نفسه في تعليق على دعوتنا ويتحدث مع كل من يهمه الأمر.