أجهزة الكمبيوتر تكتب النثر ، لكنها لا تزال أقل من الناس. لماذا؟



قبل عامين ، في مسابقة أدبية يابانية ، كدت أفوز بقصة كتبها الذكاء الاصطناعي. يطلق عليه "يوم كتب الكمبيوتر رواية". حتى لو كان هذا يبدو وكأنه تجسيد غبي للنكتة "أفضل طريقة لصنع مليون هو كتابة كتاب ، وكيفية صنع مليون" ، ذهبت القصة إلى النهاية ، متخطية حوالي نصف ونصف ألف نص كتبه الناس. لكن الاختراق لم يحدث. لا تزال النصوص الخيالية مكتوبة من قبل الناس ، ونصوص غير خيالية - في الغالب أيضًا.

قبل شهرين ، حاول مينوتيك عمل مساعد لمنظمة العفو الدولية لكتابة وكتابة قصة معه بالتعاون. المفسد - لم ينجح. أخبرنا منشئو المشروع عن الفكرة وكيف تم تنفيذها. وحاولنا معرفة لماذا يخرج الشعراء من السيارات أفضل من كتاب النثر.

أفهم أنك لا تفهم ، أننا لا نفهم أي شيء


في صيف هذا العام ، عقدت مؤسسة سيستيما مسابقة قصة قصيرة للخيال العلمي "المستقبل". سُئل المشاركون عن موضوع "الخلود" ، ووُعد الفائز بجائزة صلبة قدرها نصف مليون روبل. تم إرسال الآلاف من القصص إلى المنظمين ، من بينها كتابة واحدة باستخدام الذكاء الاصطناعي.


يعمل الذكاء الاصطناعي بشكل أفضل في النوع القصير - القصائد ، والاقتباسات الحكيمة ، والمحفزات ، والميمات. ولكن ليس كل شيء يسير دائمًا على النحو المنشود. على سبيل المثال ، يقوم InspiroBot ، الذي ينشئ ملصقات تحفيزية ، بوضع الكلمات في أشياء غريبة وأحيانًا زاحفة.

القصة تسمى "الضفدع ينشر جناحيه" . هذه قصة عن الفتاة الهندسية فوتينو ، مالك مجموعة من الصفات المميزة المميزة لأبطال السايبربانك نوير: إدمان المخدرات ، ماض مظلم ، انحرافات عقلية ، ميول انتحارية وانعكاس لا نهاية له على الطبيعة الوهمية للعالم. بين رحلات الهلوسة ، يحاول Fotino إصلاح الذكاء الاصطناعي الذي يدير المدينة.
هذه قصة لم تكتبها منظمة العفو الدولية بالكامل ، ولكن فقط بمشاركته. كانت التجربة أنه لم يتم استخدام برنامج خاص لإنشاء النص ، ولكن تم ثني عدة كتل من التعليمات البرمجية معًا ، والتي كانت تهدف في الأصل إلى حل مشاكل أخرى.

استخدم النظام مكتبة بتصميمه الخاص ، والذي يستخدم بدوره Pytorch. تم تكوين الحوارات بواسطة برنامج دردشة تم تطويره مسبقًا ، للعناوين والأوصاف - شبكة متكررة كبيرة جدًا ، مدربة على النصوص التي تم تنزيلها من lib.ru.

  • دنيس تاراسوف ( دورهام ) ، الرئيس التنفيذي لشركة مينوتيك.

أهم جوانب الكتابة - الفكرة والمؤامرة - لا يزال يأخذها الإنسان. وفقا لدينيس ، حاولوا إنشاء أداة تساعد الكاتب فقط ، ولا تعمل لصالحه.
يتم إنشاء الحوارات مع الذكاء الاصطناعي بالكامل من قبل النظام وتترك في الشكل الذي تم تلقيها فيه. يتم إنشاء الحوارات بين الشخصيات جزئيًا ويتم تنعيم الخشونة هناك. الإعادة التي تمت إزالتها من عبارات مثل "أفهم أنك لا تفهم ، أننا لا نفهم أي شيء". على الرغم من أن نسبة معينة من هذه التعبيرات بقيت. يتم إنشاء جميع العناوين الفرعية أيضًا. لقد حاولنا تصحيح الأخطاء الإملائية والنحوية ، ولكن من الممكن أن تتم إضافة أخطاء أكثر من تصحيحها.

  • دنيس تاراسوف ( دورهام ) ، الرئيس التنفيذي لشركة مينوتيك.

في النص النهائي ، من الصعب تحديد مقدار النص والآلة البشرية. وفقا لدينيس ، هناك فقرات حيث تم تكوين جملة واحدة من قبل شخص ، والثانية - خوارزمية. "سلسلة من الحلقات ببساطة ما كانت لتظهر في القصة بدون عناوين منظمة العفو الدولية و" بذور ". بشكل عام ، أثرت أساليب شظايا الذكاء الاصطناعي على الأسلوب الذي كتب به الناس ".

يذكر العمل ، إذا سمّاها ذلك ، توسعًا معينًا في الوعي. بعد كتابة جملة أو فقرة ، لا يتحول الشخص إلى مخيلته فحسب ، بل يبدو أيضًا أنه بناءً على كلماته تم إنشاء جهاز كمبيوتر. يقول دينيس: "حاول الرجل التكيف مع ما تم إنشاؤه ، وإن أمكن ، جمع كل شيء في مؤامرة ذات مغزى".



ومع ذلك ، فشل نجاح الزملاء اليابانيين. لم تصل القصة إلى القائمة الطويلة. كتب عضو لجنة التحكيم نيكولاي ف. كونونوف عن "الضفدع" هكذا:
يد المحرر ملحوظة للغاية - وبشكل عام يد الإنسان. كتب مطورو برامج الروبوت ، بالتعاون مع الخوارزمية ، قصة من غير المحتمل أن تسبب الرفض بين قراء الخيال. وبهذا المعنى كانت التجربة ناجحة.

يقول دينيس: "إن ما يعجب معظم الناس اليوم ليس بالضرورة قصة جيدة. لا يزال من الممكن تشديد جودة النص ، لكن المشكلة الرئيسية هي عدم وجود مؤامرة. اتضح أن الأجزاء الفردية من النص قد تحتوي حتى على معنى ، ولكن ليس لديهم بداية ونهاية ، ولا فكرة مشتركة. إنه مجرد حدوث شيء ما ، شخص ما يفعل شيئًا ، ويتحدث ، ولا ينتهي بأي شيء ".

ولكن لا يمكنك أن تفهم أنك ستحل مشكلة تسمح لك بالخروج بشيء ما


عندما تم صياغة كلمة "روبوت" لأول مرة ، تم استخدامها بالفعل في سياق السؤال الفلسفي "هل من العدل اعتبار الأشخاص المصطنعين أناسًا؟" هذه مسرحية لكاريل apek RUR أي كلمة هي أيضا فكرة ومعنى والسياق وراءها. بطريقة جيدة ، يجد الكاتب أولاً الأفكار والمعاني ، ثم يختار الحروف لها.

ومع ذلك ، فإن الكلمات نفسها ليست سوى حركات أو حركات بكسل على خلفية بيضاء.



المشكلة الكبرى في النصوص الآلية هي أن العملية تسير في الاتجاه المعاكس. يختار النظام مجموعة صغيرة معينة من الكلمات من مجموعة أكبر ، ويحاول الشخص - القراءة - العثور على المعنى فيها ، ويكرر هذه المجموعات حتى يتم العثور على المعنى في رأيه.
حتى الآن ، تعلمت أجهزة الكمبيوتر جيدًا كيفية كتابة الشعر. ويمكن رؤية ذلك على موقع botpoet.com ، حيث يوجد اختبار يوضح بوضوح أنه من الصعب التمييز بين شاعر "بشري" عن جهاز كمبيوتر. ولكن في الآيات يعتقد القارئ الكثير من الروابط المنطقية. في النثر (خاصة في المؤامرة) ، عادة ما يكون أكثر وضوحًا ، ولا يزال الكمبيوتر يعمل بشكل سيئ مع هذا. غالبًا ما يتم تدريب الشبكات العصبية على مجموعة من الأعمال من قبل مؤلف واحد أو آخر ، ولكن يمكنهم فقط إنتاج نص مماثل ظاهريًا ، أي أنهم يقلدون النمط ، لكنهم لا يخلقون قصة جديدة.

  • ألكسندر بيبيرسكي ( apiperski ) ، لغوي.


أنشأ موظفو Yandex شبكة عصبية ، تم تدريبها على مجموعة من الشعر الروسي ، ثم قاموا بتغذية نصوص الدفاع المدني وأصدروا قصائد بأسلوب يغور ليتوف. كما قاموا بتسجيل الألبوم الموسيقي "404" وأطلقوا على مجموعة "الدفاع العصبي"

إن كيفية ترتيب المؤامرات بشكل رسمي هو موضوع بحثي قديم. قبل ذروة تكنولوجيا المعلومات ، قام الباحثون بفرز الآلاف من النصوص يدويًا بحثًا عن الأنماط الشائعة. أحد أشهر الأمثلة هو كتاب جوزيف كامبل ، بطل ذو آلاف الوجوه. هذه محاولة لاستنتاج هيكل عام ، سلسلة من المواقف ، التي تشبه إلى حد ما في أساطير معظم الشعوب. عمل فلاديمير بروب في مهمة مماثلة. في كتاب "مورفولوجيا حكاية خرافية" ، حاول وصف المكونات العامة لقصص الفلكلور.

وفقًا لهذه المعرفة ، يتم تعليم الناس أن يصنعوا القصص. تقع دراسات شكل المؤامرات في كتب عن الكتابة وكتابة السيناريو ، حيث تتحول إلى تعليمات محددة. على سبيل المثال ، وصف كاتب السيناريو بليك سنايدر في كتاب "Save the Cat" البنية الواضحة لفيلم جيد في رأيه ، حيث قام بتوزيع وظائف المؤامرة اللازمة حتى المكان في التوقيت وعدد الصفحات.

لكن تعليمات الناس لم تتحول بعد إلى تعليمات للسيارات.
من الصعب فهم بنية مؤامرة النص وتقلبات المؤامرة ، لأنه في البداية سيكون من الجيد الاتفاق على كيفية تقديمها رسميًا ثم التفكير بالفعل في كيفية استخراجها من النص. ربما يمكن وضع التعليمات من الكتب المدرسية للكُتاب في السيارة على شكل قواعد مع بعض المتغيرات المملوءة عشوائيًا (على سبيل المثال ، بحيث تحدد مدينة العمل من قائمة العواصم الأوروبية) ، لكن هذا بالكاد يجعلنا أقرب إلى إنشاء قصص أصلية. أعتقد حتى الآن أنه من الممكن تعليم الكمبيوتر لتحليل ما إذا كان نص جديد معين أقرب إلى النصوص القديمة الناجحة أو الفاشلة ، وإعطاء المؤلف بعض التوصيات ، ولكن ليس أكثر.

  • ألكسندر بيبيرسكي ( apiperski ) ، لغوي.

يقول دينيس تاراسوف: "في الوقت الحالي ، الذكاء الاصطناعي غير قادر على تقييم جودة القصة ، لأن معايير الجودة ليست واضحة من حيث المبدأ". ولكن إذا كان من الصعب جدًا مساواة الجودة والنجاح ، فيمكن للذكاء الاصطناعي أن يقوم بالمهمة.

في العام الماضي ، ظهر كتاب Bestseller Code ، حيث حاول مؤلفو السيناريو جودي آرتشر وماثيو جوكرز وصف أوجه التشابه بين الكتب الناجحة. قاموا بتغذية نصوص الكتب إلى نظام كمبيوتر مبني على التعلم الآلي (الذي لم يصفه أحد مع ذلك) ، وقارنهم بالنجاح التجاري وأنماط مسماة يمكن أن تسهم في هذا النجاح - الموضوعات والإعدادات وخصائص الأبطال والتسلسل في تغيير حالتهم .
ليس من الصعب استخلاص موضوع: لهذا ، هناك خوارزميات لاستخراج الكلمات الرئيسية التي تبني قاموس التردد وتلقي نظرة على الكلمات التي يتم العثور عليها أكثر من المتوسط ​​في اللغة. صحيح ، من أجل معرفة كيفية تحويل الكلمات الرئيسية إلى مواضيع ، لا يزال يتعين علينا المحاولة: على سبيل المثال ، إذا علمنا أن الكلمات "kiss" و "tender" و "night" و "lilac" موجودة في النص بتردد عالٍ بشكل غير عادي ، خوارزمية ستختزل هذه الكلمات إلى موضوع "الحب". أو يمكنك تقسيم النصوص مسبقًا إلى فئات حسب المواضيع ("الحب" ، "المغامرات") ثم حل مشكلة تصنيف نص جديد - كما هو الحال ، على سبيل المثال ، في مجمعي الأخبار ، حيث تحتاج إلى فهم ما إذا كان النص يشير إلى الاقتصاد والسياسة وما إلى ذلك. ن. بشكل عام ، تبدو هذه المهمة قابلة للحل تمامًا.

كما تم تحليل خصائص الأبطال بشكل جيد. تقوم العلوم الإنسانية الرقمية بالكثير من هذا ، والذي غالبًا ما يتحول إلى أبحاث الأدب الرقمي. على سبيل المثال ، قام كلا من هذه المنطقة ، فرانكو موريتي ، ببناء تلقائيًا ، ثم حلل شبكة الاتصالات بين شخصيات هاملت . فيما يتعلق بالمواد الروسية ، على سبيل المثال ، تتعامل مجموعة فرانك فيشر في المدرسة العليا للاقتصاد ، التي تكونت فيلق الدراما الروسية RusDraCor ، مع هذا الأمر .

  • ألكسندر بيبيرسكي ( apiperski ) ، لغوي.


إن إنشاء مولد لمثل هذه القصص ليس مشكلة علمية كبيرة. على الإنترنت ، هناك مولدات قصة على هذا المبدأ وحتى مولدات قصة حيث يمكنك تحديد المعلمات والحصول على نص بجودة مختلفة. هذه هي المهمة التي يتعين حلها ، فمن الضروري فقط قضاء الوقت والجهد.

أولاً ، سيتم إنشاء تسلسل من أحداث المستوى الأعلى ، ومن ثم سيتم الكشف عن كل حدث حتى يصل إلى مستوى الجمل والحروف. أو بشكل عام ، يمكنك "إعادة كتابة" قصة شعبية ، وتغيير التفاصيل هناك ، والآن أصبحت القصة الشعبية الجديدة جاهزة.

  • دنيس تاراسوف ( دورهام ) ، الرئيس التنفيذي لشركة مينوتيك.

هل تريد أن تفعل ما لن تعرفه؟


سؤال آخر هو ما إذا كان هذا منطقيًا. عندما يحاول الناس أتمتة الإنتاج الثقيل والروبوتي ، يكون الهدف واضحًا - ففي العديد من الصناعات ، طالت القدرات المادية للناس السقف لفترة طويلة. لا توجد مثل هذه المشاكل في الكتابة - هذه المشاكل بعيدة كل البعد عن شدة العمل الجسدية.

على العكس من ذلك ، يشكو القراء في كثير من الأحيان من أي محاولات لأتمتة الكتابة ، للوصول بها إلى الأنماط والأنماط الشائعة. عند مشاهدة فيلم ، على سبيل المثال ، من المرجح أن يصاب الناس بخيبة أمل إذا حدث في كل مرة في دقيقة محددة جيدًا تطور مؤامرة معروف مسبقًا. في السينما التجارية باهظة الثمن ، يحدث هذا أكثر فأكثر ، ولكن لا يبدو أننا نسميها اختراقة مذهلة في الفن الدرامي.


في رأيي ، فإن مثل هذا النظام في الأدب سيضر بشدة ، لأنه سينشر القمامة الأدبية المختلفة ، مما يجعلها مثالية لطلبات القارئ. يتم إنتاج هذه القمامة بشكل مثالي بدون مولد ، ومع المولد لن يكون هناك شيء للتنفس منه على الإطلاق. لكتابة قصة جيدة ، تحتاج إلى فهم تعقيد العلاقات البشرية ، وفهم علم الأحياء والفيزياء ، وأكثر من ذلك بكثير ، على مستوى جيد - وليس فقط القدرة على إضافة سلاسل من الكلمات التي تتسبب في استجابة عاطفية معينة من القارئ.

لا تحل هذه المشكلة أي خوارزمية بسيطة. نحن بحاجة إلى مستوى من الذكاء والمعرفة لشخص ، وشخص متميز. يجب أن يكون الذكاء الاصطناعي قادرًا على بناء نماذج العالم نفسها والقدرة على التنبؤ بنتائج الأحداث المختلفة ، وهذه مشكلة لم يتم حلها الآن ، والعلوم بدأت للتو في الاقتراب منها.

وبالتالي ، فإن اتجاهنا في التجربة هو محاولة للجمع بين الذكاء الاصطناعي والإنسان.

  • دنيس تاراسوف ( دورهام ) ، الرئيس التنفيذي لشركة مينوتيك.

فمن ناحية ، يمكن أن تتسبب الأتمتة في تدمير الأدب. من ناحية أخرى ، إذا أصبح الذكاء الاصطناعي مجرد موسع للخيال ، إذا كان يوفر شيئًا لم يخترعه المؤلف نفسه أبدًا ، فيمكن أن يصبح الكمبيوتر حقًا مخرجًا من الأزمات الإبداعية ، الشخصية والعالمية.

Source: https://habr.com/ru/post/ar430116/


All Articles