الاتجاهات والتوقعات في مجال البرمجة اللغوية العصبية (معالجة اللغات الطبيعية)
هذا المقال يدور حول الاتجاهات والتوقعات الصادرة عن سبتمبر "تقويم الذكاء الاصطناعي" رقم 2 ، والمخصص لمراجعة سوق التقنيات والشركات في مجال البرمجة اللغوية العصبية وتوليف التعرف على الكلام في روسيا.
في هذه الدراسة ، أجرينا دراسة استقصائية للخبراء في الصناعة ، وعلى وجه الخصوص ، سألنا عن توقعات تطوير كل من التقنيات واستخدام الذكاء الاصطناعي في مختلف المجالات. لم تكن هناك إجابات كثيرة ، ولكن مع ذلك ، يمكن صياغة اتجاه عام. في هذه المقالة ، قمنا بتلخيص هذه الإجابات وأظهرنا الاتجاهات الرئيسية.
اتجاهات التكنولوجيا العامة
من النهاية إلى النهاية حل مشكلة البرمجة اللغوية العصبية
سوف تعتمد حلول أكثر وأكثر على النهج الشامل ، على سبيل المثال ، يتلقى نموذج الشبكة العصبية إشارة صوتية (الموجات الصوتية) عند الإدخال وينتج إشارة صوتية عند الإخراج ، دون مرحلة وسيطة من النص. هذا سيسرع بشكل كبير في تنفيذ النماذج وجودتها ، مع تفاقم "الشفافية" وفهمنا لـ "ما بداخلها".
تقترب من جودة التعرف على الكلام وتوليد الإنسان
في السنوات القادمة ، سيتم تحقيق تحسن كبير في جودة التعرف على الكلام. عدد الأخطاء في الاعتراف يقترب من المستوى الإنساني. سوف يتحسن التعرف على الكلام المختلط للعديد من الأشخاص الذين يتحدثون بلهجات مختلفة في بيئة صاخبة. ستتم إضافة تحليل للمشاهد الصوتية مع التعرف على جنس وعمر مكبرات الصوت ، والتلوين العاطفي للكلام وطبيعة البيئة.
لا يمكن تمييز الكلام المركب عن الكلام البشري ، وسيكون من الممكن تجميع صوت أي شخص.
متعدد اللغات
في المستقبل القريب ، ستظهر نماذج ترجمة متعددة اللغات ، بما في ذلك بسبب استخدام التعلم في مجال النقل وبسبب استخدام أحادي العقبات أكبر بكثير إلى جانب الحالات الموازية. نتيجة لذلك ، ستزداد جودة الترجمة للغات منخفضة الموارد زيادة كبيرة (مع صفيفات صغيرة نسبيا من عينات التدريب).
سيتم استبدال الترجمة اليدوية تمامًا بالترجمة الآلية نظرًا لفهم الآلة الأعمق للسياق وموضوع الوثائق. مع نمو تقنيات التعرف على الكلام وتوليف الكلام ، ستظهر الترجمة الفورية للآلة في الأفق من 5 إلى 10 سنوات.
فهم معنى النصوص
تظهر التطبيقات الأخرى القائمة على فهم المعنى المحدد للسياق في نفس الأفق خلال 5-10 سنوات: أنواع مختلفة من خدمات الحوار والمساعدة التي يمكن أن تفهم سياق الحوار ، والإجابة بذكاء على أسئلة المستخدم وتوجيه الحوار في الاتجاه الصحيح. سوف يأخذ فهم أعمق للغة إلى مستوى جديد المعالجة التلقائية لتدفقات النص على الإنترنت وفي الشبكات الاجتماعية: جمع الحقائق وتجميعها ، وتحليلها من أجل الاتساق والموثوقية.
جيل النص
الشبكات العصبية من البداية إلى النهاية ستحل محل خط أنابيب NLG الكلاسيكي. يتيح استخدام نماذج مستوى GPT2 بالفعل إمكانية إنشاء مقالات طويلة إلى حد ما حول مواضيع عشوائية في منطقة معينة ذات محتوى متحكم فيه. في أفق مدته 5 سنوات ، ستكون نماذج الشبكات العصبية قادرة على توليد نصوص ليس أسوأ من البشر. ثم المحتوى التلقائي سوف تغمر العالم.
المنصات وعبر المنصات
ستصبح العديد من الحلول قياسية ، وسيكون هناك العديد من المنصات لبناء التطبيقات القائمة على واجهات الصوت. ستتحسن الأنظمة الأساسية السحابية من حيث زمن الاستجابة وأعباء العمل والأمان. لا يُتوقع نمو الاستثمار في خدمات تفاعلية منفصلة (chatbots) ، ولكن في الأنظمة الأساسية متعددة الوظائف والحلول عبر الأنظمة الأساسية ، وبفضل ذلك سيكون المساعد الصوتي قادراً على العمل على قدم المساواة على أجهزة مختلفة. ونتيجة لذلك ، سنكون قادرين على بدء محادثة مع مساعدنا في "المنزل الذكي" ، ومواصلة ذلك على الطريق في السيارة ، ثم العمل مع جهاز الكمبيوتر الخاص بنا في مكان العمل ، كل ذلك دون فقد سياق الاتصال.
تقنيات البيانات الصغيرة
ستزداد قيمة أساليب التعلم الآلي التي تعمل بفعالية في ظروف كمية صغيرة من البيانات الأولية: نقل التعلم ، نقل المعرفة. في مثل هذه التطبيقات ، من المتوقع أيضًا استخدام GAN (شبكات الخصومة التوليدية) على نطاق واسع لإنشاء بيانات للتدريب النموذجي.
البنى مع متطلبات الحوسبة أقل
مع انتقال نماذج الشبكات العصبية من جدران المختبرات إلى مراكز البيانات التجارية ، ستزداد متطلبات كفاءة استخدام الطاقة لديها. من المتوقع إنشاء أبنية حوسبة جديدة وأكثر كفاءة. على سبيل المثال ، تجمع الشبكات المتناثرة بين أفضل الصفات الحسابية الموزعة والرموز ، والتي تتكيف نماذج التعقيد الخاصة بها مع مقدار بيانات التدريب.
اتجاهات السوق
تنفيذ في كل مكان من واجهات الصوت
سيكون تطوير تقنيات تحويل النص إلى نص الخطوة الأولى لتبسيط مهام المكتب (على سبيل المثال ، وقت مدير التخطيط والبحث عن المستندات ومعالجة المعلومات السرية). مع زيادة دقة الاعتراف وعمق الفهم وجودة تركيب الكلام ، سيتم دمج واجهات الصوت في جميع الأجهزة تقريبًا: أنظمة الحوار في المنزل الذكي ، والسيارة ، والأجهزة المنزلية ، والرموز الرمزية ، والروبوتات المساعدة.
النمو الهائل للروبوتات الصوتية
نحن في انتظار النمو الهائل في عدد المساعدين الأذكياء في مختلف قطاعات الأعمال ، بما في ذلك الخدمات التجارية للبنوك وتجار التجزئة والاتصالات وغيرها من الشركات التي تتفاعل بنشاط مع العملاء. سيتم إجراء جميع الاتصالات الكلامية مع جمهور كبير في الخدمات الأكثر شعبية بواسطة الروبوتات. سيتعلم الروبوت التعرف على المشاعر بحساسية ، بما في ذلك استخدام التقييم المتعدد الوسائط للعواطف وسيستخدم أنفسهم المكون العاطفي في المحادثة.
البحث عن معلومات اللغة الطبيعية
هناك طلب متزايد على البحث الذكي مع القدرة على تقديم استفسارات بلغة طبيعية. تريد المزيد والمزيد من المؤسسات العثور بسرعة على بيانات غير منظمة في جميع المصادر الداخلية ، وتحديد محتواها تلقائيًا وإبراز الحقائق المهمة في النصوص القانونية أو المالية المتخصصة. بسبب تطوير نماذج عميقة لاستخراج الحقائق من النصوص واستخلاص محتوياتها ، ستتحسن جودة استرجاع المعلومات بشكل كبير.
في المنزل
على الأرجح ، ستقوم الشركات الكبيرة - البنوك ، الاتصالات ، الصناعة - بتطوير وزيادة خبراتها في مجال الذكاء الاصطناعى ، بما في ذلك المحادثة مع فريق اللغويين ، وعلماء البيانات ، ومهندسي البرمجة اللغوية العصبية ، وما إلى ذلك. أمثلة على الاستعانة بمصادر خارجية المهام الفردية في المستقبل القريب ستبقى صغيرة. نحن نشهد نمواً سريعاً في فرق منظمة العفو الدولية للعديد من الشركات الكبيرة. جيد أو سيئ هو موضوع لمقال منفصل ، ولكن هذا اتجاه واضح.
اتجاهات الصناعة
المالية والتأمين
في المدى القصير ، ستركز البنوك على زيادة فوائد البيانات التي تراكمتها بالفعل البنوك التي تستخدم الذكاء الاصطناعى بشكل عام و NLP بشكل خاص. على المدى الطويل ، هناك اتجاه ثابت نحو توحيد وتبسيط العمليات المصرفية التي يمكن القيام بها دون أو مع الحد الأدنى من المشاركة (فتح حساب ، وتقييم المخاطر ، وخلق ملف الائتمان ، وسجل ، وما إلى ذلك). سيتم دمج البرمجة اللغوية العصبية مع التقنيات الأخرى (رؤية الكمبيوتر ، RPA ، التعرف عن بُعد ، إلخ).
الصناعة والخدمات اللوجستية
بفضل تقنيات البرمجة اللغوية العصبية (NLP) ، يمكن للمرء أن يتوقع جيلًا جديدًا من مصممي وثائق المشروع ، وكذلك ظهور أنظمة تقيّم تناسق المستندات التي تصف الأشياء التقنية المعقدة. علاوة على ذلك ، من الممكن التنبؤ بظهور أنظمة تخطيط التحكم الآلي استنادًا إلى تحليل وثائق المشروع ومعاييره باستخدام البرمجة اللغوية العصبية.
مع ظهور أنظمة لفهم معنى النصوص ، من المتوقع أن يكون الحل النهائي لمشكلة تطبيع التسميات في الأفق من 5 إلى 10 سنوات.
دواء
سيؤدي الإدخال الواسع للواجهات الصوتية إلى تحرير الطبيب بشكل كبير من إدخالات النص وإنشاء سجلات طبية يتم ترميزها تلقائيًا. إن ظهور مجموعة كبيرة من النصوص سيجعل من الممكن ظهور SPPVR (أنظمة دعم القرارات الطبية) لفئة جديدة تعتمد على تقنيات البرمجة اللغوية العصبية.
تكنولوجيا المعلومات والاتصالات
من المتوقع أن يوفر الاستخدام الواسع النطاق لتقنيات القياسات الحيوية الصوتية (المصادقة والترخيص للشخص عن طريق الصوت) خدمات تستند إلى بيانات مخصصة. ستتاح لمشغلي الاتصالات الفرصة لاتخاذ موقف فريد في النظام البيئي للخدمات الرقمية ، مع وجود قناة صوتية للاتصال مع العميل. من ناحية أخرى ، يعتمد المرسلون الصوتيون على التقنيات الأساسية نفسها للتعرف على الكلام وتوليفه. نحن ننتظر وقتًا ممتعًا من معارك عمالقة صناعة الاتصالات مع مراسلة فورية عبر القناة الصوتية مع العميل.
الممارسة القانونية
في الأفق من 3-5 سنوات ، يمكننا أن نتوقع اعتمادًا واسعًا لتقنيات التحقق التلقائي للعقود ، وعلى نطاق أوسع ، أتمتة العمل التعاقدي ، بما في ذلك التحقق من الوفاء بالالتزامات ، إلخ.
في السنوات 5-10 القادمة ، يمكننا أن نتوقع ظهور نماذج لفهم النصوص القانونية. بناءً عليها ، نتوقع ظهور أنظمة تُصدر سؤال المستخدم بلغة طبيعية ، وهي إجابة تمثل ملخصًا موجزًا للمستندات القانونية الحالية ، بما في ذلك التناقضات والإصدارات المختلفة.
سيتوقف جهاز الكمبيوتر الخاص بالمحامي عن أن يصبح مرجعًا وسيصبح أداة دعم قرار كاملة. تتمثل إحدى المهام الرئيسية لجهاز كمبيوتر المحامي في التنبؤ بنتيجة الدعوى من خلال إنشاء شجرة قرارات احتمالية استنادًا إلى الممارسة الحالية. من المحتمل أن يحدث معظم هذا العمل في السحابة على نماذج مدربة ذات حجم هائل.
الظهور الهائل لخدمات النقطة والمنتجات والشركات التي تحل مشكلة معينة في الطائرة القانونية.
يمكننا توقع تكامل أعمق لحلول RPA مع تقنيات البرمجة اللغوية العصبية ، مما سيؤدي إلى نقل المهام الروتينية لمعالجة المعلومات وإدخال البيانات إلى برامج الروبوت.
وأخيرًا ، فإن احتمال إبرام عقود ذكية على blockchain ، الذي يتم إنشاؤه تلقائيًا على أساس تحليل المستندات الملزمة قانونًا ، مثل العقود أو NDAs ، يبدو رائعًا للغاية. يمكن لمثل هذا المزيج من التقنيات أن يبعث في الحياة وثائق قانونية ذاتية التنفيذ ، والتي في حد ذاتها تبدو مثل الخيال العلمي ، ولكنها ليست بعيدة عن التنفيذ.
وسائل الإعلام والإعلان
نحن في انتظار إدخال التسويق الشخصي على نطاق واسع استنادًا إلى التحليل الإلكتروني للبصمة الرقمية للشخص. سيتضمن تحليلًا عميقًا للنصوص البشرية ولونتها: التقييم السلبي والإيجابي للنص ليس بشكل عام ، بل يتعلق بمنتج معين أو علامة تجارية معينة.
سيحصل كل شخص على مساعد تسوق شخصي يستهلك ما يصل إلى 90٪ من عمليات الشراء الروتينية.
ستكون هناك خدمات لتوليد الأخبار تلقائيًا لشركة معينة ، استنادًا إلى تاريخها والأحداث الداخلية والخارجية.
العلم والتعليم
في السنوات 5-10 القادمة ، يمكننا أن نتوقع ظهور نماذج لفهم النصوص العلمية. نتوقع ظهور أنظمة توفر إجابة على سؤال المستخدم الذي تم طرحه بلغة طبيعية ، والذي يعد ملخصًا موجزًا للمؤلفات العلمية الحالية حول هذه المشكلة ، بما في ذلك التناقضات الموجودة والإصدارات المختلفة. تطبيق آخر لهذه النماذج هو أنظمة التوصية للبحث أو تحليل براءات الاختراع.
ستؤدي هذه الأنظمة إلى تغيير المشهد التكنولوجي بشكل جذري وتسريع نقل التقنيات ، من خلال تحليل وتحديد الخبراء ومجتمعات الخبراء في مجال معين بناءً على تحليل لمصادر المعلومات العلمية وبراءات الاختراع.
في الأفق الممتد من 5 إلى 10 سنوات ، نتوقع ظهور مساعدين معلمين كاملين لكل تخصص ، وبشكل عام للمؤسسات التعليمية. من ناحية أخرى ، سوف يظهر المساعدون الشخصيون للطالب الذي سيقود الشخص على طول المسار الشخصي للتعليم طوال الحياة. من المرجح أن يكون تفاعل هذه العوامل الذكية بلغة طبيعية.
الدولة والأمن
تنقل الدول أنشطتها على نحو متزايد إلى الفضاء وشبكات التواصل الاجتماعي. لقد اتخذ مفهوم "حروب المعلومات" ، الذي ظهر في السنوات الأخيرة ، أشكالًا ملموسة تمامًا ويتطلب أنواعًا جديدة من "الأسلحة" و "الحماية". يتم بالفعل ملاحظة وجود اتجاه قوي وسوف يزداد الطلب على اكتشاف الأخبار المزيفة فقط. لسوء الحظ ، يمكن للمرء أن يتوقع بثقة نمو الطلب على الجيل الآلي لأنواع مختلفة من الأخبار المزيفة. سيتم تطوير استخدام الذكاء الاصطناعي لإنشاء برامج الروبوت في الشبكات الاجتماعية وللتعرف عليها.
لا تقل أهمية عن الذكاء. سيتم استخدام الذكاء الاصطناعى بشكل متزايد لتحليل كميات كبيرة من المعلومات حول الشركات والأفراد والمعاملات بأشكال مختلفة لحل المشكلات المطبقة مثل البحث عن الانتماءات والعلاقات الضمنية بين الشركات والأفراد.
مع زيادة عدد الأشخاص ، تصبح مهمة أتمتة التواصل مع المواطن من أجل تزويده بخدمات معينة أكثر إلحاحًا بالنسبة للدولة. سيتم استخدام الذكاء الاصطناعى ، ربما في شكل عملاء أذكياء ، بنشاط لتخصيص وتخصيص خدمات الدولة والبلدية لكل مواطن - ما يسمى "المدن المعرفية" و "الدولة كخدمة".
يمكن تنزيل "تقويم الذكاء الاصطناعي" الكامل على البرمجة اللغوية العصبية والتعرف على الكلام / التوليف من هنا.