أطلقنا في الربيع منصة
Dialogs التي تتيح لك إنشاء مهارات لـ Alice والتعرف على الطلبات الصوتية من المستخدمين. في البداية ، كان على مطوري المهارات تحليل الاستعلامات بأنفسهم. على سبيل المثال ، ابحث عن العنوان في النص. الآن تتولى المنصة هذا الجزء من العمل.
اليوم سنخبر قراء هبر عن التعرف على الكيانات المسماة (التعرف على الكيان المسمى ؛ NER) والفرص الجديدة لمطوري المهارات.

نحن نعتقد أن المستقبل هو واجهات الصوت. بالفعل في كثير من الحالات ، يفضل المستخدمون استخدام الصوت بدلاً من لوحة المفاتيح على الشاشة. على سبيل المثال ، عند قيادة السيارة. أو للعثور على إجابات سريعة للأسئلة البسيطة. أو اللعب في "المدينة" مستلقية على الأريكة. ولكن لكي تصبح مثل هذه السيناريوهات أكثر فأكثر ، فإن التعرف على الصوت في النص ليس كافيًا.
واجهات الصوت مماثلة لاستعلامات محرك البحث. نحن لا نفهم دائمًا كيفية صياغة طلبنا بالضبط من أجل العثور على ما نحتاج إليه بالضبط. في فجر تشكيل الإنترنت ، كانت هذه مشكلة كبيرة ، لأن محركات البحث لم تبحث إلا عن التكرار الدقيق للكلمات من الاستعلام. حتى بالصوت. إذا لم نكن نعرف الفريق المتوقع منا ، فسنخمن لفترة طويلة.
يجب ألا تقود الواجهة الصوتية الجيدة الشخص إلى طريق مسدود. بشكل نموذجي ، يقوم مطورو المهارات بحل هذه الحيلتين. بادئ ذي بدء ، تتم مطالبة الإجابات المتوقعة باستخدام الأزرار الموجودة على الشاشة. هذه ممارسة جيدة نوصي بعدم تجاهلها.
أيضًا ، يحاول مبدعو المهارات تقسيم الأسئلة المعقدة إلى سلسلة من الأسئلة الأبسط ، والتي يسهل التنبؤ بإجاباتها. علاوة على ذلك ، في بعض الحالات ، يُطلب من المستخدمين نطق الكلمات بدقة في شكل وحالة معينة. المشكلة في هذا النهج هي أنه لم يعد من الممكن أن يطلق عليه الاتصال الطبيعي. كلما زاد عدد الاصطلاحات والقيود ، اختلف التحكم الصوتي عن استخدام لوحة المفاتيح والأزرار. من الناحية المثالية ، يجب على المستخدم التواصل مع الخدمة بحرية كما هو الحال مع الشخص.
من الجيد أن يقول المستخدم "شكرًا لك! تسليم الطلب إلى Leo Tolstoy 16 وتسليمه إلى Sergey Sergeyev ، بدلاً من تقسيمه إلى سلسلة من الأسئلة حول الشارع ورقم المنزل والاسم واللقب. ولكن هذا سيتطلب من المطور إجراء مزيد من التحليل للإجابات المستلمة. يمكنك القيام بذلك يدويًا من قبل المشغل ، ولكن مع تدفق كبير من المشغلين ، ستكون هناك حاجة إلى الكثير. ومن غير المحتمل أن يقوم المشغلون بذلك في الوقت الفعلي ، لذلك ستفقد المهارة الفرصة لتوضيح المعلومات المفقودة على الفور. يمكنك تطوير تقنية ستعثر تلقائيًا على معلومات مهمة في النص وتصنيفها وتطبيعها وحفظها. لكن هذه مهمة شاقة إلى حد ما.
من أجل استخراج الكيانات المفيدة بكفاءة من النص وتصنيفها بشكل صحيح حسب النوع ، يجب أن يكون لدى الخدمة خبرة في اتجاهين مهمين. بادئ ذي بدء ، تحتاج إلى أن تكون قادرًا على جمع المعرفة حول الأشياء. إذا لم يكن لديك شارع Leo Tolstoy Street في "القاموس" ، فعند معالجة الطلب ، من السهل الخلط بينه وبين اسم الشخص وتخطيه. من ناحية أخرى ، من المهم بنفس القدر أن تكون قادرًا على العثور على هذه الكائنات في النص الخام من المستخدم. كحد أدنى ، ضع في الاعتبار مورفولوجية اللغة الروسية بحيث يتم العثور على كلمة "سيرجي" وتتحول إلى اسم "سيرجي".
حدث أن Yandex لديها الكثير من الخبرة في هذه المجالات. يتم استخدام تقنيات البحث للبحث عن كائنات جديدة ولتحليل استعلامات المستخدم. الآن هذه التقنيات متاحة أيضًا لمطوري المهارات لـ Alice.
التعرف على الكيانات المسماة في Dialogs
بعد أن ينطق المستخدم بأمر ، يتعرف نظامنا الأساسي على نصه ويستخرج الكلمات والعبارات التي تصف كائنات محددة. تعترف الحوارات حاليًا بما يلي:
- الأسماء ؛
- مؤشرات الموقع ؛
- التواريخ والوقت ؛
- الأعداد الصحيحة والكسرية.
يتم إرسال المعلومات حول الأشياء التي تم التعرف عليها إلى خادم المهارات مع نص رد المستخدم. فكر في مثال:
"اطلب بيتزا على Leo Tolstoy 16 لـ Sergey Sergeyev الساعة 10 مساءً"
يعرف برنامجنا أن Leo Tolstoy ليس مجرد شخص ، ولكن أيضًا شارع. كما تأخذ في الاعتبار أنه في العناوين المجاورة لأسماء الشوارع تشير غالبًا إلى أرقام المنازل. لذلك ، سيحتوي طلب المهارة على الكتلة التالية:
{ "type": "YANDEX.GEO", "value": { "house_number": "16", "street": " " } }
يمكن أن تشمل المواقع ليس فقط الشارع والمنزل ، ولكن أيضًا المدينة أو البلد أو حتى المطار.
مع الأسماء يعمل بنفس الطريقة. يمكن للمنصة العثور على الاسم واللقب والاسم الأوسط وإحضارهم إلى الحالة الاسمية.
{ "type": "YANDEX.FIO", "value": { "first_name": "", "last_name": "" } }
يعد تطبيع البيانات ميزة مهمة للتعرف على الكيانات المسماة. إذا كانت هذه الخاصية غير واضحة للعناوين والأسماء ، فعندئذٍ مع التواريخ والأوقات يكون كل شيء أكثر وضوحًا. "10 مساءً" تتحول تلقائيًا إلى "22". غدا وغدا بعد غد تواريخ زيادة صريحة.
{ "type": "YANDEX.DATETIME", "value": { "hour_is_relative": false, "hour": 22 } }
لا ينبغي التقليل من التعرف على الأرقام. على سبيل المثال ، ستتحول عبارة "أربعة أعشار خمسة أعشار" في نص من المستخدم إلى:
{ "type": "YANDEX.NUMBER", "value": 4.5 }
مهتم؟ ندعوك إلى
الوثائق . إذا بقيت الأسئلة ، فمرحباً بك في
محادثتنا في
Telegram . من السهل متابعة أخبار المنصة الأخرى على
المدونة .