ضد الجميع: المساعدين الصوتيين داخل التطبيق


هل تستخدم مساعدين صوتيين كل يوم؟ انا لا . على الرغم من أنني أطورها منذ أكثر من 7 سنوات!
بهذه الكلمات ، تم افتتاح جلسة تطوير مؤتمرنا حول تقنيات المحادثة في موسكو .

وما الخطأ ، في الواقع ، في كل هذه "أليس" و "ماروسيا" و "مساعدي Google"؟ لماذا لا يشعر المستخدمون بالارتياح تجاههم ، لكنهم غير مفهومين للعمل؟ وما هو المصدر المفتوح البديل لكل هذا؟



مشاكل المساعدين صوت المحمول


تعمل جميع المساعدين الصوتيين المتنقلين اليوم وفقًا لمبدأ "الحصاد" - حيث يتم إخفاء مئات الآلاف من الوظائف تحت زر ميكروفون واحد. يبدو - وهو أكثر ملاءمة؟ لا تحتاج إلى الاحتفاظ بعشرات أو اثنين من رموز تطبيقات الجهات الخارجية في متناول اليد. فقط انقر على الميكروفون ، وقال - وهذا لا يعمل.

ولكن فيما يلي المشكلات التي ستواجهها كمستخدم وكمطور لوظيفة صوتية مثل "المساعدين".



1. اسم فريد


يجب أن يكون لكل "مهارة" صوت (Alice - "skill") اسم فريد . في الواقع ، وإلا فإن "الحاصدة" بضغطة واحدة لا يمكنها التمييز بينها! وكلما زاد عدد وظائف المساعد الصوتي ، زاد صعوبة اختيار هذا الاسم بحيث يتذكره المستخدمون.

2. اكتشاف متطور


"أليس ، أطلق مهارة متجري المفضل." أو "حسنًا Google ، تحدث إلى Pizza Papa Johns." هل هذا مألوف؟ لا يزال يتعين على المستخدم تعليم كيفية تشغيل الخدمة الصوتية.

3. قيود UI ، UX و API


مساعد الصوت هو تطبيق تابع لجهة خارجية مع حدوده. أنت ، كمطور ، لا يمكنك إضافة عناصر التحكم والأدوات الذكية التي تحتاجها إلى واجهته. نتيجة لذلك ، عليك ببساطة أن تتعامل مع ما لديك ، على الرغم من أن وظيفتك يمكن أن تكون أوسع بكثير!

وأكثر من ذلك بكثير


بالإضافة إلى ذلك ، هناك قيود مفروضة بواسطة تقنيات التعرف على الكلام وتوليف الكلام ، من الصعب تخويل مستخدم في خدمتك وأكثر من ذلك بكثير .

نتيجة لذلك ، لا يتمكن المستخدم في كثير من الأحيان من العثور على الخدمة الصوتية الخاصة بك ، ولا يعرف كيفية التحدث إليه ، ويواجه وظائف محدودة. وأنت ، كمطور ، لا تفهم كيفية نقل المستخدم إلى قناة جديدة تعد بجمهور مليون شخص .

مساعد مفهوم في التطبيق


على الأرجح أن عملك يحتوي بالفعل على تطبيق للجوال مزود بوظيفة واضحة وأدوات التطوير والترويج والتحليل.



أنت تفهم من أين هو المستخدم ومن هو. ما هي الوظائف التي يستخدمها ، وكيفية تحسينها ، وتطويرها ، وكيف تؤثر على الأعمال. وراء كل هذا ، هناك فريق تطوير الأجهزة المحمولة والمصممين والمتخصصين في UX وقسم ضمان الجودة والمنتجات.

ويفهم المستخدم الوظيفة التي يمتلكها تطبيقك.
عندما أحتاج إلى تحويل الأموال إلى شخص ما ، أقوم بتشغيل تطبيق البنك الخاص بي ، حيث يتم ربط حساباتي. عندما تحتاج إلى طلب منتجات - أبدأ تشغيل تطبيق المتجر ، الذي أشتري فيه السلع عادةً.

يتصرف المستخدم دائمًا وفقًا للموقف ويقوم بتشغيل تطبيق الهاتف المحمول الذي سيلبي بدقة حاجته هنا والآن. لا يوجد أي سبب للاعتقاد بأن المستخدم سيضغط بالتأكيد على زر الميكروفون على أمل أن يكون المساعد الصوتي لديه الوظيفة التي يحتاجها وسوف يفي بطلبه!

لذلك ظهر مفهوم المساعد داخل التطبيق - مفهوم المساعد الصوتي الذي يعمل بالفعل داخل تطبيق هاتفك المحمول كواجهة مستخدم إضافية . في هذه الحالة ، تتم تسوية جميع قيود الحصادات المساعدة ، ويفهم المستخدم وظائف المساعد استنادًا إلى سياق تطبيق الهاتف المحمول.

الحالات مساعد في التطبيق


وظيفة الصوت هي تماما الظرفية مثل إطلاق تطبيق الهاتف المحمول. قد يكون من المناسب للمستخدم بدء بعض الوظائف عن طريق الصوت ، إذا

  • هذا مستخدم جديد ، ولم يكتشف بعد بنية واجهة المستخدم الخاصة بالتطبيق الخاص بك.
  • لا يتذكر المستخدم مكان إخفاء القائمة أو الزر المرغوب
  • إذا كان يحتاج فقط إلى تكرار الإجراء السابق
  • إذا كان يمكنك قول كلمتين بدلاً من 5 أشرطة ومخطوطات
  • عندما يكون تفسير المشكلة أسهل من البحث عن حل داخل التطبيق

انظر إلى بضع حالات بسيطة.


على سبيل المثال ، في التطبيق المصرفي ، يمكنك تحويل الأموال إلى أشخاص من قائمة الاتصال الخاصة بك. يمكن لمساعد التطبيق فهم من يعني المستخدم عندما يقول "نقل 500 روبل إلى أمي". ولا يحتاج المستخدم للبحث عن الزر المطلوب ، والبحث عن جهة الاتصال وإدخال المبلغ.


في تطبيق تاجر التجزئة ، يمكن للمستخدم الاتصال بمساعد لوصف المشكلة ببساطة ، وسوف يقدم المساعد المنتج المناسب.



من المهم أن نفهم هنا أن واجهة الصوت هذه مكملة فقط لواجهة مستخدم حالية. كما ذكرنا سابقًا ، ستظهر القيمة فقط عندما يكون المساعد بمثابة "نظام تنقل" أو نظام توصية.

ونظرًا لأن هذا هو المساعد الخاص بك داخل التطبيق الخاص بك ، فإنه لا يقتصر على كل ما ذكرناه أعلاه في هذه المقالة: لا تحتاج إلى التوصل إلى اسم فريد ، يمكن أن تكون واجهة المستخدم هي أي شيء ، ويمكن للمساعد التفاعل مع وظائف التطبيق مباشرةً وهكذا.

كيفية إضافة صوت إلى التطبيق الخاص بك




نعم ، سيتعين على مطوري الأجهزة المحمولة التعامل مع مجموعة متنوعة من التقنيات على الفور لدمج الواجهة الصوتية. وهذا على الرغم من حقيقة أنه نوع من الإضافة اللطيفة ، وليس الوظيفة الرئيسية ... وهي: الاتصال بنظام التعرف على الكلام ، وتوليف الكلام ، إلى محرك معالجة اللغة ، وتقديم واجهة مستخدم مساعد الصوت الخاص بك ، وتنفيذ الهيكل وتغطية الاختبارات.

ولكن هناك حل مفتوح المصدر يساعد في جعل كل هذا أسرع وأكثر كفاءة!

Aimybox


لقد كتبنا مؤخرًا بعض الشيء عن مساعد الصوت مفتوح المصدر Aimybox ، والذي تم تصميمه خصيصًا لتسهيل تنفيذ وظائف الصوت في تطبيق جوال موجود. هنا سنتحدث عنه من حيث مفهوم المساعدين داخل التطبيق.



الآن لن تفاجئ أي شخص بوجود زر دردشة على الإنترنت على الموقع ، مما يجعل من الممكن الاتصال بسرعة بالمشغل وطرح الأسئلة حول السلع والخدمات. هذه ميزة إضافية ، ومع ذلك ، تزيد التحويلات عند استخدامها بشكل صحيح. علاوة على ذلك ، لبدء الدردشة عبر الإنترنت على موقعك ، كقاعدة عامة ، تحتاج فقط إلى إضافة علامة نصية واحدة إلى رمز HTML الخاص بك.

يسير Aimybox على نفس المنوال ، ولكن فيما يتعلق بالمساعد الصوتي. كل ما عليك القيام به هو إضافة اثنين من التبعيات لمشروع تطبيق المحمول الخاص بك وبضعة أسطر من التعليمات البرمجية بحيث يظهر زر الميكروفون في الزاوية اليمنى السفلى.

هنا يمكنك أن ترى كيف يتم ذلك.



من خارج الصندوق ، يقدم Aimybox واجهة مستخدم موجزة وقابلة للتخصيص (والتي ، إذا رغبت في ذلك ، يمكن تغييرها بالكامل) ومساعد SDK نفسه. علاوة على ذلك ، كمحركات التعرف والتوليف و NLP ، يمكنك الاختيار من بين تلك الموجودة أو إنشاء الوحدة النمطية الخاصة بك.

في الجوهر ، تطبق Aimybox بنية مساعد الصوت ، وتوحيد واجهات جميع هذه الوحدات ، وتنظيم تفاعلها بشكل صحيح. وبالتالي ، بتقديم هذا الحل ، يمكنك تقليل الوقت اللازم لتطوير واجهة صوتية داخل التطبيق الخاص بك بشكل كبير.



في النهاية


المساعدين الصوتيين ، بالطبع ، رائعون. ولكن الشعور هو أن المسار الذي يسلكونه الآن يؤدي فقط المستخدم والعمل بعيدا عن التكنولوجيا المريحة. وغالبًا ما يرجع هذا أيضًا إلى حقيقة أن المطورين لا يعرفون بعد كيفية إنشاء صوت UX عالي الجودة. لقد كتبنا مؤخرًا عن كيفية إصلاح هذا.

في هذه المقالة ، حاولنا التحدث بإيجاز عن المفهوم الجديد تمامًا للمساعدين داخل التطبيق - أي عن المساعدين الصوتيين كدالة داخلية لتطبيق الهاتف المحمول. في هذه الحالة ، تصبح قيمة الصوت باعتباره واجهة مستخدم إضافية واضحة لكل من المستخدم والمطور.

روابط مفيدة


Source: https://habr.com/ru/post/ar479554/


All Articles