يتحدث كل من حولنا عن مساعدين صوتيين ، أليس ، مساعد Google ، وهم يعرفون كيف وماذا لا يعرفون ... وقد اتخذنا وكتبنا
إطارًا لإنشاء مساعدين صوتيين للجوال. نعم ، وفتح المصدر! حتى الآن قمنا بهذا فقط لنظام
Android ، والآن نحن نبحث عن مطور iOS رائع يمكنه بسهولة تحويل كود Kotlin إلى Swift.
تحت القصاصة ، نوضح سبب قيامنا بذلك على الإطلاق ، وما الذي فعلناه ومن الذي نبحث عنه بالضبط في فريق Aimybox.

لقد حدث ذلك
أننا في
Just AI نقوم بعمل روبوتات ناطقة ومساعدين صوتيين وجميع أنواع برامج الدردشة لفترة طويلة. تحت غطاء محرك السيارة ، لدينا تقنيات البرمجة اللغوية العصبية الخاصة بنا (معالجة اللغة الطبيعية) ومنصة كاملة ،
ومصممون بصريون وكل شيء للجميع.
وفي الوقت نفسه ، سوق لأجهزة الحديث
والتطبيقات
تنمو وتتفتح ! ليس فقط Amazon و Google و Yandex - عشرات الشركات ، من الصغيرة إلى الكبيرة ، تسعى جاهدة لإنشاء وإطلاق مساعد الصوت أو الجهاز.
"لماذا؟ من يحتاجها؟
- صرخ المستخدمين. وقيل لهم -
"مساعد الصوت رائع! قريبا الجميع سوف نتحدث معهم فقط! " . لا ، إنها بالطبع مريحة. إذا كان المساعد ذكيًا ، فهم كل شيء ويعمل بسرعة وبسرعة. ولكن إذا نظرت إلى هذا الأمر من منظور آخر ، فسنرى ذلك ...
يحتاج العمل إلى ميزة صوتية واحدة
حسنا ، أو زوجين. ولكن الأهم من ذلك ،
تحتاج إلى إضافة مساعد صوت بسرعة وسهولة إلى تطبيق جوال موجود . وبعد ذلك يمكنك تخصيص ما تريد.
كيف يبدو في الممارسة العملية. يوجد تطبيق للهاتف المحمول ، به الكثير من الأزرار وكل أنواع عناصر واجهة المستخدم الأخرى. على سبيل المثال ، بنك المحمول. ماذا يريد البنك؟ لكي يظهر زر الميكروفون في التطبيق ، يقوم المستخدم بالنقر فوقه ويقول:
"تحويل الأموال إلى أمي" . بدلا من ثلاثة tapas على الشاشة - واحد. علاوة على ذلك ، يمكن للتطبيق ببساطة فتح إحدى شاشاته مع ملء حقل المستلم بالفعل.
أو هنا:
"أين يعطون الدولارات؟" . ويفتح التطبيق بطاقة مع أجهزة الصراف الآلي لبنكنا ، والتي يمكن أن تصدر هذا العمل داخل دائرة نصف قطرها كيلومتر واحد من المستخدم.
ما هو الصعب جدا؟
يبدو أنه أضاف ببساطة زرًا للتطبيق ، مرتبطًا بنوع من التعرف على الكلام ، ومُزج الكلام ، ومحرك البرمجة اللغوية العصبية NLP هناك ، وقام بإنشاء واجهة المستخدم الرسومية الجميلة مع التمرير ، مما يدل على عملية التعرف على الكلام (ليس أسوأ من جوجل) ، تزامن كل شيء ، اختبرها. البق اشتعلت. أدركت أن كل شيء ليس بهذه البساطة ...

لذلك فكرنا
يمكننا إنشاء إطار يخفي كل هذا التعقيد تحت غطاء محرك السيارة (مغطى بالاختبارات) ويسمح للمطور بإضافة مساعد صوتي بسرعة مع الوظائف الضرورية إلى تطبيقه المحمول الذي يعمل بالفعل. لقد أكلنا جميع الكلاب منذ فترة طويلة في طريقنا لإنشاء تطبيقات صوتية ونعرف مآزقها.
ماذا حدث
Aimybox ! قم بفتح وحر ،
SDK مخصص
ومساعد صوت جاهز ، والتي يمكنك إضافتها إلى تطبيق المحمول الخاص بك ، مثل الدردشة عبر الإنترنت على الموقع. في ذلك ، نحن تجسد كل خبرتنا في خلق حلول الكلام. ولكن في الوقت نفسه ، لا نربط المساعد بأي محركات محددة للاعتراف والتوليف و NLP. حسنًا ، بحيث يمكنك استخدام أي محركات في مساعدك بشكل مستقل عن بعضها البعض ، ويقوم Aimybox بمزامنة عملهم بشكل صحيح. لديه أيضا واجهة مستخدم جميلة!
إليك ما تحدثنا عنه حول Aimybox في مؤتمر محادثات AI للمحادثات:
المصدر المفتوح يدفع حقا ،
لأنه يجب أن يتمتع مطورو الطرف الثالث (نفس البنوك) بالسيطرة الكاملة على ما يقومون بتضمينه في تطبيقاتهم. إنها لا تزال واجهة صوتية ، ولا تعرف أبدًا ما الذي تفعله من الداخل ...
وهناك في الداخل
هناك
وحدات جاهزة من مختلف التعرف على الكلام ومحركات توليف ، البرمجة اللغوية العصبية والتنشيط الصوتي. هناك
مساعد واجهة المستخدم الرسومية للتخصيص الجاهزة . هناك
وثائق ومثال على كيفية تطبيقه في تطبيقك بسهولة وبساطة. ولكن كل هذا للأندرويد فقط!
لذلك ، نحن نبحث عن سادة دائرة الرقابة الداخلية ،
الذي يتوق لعدم الانضمام إلى المشروع مجانا وميناء Kotlin إلى سويفت. وأنا مستعد لإنشاء أول مساعد صوتي مفتوح في العالم لنظام التشغيل iOS ، والذي ليس من العار نشره على جيثب للإدانة العامة للمجتمع.
ماذا لو كنت الشخص الذي يستطيع قراءة Kotlin الجميلة والكتابة سويفت لا تقل جمالا؟ الكتابة إلى
che@just-ai.com . أنت في انتظار فريق Just AI ، عالم المساعدين الصوتيين ، التعرف على الكلام والتوليف ، البرمجة اللغوية العصبية وسبب كبير لإضافة مشروع رائع آخر إلى محفظتك!
