
ماذا لدينا لفترة معينة من الزمن في عالم
GA ؟ حقيقة معروفة: لكل شركة من شركات تكنولوجيا المعلومات الكبيرة أداة خاصة بها للعمل مع المنازل الذكية. ويوفر كل بائع واجهة برمجة التطبيقات الخاصة به للمهتمين بالتكامل. وفي المرحلة الأولية ، يدفع أيضًا للمطورين مهارات جديدة (الإجراءات ، والمهارات ، وما إلى ذلك - وفقًا لمصطلحات البائع).
الخدمة الأكثر ملاءمة وعملية حتى الآن ، وفقًا لخبرائنا ، هي Amazon Amazon. لديها المزيد من الفرص لتشكيل مهارات مفصلة من مساعد جوجل ، ياندكس "أليس" ، Mail.Ru "Maroussia" ، تينكوف "أوليغ" وغيرها. بالنسبة إلى Alexa ، يعد الجهاز كيانًا افتراضيًا حدوديًا ، ونتيجة لذلك يمكن تخصيص المهارات لكل جهاز على حدة. على سبيل المثال ، بالإضافة إلى درجة حرارة الماء ، يمكنك تحديد المواد الاستهلاكية التي سيقدمها المساعد للشراء من Amazon. لكن ، لسوء الحظ ، لا تدعم Alexa اللغة الروسية حاليًا ولا تعمل على أراضي الاتحاد الروسي ، لذلك فإن هذه الجمعية العامة غير مجدية للمستخدم الروسي. في Google و Yandex ، يكون المساعد أكثر "طبيعية" - يتلقى ويستجيب للأوامر باللغة "البشرية" ، ويمكن إجراء حوار مع المستخدم ، مما يجعل هذا GA أكثر متعة للاستخدام. العيب الخطير الوحيد في جوجل هو أن أفعاله لم تدعم اللغة الروسية. ومع ذلك ، فمن 24 يوليو 2019 ، كانت Google Actions تعمل في "هواتف" باللغة الروسية ، لذا فقد تخلص الزملاء من هذا العيب.
هذا كل الحق. وإذا كنا نريد دمج جهاز واحد مع عدة GA؟
إنه ممكن. باستخدام الجهاز.
الجهاز عبارة عن كيان له سلوكه في النظام. هذا هو مبدأ مشترك لجميع البائعين. وهنا يستحق التوقف ، هنا تبدأ كل المتعة. الاختلافات في النهج. على سبيل المثال ، تحاول Google و Yandex توحيد إدارة التكنولوجيا. أي أنه من الضروري الآن كتابة التعليمات البرمجية ليس لكل جهاز على حدة ، ولكن برنامج واحد لسلسلة كاملة يكفي. وحتى إذا تغيرت البرامج الثابتة ، فسيتعين عليك تغيير الرمز مرة واحدة ، وهو أمر مريح للغاية. شركتنا لديها بالفعل التكامل مع جوجل ، ياندكس ، الأمازون. تقنية
تستمع إلى أليس ، أليكس ، ومساعد جوجل. في وقت سابق أظهرنا
أن داخل المساعدين الصوتيين .
من أين أتى المساعدون الصوتيون؟
يعد Google أحد أكثر أنظمة التعرف على الكلام تقدمًا في العالم ، وقد بدأ تاريخه في عام 2002. أصدرت الشركة البحث الصوتي ، والذي تم على أساسه تطوير مساعد Google. في عام 2016 ، تم تقديمه في عرض Google I / O. يعد Google Home أحد "السطح" لمساعد Google. الآن تقدر دقة التعرف على الكلام في الجمعية العامة بنسبة 95 ٪ وأقل من الناس تقريبا.
تم تقديم مساعد صوت Alexa بواسطة Amazon في عام 2014. كما تم تقديم العمود الذكي Amazon Echo ، والذي يمكنه التحكم في عدد كبير من الأجهزة داخل المنزل الذكي.
Yandex SpeechKit - نظام التعرف على الكلام ياندكس. يتم استخدامه في 400+ التطبيقات. تقوم الشركة أيضًا بتضمين GA - Alice في المتصفحات والأجهزة الإلكترونية. أدخلت الشركة الروسية GA في عام 2017 ، وبالفعل في خريف عام 2018 ، أطلقت Yandex عمودها الذكي Yandex.Station.
يقول خبراؤنا أنه بحلول السنة السادسة والخمسين ...
نحن نمزح ، حتى الآن فقط بحلول عام 2020. قليلا عن الإحصاءات:
- في عام 2017 ، تم تسجيل ما يقرب من 33 مليون جهاز تحكم صوتي في جميع أنحاء العالم ؛
- وصف الخبراء الغربيون البحث الصوتي بأنه أحد أفضل ثلاثة اتجاهات لكبار المسئولين الاقتصاديين في عام 2017 ؛
- لعام 2018 ، يعمل مساعد Google على 400 مليون جهاز في جميع أنحاء العالم. وهذا الرقم ينمو فقط.
- وفقًا لمؤشر الويب العالمي ، يستخدم 25٪ من الأشخاص الذين تتراوح أعمارهم بين 16 و 24 عامًا البحث الصوتي من الأجهزة المحمولة ؛
- وفقا لتوقعات Comscore ، بحلول عام 2020 ، سيتم تقديم 50 ٪ من الطلبات عن طريق الصوت ؛
- وفقًا لبحث أجرته WalkerSands عام 2018 ، اشترى كل مستخدم خامس لمكبر صوت ذكي من Amazon معه ، وخطّط ثالث للقيام بذلك في العام المقبل ؛
- وفقًا لدراسة PWC ، يفضل 71٪ من المستخدمين الذين يبحثون على الويب كتابة الأصوات بدلاً من الكتابة يدويًا.
كما تعلمون ، يزداد الميل إلى استخدام GA ، مما يوحي بأن الوقت قد حان لأخذ بائع وإطلاق مساعدك الخاص. بالنسبة لنا ، المفتاح لذلك هو القدرة على التحكم في الأجهزة الذكية ، والتي ستميز SkyFriend عن غيرهم من المساعدين.
ودعونا ندمج!
لكن مهمتنا هي أيضًا العمل مع نهج البائع الحالي ومواءمته مع بروتوكول التحكم التكنولوجي الخاص بنا. نحن نتبع مسار التقييس والتطبيق العملي ، وننظر إلى الجهاز على أنه مجموعة من المهارات: يمكن لكل غلاية غلي الماء (المهارة) ، كما يمكنها تسخينه إلى درجة الحرارة المطلوبة (المهارة) ، والحفاظ على درجة الحرارة هذه لفترة معينة ، إلخ. على سبيل المثال ، أمر "تشغيل / إيقاف" قياسي لأي جهاز. المهمة هي نقل هذا الأمر من الخدمة إلى بروتوكولنا. ما هي خصوصية بروتوكولنا؟ إنه يربط مساعدين صوتيين مختلفين (الآن ثلاثة ، في المستقبل - جميعهم كبيرون) ويسمح لهم جميعًا بالعمل مع الأجهزة ، بما في ذلك في نفس الوقت. التواصل هو واحد للكثيرين. والسؤال الوحيد هو كيف يمكننا بالضبط تكييف بروتوكولنا لجميع النهج؟
لنرى. مشاريع منفصلة لكل GA هي:
- زيادة الموظفين
- الكثير من الشفرة والتراث في المستقبل ؛
- عدم القدرة على التوسع.
عند ظهور مساعدين جدد في السوق ، سيكون من الضروري زيادة عدد الموظفين وحجم العمل بشكل متناسب. من المنطقي أننا رفضنا هذا الخيار. ومع ذلك ، على الرغم من الأساليب المختلفة لكل مساعد صوت ، إلا أنه يمكنهم العثور على شيء مشترك - ما يعملون بشكل أساسي هو المهارة والسمات والمهارات. أسماء مختلفة ، ولكن جوهر هو نفسه. لذلك ، فإن المهمة هي تطوير "مهارتك" ، والتي سوف ينظر إليها من قبل المساعدين. في المستقبل ، ستحتاج فقط إلى إضافة موردين جدد ، مما يحل مشكلة التوسع. سنضع في اعتبارنا أيضًا أن كمية كبيرة من أجهزتنا تستخدم سيارات بليه ، والتي تحدد الخصائص المعمارية.
لقد قمنا بتطوير اثنين من الخدمات المصغرة التي تعمل في أزواج.

الأول هو طبقة الأوامر. مهمتها: إجراء التحويل (التعيين) بين واجهة برمجة تطبيقات البائع وبروتوكولنا. يعمل مثل هذا: طلب معين لمساعد هو تعيين لدينا المهارات - تعيين لبروتوكول الجهاز. مع هذا النهج ، من السهل إضافة مهارات جديدة: يتم إجراء التعيين لبروتوكول R4S النهائي - يتم نقل الرمز إلى الخدمة الثانية. قد يتم استبعاد العنصر الأخير عند إرسال أمر عبر Wi-Fi.
يتم استخدام طبقة الخدمة أو النقل الثانية من أجل:
- إنشاء جلسة مع بوابة العميل ؛
- رفع والحفاظ على اتصال Bluetooth ؛
- استقبال / نقل الأوامر من الخدمة الأولى.
هذه الخدمة جزء من كيان أعلى مستوى: BT-device بالإضافة إلى وسيط البوابة ، ويعمل على المبدأ: تلقي الأوامر عبر الإنترنت - الإرسال عبر BT. قد تكون الاتصالات اللاسلكية غير موثوق بها. لماذا؟ يمكن تقييد القناة الراديوية بالمعلمات البيئية - الجدران الخرسانية السميكة ، وما إلى ذلك ... ونتيجة لذلك ، يمكن للأجهزة "السقوط" ببساطة ، وبالتالي يصبح الحفاظ على اتصال مستقر مهمة مهمة لطبقة النقل.

قد تختلف سياسة الاتصال:
1. دعم التواصل المستمر.
الايجابيات : الحد الأدنى من التأخير في تنفيذ أوامر GA.
سلبيات : باهظة الثمن لحركة المرور واستهلاك الطاقة. يوجد حد لعدد الأجهزة المتصلة في وقت واحد (في هذا الجيل Bluetooth 4.0 / 4.2 - ستة ، في Bluetooth 5.0 حتى عشرين). سيتطلب أيضًا موارد خادم إضافية.
2. اتصال على الطلب.
الايجابيات : الاتصال تقريبا لا يتطلب المرور ورسوم.
السلبيات : التأخير الكبير في تنفيذ الأوامر بالإضافة إلى التنفيذ نفسه غير مضمون (قد "ينقطع الاتصال" أو قد يكون غير ناجح). مع هذا النهج ، نحن لا نلتزم أثناء انتظار الإجابة على الجمعية العامة. انتهت الجلسة والنهاية.
يبقى السؤال أيضًا - تم استلام الأمر وعمله ، ولكن ما يجب القيام به مع الاتصال: قطع الاتصال أو الاستمرار. لاحظ بنفس الطريقة التي تعمل بها Apple HomeKit تمامًا عند العمل مع الأجهزة الطرفية BLE (عبر Apple TV أو iPad كبوابة). يبدو الأمر هكذا - في المرة الأولى التي تحاول فيها إرسال أمر ، تستغرق العملية وقتًا طويلاً (أو الأفضل أن تقال ، تكون ملحوظة للمستخدم) ، لكن الأوامر اللاحقة يتم تنفيذها على الفور تقريبًا. بعد اكتمال عمل المستخدم مع الجهاز ، يقوم نظام التشغيل "بإعداد" الجلسة بعد فترة زمنية معقولة ثم تتكرر العملية كجديدة.
ومع ذلك ، هذا ليس كل شيء.
الصعوبة 1 . بوابة التوجيه.

إذا كانت هناك عدة بوابات في الغرفة ، فإن السؤال الذي يطرح نفسه هو أي بوابة للاتصال بها وأي بوابة أخرى متصلة بالجهاز. الآن كل شيء يعمل وفقًا للمبدأ - من ينجح مرتبط. التنفيذ ليس ناجحًا دائمًا ، لأن أقرب بوابة (وبالتالي قادرة على الاتصال بشكل أكثر موثوقية) يمكن أن تكون مشغولة في الفاصل الزمني المستخدم. ثم الشخص الحر والقادر متصل. يحدث هذا دون النظر إلى جودة الاتصال. لذلك ، من المهم بناء تسلسل هرمي ونظام عمل حتى يكون المستخدم مرتاحًا قدر الإمكان.
الصعوبة 2 . الكثير من المستخدمين.
هذا موقف حيث يمكن لعدة مستخدمين استخدام بوابة واحدة أو جهاز واحد في نفس الوقت. بالطبع مع مستوى عال من الأمن. على سبيل المثال ، من GAs مختلفة أو من GAs وهواتف المستخدم. مجموعة من الأسئلة: أي جهاز يتم تشغيله أولاً ، إذا كانت أوامر GA تتناقض مع بعضها البعض ، أي الأمر يمثل أولوية ويجب تنفيذه مسبقًا ، إلخ. جزئيًا يتم حل مشكلتنا بواسطة خدمة Redis - قاعدة بيانات يتم تخزين جلسات المستخدم فيها وحالات الجهاز وجهاز الإرسال والاستقبال الأوامر وخدمة ناقل البيانات بين الخدمتين الأولى والثانية. ولكن هذا هو المكان الذي يتوقف فيه حل المشكلة.
ماذا فعلنا؟ لقد صنعنا SkyFriend. هذا هو تطورنا ، مساعد صوت لإدارة التكنولوجيا ، والتي سوف تدعم أيضا اللغة الروسية. من الميزات الرئيسية في GA لدينا أنه يتم شحذها للتفاعل المباشر مع تقنية Smart Ready for Sky بدون أدوات إضافية. يتكون الجهاز من اثنين في واحد - يتم الجمع بين المساعد وبوابة ستتلقى المعلومات إما من خلال أوامر يرسلها المستخدم من هاتفه الذكي ، أو مباشرة عن طريق الصوت. يحتوي Plus SkyFriend على ميزات إضافية تتيح لها التنافس مع الميزات الموجودة بالفعل. يمكنه تشغيل التذكيرات عند الطلب ، ويمكنه تحديد الموقع الجغرافي للمستخدم ، والبحث عن المعلومات على ويكيبيديا ، والتوصية بالأفلام ، وتحميص الخبز المحمص ، وقراءة الأخبار ، والإجابة على الأسئلة ، وتحديد الوقت والطقس في أي مدينة في العالم ، ولعب الألغاز والمدن مع المستخدم صنع النكات. لا يزال شراء التذاكر وطلب سيارة أجرة في مرحلة اختبار ألفا. وهذا ليس سوى جزء من الوظيفة.
في الآونة الأخيرة ، أعلنت Google عن عمل عمودها على بنية مماثلة - يتم تحميل البرنامج النصي للتنفيذ مباشرة في عمود Google Home. الفوز على جانب المستخدم هو تقليل الوقت الذي يستغرقه تنفيذ الأوامر. لا تحتاج إلى إرسالها إلى خادم الشركة المصنعة للمعدات ؛ فهي تنتقل مباشرةً إلى العمود من خادم Google عبر قناة الاتصال نفسها ويتم تنفيذها هناك.
ومع ذلك ، لا تزال Google لا تدعم عمليات النقل الأخرى - Bluetooth ، ZigBe ، Z-Wave ، RF ، إلخ. مباشرة على العمود ، ويدعم SkyFriend تقنية Bluetooth 5.0.
ماذا تركنا؟ العمل مع موارد النظام - إضافة ذاكرة ، طاقة المعالج ، إلخ. ونحن على استعداد لتزويد المستخدمين بجودة GA جديدة.
ماذا يمكن أن نقول في الختام؟
GA هو اتجاه ، إنه مناسب ، إنه عملي. الموضوع جديد وشامل ولديه العديد من الأسئلة التي لا يزال من الصعب حلها. خاصة وحدها. لذلك ، ندعوك إلى مناقشة.
ماذا سيحدث بعد ذلك؟ وبعد ذلك سيكون هناك مقال جديد حول هندسة SkyFriend. سنقول ونظهر كل شيء. لكن بعد ذلك.
يمكن ترك اقتراحات PS والاستعراضات في التعليقات.