Rhasspy هو مجموعة أدوات خطاب مفتوحة المصدر بالكامل حاليا. الاعتراف باللغة الروسية. لا تسرب إلى السحابة


صورة من مقارنة صفائف الميكروفون لأجهزة DIY مثل مكبر صوت ذكي محلي الصنع

ترسل أنظمة مثل Amazon Echo محادثاتك الحساسة (حتى المسجلة بطريق الخطأ) إلى السحابة للتخزين . في بعض الحالات ، يتم سماع التسجيلات بواسطة المشغلين المباشرين . هذه ليست مجرد فقدان للخصوصية. إنه مثل السماح طوعًا لـ "الرفيق الرائد" الذي يقف على مدار 24 ساعة يوميًا ، ويستمع ويسجل بعناية ، ويتظاهر بأنه مساعد مفيد.

بدلاً من شراء نظام تجاري من شركات مثل Google أو Amazon أو Yandex ، يمكنك إنشاء نظام مشابه مفتوح المصدر يعتمد على Raspberry Pi 2-3 B / B + أو كمبيوتر شخصي أو كمبيوتر محمول.

Rhasspy هو مساعد صوت آمن يعمل بشكل مستقل. لا ينقل أي شيء إلى الخدمات عن بعد ، بينما يتعامل بنجاح مع التعرف على الكلام والأوامر الصوتية.

Rhasspy لديه تكامل بسيط للغاية في أي برنامج أو نظام أجهزة حيث تريد إضافة التحكم الصوتي. يوضح المؤلف أن الأداة كانت مكتوبة في الأصل لمشروع Home Assistant ، ولكنها الآن متوافقة مع معظم أنظمة التشغيل الآلي للمنزل (Hass.io ، Node-RED ، OpenHAB ، Jeedom).

تم تحسين Rhasspy للعمل مع الخدمات الخارجية عبر MQTT أو HTTP أو Websockets. مُحسَّن خصيصًا للأوامر الصوتية مع بنية نحوية محددة بوضوح (قم بتشغيل / إيقاف تشغيل الضوء ، وجعل الموسيقى أعلى صوتًا / أكثر هدوءًا ، إلخ)

يتم دعم 14 لغة ، بما في ذلك الروسية.

يوصف نموذج العمل في الوثائق . يعتمد على التعرف على الأوامر الصوتية من خلال لغة قالب معينة ، تم تكييفها خصيصًا لهذا المجال. يتم تصنيف هذه الأوامر حسب القصد وقد تحتوي على فتحات أو علامات ، مثل لون الإضاءة أو اسم العنصر المحدد الذي تم إعطاء الأمر إليه.

للبدء ، اذكر النوايا (بين قوسين معقوفين) والطرق الممكنة للاتصال بها. يبدو القالب مثل هذا:

[LightState] states = (on | off) turn (<states>){state} [the] light 

وفقًا لهذا النمط ، ستقوم Rhasspy بإنشاء رمز JSON يمكن استخدامه بواسطة نظام التشغيل الآلي للمنزل أو تطبيق خارجي أو جهاز (عبر Node-RED ، مآخذ الويب):

 { "text": "turn on the light", "intent": { "name": "LightState" }, "slots": { "state": "on" } } 

يتم تنفيذ التعرف على الكلام مباشرة بواسطة pocketsphinx : محرك مفتوح المصدر خفيف الوزن مع دعم للغة الروسية. إنه لأمر رائع بالنسبة للأجهزة المحمولة أو أجهزة الكمبيوتر ذات اللوحة المفردة مثل Raspberry Pi.

معالجة الصوت غير متصلة على جهازك. يمكن أن يأتي الصوت نفسه من مجموعة ميكروفون Raspberry Pi (مثل ReSpeaker 4 Mic Array أو ReSpeaker 2 Mics pHAT ) أو من دفق صوت عبر شبكة .

Rhasspy هي مجرد أداة مريحة للغاية لربط محرك التعرف على الكلام بنظام الأتمتة المنزلية أو أي نظام آخر يتطلب التحكم الصوتي. من حيث المبدأ ، يمكن استخدامه في أي مكان: على سبيل المثال ، في تطبيقات الهاتف المحمول. أو في نوع من الروبوت المنزلي مثل مكنسة كهربائية أو نادل.

من الجيد أن يقوم الروبوت بتنفيذ نفس الإجراءات كما كان من قبل ، ولكن الآن بواسطة الأوامر الصوتية.

مؤلف كتاب Rhasspy هو أيضًا مؤلف مشروع voice2json : إنه برنامج وحدة تحكم لنفس المهمة تقريبًا ، لتحويل خطاب الإنسان بسهولة إلى قائمة أوامر الكمبيوتر (أو العكس).

يبدو أن المستقبل هو مع واجهات الصوت. في هذه الحالة ، من المهم للغاية أن تتم معالجة تدفقات الصوت محليًا ولا تتطلب الوصول إلى الإنترنت.

Source: https://habr.com/ru/post/ar482764/


All Articles