Google AIY: مجموعة أدوات التحكم في الصوت



أطلقت Google مبادرة مشروعات AIY لدمج الذكاء الاصطناعي مع DYI ، أي دمج تطبيقات برامج AI مع مجموعات تجميع الأدوات. ونتيجة لذلك ، تعتقد Google ، أنه سيتمكن المصنعون من صنع أجهزة مفيدة ستساعد في "حل المشكلات الحقيقية" في الحياة. سوف تتفاعل هذه الأدوات مع الشخص حقًا. على سبيل المثال ، تعرف على الكلام وأجب عن الأسئلة وقم بتنفيذ الأوامر الصوتية.

كان المشروع الأول هو مجموعة أدوات الصوت ، وهو نظام تجريبي للتعرف على الكلام مع مساعد Google أو بدونه. كما هو موضح في الوصف ، بالإضافة إلى جميع الوظائف المعتادة لمساعد Google ، هنا يمكنك أيضًا إضافة أزواج من الأسئلة والإجابات الخاصة بك إلى الأداة. الجهاز مصنوع على شكل مكعب صغير من الورق المقوى مع Rasberry Pi 3 في الداخل. يستغرق تجميع مجموعة مكونة من 12 جزءًا حوالي 1.5 ساعة.

تتوفر مجموعة من الأجزاء مجانًا عند الاشتراك في MagPi . بالمناسبة ، هذه المجلة متاحة في شكل رقمي - تصف الكثير من المشاريع المدهشة ، بما في ذلك في مجال التعلم الآلي ، التي تم إجراؤها باستخدام Rasberry Pi.

تباع المجموعة أيضًا بدون مجلة في متاجر Barnes & Noble والمتاجر البريطانية WH Smith و Tesco و Sainsburys و Asda. على ما يبدو ، هذه هي الأماكن الوحيدة التي تباع فيها المجموعة. تتضمن المجموعة لوحات واجهة وكابلات وحوامل بلاستيكية ومكبر صوت وزر. لا يتم تضمين لوحة Raspberry Pi 3 نفسها ، وبطاقة SD ، بالإضافة إلى مفك البراغي والشريط المطلوب للتجميع. المكونات الرئيسية هي بطاقة Voice HAT للتعرف على الكلام وبطاقة ميكروفون Voice HAT. هذه لوحات جديدة ، وهي ليست متاحة للبيع بشكل منفصل حتى الآن.



تقدم Google تعليمات تفصيلية حول كيفية إنشاء أداة. بدءًا من سندات Raspberry Pi 3 ولوحة Voice HAT ،



طي الصناديق ...



... وربط كل هذا في أداة واحدة.





الاقتراحات التالية هي تنزيل صورة Voice Kit SD للتسجيل على بطاقة فلاش.

يتم توصيل الأجهزة الطرفية بالموصلات المكشوفة في فتحات صندوق الكرتون: لوحة المفاتيح (1) والماوس (2) والشاشة (3).



بعد التنزيل من بطاقة فلاش ، يكون الجهاز جاهزًا للاتصال بـ Google Cloud Platform عبر اتصال WiFi مهيأ. هناك ، تحتاج إلى إعداد مشروع جديد من خلال Google Assistant API ، وبعد ذلك سيبدأ الجهاز في العمل بشكل طبيعي ، وقبول الطلبات الصوتية والتعرف عليها في السحابة.

يفهم الجهاز على الفور الأوامر الرئيسية الناطقة باللغة الإنجليزية:

  • كم الساعة؟
  • قل مزحة
  • اجعل الموسيقى بصوت أعلى
  • اجعل الموسيقى أكثر هدوءًا
  • الحجم الأقصى
  • مرحبًا (الإجابة: "مرحبًا بك")

كما ذكرنا من قبل ، يمكنك إضافة أزواج من الأسئلة والإجابات الخاصة بك ، أي برمجة الذكاء الاصطناعي لاتخاذ الإجراءات اللازمة. يتم ذلك في الملف ~/voice-recognizer-raspi/src/action.py .

 # ========================================= # Makers! Implement your own actions here. # ========================================= import RPi.GPIO as GPIO class GpioWrite(object): '''Write the given value to the given GPIO.''' def __init__(self, gpio, value): GPIO.setmode(GPIO.BCM) GPIO.setup(gpio, GPIO.OUT) self.gpio = gpio self.value = value def run(self, command): GPIO.output(self.gpio, self.value) 

إذا رغبت في ذلك ، يمكنك استخدام واجهات برمجة تطبيقات Cloud Speech الأخرى ، التي تترجم الكلام الصوتي إلى نص وتدعم 80 لغة ، بما في ذلك الروسية ، ومعالجة ملفات الصوت الطويلة.

بالطبع ، يدعم اتصال أجهزة استشعار إضافية. على سبيل المثال ، توصيل طابعة وأجهزة منزلية أخرى بالأوامر الصوتية:

  • قم بتشغيل الطابعة
  • قم بتعتيم الضوء في الغرفة
  • قم بتشغيل الغلاية في المطبخ
  • غلي البيض (أي غلي الماء لمدة أربع دقائق بالضبط)
  • قم بإيقاف الطوق الاحتفالي على شجرة عيد الميلاد



لا يمكن التغلب على مثل هذا المشروع مجانًا. أولاً ، يتم بيع المجموعة نفسها بشكل منفصل ، وبعض التفاصيل فريدة من نوعها هناك. ثانيًا ، عليك أيضًا الدفع مقابل استخدام واجهة برمجة التطبيقات السحابية. على الرغم من أن الثاني ليس شرطا مسبقا. من حيث المبدأ ، يمكن التعرف على الكلام محليًا باستخدام تطبيق TensorFlow.

تحدث حبري عن منصة Google الجديدة لإنترنت الأشياء - Android Things . لذا ، تم إصداره في إصدار AIY Voice Kit ، تمامًا كما يوجد إصدار لـ Raspberry Pi وبعض لوحات dev الأخرى.



في الواقع ، هذه الأداة قادرة على استبدال أزرار التشغيل / الإيقاف في جميع الأجهزة المنزلية والأجهزة الكهربائية المنزلية: من المكنسة الكهربائية إلى الميكروويف. يمكن استخدامه بدلاً من التطبيق على الهاتف الذكي للتحكم الصوتي الأكثر ملاءمة للأجهزة المنزلية "الذكية" مثل الترموستات أو المصابيح الكهربائية القابلة للبرمجة. في النهاية ، يمكنك توصيله بالروبوت - التواصل معه وقيادة الصوت (مثل "أخبرني عندما ينفد القط من الطعام").

Source: https://habr.com/ru/post/ar403743/


All Articles