
Google ने AI को DYI के साथ मिलाने के लिए
AIY प्रोजेक्ट्स पहल शुरू की,
यानी गैजेट असेंबली किट के साथ AI सॉफ्टवेयर एप्लिकेशन को संयोजित किया। नतीजतन, Google का मानना है, निर्माता उपयोगी उपकरण बनाने में सक्षम होंगे जो जीवन में "वास्तविक समस्याओं को हल करने" में मदद करेंगे। ये गैजेट वास्तव में व्यक्ति के साथ बातचीत करेंगे। उदाहरण के लिए, भाषण को पहचानें, प्रश्नों का उत्तर दें और वॉइस कमांड निष्पादित करें।
पहली परियोजना
वॉयस किट थी , जो Google सहायक के साथ या उसके बिना एक डेमो भाषण पहचान प्रणाली थी। जैसा कि विवरण में कहा गया है, Google सहायक के सभी सामान्य कार्यों के अलावा, यहां आप गैजेट में अपने स्वयं के जोड़े और प्रश्नों के उत्तर भी जोड़ सकते हैं। डिवाइस को एक छोटे कार्डबोर्ड क्यूब के रूप में रसबेरी पाई 3 के अंदर बनाया गया है। 12 भागों के एक सेट को इकट्ठा करने में लगभग 1.5 घंटे लगेंगे।
जब आप
MagPi की सदस्यता लेते हैं, तो भागों का एक सेट मुफ़्त में उपलब्ध
होता है । वैसे, यह पत्रिका
डिजिटल रूप में उपलब्ध है - इसमें मशीन लर्निंग के क्षेत्र में कई अद्भुत परियोजनाओं का वर्णन किया गया है, जिसमें रसबेरी पाई का उपयोग किया गया है।
किट को बार्न्स एंड नोबल स्टोर्स में और ब्रिटिश स्टोर्स डब्ल्यूएच स्मिथ, टेस्को, सेन्सबरीस और एसडा में भी बिना किसी पत्रिका के बेचा जाता है। जाहिरा तौर पर, ये अब तक एकमात्र स्थान हैं जहां किट बेचा जाता है। सेट में इंटरफ़ेस बोर्ड, केबल, प्लास्टिक धारक, एक स्पीकर और एक बटन शामिल हैं। रास्पबेरी पाई 3 बोर्ड स्वयं, एसडी कार्ड, साथ ही विधानसभा के लिए आवश्यक पेचकश और टेप शामिल नहीं हैं। मुख्य घटक वाक् पहचान के लिए वॉयस हाट कार्ड और वॉयस हाट माइक्रोफोन कार्ड हैं। ये नए बोर्ड हैं, जो अभी तक अलग से बिक्री के लिए उपलब्ध नहीं हैं।

Google एक गैजेट बनाने के बारे में विस्तृत निर्देश प्रदान करता है। रास्पबेरी पाई 3 बांड और वॉयस हाट बोर्ड के साथ शुरू,

बक्से को तह करना ...

... और एक ही गैजेट में यह सब बन्धन।


फ्लैश कार्ड में रिकॉर्डिंग के लिए वॉयस किट एसडी इमेज डाउनलोड करने के लिए निम्नलिखित सुझाव दिए गए हैं।
परिधीय उपकरण कार्डबोर्ड बॉक्स के स्लॉट में उजागर किए गए कनेक्टर से जुड़े होते हैं: कीबोर्ड (1), माउस (2) और मॉनिटर (3)।

फ्लैश कार्ड से डाउनलोड करने के बाद, डिवाइस कॉन्फ़िगर किए गए वाईफाई कनेक्शन के माध्यम से Google क्लाउड प्लेटफॉर्म से कनेक्ट होने के लिए तैयार है। वहां, आपको Google सहायक एपीआई के माध्यम से एक नई परियोजना स्थापित करने की आवश्यकता है, और फिर डिवाइस सामान्य रूप से कार्य करना शुरू कर देगा, आवाज के अनुरोधों को स्वीकार करेगा और उन्हें क्लाउड में पहचान लेगा।
डिवाइस मुख्य अंग्रेजी बोलने वाले कमांड को तुरंत समझता है:
- समय क्या हुआ है?
- एक चुटकुला सुनाओ
- संगीत जोर से करो
- संगीत को शांत बनाएं
- अधिकतम मात्रा
- नमस्ते (उत्तर: "आपको नमस्कार")
जैसा कि पहले ही उल्लेख किया गया है, आप अपने स्वयं के जोड़े प्रश्नों और उत्तरों को जोड़ सकते हैं, अर्थात आवश्यक क्रियाओं के लिए AI को प्रोग्राम कर सकते हैं। यह फ़ाइल
~/voice-recognizer-raspi/src/action.py
।
यदि वांछित है, तो आप अन्य क्लाउड स्पीच एपीआई का उपयोग कर सकते हैं, जो वाणी भाषण को पाठ में अनुवाद करते हैं और रूसी सहित 80 भाषाओं का समर्थन करते हैं, और लंबी ऑडियो फाइलों का प्रसंस्करण करते हैं।
बेशक, यह अतिरिक्त सेंसर के कनेक्शन का समर्थन करता है। उदाहरण के लिए, प्रिंटर और अन्य घरेलू उपकरणों को वॉयस कमांड से जोड़ना:
- प्रिंटर चालू करें
- कमरे में प्रकाश मंद
- रसोई में केतली चालू करें
- अंडे उबालें (यानी ठीक चार मिनट तक पानी उबालें)
- क्रिसमस के पेड़ पर उत्सव की माला बंद करें

नि: शुल्क ऐसी परियोजना में महारत हासिल नहीं की जा सकती। सबसे पहले, किट खुद को अलग से बेचा जाता है, कुछ विवरण वहां अद्वितीय हैं। दूसरे, आपको क्लाउड एपीआई का उपयोग करने के लिए भी भुगतान करना होगा। हालांकि दूसरा कोई शर्त नहीं है। सिद्धांत रूप में, TensorFlow एप्लिकेशन का उपयोग करके स्थानीय स्तर पर भाषण पहचान की जा सकती है।
Habré ने चीजों के इंटरनेट के लिए नए Google प्लेटफॉर्म के बारे में बात की -
एंड्रॉइड थिंग्स । तो, और यह
एआईवाई वॉयस किट के लिए संस्करण में निकला , ठीक उसी तरह जैसे रास्पबेरी पाई और कुछ अन्य देव-बोर्डों के लिए एक संस्करण है।
वास्तव में, ऐसा गैजेट सभी घरेलू घरेलू और बिजली के उपकरणों पर ऑन / ऑफ बटन को बदलने में सक्षम है: वैक्यूम क्लीनर से माइक्रोवेव तक। थर्मोस्टैट या प्रोग्रामेबल लाइट बल्ब जैसे "स्मार्ट" घरेलू उपकरणों के अधिक सुविधाजनक आवाज नियंत्रण के लिए स्मार्टफोन पर एप्लिकेशन के बजाय इसका उपयोग किया जा सकता है। अंत में, आप इसे रोबोट से जोड़ सकते हैं - इसके साथ संवाद कर सकते हैं और आवाज को कमांड कर सकते हैं (जैसे कि "मुझे बताओ जब बिल्ली भोजन से बाहर निकलती है")।