भाषण मान्यता ASIC के लिए तकनीकी विनिर्देशइलेक्ट्रॉनिक्स को नियंत्रित करने के लिए वॉयस कमांड सबसे स्वाभाविक और सुविधाजनक इंटरफेस है। एक कल्पना कर सकता है कि भविष्य में, लगभग सभी इलेक्ट्रॉनिक उपकरण मालिक की आज्ञाओं को समझेंगे: अपार्टमेंट में प्रकाश बल्ब से लेकर रेफ्रिजरेटर, माइक्रोवेव और रसोई में केतली। इंटरनेट ऑफ थिंग्स के एक सामान्य नेटवर्क से जुड़े, ये उपकरण न केवल मालिक को समझेंगे, बल्कि एक दूसरे के साथ अपने कार्यों का समन्वय भी करेंगे।
हाल के वर्षों में, भाषण मान्यता प्रौद्योगिकियां उच्च स्तर पर पहुंच गई हैं और विभिन्न व्यावसायिक अनुप्रयोगों के लिए परिपक्व हो गई हैं: कार कंप्यूटर नियंत्रण, स्वास्थ्य देखभाल (डॉक्टरों के भाषण की पहचान के लिए डिजिटल प्रलेखन) और सैन्य उपयोग। उदाहरण के लिए, इतालवी प्रशिक्षण विमान एम -346 और अमेरिकी लड़ाकू-बमवर्षक एफ -35 में, भाषण मान्यता प्रणालियों की सटीकता
98% तक पहुंच जाती है । लेकिन घरेलू उपकरणों और पहनने योग्य इलेक्ट्रॉनिक्स पर भाषण पहचान करने के लिए, आपको इस इंटरफ़ेस की बिजली की खपत को काफी कम करना होगा।
मैसाचुसेट्स इंस्टीट्यूट ऑफ टेक्नोलॉजी (एमआईटी) लेबोरेटरी फॉर इंफॉर्मेटिक्स एंड आर्टिफिशियल इंटेलिजेंस (सीएसआईएल) के इंजीनियरों ने इस भविष्य की तस्वीर के लिए तैयारी शुरू कर दी है जब आसपास के सभी इलेक्ट्रॉनिक्स मानव आवाज को समझना शुरू करते हैं।
क्वांटा कंप्यूटर के साथ एक संयुक्त
क्यूमुलस परियोजना के हिस्से के रूप में
, एमआईटी के शोधकर्ताओं ने भाषण मान्यता के लिए एक विशेष माइक्रोचिप (एएसआईसी) का एक प्रोटोटाइप विकसित किया है। इस चिप की एक अनूठी विशेषता इसकी अल्ट्रा-लो बिजली खपत है: केवल 0.2 mW से 10 mW तक, शब्दों की संख्या के आधार पर जिन्हें पहचानने की आवश्यकता है। यह इस तरह के इलेक्ट्रॉनिक्स का शाब्दिक रूप से किसी भी उपकरण का उपयोग करना संभव बनाता है, यहां तक कि मानव शरीर द्वारा संचालित भी।
एक वयस्क पुरुष के शरीर में सामान्य चयापचय लगभग 80 वाट गर्मी पैदा करता है, और एक प्रशिक्षित साइकिल चालक 400 वाट तक यांत्रिक ऊर्जा पैदा करता है। बेशक, इस तरह की शक्ति का उपयोग इलेक्ट्रॉनिक्स को पूर्ण करने के लिए नहीं किया जा सकता है, लेकिन बहुत अधिक आवश्यकता नहीं है। निष्क्रिय मोड में मानव शरीर से कुछ वाट आसानी से हटा दिए जाते हैं। उदाहरण के लिए, कलाई पर 10 सेमी लंबा एक छोटा कंगन मानव शरीर के तापमान (लगभग 37 ° C) और परिवेशी वायु (20 ° C) के अंतर के कारण
लगभग 40 mW लगातार उत्पन्न होता है।

यदि आप एक ब्रेसलेट पर नहीं डालते हैं, लेकिन एक पूरी थर्मल जैकेट या 50-100 सेंटीमीटर चौड़ी है, तो यह शरीर से लगभग 2 वाट निकाल देगा। लेकिन आप फिर भी गति की गतिज ऊर्जा को परिवर्तित कर सकते हैं और रक्त से शर्करा को तोड़ सकते हैं। यह शरीर के इलेक्ट्रॉनिक्स, कपड़े और सबसे सरल गैजेट को बिजली देने के लिए पर्याप्त है।
मानव शरीर के अलावा, कम-शक्ति वाले इलेक्ट्रॉनिक उपकरण ऊर्जा का उत्पादन कर सकते हैं, उदाहरण के लिए, पृष्ठभूमि रेडियो तरंगों (माइक्रोवेव, रेडियो, वाईफाई, आदि) से, खिड़की और फर्श कंपन, आदि से।
एक साधारण औसत स्मार्टफोन मानव शरीर से या ईथर से एकत्रित ऊर्जा पर काम करने की संभावना नहीं है। डेवलपर्स के अनुसार, एक नियमित मोबाइल हार्डवेयर पर स्मार्टफोन पर भाषण मान्यता कार्यक्रम लगभग 1 डब्ल्यू खींचेगा। यह बहुत कुछ है। वास्तविक परिस्थितियों में एक विशेष एमआईटी चिप और क्वांटा कंप्यूटर का उपयोग करने का मतलब है 90-99% की ऊर्जा बचत। सबसे महत्वपूर्ण बात यह है कि इस तरह के कम-पावर डिवाइस नाटकीय रूप से भाषण मान्यता के दायरे का विस्तार करते हैं। अब इसे न केवल स्मार्टफोन या महंगे इलेक्ट्रॉनिक उपकरणों में लागू किया जा सकता है, बल्कि सबसे आम आसपास की वस्तुओं में, यहां तक कि बाथरूम के दर्पण में भी।
यदि आप पर्यावरण से ऊर्जा एकत्र करते हैं, तो इस तरह के उपकरण को बैटरी को बदलने की आवश्यकता कभी नहीं होगी। यदि आप अभी भी इसे विश्वसनीयता के लिए बैटरी के साथ आपूर्ति करते हैं, तो एक शुल्क महीनों या वर्षों के लिए पर्याप्त है।
एमआईटी और क्वांटा कंप्यूटर पर संयुक्त परियोजना क्यूमुलस 2005 में वापस शुरू हुई, जब इसे टी-पार्टी कहा जाता था। डेवलपर्स का सुझाव है कि चीजों के इंटरनेट के प्रसार के साथ, कंप्यूटर चिप्स को विभिन्न वस्तुओं में, यहां तक कि पालतू जानवरों और मवेशियों में भी पशुधन के लिए खाते में रखा जाएगा और उनकी स्थिति की निगरानी की जाएगी। माइक्रोचिप्स लगातार सूचनाएं एकत्र करती हैं और वास्तविक समय में केंद्रीय सर्वर को भेजती हैं।
शायद भाषण मान्यता चिप्स को पालतू जानवरों के कॉलर में बनाया जा सकता है - उदाहरण के लिए, एक आवाज कमांड कॉलर को एक कमजोर विद्युत पल्स भेज सकता है, जो पालतू को एक या किसी अन्य क्रिया को करने के लिए उत्तेजित करता है। हालांकि, पालतू जानवर और एक माइक्रोचिप के बिना बहुत अच्छी तरह से मालिक की आवाज आज्ञाओं को समझते हैं, इसलिए इस तरह के एक आविष्कार अन्य क्षेत्रों में अधिक उपयोगी है।
"वॉयस कमांड पहनने योग्य और स्मार्ट उपकरणों के लिए प्राकृतिक इंटरफ़ेस बन जाएगा," MIT में इलेक्ट्रिकल इंजीनियरिंग की प्रोफेसर अनंत चंद्रकासन
ने कहा , जिनके समूह ने नया माइक्रोचिप विकसित किया। - इस तरह के उपकरणों के लघुकरण में कीबोर्ड के अलावा अन्य इंटरफ़ेस की आवश्यकता होगी। क्लाउड में इस ऑपरेशन को करने की तुलना में सिस्टम पावर की खपत को कम करने के लिए स्थानीय स्तर पर आवाज पहचान की कार्यक्षमता को एकीकृत करना महत्वपूर्ण है। "
डिज़ाइन किया गया ASIC 145 हज़ार शब्दों के शब्दकोश के साथ कमर्शियल काल्डी सॉफ़्टवेयर के समान मान्यता सटीकता दिखाता है, और 80 मेगाहर्ट्ज की घड़ी की आवृत्ति पर, माइक्रोक्रिकिट का प्रदर्शन (शब्दावली जाली में शब्दों की खोज की गति) लगभग एक एक्सॉन प्रोसेसर और 3 की घड़ी आवृत्ति के साथ कंप्यूटर के प्रदर्शन से मेल खाती है। 7 गीगा।

सतत भाषण मान्यता गुणवत्ता (WER) और ASIC बिजली की खपत तालिका में दिखाए गए हैं।
कार्य | शब्दकोश | आवृत्ति | मेमोरी एक्सचेंज | WER | बिजली की खपत |
---|
आंकड़े | 11 | 3 मेगाहर्ट्ज | 0.11 एमबी / एस | 1.65% | 172 mcw |
मौसम | 2k | 23 मेगाहर्ट्ज | 10.1 एमबी / एस | 4.38% | 4.70 mW |
भोजन की डायरी | 7K | 46 मेगाहर्ट्ज | 9.02 एमबी / एस | 8.57% | 4.67 mW है |
समाचार (1) | 5k | 15 मेगाहर्ट्ज | 4.84 एमबी / एस | 3.12% | 1.78 mW |
समाचार (2) | 145k | 40 मेगाहर्ट्ज | 15.0 एमबी / एस | 8.78% | 7.78 mW |
माइक्रोचिप के वर्णन के साथ वैज्ञानिक आलेख
"डी-न्यूरल-नेटवर्क ध्वनिक मॉडल और आवाज-सक्रिय पावर गेटिंग के साथ एक स्केलेबल भाषण पहचानकर्ता" पिछले सप्ताह
अंतर्राष्ट्रीय ठोस-राज्य सर्किट सम्मेलन (
प्रस्तुति, पीडीएफ ) में
प्रस्तुत किया गया था ।