Google AIY: Kit para criadores de gadgets de controle de voz



O Google lançou a iniciativa AIY Projects para combinar AI com DYI, ou seja, combinar aplicativos de software AI com kits de montagem de gadgets. Como resultado, o Google acredita que os fabricantes poderão fabricar dispositivos úteis que ajudarão a "resolver problemas reais" na vida. Esses gadgets irão realmente interagir com a pessoa. Por exemplo, reconheça a fala, responda a perguntas e execute comandos de voz.

O primeiro projeto foi o Voice Kit , um sistema de reconhecimento de fala demo com ou sem o Google Assistant. Conforme indicado na descrição, além de todas as funções usuais do Google Assistant, você também pode adicionar seus próprios pares de perguntas e respostas ao gadget. O dispositivo é feito na forma de um pequeno cubo de papelão com o Rasberry Pi 3 dentro. A montagem de um conjunto de 12 peças levará aproximadamente 1,5 horas.

Um conjunto de peças está disponível gratuitamente quando você assina o MagPi . A propósito, esta revista está disponível em formato digital - descreve muitos projetos incríveis, inclusive no campo de aprendizado de máquina, feitos com o Rasberry Pi.

O kit também é vendido sem uma revista nas lojas Barnes & Noble e nas lojas britânicas WH Smith, Tesco, Sainsburys e Asda. Aparentemente, esses são os únicos lugares onde o kit é vendido. O conjunto inclui placas de interface, cabos, suportes de plástico, um alto-falante e um botão. A própria placa Raspberry Pi 3, o cartão SD, assim como a chave de fenda e a fita necessárias para a montagem, não estão incluídos. Os principais componentes são o cartão Voice HAT para reconhecimento de fala e o cartão Voice HAT Microphone. Estas são novas placas, que ainda não estão disponíveis para venda separadamente.



O Google oferece instruções detalhadas sobre como criar um gadget. Começando com a placa Raspberry Pi 3 bond e Voice HAT,



dobrar as caixas ...



... e prendendo tudo isso em um único gadget.





As sugestões a seguir são para baixar a imagem SD do Voice Kit para gravar em um cartão flash.

Os dispositivos periféricos são conectados aos conectores expostos nos slots da caixa de papelão: teclado (1), mouse (2) e monitor (3).



Após o download de um cartão flash, o dispositivo está pronto para se conectar ao Google Cloud Platform por meio de uma conexão WiFi configurada. Lá, você precisa configurar um novo projeto por meio da API do Google Assistant e, em seguida, o dispositivo começará a funcionar normalmente, aceitando solicitações de voz e reconhecendo-as na nuvem.

O dispositivo entende imediatamente os principais comandos de língua inglesa:

  • Que horas são?
  • Conte uma piada
  • Torne a música mais alta
  • Torne a música mais silenciosa
  • Volume máximo
  • Olá (resposta: "Olá para você")

Como já mencionado, você pode adicionar seus próprios pares de perguntas e respostas, ou seja, programar a IA para as ações necessárias. Isso é feito no arquivo ~/voice-recognizer-raspi/src/action.py .

 # ========================================= # Makers! Implement your own actions here. # ========================================= import RPi.GPIO as GPIO class GpioWrite(object): '''Write the given value to the given GPIO.''' def __init__(self, gpio, value): GPIO.setmode(GPIO.BCM) GPIO.setup(gpio, GPIO.OUT) self.gpio = gpio self.value = value def run(self, command): GPIO.output(self.gpio, self.value) 

Se desejar, você pode usar outras APIs do Cloud Speech, que traduzem o discurso de voz em texto e suportam 80 idiomas, incluindo russo, e o processamento de arquivos de áudio longos.

Obviamente, ele suporta a conexão de sensores adicionais. Por exemplo, conectando uma impressora e outros dispositivos domésticos com comandos de voz:

  • Ligue a impressora
  • Escureça a luz na sala
  • Ligue a chaleira na cozinha
  • Ferva os ovos (ou seja, ferva a água por exatamente quatro minutos)
  • Desligue a guirlanda festiva na árvore de Natal



Esse projeto não pode ser dominado de graça. Em primeiro lugar, o kit em si é vendido separadamente, e alguns dos detalhes são únicos. Em segundo lugar, você também precisa pagar pelo uso da API da nuvem. Embora o segundo não seja um pré-requisito. Em princípio, o reconhecimento de fala pode ser feito localmente usando o aplicativo TensorFlow.

Em Habré falou sobre a nova plataforma do Google para a Internet das coisas - Android Things . Então, e saiu na versão para o AIY Voice Kit , assim como há uma versão para o Raspberry Pi e algumas outras placas de desenvolvimento.



De fato, esse dispositivo pode substituir os botões liga / desliga de todos os eletrodomésticos e eletrodomésticos: de um aspirador a um micro-ondas. Ele pode ser usado em vez da aplicação em um smartphone para um controle de voz mais conveniente de eletrodomésticos “inteligentes”, como um termostato ou lâmpadas programáveis. No final, você pode conectá-lo ao robô - comunicar-se com ele e comandar a voz (como "Diga-me quando o gato ficar sem comida").

Source: https://habr.com/ru/post/pt403743/


All Articles