Si habéis tenido suerte y os han regalado un AIY Voice Kit por navidad u os lo habéis comprado vosotros, hoy vamos a ver como montarlo y ponerlo a funcionar. La verdad es un proyecto muy sencillo y no debería llevar más de una hora.
Componentes Necesarios
Para llevar a cabo el montaje del AIY Voice Kit necesitaremos además del propio kit lo siguiente:
- Una Raspberry Pi 3B, 2B o Zero W
- Una tarjeta micro SD de al menos 8Gb
- Un destornillador Philips
- Cinta de doble cara
Cualquiera de los modelos de Raspberry Pi anteriormente mencionados nos sirve aunque necesitaremos un adaptador Wifi si utilizamos una Raspberry Pi 2B. Además hemos de tener en cuenta que el modelo Zero W no es compatible con la detección de palabra clave «OK Google». Para este artículo se ha utilizado una Raspberry Pi 3B.
Preparando la tarjeta SD y montando el AIY Voice Kit
Desde Google han preparado una imagen de Raspbian para AIY Voice Kit. Esta imagen puede descargarse desde la página del proyecto. Incluye el SDK de Python para Google asistant y viene 100% configurada para funcionar con el kit.
Una vez la tengamos descargada procederemos a escribirla en la tarjeta SD con un programa como ETCHER.io. Esto llevará algún tiempo, por lo que mientras termina empezaremos amontar el kit.
En cuanto al montaje físico del kit sólo debemos seguir las instrucciones del manual incluído. Si no entendéis inglés no os preocupéis, con las imágenes es más que suficiente y al fin y al cabo no es tan complicado, sólo es doblar cartón.
Mencionar que es necesaria una doblez que no viene marcada en el cartón. Deberemos doblar la pieza de cartón dónde irá el altavoz para que esta quede alineada con el resto de la estructura como se puede ver en los pasos 12 y 13 del capítulo 3 del manual.
Primer arranque
Con el kit ya montado introducimos la tarjeta micro SD en la Raspberry Pi, conectamos un monitor, teclado y ratón y enchufamos la corriente. Este primer arranque será un poco más lento de lo normal pues han de redimensionarse las particiones y aplicarse algunas configuraciones.
Una vez en el escritorio lo primero que tendremos que hacer es conectarnos a una red WiFi. Para comprobar la conexión ejecutaremos el script Check WiFi que se encuentra en el escritorio. Si todo va según lo esperado veremos lo siguiente:
1 2 3 4 | Checking the WiFi connection... Trying to contact Google's servers... The WiFi connection seems to be working. Press Enter to close... |
A continuación, con el script Check Audio comprobaremos el altavoz y el micrófono. Primero deberemos escuchar las palabras «front, center» y luego deberemos hablar al micrófono (1,2 probando…) y escuchar nuestras palabras repetidas.
Si esto ha funcionado estamos listos para seguir adelante, crear una aplicación en Google Cloud Console y habilitar las APIs necesarias para el uso del dispositivo.
Configurando Google Cloud Console y habilitando APIs
Para esta parte de la configuración os recomiendo que veáis el vídeo y sigáis los pasos. Resumiendo lo que tenemos que hacer, desde el navegador web en nuestra Raspberry Pi, es lo siguiente:
- Acceder a Google Cloud Platform
- Crear un nuevo proyecto
- Habilitar Assistant API para el Proyecto
- Crear un ID de cliente de OAuth y una pantalla de autorización
- Descargar los credenciales en formato json
- Mover los credenciales a la carpeta /home/pi y renombrarlos a assistant.json
Ademas, debemos acceder al control de actividad de la cuenta Google y verificar que tenemos activado lo siguiente:
- Actividad en la Web y en Aplicaciones
- Información de los dispositivos
- Actividad de voz y audio
Probando las demos de AIY Voice Kit
Ha llegado la hora de probar las demos incluidas con el AIY Voice Kit. Para ello hacemos clic en el icono Start Dev Terminal en el escritorio de la Raspberry Pi.
En la imagen se incluyen las siguientes demos:
- assistant_library_demo.py muestra el funcionamiento de Google Assistant y la detección de «Okay Google».
- assistant_library_with_button_demo igual que el anterior pero funciona pulsando el botón.
- assistant_grpc_demo.py muestra el uso del GRPC API y el uso del botón
- cloud_speech_demo.py en teoría muestra el funcionamiento de Google Cloud Speech API, uso del botón, y comandos de voz personalizados
Por desgracia, en Europa no podemos usar la Cloud Speech API con nuestro AIY Voice Kit. Su uso está reservado para aplicaciones comerciales.
Existe además otra demo que no viene con la imagen, se trata de assistant_library_with_local_commands_demo.py. Para utilizarla deberemos actualizar Voice Kit del siguiente modo.
1 2 3 4 5 | git fetch origin pull/207/head:voicekit git checkout voicekit rm -rf ~/voice-recognizer-raspi/env scripts/install-deps.sh sudo systemctl restart voice-recognizer.service |
Esta demo permite ejecutar comandos locales, como reiniciar/apagar la Raspberry Pi o decir la IP de la misma. Esta demo es de las más interesantes para echar un vistazo y modificar para así comenzar nuestro proyecto de forma sencilla.
Próximos pasos
Espero que el tutorial haya sido lo bastante claro. Si no habéis podido seguir el tutorial, os habéis perdido o tenéis cualquier duda dejad un comentario e intentaré responderos lo antes posible.
Y esto es todo por hoy. Espero que os haya gustado y resultado de utilidad. Si es así, compartid el artículo, el vídeo Youtube y suscribiros al canal. Si veo que el post tiene aceptación os enseñaré a crear vuestros propios scripts con los que controlar desde las luces hasta lo que se os ocurra.