🌽 🤟🏻 🔅 Grabar sonido JS desde un micrófono o comentarios de voz 😰 🍏 ❣️

Grabar sonido JS desde un micrófono o comentarios de voz

No hace mucho tiempo, al desarrollar una aplicación web corporativa, el cliente deseaba poder dejar comentarios de voz. Anteriormente, no encontré la creación de contenido de medios y comencé a estudiar este tema con interés.

La red proporcionó suficiente información de fondo sobre el tema de crear y procesar este tipo de contenido, pero no encontré un ejemplo simple y completamente funcional. Después de la implementación de la tarea por parte del cliente, decidí publicar el ejemplo más simplificado de grabar y guardar comentarios de voz y escribir un artículo. Quizás este material sea útil para alguien y ayude en el estudio.

Declaración del problema.

Nos propusimos la tarea de desarrollar una mini aplicación que se ejecute en un navegador que le permita grabar un comentario de voz, enviar una grabación al servidor, el servidor guardará la grabación, si tiene éxito, devolverá una respuesta con el nombre del archivo creado y mostrará el objeto en la página para que se pueda escuchar la grabación.

Grabar sonido en el navegador

Se decidió implementar la grabación de sonido utilizando la API web de grabación de MediaStream. Para la grabación, utilizamos la interfaz MediaRecorder (). Pero primero, crea una interfaz. Tengamos index.html que contiene solo las etiquetas más básicas, y en el cuerpo de la etiqueta incluiremos un archivo con nuestro futuro JavaScript voice.js:

<!DOCTYPE html> <head> <meta charset="UTF-8"> <title>Voice comments</title> </head> <body> <script src="voice.js"></script> </body> </html>

Cree un archivo voice.js, defina una URL constante que contenga un enlace a un script que reciba sonido grabado. A continuación, cree los botones Iniciar y Parar para iniciar y detener la grabación de sonido, así como el bloque div en el que se mostrarán los registros guardados. En esto nuestra interfaz está lista, puede proceder directamente a la grabación de sonido.

Como ya se mencionó para la grabación, utilizaremos la interfaz MediaRecorder () (para obtener más información sobre la interfaz, consulte la documentación), para su funcionamiento es necesario determinar la secuencia de medios de la que tomaremos sonido, inicialícela solo porque solo necesitamos una pista de audio.

 navigator.mediaDevices.getUserMedia({ audio: true}) .then(stream => { const mediaRecorder = new MediaRecorder(stream)});

Ahora tenemos el mediaRecorder constante, que contiene una instancia de la interfaz, y continuaremos trabajando con ella.

Para comenzar a grabar, debemos llamar al método MediaRecorder.start (), para detener la grabación, al método MediaRecorder.stop (). En este caso, MediaRecorder.stop () genera un evento disponible de datos a través del cual tenemos acceso a la grabación de sonido digitalizada en forma de una matriz binaria.

Entonces, describiremos los eventos anteriores, declararemos la matriz de voz [] y escribiremos los datos recibidos en ella:

 navigator.mediaDevices.getUserMedia({ audio: true}) .then(stream => { const mediaRecorder = new MediaRecorder(stream); let voice = []; document.querySelector('#start').addEventListener('click', function(){ mediaRecorder.start(); }); mediaRecorder.addEventListener("dataavailable",function(event) { voice.push(event.data); }); document.querySelector('#stop').addEventListener('click', function(){ mediaRecorder.stop(); }); });

Ahora prepararemos los datos recibidos para enviar. Para hacer esto, mediante el evento stop, cree una instancia BLOB, coloque los datos recibidos y especifique el tipo de datos MIME. En nuestro caso, será audio / wav.

 mediaRecorder.addEventListener("stop", function() { const voiceBlob = new Blob(voice, { type: 'audio/wav' });

Como resultado, tenemos una constante voiceBlob en la que se encuentra el contenido de nuestro futuro archivo wav con la grabación de un mensaje de voz.

Enviar un registro al servidor

Para enviar un registro al servidor, decidí usar el método fetch (). Dado que este método es el más moderno y proporciona una interfaz mejorada para realizar solicitudes al servidor. Como parte de nuestra tarea, debemos iniciar una solicitud POST en el cuerpo para enviar el contenido de nuestro archivo futuro para guardar en el servidor (cómo funciona el método fetch () y qué capacidades se pueden encontrar en la documentación en detalle). Cree un nuevo formulario con el campo de voz y coloque el contenido de nuestro registro en él.

 let fd = new FormData(); fd.append('voice', voiceBlob);

Creamos una función asincrónica para enviar un mensaje al servidor para recibir una respuesta y mostrar un objeto de audio para reproducir un archivo ya guardado. Como argumento, la función tomará la forma creada anteriormente.

Iniciamos una solicitud del servidor:

 let promise = await fetch(URL, { method: 'POST', body: form});

Si la respuesta HTTP del servidor no contiene un código de error (el código de respuesta está en el rango de 200-299), entonces nos queda por descifrar la respuesta, crear un nuevo objeto de audio en la página, determinar sus propiedades y mostrarlo. La forma en que se forma la respuesta se discutirá a continuación.

Guardar un archivo en el servidor

Creemos un script en el servidor que recibirá nuestra solicitud POST con un mensaje de voz. Dado que la grabación de sonido que enviamos es esencialmente un archivo en forma, la recibiremos en el servidor en consecuencia:

 $uploadDir = 'voice/'; $typeFile = explode('/', $_FILES['voice']['type']); $uploadFile = $uploadDir . basename(md5($_FILES['voice']['tmp_name'].time()).'.'.$typeFile[1]); if (move_uploaded_file($_FILES['voice']['tmp_name'], $uploadFile)) { $response = ['result'=>'OK', 'data'=>'../'.$uploadFile]; } else { $response = ['result'=>'ERROR', 'data'=>'']; } echo json_encode($response);

Puede encontrar muchos ejemplos similares de código PHP, procesando archivos recibidos en la red. Primero, inicialice las variables, $ uploadDir: el directorio en el que se guardará el archivo recibido, el tipo de archivo y tipo de archivo en nuestro caso será igual a wav y el nombre completo del archivo, incluido el directorio. El nombre de archivo en este caso se forma combinando el nombre de archivo "temporal" y el valor de cadena de la hora actual cifrada usando el método md5. Si guarda con éxito el archivo con un mensaje de voz en el directorio especificado, formamos una respuesta en forma de matriz que contiene el campo de resultado igual a "OK" o "ERROR" dependiendo del resultado y el campo de "datos" que, en caso de procesamiento exitoso, contiene un enlace al archivo guardado.

Por conveniencia, transformamos la matriz en un objeto JSON y lo enviamos como respuesta.

El código de muestra completo está disponible en GitHub .

PD: el navegador le permite grabar contenido multimedia solo con una conexión HTTPS segura.

Grabar sonido JS desde un micrófono o comentarios de voz