Mejorando la experiencia de usuario con Web Speech API

Es una epoca emocionante para las web APIs, y una a tener en cuenta es Web Speech API, que permite a los sitios web y webapps no solo hablar con el usuario sino escuchar también. Aún esta despegando, pero esta funcionalidad se abrirá a toda una serie de casos de uso.

En este articulo examinaremos su tecnología y su propósito de uso, también veremos algunos ejemplos de como puede se puede usar esto para mejorar la experiencia de usuario.

Esta tecnología es bastante innovadora, y las especificaciones oficiales son un «borrador». Os invito a echarle un ojo a la especificación. Cuando digo innovadora me refiero al mundo web, pues en el mundo de los dispositivos móviles ya se le saca provecho al micrófono integrado, pero ¿que pasa con los sitios de escritorio? los ordenadores personales también cuentan con micrófonos, ¿por que no puede el usuario interactuar con la web a través de su voz?.

¿Como funciona?

Para empezar veamos la parte que te habla. Si tu sitio tiene contenido textual puedes ejecutar algunas funciones y la web le dirá al usuario el contenido que le pasemos. Desde JavaScript sería algo parecido a esto:

speak(‘Bienvenidos a Desarketing’);

Por supuesto hay más funciones para controlar más a fondo, puedes parar e iniciar la voz cuando quieras, así como cambiar el idioma y la voz. Actualmente la síntesis de voz solo está soportada en Chrome y Safari. También las voces disponibles dependen del sistema operativo. Si quereis meteros a fondo y usar la la API, podeis ver las voces disponibles desde la consola de tu navegador con:

window.speechSynthesis.getVoices();

Reconocimiento de voz

La otra parte de esta herramienta es el reconocimiento de voz, que le permite al usuario hablarle a la web. Si queremos que nuestro sitio escuche basta con cambiar un atributo:

newRecognition.continuous = true;

Para iniciar y parar el reconocimiento de voz basta con llamar a los métodos:

newRecognition.start();
newRecognition.stop();

Posibles usos

Dictado

Ahora mismo el uso más común para esta herramienta es el dictado o mecanismo de lectura, es decir, el usuario habla al micrófono y el dispositivo lo traduce a texto (demo), o el usuario pasa un texto para que el dispositivo lo lea.

Control por voz

El dictado puede pasar fácilmente al control por voz, ya sea para navegar por la web, ayudar con voz a un usuario a rellenar un formulario sin errores etc.

Traducción

La traducción cambia radicalmente si se hace en tiempo real, alguien podría conversar en un idioma y la otra persona oiría lo que dice en su propio idioma.

Conclusión

Cómo he dicho al principio, si hablamos a nuestros dispositivos móviles, ya sea para buscar algo en la web o realizar alguna acción, podemos también hacerlo en el mundo web. He de reconocer que está en pañales esta tecnología, pero sin ninguna duda en el futuro hablaremos con todos nuestros dispositivos, y ellos con nosotros.

Ya sabes, puedes comentar tu opinión al respecto.

¿Como funciona?

Reconocimiento de voz

Posibles usos

Dictado

Control por voz

Traducción

Conclusión

DSK - Desarketing

Leave a Reply Cancel Reply

Recibe novedades en tu buzón

Consulta Rápida

Contacto

Secciones

Enlaces