eSpeak / Gespeaker: cómo convertir texto a voz
Todas las personas que tengan algún tipo de problema visual también tienen derecho a usar distribuciones GNU/Linux. Quizás estés pensando en usar algún tipo de software que convierta el texto en voz, y de esa forma poder leer todo tipo de textos sin problema. Otra posibilidad sería para aquellos que quieren pasar el texto a voz por algún motivo, como convertir un libro en un audiolibro y grabarlo en MP3, para convertir texto en otros idiomas en audio para practicar la pronunciación con este sintetizador de voz, etc.
Sea cual sea tu propósito, en este tutorial te enseñaremos todo lo que necesitas saber sobre esta app de código abierto que está disponible con bibliotecas de voz en inglés y otros idiomas, también en español. Tienes dos opciones, por un lado tienes la herramienta eSpeak y por otro lado también tienes a tu disposición la herramienta Gespeaker. Ambas tienen la misma funcionalidad, de hecho están relacionadas.
Distros pensadas para mejorar la accesibilidad
Las herramientas de accesibilidad en macOS y Windows están bastante bien, en GNU/Linux aún faltan cosas que pulir para que los que tienen algún tipo de discapacidad, o problema de cualquier tipo que permita el normal uso de los sistemas informáticos, puedan disfrutar de ellos. No obstante, la comunidad ha hecho grandes esfuerzos para acercar las distros a todos. Prueba de ello es la distro SONAR, aunque desgraciadamente ha sido descontinuada.
Y SONAR no es la única distro pensada para mejorar la accesibilidad, de hecho, la mayoría de distros actuales suelen incluir algunas configuraciones de accesibilidad para cambiar el contraste, ampliar las fuentes, lupa, teclado en pantalla, etc.
Vinux también fue otra distro para ellos, o el proyecto ADRIANE (basada en Kanoppix) pensada para personas con problemas visuales, o Talking Arch Linux, etc. Además, como mi intención con éste artículo es ayudar a cuantas más personas mejor, dejo aquí otra lista de proyectos que quizás te interesan, a parte de las que vamos a detallar más adelante:
- Speakup (software)
- DoubleTalk (hardware)
Como ves, la mayoría son para personas ciegas o con otros problemas en la vista, ya que son las que más dificultades presentan a la hora de usar un sistema informático. Por ejemplo, las personas con algún problema auditivo pueden usar un sistema normalmente, excepto que no pueden escuchar. Los que tienen algún tipo de problema de movilidad también puede usar cualquier distro, simplemente deberán tener teclados especiales, teclados en pantalla, cambiar la configuración del ratón o touchpad, etc.
eSpeak vs Gespeaker
Tanto eSpeak y Gespeaker están relacionadas, ésta segunda es un front-ent para la primera, aunque la primera se puede usar de forma totalmente independiente como sintetizadores de voz para convertir el texto en voz. La diferencia entre una y otra es:
- eSpeak: es una herramienta de síntesis de voz basada en texto, es decir, para la línea de comandos. Básicamente lo que hace es tomar una entrada en forma de cadena de texto que introduzcas como parámetro tras el comando (stdin), o un archivo de texto como entrada y lo reproduce con una voz sintética producida por la computadora. Concretamente vas a encontrar hasta 107 idiomas y acentos diferentes entre los que elegir. Así que tiene muchas posibilidades…
- Gespeaker: la alternativa más gráfica e intuitiva con GUI para los que no les gusta trabajar tanto desde la consola. Usa una interfaz GTK+ sobre espeak para ello. También es gratuita y de código abierto. Pero permite ajustar los parámetros de una forma más sencilla, como las configuraciones de voz, idiomas, volumen, tono, velocidad, etc. Además, permite grabar un archivo WAV para escucharlo más tarde o para transformarlo en otro formato como MP3 y luego usarlo en un reproductor portátil, etc.
Es decir, eSpeak es una herramienta más rudimentaria pero funcional, mientras que Gespeaker es la versión gráfica similar, o como alternativa, a TextAloud para Windows….
Instalar y usar espeak
Para usar espeak lo primero que debes hacer es instalar esta herramienta en tu sistema si no la tienes ya. Para ello, puede variar en función de la distro que uses, pero será más o menos igual de sencilla usando los siguientes comandos:
- Debian / Ubuntu / Derivados:
sudo apt-get install espeak -y
- openSUSE / SUSE:
sudo zypper install espeak-ng
- RHEL / CentOS / Fedora:
sudo yum install espeak -y
- Arch Linux:
sudo pacman -S espeak
Una vez instalado, ya podrás comenzar a usarlo. Para obtener información, puedes usar alguno de los siguientes comandos. El primero para ver la versión, y el segundo para saber más sobre el uso:
espeak --version espeak --help man espeak
Para usarlo puedes hacerlo de dos formas, una es introducir el texto o el archivo de texto directamente como parámetro del comando y la otra es en modo interactivo, es decir, la segunda de las opciones que te dejará teclear el texto que quieras para luego leerlo:
espeak "Hola, esto es un mensaje" espeak -f /home/isaac/leer.txt espeak
Así de sencillo…
Instalar y usar Gespeaker
Para instalar la versión gráfica, que quizás te guste mucho más y resulte más práctica e intuitiva, puedes usar este procedimiento para las principales distros:
Importante: para que Gespeaker funcione tienes que tener instalado el paquete python-dbus, así que también lo debes instalar si no lo tienes…
- Modo gráfico: ve a la tienda de app de tu distro. Por ejemplo, si estás en Ubuntu, puedes ir a la app Software de Ubuntu, luego, en el buscador escribe el nombre gespeaker para buscarlo. Entre los resultados encontrarás esta app. Tan solo tienes que pulsar el botón Instalar y la tendrás lista para usar…
- Modo texto: para el modo texto, puedes usar los mismos comandos del apartado de espeak, pero sustituyendo el nombre del paquete por el de gespeaker para intentar instalarlo.
Una vez instalado, su uso es bastante sencillo, tienes todas las opciones de configuración disponibles en la interfaz gráfica:. Lánza la app para iniciarla desde el menú de apps de tu entorno de escritorio y una vez veas la ventana principal del programa, puedes pegar o escribir texto en el espacio en blanco para que lo lea o lo guarde en formato audio. En la siguiente imagen te explico las principales opciones:
De esta forma todo es mejor y más rápido que usando comandos, aunque sigues teniendo espeak tras esta bonita infertaz…
Espero haberte ayudado. En caso de tener alguna recomendación o sugerencia, y también dudas, ya sabes que puedes dejar tus comentarios.