Las mejores herramientas para reconocimiento de voz para Linux
La voz es cada vez un método más usado para interactuar con nuestros dispositivos, además de ser el único método para aquellas personas que necesiten de este tipo de métodos de accesibilidad. En cualquier caso, resulta bastante cómodo hablar para dictar texto o simplemente introducir comandos de voz en nuestros sistemas para que éstos hagan algún tipo de operación sin necesidad de usar las manos. El problema es que los sistemas de reconocimiento de voz se basan en motores que usan algoritmos matemáticos para reconocer la voz y no son 100% fiables.
Los avances tecnológicos cada vez acercan más la fiabilidad a la perfección, y los sistemas de inteligencia artificial y big data también están ayudando mucho a que los programas de reconocimiento de voz mejoren enormemente. Últimamente se están poniendo muchos esfuerzos para mejorar estos sistemas al máximo, y muchos estudios se están centrando en ello para mejorar el control y que sean la interfaz del futuro. Ten encuenta que las actuales interfaces son menos naturales para las personas y menos rápidas que la voz.
Los sistemas de reconocimiento de voz tendrán un valor de unos 10 mil millones de dólares en los próximos años y por eso las grandes empresas se están centrando en el desarrollo de asistentes como Siri de Apple, Cortana de Microsoft o Mycroft para Linux, además de hacerse cada vez más populares y frecuentes los productos como Amazon Echo, Google Home, o Apple HomePod para el hogar, así como integrar sofisticados sistemas de reconocimiento de voz en los coches conetados.
Dicho esto, nuestra lista de tools de reconocimeinto de voz para Linux son:
- Julius: es un potente motor de reconocimiento de voz continuo con gran cantidad de vocabulario.
- DeepSpeech: es una implementación de TensorFLow de la arqutiectura DeepSpeech de Baidu.
- Simon: un software de reconocimiento de voz bastante flexible.
- Kaldi: es un kit de herramientas C++ de diseño para investigación del reconocimiento de voz.
- CMUSphinx: en este caso se trata de un motor de reconocimiento de voz para apps móviles y servidores.
- deepspeech.python: es una implementación de DeepSPeech con Python y usando Baidu Warp-CTC.
El artículo Las mejores herramientas para reconocimiento de voz para Linux ha sido originalmente publicado en Linux Adictos.