Mozilla ya esta trabajando en el desarrollo su propio sistema de traducción automática
Mozilla ha dado a conocer como parte del proyecto Bergamot, el lanzamiento de un sistema de traducción automática basado en el navegador, algo similar al traductor de Chrome, pero con la diferencia de que será que la opción de traducir páginas web en Firefox funcionará sin conexión a Internet.
El lanzamiento de este proyecto permitirá integrar en Firefox un motor de traducción de páginas autónomo que no accede a servicios en la nube externos y procesa datos exclusivamente en el sistema del usuario. El objetivo principal del desarrollo de este proyecto es garantizar la confidencialidad y proteger los datos del usuario de posibles fugas al traducir el contenido de las páginas abiertas en el navegador.
Bergamot se está desarrollando en la sede de Mozilla en Berlín con la participación de investigadores de varias universidades del Reino Unido, Estonia y la República Checa. El desarrollo está financiado por la Unión Europea como parte de una subvención recibida en el marco del programa Horizon 2020.
El importe de este apoyo es de alrededor de unos tres millones de euros. El proyecto está diseñado para tres años. Mozilla ha abierto un trabajo como especialista en sistemas de aprendizaje automático para participar en el desarrollo de un motor para la traducción de un idioma a otro.
De los desarrollos relacionados con el proyecto Bergamot, se mencionan los siguientes:
- La Universidad de Edimburgo trabaja en el desarrollo del marco de traducción automática Marian, el cual esta construido sobre la base de una red neuronal recurrente. El marco está escrito en C ++, y puede hacer uso de la GPU para acelerar el aprendizaje y la traducción. El proyecto viene bajo la licencia MIT.
- La herramienta Neural Monkey desarrollada en la Universidad de Praga para procesar información del lenguaje natural utilizando métodos secuenciales de aprendizaje automático. El proyecto utiliza el marco TensorFlow y puede usarse para crear prototipos de sistemas de traducción automática y clasificar información en un lenguaje natural. El código está disponible bajo la licencia BSD.
- El proyecto QuEst ++, que es desarrollado en la Universidad de Sheffield, se utiliza para evaluar y predecir la calidad de los sistemas de traducción automática.
- Mozilla está desarrollando en un sintetizador de voz (TTS) y reconocimiento de voz motor (Deep Speech)
- El proyecto ParaCrawl, financiado por la Union Europea, que acumula una base de datos de traducciones simultáneas de varias frases en diferentes idiomas, que pueden utilizarse para formar sistemas de aprendizaje automático.
- La base del proyecto es bitextor, el cual es un bot, que indexa sitios web multilingües y encuentra automáticamente los mismos textos presentados en varios idiomas. La base de ejemplos de traducciones paralelas está formada por 24 idiomas.
Como se muestra en el vídeo de demostración, aparecerá un nuevo botón en Firefox, al hacer clic el usuario en este boton podrá seleccionar el idioma al que se quiere traducir. Al lado se colocará un botón para volver al idioma original.
Los desarrolladores dicen que el nuevo sistema local proporcionará una mejor privacidad y protección de datos para los usuarios al traducir el contenido de la página en el navegador.
Hace unos años, Mozilla ya estaba tratando de agregar una función de traducción similar a Google Chrome en su navegador, pero la abandonó debido a los costos de soporte demasiado elevados.
Firefox cuenta con una función incorporada para la traducir de páginas, pero está vinculado al uso de servicios en la nube externos (compatibles con Google, Yandex y Bing) y no está activado por defecto. Para activar la función es necesario dirigirnos a “about: config” y cambiar la configuración de “browser.translation“).
El mecanismo de traducción también admite la detección automática de idioma cuando se abre una página en un idioma desconocido y muestra un indicador especial con una propuesta para traducir la página.
El prototipo del sistema de traducción que se está desarrollando como parte del proyecto Bergamot utiliza la misma interfaz para interactuar con el usuario. Este sistema de traducción puede ser probado en Firefox Nightly habilitando las configuraciones browser.translation.ui.show y browser.translation.detectLanguage.