Wikipedia2text, consulta artículos de Wikipedia desde la terminal
En el siguiente artículo vamos a echar un vistazo a Wikipedia2text. Este es un pequeño script de Shell que nos va a permitir consultar los artículos de Wikipedia desde la consola. Con el también podremos abrir el artículo seleccionado en cualquier navegador de texto. Se trata de una aplicación similar a Wikit, que es una aplicación para buscar en la Wikipedia desde la terminal artículos y resúmenes, sobre la que ya hemos publicado un artículo en su día en este mismo blog.
La mayoría de los usuarios tarde o temprano tiramos de Wikipedia. Bien sea para buscar información sobre cualquier compañía u otra información sobre casi cualquier cosa que se nos ocurra o necesitemos consultar. Cuando realizamos una búsqueda en google, por defecto el enlace a Wikipedia suele estar en el Top 5. Wikipedia tiene unos 40 millones de artículos, aproximadamente en más de 299 idiomas diferentes. Decir que la Wikipedia en inglés es la versión más grande.
Este script de shell utiliza un navegador de texto para consultar y representar los artículos de Wikipedia. La salida se imprimirá como una salida estándar. Actualmente es compatible con alrededor de 30 idiomas de Wikipedia.
Como ya he dicho, esta secuencia de comandos utiliza el navegador de texto para consultar y representar artículos de Wikipedia. Por ello necesitaremos instalar cualquiera de los siguientes navegadores en modo texto. Después podremos continuar con la instalación de Wikipedia2text. Mientras no instalemos algún navegador para la terminal, no nos va apermitir realizar las consultas.
Cómo instalar Wikipedia2text en Ubuntu
En las distribuciones basadas en Debian se incluye este paquete en el repositorio predeterminado. Sin embargo, también vamos a poder instalarlo en otras distribuciones.
En Debian, Ubuntu y derivados, podremos instalar este script utilizando el administrador de paquetes. Abrimos una terminal (Ctrl+Alt+T) y solo tendremos que escribir la siguiente orden:
sudo apt install wikipedia2text
Aun que si no queremos instalar nada también tendremos la opción de clonar el repositorio y mover el archivo Wikipedia2text solo al directorio /bin. Podremos dejarlo con el mismo nombre o si quieres hacerlo más corto y sencillo de recordar, renómbralo como wiki-cli (u otro nombre de tu agrado), como voy a hacer en el siguiente ejemplo. Para ello, abrimos una terminal (Ctrl+Alt+T) y escribimos cada una de las siguientes órdenes:
git clone https://github.com/chrisbra/wikipedia2text sudo mv wikipedia2text/wikipedia2text /bin/wiki-cli rm -Rf wikipedia2text/
Cómo utilizar Wikipedia2text
Ver la ayuda de Wikipedia2text
Cuando lancemos el comando sin ningún argumento, de forma predeterminada se nos va a mostrar la página de ayuda de la herramienta. En ella podremos consultar todas las opciones que encontraremos disponibles para utilizar al lanzar el script.
Entre ellas quiero destacar la que nos va a permitir consultar los idiomas admitidos. Como se puede ver en la anterior captura, nos va a mostrar las siglas que podremos utilizar a la hora de consultar los artículos en diferentes idiomas.
Para lanzar este script y consultar la ayuda, no tendremos más que abrir una terminal (Ctrl+Alt+T) y escribir:
wiki-cli
Leer artículo
Para leer cualquier artículo de Wikipedia, ejecuta el siguiente comando. Tendrás que presionar la barra espaciadora para avanzar a la página siguiente del artículo:
wiki-cli -p ubuntu
Leer artículo en otro idioma
Vamos a poder leer el artículo en otros idiomas soportados por Wikipedia, que ya mencioné líneas más arriba. Actualmente el script es compatible con 30 idiomas. Para ello, ejecuta el siguiente comando. En este ejemplo vamos a probar el idioma francés:
wiki-cli -pl fr arch linux
Abrir un artículo en el navegador de texto
Para abrir el artículo de Wikipedia en el navegador de texto que tendremos que tener previamente instalado, ejecuta el siguiente comando:
wiki-cli -po opensuse
Obtener la URL de un artículo
En caso de que quieras conocer la URL de la consulta, podrás obtener esta información ejecutando el siguiente comando:
wiki-cli -u debian
Desinstalar Wikipedia2text
En el caso de que utilicemos apt para instalar este script en nuestro equipo, podremos eliminarlo de manera sencilla como siempre hacemos. Abrimos la terminal (Ctrl+Alt+T) y escribimos en ella la siguiente orden:
sudo apt remove wikipedia2text
Si queremos echar un vistazo al código fuente de esta utilidad, podremos verlo en la página de GitHub del proyecto.
El artículo Wikipedia2text, consulta artículos de Wikipedia desde la terminal ha sido originalmente publicado en Ubunlog.