Guía completa para instalar y aprovechar Gemini CLI en Ubuntu
Gemini CLI ha llegado para revolucionar la forma en la que los desarrolladores y usuarios avanzados interactúan con la Inteligencia Artificial desde el terminal de Ubuntu. Cada vez son más las herramientas basadas en IA que se integran en el flujo de trabajo de programación, pero no todas ofrecen la potencia, flexibilidad y acceso directo que proporciona Gemini CLI.
El auge de la IA en el mundo Linux ha abierto nuevas posibilidades para automatizar, analizar código y generar contenido de manera creativa. Sin embargo, la instalación y configuración de ciertas utilidades no siempre es sencilla, especialmente para quienes buscan aprovechar el potencial de Gemini AI desde la comodidad de su terminal. Si has oído hablar de Gemini CLI o necesitas un compañero inteligente en tu shell, aquí tienes toda la información que necesitas saber para instalarlo, configurarlo y exprimirlo al máximo en Ubuntu.
¿Qué es Gemini CLI y por qué destaca en Ubuntu?
Gemini CLI es una herramienta de línea de comandos desarrollada por el equipo de Google Gemini, orientada principalmente a desarrolladores, administradores de sistemas y, en general, cualquier persona que quiera aprovechar las ventajas de la IA en el terminal. No solo permite analizar y editar grandes bases de código, sino que también automatiza tareas de DevOps, prototipa aplicaciones con entrada multimodal y ofrece integración con otros servicios y modelos generativos. Además, se trata de un proyecto open source bajo licencia Apache 2.0, lo que garantiza transparencia y una evolución constante de la mano de la comunidad.
Principales funciones y ventajas de Gemini CLI
- Soporte para grandes bases de código: Es capaz de manejar más de un millón de tokens en contexto, lo que permite analizar proyectos de gran tamaño sin perder eficiencia.
- Prototipado multimodal de aplicaciones: Permite crear prototipos a partir de documentos PDF, imágenes o bocetos, aprovechando la capacidad multimodal de Gemini.
- Automatización avanzada de tareas DevOps y Git: Consulta y manipula pull requests, planea migraciones, resuelve rebases complejos y mucho más, todo desde el terminal.
- Integración sencilla con modelos multimedia: Puedes conectar con servicios como Imagen, Veo y Lyria a través de servidores MCP para generar contenido multimedia directamente.
- Búsqueda web integrada: Dispone de una herramienta de búsqueda basada en Google, para obtener respuestas actualizadas y fiables en tiempo real.
El entorno de trabajo en la terminal es sumamente personalizable, gracias a estándares emergentes como MCP, archivos GEMINI.md y opciones tanto para la configuración individual como en equipos. El proyecto está diseñado con la extensibilidad en mente, por lo que no deja de crecer e incorporar nuevas funcionalidades sugeridas por la comunidad internacional de desarrolladores.
Requisitos previos para instalar Gemini CLI en Ubuntu
Antes de lanzarte a la instalación, asegúrate de cumplir los siguientes requisitos imprescindibles:
- Ubuntu (o distribución basada en Ubuntu) en funcionamiento.
- Permisos de sudo para instalar software y realizar cambios en el sistema.
- Google Account: tendrás que iniciar sesión la primera vez que ejecutes Gemini CLI.
- Node.js versión 20 o superior (preferentemente la más actual).
- npm (el gestor de paquetes de Node.js).
Para comprobar qué versión de Node.js tienes instalada puedes ejecutar en el terminal:
node -v
Si es menor que la requerida, o no está instalado, sigue los pasos siguientes.
Cómo instalar Node.js y npm en Ubuntu
La forma más rápida de instalar Node.js y npm es desde los propios repositorios de Ubuntu. Abre una terminal y ejecuta:
sudo apt-get update sudo apt-get install nodejs -y sudo apt-get install npm -y
Si precisas una versión superior de Node.js (por ejemplo, la 20 o una más reciente), puedes recurrir al repositorio oficial de Nodesource:
curl -fsSL https://deb.nodesource.com/setup_23.x -o nodesource_setup.sh sudo -E bash nodesource_setup.sh sudo apt-get install nodejs -y sudo apt-get install npm -y
TIP: Si ya tenías Node.js instalado y encuentras conflictos, ejecuta de nuevo la instalación de npm tras actualizar Node.js.
Instalación de Gemini CLI en Ubuntu paso a paso
Existen varias formas de instalar Gemini CLI, pero en Ubuntu la opción más cómoda y recomendada es mediante npm, con el siguiente comando:
sudo npm install -g @google/gemini-cli
Con eso, la herramienta quedará disponible como comando global en tu sistema y podrás lanzarla desde cualquier directorio.
Si prefieres evitar la instalación global, también puedes ejecutarla de forma puntual usando npx, aunque para el día a día se recomienda instalarla globalmente.
Primeros pasos tras la instalación: configuración y autenticación
Al ejecutar por primera vez Gemini CLI con el comando:
gemini
aparecerá un asistente interactivo para la configuración inicial. Estos son los pasos habituales:
1. Selección de tema visual
Gemini CLI permite elegir entre distintos colores y estilos para que el entorno se adapte a tus preferencias. Usa las flechas y Enter para confirmar.
2. Método de inicio de sesión
Lo más sencillo es autenticarse con tu cuenta de Google personal, lo que garantiza hasta 60 peticiones por minuto y 1.000 al día en la modalidad gratuita estándar. Si necesitas más capacidad, puedes usar API Keys o Vertex AI:
- API Key de Google AI Studio: accede a Google AI Studio, genera una clave y establécela como variable de entorno
GEMINI_API_KEY
. - API Key de Google Cloud para Vertex AI: desde la consola de Google Cloud, genera la clave y exporta las variables
GEMINI_API_KEY
yGOOGLE_GENAI_USE_VERTEXAI=true
en tu terminal. - Si tienes cuenta de Google Workspace en tu empresa, consulta la guía de autenticación para métodos avanzados.
3. Autenticación mediante navegador
Tras seleccionar el método, la herramienta abrirá una ventana de navegador para que inicies sesión de forma segura. Una vez autenticado, vuelve al terminal y verás un mensaje de confirmación. ¡Ya puedes empezar a usar Gemini CLI!
Cómo usar Gemini CLI tras la instalación
El uso de Gemini CLI es sencillo pero potente. Puedes:
- Iniciar un proyecto en un directorio nuevo o trabajar sobre uno ya existente usando
cd
y ejecutandogemini
. - Interactuar directamente con el modelo IA mediante lenguaje natural: describe tareas, solicita generación de código, saca dudas técnicas, automatiza tareas recurrentes, etcétera.
- Adjuntar archivos locales a la conversación utilizando el caracter
@
. - Descubrir comandos y posibilidades escribiendo
/
en la propia CLI. - Integrar servidores MCP para conectar Gemini CLI con otras herramientas de tu sistema o de colaboración empresarial.
Cada vez que hagas una consulta, Gemini CLI procesará tu petición en el contexto del directorio y archivos donde trabajas, permitiendo manipulaciones específicas sobre tu proyecto.
Solución de problemas frecuentes y consejos útiles
Aunque la instalación suele ser directa, puedes encontrar algunos contratiempos:
- Error de versión de Node.js: Asegúrate de cumplir con la versión mínima, actualiza siguiendo los pasos previos.
- Problema con permisos npm global: Añade
sudo
al comando de instalación si recibes errores de permisos. - Fallo en la autenticación: Comprueba que tu navegador predeterminado está vinculado a la cuenta de Google correcta antes de iniciar Gemini CLI.
- Fallo de red o cambios de modelo: Si tu conexión es inestable, Gemini puede conmutar automáticamente del modelo
gemini-2.5-pro
agemini-2.5-flash
para seguir funcionando con menor latencia.
En cualquier caso, puedes consultar la documentación oficial, la guía de problemas frecuentes o el repositorio de GitHub donde la comunidad y los desarrolladores publican soluciones y actualizaciones.
Usos avanzados y trucos para exprimir Gemini CLI en Ubuntu
Además de interactuar desde el terminal convencional, Gemini CLI puede ejecutarse en terminales integradas de editores como Visual Studio Code, beneficiándote así de la IA en tu flujo de desarrollo diario. Basta con abrir una terminal en VSCode y ejecutar gemini
para comenzar.
Otra funcionalidad avanzada es el manejo de archivos: si en mitad de una conversación necesitas consultar, editar o analizar un archivo concreto, utiliza @
para seleccionarlo y hacer referencia explícita en tu consulta. Gemini lo procesará en contexto.
Para quienes deseen ampliar las capacidades de la CLI o integrarla con sistemas empresariales, los servidores MCP permiten tender puentes con herramientas de tu organización o añadir nuevas funcionalidades. Al tratarse de software open source y extensible, puedes desarrollar tus propios complementos o contribuir con mejoras que la propia comunidad agradecerá.
Opciones de autenticación, planes y limitaciones
Gemini CLI ofrece diferentes formas de autenticación y uso:
- Acceso gratuito con cuenta Google personal: hasta 1.000 peticiones/día y 60/minuto.
- API Key de Google AI Studio: 100 peticiones/día gratuitas, con opción de ampliar bajo pago en la página de claves.
- Vertex AI API (Google Cloud): acceso básico a Gemini 2.5 Pro con modo express, pero posibilidad de elevar límites vinculando una cuenta de facturación.
Para proyectos profesionales o casos de uso intensivo, conviene revisar las limitaciones y considerar los planes de pago disponibles, así como respetar la política de privacidad y términos de servicio.
Comunidad, soporte y filosofía open source
Al ser de código abierto, Gemini CLI invita a la participación activa. Puedes reportar bugs, sugerir nuevas funciones, mejorar la seguridad o aportar código directamente en el repositorio de GitHub oficial. Google y la comunidad global fomentan un espacio colaborativo donde tanto usuarios individuales como equipos pueden adaptar la herramienta a sus necesidades.
Los estándares emergentes que adopta Gemini CLI (como MCP, configuraciones personalizables o prompts de sistema centralizados en archivos GEMINI.md) lo convierten en un entorno único y versátil. Esto permite configuraciones muy avanzadas, ya sea para uso personal como para entornos empresariales y colaborativos.
Herramientas complementarias recomendadas: Apidog
Junto a Gemini CLI, conviene destacar utilidades como Apidog, un entorno integral para documentación, testeo y automatización de APIs. Apidog es compatible con formatos como Postman o Swagger, lo que facilita la transición y la importación de proyectos previos. Su interfaz intuitiva lo hace ideal tanto para desarrolladores expertos como para quienes se inicien en el trabajo con APIs, siendo un gran aliado para mejorar la productividad junto a Gemini CLI.
La integración de IA en el terminal Linux ya es una realidad y está al alcance de cualquiera dispuesto a dar el salto. Gemini CLI destaca por su potencia, flexibilidad y personalización, facilitando tareas cotidianas y complejas tanto para programadores, equipos DevOps como para usuarios avanzados. Con una instalación relativamente sencilla, amplias opciones de autenticación, soporte activo de la comunidad y actualizaciones constantes, esta herramienta se postula como imprescindible para exprimir la IA desde la consola.