Gemini 3 llega con razonamiento mejorado, multimodalidad y ventana de contexto de 1 millón de tokens.

Google ha presentado Gemini 3, su nueva generación de modelo de inteligencia artificial orientada a combinar razonamiento avanzado, comprensión del contexto y capacidades multimodales. La compañía lo posiciona como su sistema más capaz hasta la fecha, diseñado para interpretar matices y resolver tareas complejas con menos idas y venidas.
En el despliegue inicial, la app de Gemini y las herramientas para desarrolladores integran desde ya esta versión, mientras que el Modo IA en la Búsqueda se estrena primero en Estados Unidos. En España y el resto de Europa, Google prioriza el acceso a través de la aplicación, la API y los servicios de nube, junto a una ampliación de idiomas que incluye catalán, euskera y gallego.
Qué aporta Gemini 3 y por qué es relevante
Gemini 3 combina en un solo sistema la experiencia acumulada de las generaciones anteriores y un salto en razonamiento y comprensión del contexto. La compañía sostiene que el modelo “capta las pistas sutiles” en ideas creativas y descompone problemas complejos por capas, con respuestas más precisas y menos necesidad de reformular la consulta.
Este enfoque se concreta en respuestas más concisas que priorizan la información útil frente a los clichés, un comportamiento que Google venía probando para reducir la adulación y mejorar la solidez factual. Además, la naturaleza multimodal del modelo permite trabajar con texto, imágenes, audio y vídeo en la misma interacción.
Rendimiento en pruebas independientes y comparativas
Según las métricas publicadas por Google y rankings públicos, Gemini 3 Pro encabeza LMArena con 1.501 puntos ELO, superando a su predecesor. En evaluación académica, alcanza un 37,5% sin herramientas en Humanity’s Last Exam y un 91,9% en GPQA Diamond; en matemáticas firma un 23,4% en MathArena Apex.
El modo de razonamiento reforzado Deep Think lleva aún más lejos estos resultados, con un 41,0% en Humanity’s Last Exam y un 93,8% en GPQA Diamond. En ARC-AGI-2, con ejecución de código, registra un 45,1%, indicador del avance en razonamiento abstracto y comprensión visual.
Multimodalidad y una ventana de contexto enorme en Gemini 3
Uno de los grandes cambios es la ventana de contexto de 1 millón de tokens, que facilita el análisis de repositorios de código extensos, papers o vídeos largos. El modelo puede, por ejemplo, traducir y unificar recetas manuscritas para crear un recetario familiar, o convertir materiales complejos en visualizaciones y tarjetas interactivas.
La lectura multimodal se refleja en pruebas como MMMU-Pro (81%) y Video-MMMU (87,6%), y en SimpleQA Verified (72,1%), donde el foco está en una mayor precisión factual. En el Modo IA, integrado en la Búsqueda, Google enseña elementos interactivos —como widgets y simulaciones— para explicar conceptos sobre la marcha.
Programación y agentes: el impulso de Antigravity
En tareas de desarrollo, Gemini 3 lidera WebDev Arena con 1.487 ELO, alcanza un 54,2% en Terminal-Bench 2.0 y un 76,2% en SWE-bench Verified, lo que se traduce en más solvencia para generar código, usar herramientas y operar un entorno de terminal.
La novedad más destacada para construir agentes es Google Antigravity, una plataforma que da a los agentes acceso al editor, al terminal y al navegador. Con ello, el sistema puede planificar y ejecutar flujos de software de extremo a extremo, validando su propio código y dejando al desarrollador la revisión y auditoría final.
Seguridad, pruebas externas y despliegue responsable
Google afirma que este es su modelo más seguro hasta la fecha, reforzado contra la adulación y más resistente a inyecciones de prompt y usos indebidos (por ejemplo, ciberataques). La evaluación se enmarca en su Frontier Safety Framework y se ha contrastado con expertos externos, incluyendo el AISI del Reino Unido y firmas como Apollo, Vaultis y Dreadnode.
El modo Deep Think se somete a validaciones adicionales antes de llegar a los suscriptores de Google AI Ultra, debido al alcance de sus capacidades de planificación y uso de herramientas. La compañía enfatiza un despliegue gradual y medido a escala de productos y regiones.
Disponibilidad de Gemini 3
El previo de Gemini 3 Pro está accesible en la app de Gemini y en la API para desarrolladores a través de AI Studio y Vertex AI. La interfaz suma 30 nuevos idiomas, incluyendo catalán, euskera y gallego, lo que facilita su adopción en contextos locales.
El Modo IA en la Búsqueda arranca en Estados Unidos y se irá extendiendo; mientras tanto, empresas y equipos técnicos pueden integrar Gemini 3 en sus flujos con Vertex AI y Gemini Enterprise, además de la nueva CLI y la plataforma Antigravity para agentes.
Casos de uso: de aprender mejor a automatizar tareas
Más allá del chat, el modelo puede transformar contenidos complejos en experiencias interactivas con gráficos, calculadoras o simulaciones. Es útil para estudiar conceptos técnicos, analizar partidos deportivos y proponer planes de entrenamiento, o desglosar papers y generar guías navegables.
En el día a día, los agentes pueden clasificar el correo de Gmail, planificar viajes o ejecutar tareas de varios pasos combinando razonamiento, llamadas a herramientas y control del navegador, siempre con supervisión humana para mantener el control.
Google sostiene que el impacto de Gemini crece: “Vista Creada con IA” llega a 2.000 millones de usuarios mensuales, la app de Gemini supera los 650 millones al mes, el 70% de los clientes de Cloud usa sus capacidades de IA y 13 millones de desarrolladores han construido soluciones con sus modelos. Son cifras que apuntalan el despliegue de Gemini 3 en el ecosistema de productos.
Con su apuesta por el razonamiento, la multimodalidad y los agentes, Gemini 3 se perfila como la base común de la estrategia de IA de Google: una plataforma más directa, menos complaciente y con mayor contexto, que en España puedes empezar a usar desde la app de Gemini y, si desarrollas, desde AI Studio y Vertex AI; la Búsqueda con Modo IA se irá activando por mercados.
