Linux Adictos Pablinux  

OpenAI revoluciona la IA con GPT-OSS: un modelo de pesos abiertos para todos

GPT-OSS

OpenAI ha dado un giro inesperado al panorama de la inteligencia artificial con el lanzamiento de GPT-OSS, su primer modelo de peso abierto en más de un lustro. Este desarrollo supone una ruptura respecto a la estrategia reciente de la compañía, que había apostado principalmente por modelos propietarios y servicios cerrados. Con la llegada de GPT-OSS, OpenAI vuelve a sus raíces, abriendo la puerta para que cualquier persona o entidad pueda acceder, ejecutar y personalizar un potente modelo de lenguaje sin depender de su plataforma en la nube ni de conexiones a internet.

El nuevo modelo está disponible en dos versiones: una de 120.000 millones de parámetros y otra más ligera de 20.000 millones. La variante más potente se puede ejecutar en una única GPU profesional con al menos 80 GB de memoria, mientras que la versión menor está orientada a ordenadores y portátiles convencionales con 16 GB de RAM, lo que democratiza notablemente el acceso a capacidades avanzadas de IA. Ambas versiones pueden descargarse gratuitamente de plataformas como Hugging Face y desplegarse en servicios conocidos como Azure o AWS.

Características técnicas y tecnología empleada

Con GPT-OSS, OpenAI ha puesto sobre la mesa dos modelos diseñados con una arquitectura basada en Transformer y mixture-of-experts (MoE). Esto permite optimizar el uso de memoria y la latencia al activar solo una fracción selecta de expertos por cada token de entrada, incrementando la eficiencia sin sacrificar potencia. La edición de 120B utiliza 36 bloques y activa 5.100 millones de parámetros por token, mientras que la de 20B emplea 24 bloques y activa 3.600 millones, lo que favorece su ejecución en hardware más asequible.

Ambos modelos han sido entrenados principalmente con datos en inglés de áreas STEM, programación y conocimiento general, incluyendo una fase adicional de ajuste supervisado y refuerzo para mejorar su alineación con instrucciones humanas. Entre sus capacidades destacan el razonamiento encadenado (chain-of-thought), la posibilidad de desglosar los pasos intermedios antes de ofrecer una respuesta, así como el manejo de herramientas externas como navegación web o ejecución de código Python.

Disponibilidad, licencia y opciones de integración

Uno de los grandes atractivos de GPT-OSS es su licencia Apache 2.0, que elimina muchas de las restricciones habituales de otros modelos cerrados: permite su uso comercial, redistribución e integración en todo tipo de proyectos, desde pequeñas startups hasta grandes organismos públicos o iniciativas de I+D. Los pesos de los modelos están disponibles en formato MXFP4 y cuentan con implementaciones de referencia en PyTorch y Apple Metal, así como compatibilidad total con herramientas como Ollama, llama.cpp, LM Studio y vLLM, facilitando su uso tanto en entornos profesionales como domésticos.

La instalación y puesta en marcha de GPT-OSS-20B resulta especialmente sencilla gracias a utilidades como LM Studio, que permite a usuarios sin experiencia en programación descargar y probar el modelo localmente mediante una interfaz gráfica. Además, OpenAI ha publicado recomendaciones y documentación detallada para afinar y adaptar los modelos mediante fine-tuning, así como integraciones listas para plataformas cloud y on‑premise.

Seguridad, pruebas y enfoque responsable

El lanzamiento de GPT-OSS no solo ha estado centrado en la apertura, sino también en la seguridad y el uso responsable de los modelos. OpenAI ha incorporado nuevos mecanismos de revisión y validación para evitar riesgos asociados al uso indebido, especialmente en áreas sensibles como la ciberseguridad o la creación de agentes maliciosos. Para ello ha implementado una metodología de pruebas adversarias (red teaming), con revisiones externas de expertos independientes y protocolos para simular escenarios de explotación extrema.

Junto a la publicación de los modelos, OpenAI ha puesto en marcha un reto de red teaming con recompensas económicas para quienes identifiquen vulnerabilidades o comportamientos problemáticos, buscando así la colaboración activa de la comunidad global en la detección de riesgos. Además, GPT-OSS expone su cadena de razonamiento, facilitando la auditoría de respuestas y el monitoreo para evitar sesgos o errores delicados.

Rendimiento y comparación con otros modelos abiertos

En los benchmarks académicos y pruebas de razonamiento, GPT-OSS-120B se sitúa a la par, e incluso supera en ciertos apartados, a modelos propietarios recientes de OpenAI como o4-mini, y aventaja a otros como DeepSeek R1 o la serie Llama en determinados contextos. La versión 20B, ajustada a dispositivos domésticos, mantiene una excelente relación entre eficiencia y capacidad, con puntuaciones muy competitivas en tareas matemáticas, de código y salud.

OpenAI advierte que estos modelos abiertos pueden presentar una mayor propensión a «alucinaciones» (errores factuales) respecto a sus homólogos en la nube, habida cuenta de las diferencias en el entrenamiento y monitorización. Sin embargo, los usuarios ahora tienen la posibilidad de utilizar modelos de alto nivel sin necesidad de servicios en línea.

Leave A Comment

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.