BrowserOS, el navegador agentico y abierto que automatiza la web con el objetivo de plantar cara a Comet y Atlas

BrowserOS

Si has oído hablar de BrowserOS y te preguntas por qué tanta gente está hablando de un «navegador con cerebro», aquí vas a encontrar la foto completa. BrowserOS es un navegador de código abierto que incorpora agentes de IA capaces de entender instrucciones en lenguaje natural y ejecutarlas, clicando, escribiendo y navegando por ti con tus sesiones iniciadas y de forma local. Todo ello con un enfoque de privacidad por defecto y sin depender de infraestructuras en la nube para tus datos personales.

La propuesta no es una ocurrencia más en el mundo de los navegadores: BrowserOS nace como un fork de Chromium, con compatibilidad con tus extensiones de Chrome y un objetivo claro: ser una alternativa abierta y centrada en la privacidad a soluciones como Atlas (ChatGPT), Comet (Perplexity) o Dia, además de los navegadores tradicionales. La idea es sencilla de explicar y potente en su impacto: tú describes la tarea y un agente la lleva a cabo desde tu propio equipo, con tus credenciales y sin enviar tu historial a terceros.

¿Qué es BrowserOS y en qué se diferencia?

En esencia, BrowserOS es un navegador que ejecuta agentes de IA nativamente. Te permite redactar instrucciones como si se las explicaras a un compañero y el sistema se encarga de realizar la secuencia de acciones: abrir páginas, iniciar búsquedas, completar formularios o extraer datos. No es un asistente externo que «mira» tu navegador: los agentes viven dentro del propio BrowserOS.

Al estar construido sobre Chromium, la experiencia resulta familiar desde el minuto uno: interfaz reconocible, compatibilidad con extensiones, importación de datos de Chrome y adopción prácticamente instantánea para quien ya se mueve en ese ecosistema. Ese «se siente como en casa» reduce la fricción para empezar a automatizar sin sacrificar usos cotidianos.

Por qué ahora: el momento de los agentes en el navegador

En los últimos meses, las herramientas de programación asistida por IA han multiplicado la productividad de los desarrolladores. Sin embargo, millones de profesionales del conocimiento siguen atrapados en tareas repetitivas de navegador: copiar-pegar, rellenar formularios, exportar datos de dashboards, lanzar campañas, etc. Es un cuello de botella diario.

El equipo de BrowserOS plantea que, por primera vez desde los tiempos de Netscape, tenemos la oportunidad de reimaginar el navegador para el trabajo real. Si la IA ya «escribe» proyectos enteros, ¿por qué no puede también pulsar botones, desplazarse por una interfaz web o concatenar acciones como lo harías tú, pero sin que tengas que estar a los mandos todo el rato?

Los problemas que ataja BrowserOS

Antes de BrowserOS, el despliegue de agentes en tareas reales fallaba por motivos muy concretos. El proyecto identifica tres frenos principales que dificultaban su adopción masiva, especialmente en empresas:

Acceso a sesiones autenticadas: Muchas soluciones de agentes se ejecutan en máquinas remotas y no pueden operar con tus cuentas reales (Gmail, LinkedIn, herramientas corporativas). Resultado: se quedan cortas en tareas de verdad.
Fragmentación de herramientas: Unos agentes hablan con servidores MCP, otros hacen solo automatización web, otros encadenan APIs como si fueran Zaps. Falta una «caja de herramientas» unificada para construir flujos complejos.
Caja negra y cierre: Varios navegadores populares son productos de búsqueda o publicidad. No abren sus prompts ni su funcionamiento interno, te fijan un LLM concreto y derivan datos a sus servidores. Para muchas empresas, eso es un no rotundo.

BrowserOS responde desde la base: agentes dentro de tu navegador, corriendo en tu equipo, combinando MCP y automatización, y bajo una filosofía 100% abierta que puedes auditar y forkar cuando quieras. Esa suma resuelve lo que hasta ahora hacía inviable delegar trabajo serio a la IA en el navegador.

Cómo funciona BrowserOS y primeros pasos

El flujo es directo: descargas e instalas BrowserOS como cualquier navegador, inicias sesión en los sitios que usas a diario y, desde ahí, describes tareas en lenguaje natural. El agente actúa en tu contexto real, con tus permisos y sesiones activas, como si fueras tú frente a la pantalla.

Descarga e instalación de BrowserOS para tu sistema (disponible para macOS, Windows y Linux). Si te preocupa la instalación en Linux, está como AppImage en GitHub.
Importa tus datos de Chrome si te interesa mantener marcadores, historial o configuraciones.
Conecta tu proveedor de IA: OpenAI, Anthropic o modelos locales vía Ollama/LM Studio, con tus propias claves.
Empieza a automatizar: formula objetivos en texto y deja que el agente ejecute los pasos en la web.

Además, puedes combinar automatización de navegador con servidores MCP y llamadas a APIs en un mismo flujo. Esa mezcla permite montar asistentes capaces de raspar datos, procesarlos en un modelo y actualizar hojas de cálculo o herramientas SaaS, todo encadenado por un solo agente.

Características clave de BrowserOS que marcan la diferencia

Construcción de agentes en lenguaje natural: di lo que quieres, sin programar.
Libertad de modelos: trae tus claves y alterna LLMs, o ejecuta modelos locales.
Es un navegador «normal»: base Chromium, funcionan tus extensiones de Chrome.

La privacidad es un pilar del diseño: tus datos, historial y sesiones se quedan en tu ordenador, sin telemetría invasiva ni dependencia de nubes ajenas. Si lo prefieres, puedes trabajar exclusivamente con modelos locales y cerrar el grifo por completo.

Por si fuera poco, están trabajando en un bloqueador de anuncios potenciado por IA que promete cubrir escenarios más complejos que los filtros estáticos. Y, para desarrolladores y power users, hay soporte para usar el navegador como servidor MCP, integrándolo con herramientas como claude-code o gemini-cli.

Integraciones, MCP y uso desde herramientas externas

Una de las bazas más potentes es que BrowserOS puede operar como servidor MCP. Esto significa que otras aplicaciones compatibles con el protocolo (como las citadas claude-code o gemini-cli) pueden «hablar» con tu navegador y delegar tareas de interfaz web a sus agentes.

Lo interesante es la orquestación: no necesitas elegir entre automatizar el navegador o llamar a una API. Puedes hacer ambas cosas en la misma receta de agente. Por ejemplo, extraer datos de un portal con UI complicada, procesarlos con un modelo y, acto seguido, cargar el resultado en una hoja o un CRM, sin mezclar manualmente herramientas.

Comparativa rápida con Chrome, Brave, Arc/Dia y Perplexity Comet

Frente a Chrome

Gracias al open source de Chromium, BrowserOS hereda la base, pero Chrome lleva años sin grandes avances nativos de IA para automatización. Sin MCP, sin agentes locales, sin esa capa de orquestación integrada, se queda como un gran navegador… sin «asistente que hace clic por ti».

Frente a Brave

Brave abrió camino en privacidad, pero su foco está repartido entre cripto, búsqueda, VPNs y más frentes. BrowserOS va a lo suyo: IA en el navegador y automatización real del trabajo.

Frente a Arc/Dia

Mucha gente valoró la propuesta de Arc, pero cerró su código y dejó a usuarios en el aire. En BrowserOS es justo al revés: 100% abierto, auditable, forkeable, con comunidad implicada y sin dependencia de un proveedor único.

Frente a Perplexity Comet

Perplexity es, al final, una empresa de búsqueda y anuncios. Tu historial puede convertirse en producto. En BrowserOS, la promesa es tajante: datos locales y control completo por tu parte.

Seguridad, privacidad y licencia

La filosofía es «privacy-first»: usas tus propias claves de API o modelos locales con Ollama/LM Studio, eliges qué sale y qué no de tu equipo y mantienes el historial y sesiones fuera del alcance de terceros.

A nivel legal y de comunidad, BrowserOS es software libre bajo licencia AGPL-3.0. Puedes ver cómo está hecho, revisar prompts del sistema, proponer cambios, bifurcar el proyecto y contribuir. Todo ello con el espíritu «hecho con cariño desde San Francisco» que mencionan sus creadores.

Comunidad, cifras e impulso del proyecto

El interés es palpable. Se habla de más de 4,3k estrellas en GitHub, 25.000+ descargas y una comunidad de Discord por encima del millar de personas participando de forma activa. En otro fragmento aparecen métricas como «6,3k» y «558» (relacionadas con el repositorio, previsiblemente estrellas/seguidores/ramas), lo que sugiere una evolución al alza.

En lo técnico, el proyecto destaca por su base C++ sobre el coloso de Chromium, una travesía exigente que requiere picar mucha piedra y mantener compatibilidad con cambios upstream sin dejar de innovar en la capa de agentes.

Casos de uso y demos

Piensa en tareas reales: identificar perfiles de interés entre tus solicitudes de LinkedIn y añadirlos a una hoja de Google, cumplimentar formularios largos, recopilar datos de varias webs o preparar un «prebriefing» con información clave para una reunión. Lo cuentas en texto y el agente navega y actúa como lo harías tú.

Hay material audiovisual que muestra el concepto en marcha: demos como «HackerNews.top.3.mp4», «use-browserOS-to-chat.mp4» o «use-browserOS-to-extract.mp4» enseñan desde conversaciones asistidas a extracción de datos en sitios reales, reforzando que la automatización sucede en tu contexto auténtico.

Visión: el navegador como «sistema operativo» para agentes

Las empresas viven en el navegador: Salesforce, SAP, Workday, herramientas internas… Un ejército de trabajadores del conocimiento se pasa el 60–80% del día en apps web. Si un agente puede clicar y escribir como una persona, podrá automatizar prácticamente cualquier interfaz, incluidas aquellas sin APIs.

La visión que plantea el proyecto es que IT pueda desplegar «agentes-empleado» reutilizables: el «agente de gastos» de la compañía, el «agente de anuncios en Facebook» compartido por la comunidad que tú adaptas a tu flujo, etc. Menos tareas mecánicas, más foco en lo que aporta valor.

Quién hay detrás de BrowserOS

El núcleo del proyecto lo lideran dos hermanos gemelos con trayectoria seria en Big Tech. Nikhil ha trabajado en el backend de Reels y el feed de Facebook con C++ y sistemas, y Nithin ha sido ingeniero de ML en YouTube, participando en el primer gran modelo de recomendación (LRM) de la plataforma. Esa mezcla de low-level y capa de IA les da soltura para lidiar con Chromium y, a la vez, construir el «cerebro agente» encima.

Experiencia en C++ y sistemas a gran escala: mantenimiento de servicios críticos y de alto rendimiento.
Especialización en ML y recomendadores: entendimiento profundo de modelos modernos y su despliegue.

Voces de la comunidad y alternativas menos conocidas

Entre usuarios avanzados hay apetito por navegadores «diferentes» con potencial. Se han probado alternativas como Wavebox, Ulaa, Arc, Ghost Browser o Thorium, y se valora Zen Browser por productividad (aunque no sea Chromium). En esas pruebas se comenta que Wavebox es completísimo pero puede abrumar y que desbloquearlo al máximo cuesta; Ulaa presume de privacidad pero trae demasiados extras; Arc ha generado reacciones diversas; y Ghost Browser no termina de convencer.

Sobre Thorium, se oye que es muy rápido pero con ciertas dudas de seguridad, motivo por el que algunos lo aplazan. Y a menudo se pide no recomendar los más conocidos porque ya se han catado una veintena y el objetivo es descubrir rarezas que aporten algo realmente nuevo.

Guía breve de uso con agentes

Una vez dentro, el «momento mágico» llega cuando describes tareas reales. En lugar de pedir «que busque tal cosa» y devolver un resumen, el agente ejecuta la interacción en tu navegador. Si la web no tiene API, da igual: hay UI, hay acciones que un agente puede replicar con precisión.

Describe tu objetivo: por ejemplo, localizar contactos específicos en una red profesional y volcar su info en una hoja.
Confirma los pasos si el agente te los propone (útil para auditar lo que hará).
Supervisa la primera vez para ajustar prompts o reglas. Luego, reutiliza la receta.

El uso de MCP y la posibilidad de «coser» automatización, APIs y modelos permiten que un único agente resuelva de punta a punta procesos completos, algo que antes requería pegar varias herramientas con duct tape.

Privacidad por diseño y control de modelos

Un beneficio clave es la libertad para elegir el motor de IA. Puedes trabajar con OpenAI, Anthropic o mantener todo local con Ollama/LM Studio, intercambiando según coste, latencia o sensibilidad del proyecto. Quien prioriza privacidad absoluta tiene una ruta 100% local.

Además, el proyecto publica y permite editar los prompts del sistema, algo poco común. Esa transparencia facilita ajustar el comportamiento del agente a tu organización o caso concreto y auditar cómo toma decisiones.

Pasos para aportar al proyecto BrowserOS

Si crees en la idea y quieres echar un cable, hay varias formas de apoyar. Dejar una estrella en GitHub ayuda a dar visibilidad; descargarlo y usarlo aporta telemetría de interés (si la activas) y feedback; y entrar al Discord permite proponer, descubrir y testear novedades.

Por último, en el sitio oficial suele aparecer el recordatorio de descargar el navegador para tu sistema, importar si quieres tus datos de Chrome y conectar el proveedor de IA de tu preferencia. A partir de ahí, es cuestión de ir creando tus agentes y compartir lo que te funcione.

Mirando todo el panorama, BrowserOS se consolida como un navegador open source de enfoque agentico, con privacidad por bandera, base Chromium y comunidad creciente. Aúna compatibilidad con extensiones, MCP, soporte para modelos locales (Ollama/LM Studio) y un compromiso de apertura que incluye licencia AGPL-3.0 y prompts editables. Frente a Chrome, Brave, Arc/Dia o propuestas ligadas a la publicidad y la búsqueda, apuesta por traer la «magia» de la IA directamente al sitio donde trabajas cada día. Y aunque aún hay detalles por pulir (como un bloqueador de anuncios con IA que llegará, o incidencias de instalación puntuales en Windows), el ritmo y la implicación de los usuarios apuntan a un proyecto que va a más, construido con «cariño» desde San Francisco y con ganas de que la web deje de ser una cadena de clics y pase a ser, por fin, una plataforma para agentes que curren contigo.

Tagged Programas, Software Libre

Linux-OS.net