MuyLinux Eduardo Medina  

ByteDance (TikTok) publica sus modelos de IA Seed-OSS como código abierto

Según informan en VentureBeat, ByteDance, la empresa matriz de TikTok, ha publicado dos nuevos modelos de lenguaje grande (LLM), Seed-OSS-36B-Base y Seed-OSS-36B-Instruct, para razonamiento avanzado. Según la compañía, ambos modelos son de código abierto bajo la licencia Apache 2 y pueden ser encontrados en GitHub bajo el paraguas de su Seed Team.

El modelo Seed-OSS-36B-Base está disponible en dos versiones, una con datos sintéticos y otra sin datos sintéticos, mientras que Seed-OSS-36B-Instruct se diferencia del otro por el hecho de que está posentrenado con datos de instrucciones para priorizar la ejecución de tareas y el seguimiento de instrucciones en lugar de servir puramente el modelo base.

El Seed-OSS-36B-Base con datos sintéticos está entrenado con datos de instrucciones adicionales, permitiéndole así ofrecer mejores resultados en las pruebas de rendimiento estándar y está más dirigido al propósito general de alto rendimiento. Por su parte, la versión sin datos sintéticos omite estas adiciones, creando así una base más limpia que evita sesgos y distorsiones introducidos por los datos de instrucción sintéticos.

La permisividad de la licencia Apache 2 abre la puerta al uso de los modelos en prácticamente cualquier contexto, desde aplicaciones comerciales hasta internas de una empresa o dirigidas a los clientes, todo sin ningún coste para los usuarios y desarrolladores tanto para usar los propios modelos como las API asociadas. Seed Team posiciona sus LLM para aplicaciones internacionales, haciendo énfasis en la versatilidad del razonamiento, la ejecución de tareas de forma similar a como lo haría un agente y entornos multilingües.

El Seed Team de ByteDance ha resaltado la accesibilidad de sus LLM para desarrolladores y profesionales, ya que estos pueden ser implementados con Hugging Face Transformers, empleando cuantización de 4-bit u 8-bit, para reducir los requerimientos de memoria. Además, también pueden ser integrados con vLLM para un servicio escalable, abarcando ejemplos de configuraciones e instrucciones para el servidor de la API. Para reducir todavía más las barreras hay scripts para la inferencia, personalización de prompts, integración de herramientas y más opciones con el fin de poder adaptar las implementaciones de los modelos a diversos contextos.

Los modelos Seed-OSS-36B-Base y Seed-OSS-36B-Instruct de ByteDance podrían ser una respuesta a los gpt-oss-120b y gpt-oss-20b publicados este mismo mes por OpenAI, los cuales también están disponibles a través del mismo alojamiento de repositorios y bajo la misma licencia. De hecho, y teniendo en cuenta que cada empresa tiene su enfoque, ambas pretenden con sus modelos de código abierto abrir el abanico de usuarios reduciendo los requisitos y ampliando los contextos en los que pueden ser utilizados.

Parece que los últimos movimientos en torno a la inteligencia artificial se centran más en la accesibilidad y en hacer que la mayor cantidad de usuarios puedan utilizar los modelos. Esto tiene sentido, sobre todo si se pretende que el sector siga creciendo. Sin embargo, son cada vez más las voces que denuncian que en torno a la inteligencia artificial hay una burbuja que podría explotar de la peor manera, recordando al episodio conocido como la burbuja puntocom.

La entrada ByteDance (TikTok) publica sus modelos de IA Seed-OSS como código abierto es original de MuyLinux

Leave A Comment

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.