Desde Linux Darkcrizt  

Gemma: el modelo de IA de Google basado en Gemini, ahora está disponible como código abierto

Gemma

Gemma, un nuevo modelo de inteligencia artificial de código abierto

Google dio a conocer, mediante una publicación de blog, el lanzamiento de su nueva familia de modelos de IA basados en el chatbot Gemini, «Gemma«. Este es un modelo de aprendizaje automático que está construido sobre las tecnologías utilizadas para Gemini, el modelo de chatbot de Google y ofrece una gama de variantes que van desde 2 hasta 7 mil millones de parámetros, diseñadas para diferentes aplicaciones y requisitos de hardware.

Gemma tiene como objetivo proporcionar a los desarrolladores herramientas avanzadas para crear aplicaciones de IA de forma consciente y entre las áreas de aplicación que abarcan Gemma, se menciona desde la creación de sistemas de diálogo y asistentes virtuales hasta la generación de texto, respuestas a preguntas en lenguaje natural, resúmenes de contenidos, corrección de textos y apoyo en el aprendizaje de idiomas. Además, el modelo permite la manipulación de varios tipos de datos de texto, incluyendo poesía, código de programación, reescritura de textos y generación de cartas mediante plantillas.

Y es que un aspecto destacado de Gemma es su tamaño relativamente pequeño, lo que facilita su implementación en hardware con recursos limitados, como computadoras portátiles y PC estándar. En las comparaciones realizadas por Huggingface y Google, el modelo Gemma-7B ha demostrado un rendimiento sólido, ocupando el segundo lugar después del modelo LLama 2 70B Chat en la comparación de Huggingface. En la comparación de Google, Gemma-7B se sitúa ligeramente por delante del LLama 2 7B/13B y el Mistral-7B.

Por la parte del ecosistema de herramientas y los marcos de trabajo, el nuevo chatbot de IA ofrece integración con una gran cantidad de herramientas comúnmente utilizadas por los desarrolladores, ya que cuenta con varios proyectos importantes que ya han integrando el soporte para trabajar con Gemma y entre los proyectos que ya cuentan con el soporte se destacan los siguientes: Hugging Face , MaxText , NVIDIA NeMo,  TensorRT-LLM, Transformers, Responsible Generative AI Toolkit entre otras.

Ademas de ello, Google ha lanzado un motor de salida independiente llamado gemma.cpp, escrito en C++, específicamente para Gemma y se ha agregado soporte para Gemma al motor llama.cpp. Para optimizar el modelo, los desarrolladores pueden aprovechar el marco de Keras y los backends para TensorFlow, JAX y PyTorch.

Es importante tener en cuenta que el modelo Gemma tiene un tamaño de 8 mil tokens, lo que limita la cantidad de información que puede procesar y recordar durante la generación de texto (en comparación, modelos como Gemini y GPT-4 tienen tamaños de contexto de 32 mil tokens, y GPT-4 Turbo tiene 128 mil). Además, el modelo Gemma actualmente solo admite inglés como idioma.

Para garantizar los más altos estándares de seguridad, Google empleó técnicas automatizadas para eliminar información personal de los datos de entrenamiento de los modelos Gemma. Además, se utilizó el aprendizaje por refuerzo, guiado por la retroalimentación humana, para refinar las variantes de Gemma adaptadas a las instrucciones, garantizando que se adhieran a patrones de comportamiento responsables.

Google menciona que la naturaleza en constante evolución de la IA plantea importantes consideraciones sobre seguridad y uso ético, ya que en las manos equivocadas, la falta de restricciones en los modelos de IA abiertos puede generar riesgos significativos para la sociedad. Google reconoce estos desafíos y ha adoptado un enfoque integral para abordarlos mediante evaluaciones rigurosas y términos de uso claros, la empresa busca garantizar que los modelos de IA abiertos se utilicen de manera ética y responsable, al tiempo que fomenta la innovación y la colaboración en la comunidad.

Para los interesados, deben saber que Gemma está disponible en dos configuraciones, Gemma 2B y Gemma 7B, este modelo de IA de código abierto ofrece variantes previamente entrenadas y ajustadas por instrucciones para operar de manera eficiente. Ademas, la licencia de Gemma permite su uso gratuito en proyectos de investigación, personales y comerciales, así como la creación y distribución de versiones modificadas del modelo.

Finalmente si estás interesado en poder conocer más al respecto, puedes consultar los detalles en el siguiente enlace.

Leave A Comment

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.