CodeCarbon, una herramienta open source que rastrear la contaminación generada por la investigación machine learning
El daño al clima causado por las emisiones de gases de efecto invernadero es más que evidente y para ayudar a la comunidad investigadora a comprender la contribución de la inteligencia artificial al cambio climático y adoptar nuevos paradigmas de investigación en los que la reducción de emisiones se trata como una medida de rendimiento crítica, un grupo de investigadores internacionales de IA y científicos de datos ha colaborado para diseñar software capaz de estimar la huella de carbono de las operaciones de TI.
CodeCarbon es un software de código abierto diseñado para ayudar a las empresas a monitorear su huella de carbono de IA.
Comet, un proveedor de soluciones MLOps, se ha asociado con un consorcio de empresas de ciencia de datos y IA de todo el mundo: MILA, el laboratorio de investigación de IA dirigido por Yoshua Bengio en Montreal, BCG GAMMA, la división de análisis y ciencia de datos de Boston Consulting Group y Haverford College en Pensilvania, para crear el software de código abierto.
Sobre CodeCarbon
CodeCarbon es un software basado en Python que permitirá a los programadores hacer su código más eficiente y reducir la cantidad de CO2 generado por el uso de recursos informáticos y los motivará a hacerlo.
El software no solo estima la cantidad de CO2 producido por el uso de recursos de TI, sino que también brinda a los desarrolladores consejos sobre cómo reducir las emisiones seleccionando su infraestructura en la nube en regiones que usan fuentes de baja energía.
Yoshua Bengio, fundador de MILA y ganador del Premio Turing, dijo:
“La IA es una tecnología poderosa y una fuerza para el bien, pero es importante ser consciente de su creciente impacto ambiental. El proyecto CodeCarbon tiene como objetivo precisamente lograr este objetivo y espero que inspire a la comunidad de IA a calcular, divulgar y reducir su huella de carbono ”.
Sylvain Duranton, Director Gerente y Socio Senior de Boston Consulting Group (BCG) y Director Global de BCG GAMMA, dijo:
“Basado en la historia reciente, el uso de TI en general, y la IA en particular continuará creciendo exponencialmente en todo el mundo. En este contexto, CodeCarbon puede ayudar a las organizaciones a garantizar que su huella de carbono colectiva aumente lo menos posible ”.
En el entorno de investigación centrada en el aprendizaje profundo, los avances en inteligencia artificial se están logrando en gran medida mediante la creación de modelos más grandes, la agregación de conjuntos de datos más grandes y el aprovechamiento de una mayor potencia informática.
El entrenamiento de un poderoso algoritmo de aprendizaje puede requerir el uso de múltiples computadoras durante días o semanas.
Para arquitecturas como VGG, BERT, GPT-2 y GPT-3, que tienen millones de configuraciones y están capacitadas en múltiples GPU durante varias semanas, esta puede ser una diferencia de varios cientos de kilogramos de CO -eq.
El GPT-2 de OpenAI lanzado en 2019 se basa en 1.5 mil millones de parámetros, mientras que su sucesor GPT-3 se lanzó el año pasado, cuyos 175 mil millones de parámetros lo hacen más de 100 veces más grande que su predecesor. A medida que los modelos más grandes continúen avanzando en el campo, la cantidad de energía consumida para entrenarlos también aumentará.
CodeCarbon tiene un módulo de mecanismo de seguimiento que registra la cantidad de energía utilizada por los principales proveedores de computación en la nube y los centros de datos locales alojados de forma privada.
Luego, el sistema utiliza datos de fuentes públicas para estimar el volumen de CO2 generado, verificando las estadísticas de la red eléctrica a la que está conectado el equipo.
El rastreador estima el CO2 producido para cada experimento usando un módulo de IA particular, almacenando datos de emisiones para proyectos y para toda la organización.
La idea es que CodeCarbon ayudará a las empresas de TI e IA a limitar su huella de carbono a medida que crecen. CodeCarbon generará un tablero que permitirá a las empresas ver fácilmente la cantidad de emisiones generadas al entrenar sus modelos de aprendizaje automático.
La capacidad de rastrear las emisiones de CO2 representa un avance significativo en la capacidad de los desarrolladores de utilizar los recursos energéticos de manera inteligente y, por lo tanto, de reducir el impacto de su trabajo en un entorno cada vez más frágil.
Fuente: https://www.comet.ml/