La escena

Blockchain y las criptomonedas han sido criticadas durante años como una “solución en busca de un problema”.

Ahora algunos empresarios de la industria pueden haber encontrado el problema: una escasez de potencia informática necesaria para entrenar modelos de IA.

La solución: los investigadores y las nuevas empresas que no pueden obtener unidades de procesamiento de gráficos (GPU) pueden utilizar los mercados basados ​​en blockchain para acceder rápida y fácilmente a la potencia informática por una fracción de lo que cobran los principales proveedores.

Los mineros de Bitcoin y otros impulsaron una carrera armamentista por las GPU necesarias para realizar cálculos para mantener los sistemas en funcionamiento, pero la demanda se desplomó cuando el mercado de divisas digitales colapsó el año pasado. Ahora, en lugar de simplemente canibalizar la industria de la criptografía en dificultades, algunas empresas de inteligencia artificial se están apoyando en la cadena de bloques para distribuir esas mismas GPU.

Ishan Dhanani, un estudiante de posgrado en informática de la Universidad de Columbia, es un ejemplo de cómo las empresas emergentes están solucionando la escasez de GPU a través de blockchain. Quería comenzar a afinar el modelo de IA de código abierto LLama2 de Meta para experimentar con él, pero se topó con la realidad de que grandes empresas se han tragado la mayor parte de la potencia informática.

No podía conseguir ninguno a través del líder del mercado Amazon Internet Services y los proveedores más pequeños siempre estaban agotados. Obtener acceso a través de Columbia también fue un dolor de cabeza.

Eso lo llevó a Akash Community, una de las pocas empresas que han creado protocolos para permitir a los propietarios de GPU alquilarlas en la cadena de bloques, ganando tokens por cada minuto que se utiliza la GPU. Dhanani pudo acceder a una Nvidia A100 de 15.000 dólares por 1,10 dólares la hora a través de Akash. Le tomó alrededor de siete horas completar su trabajo, por aproximadamente el costo de una cerveza.

Empresas como Akash pueden ofrecer un acceso más económico en parte porque los protocolos están configurados para funcionar por sí solos, como una versión de Airbnb o Uber sin que esas empresas cobren comisiones. Los miembros de la comunidad en la cadena de bloques, incentivados con tokens, manejan los aspectos prácticos de la operación. Como resultado, los costos son bajos y nadie, excepto los propietarios de las GPU, obtiene ingresos significativos por la transacción.

La experiencia impulsó a Dhanani y dos amigos a lanzar Agora Labs hace unos meses para ayudar a los que él llama «los pobres de GPU» a reservar tiempo en GPU a través de blockchain. «OpenAIs y Anthropics no pueden ser los únicos que tienen el poder de entrenar y alojar modelos como ChatGPT», dijo.

Gensyn, con sede en el Reino Unido, que recientemente anunció una ronda de financiación Serie A de 43 millones de dólares, representa una enorme apuesta de funds de riesgo a que blockchain tiene futuro facilitando la venta de tiempo de GPU para la industria de la IA.

Gensyn está construyendo un sistema que simplificaría enormemente el modelo de precios para la formación en IA, según una entrevista con los cofundadores de la empresa. En lugar de pagar por el tiempo en una GPU, Gensyn planea estimar el tiempo total y el costo del trabajo de capacitación y luego distribuir las tareas entre computadoras de todo el mundo, buscando los mejores precios.

Esa estrategia implica abordar un problema tecnológico espinoso: cuanto más dispersos están los recursos informáticos, más complicada se vuelve la capacitación.

El cofundador de Gensyn, Harry Grieve, dijo que cuando estaba obteniendo su doctorado en aprendizaje profundo, la escasez de recursos informáticos le impidió completar por completo su investigación sobre la automatización del desarrollo de modelos de IA.

«Las únicas personas que podían hacer esa investigación eran Google y Microsoft», dijo. «Me di cuenta de que si yo estaba en esa posición, muchas otras personas en el mundo estaban en esa posición, lo que significaba que no estábamos avanzando tan rápido como podríamos hacia un futuro de aprendizaje automático».

Saber más

Grieve dijo que la investigación de la IA ha evolucionado en torno a los procesadores gráficos más potentes del mundo. Pero argumentó que si hubiera una pink masiva de GPU disponibles en la cadena de bloques, los tipos de modelos de IA se adaptarían para poder entrenarlos en una variedad más amplia de procesadores.

Mientras Gensyn prepara su producto, Akash Network dice que pronto ayudará a facilitar el entrenamiento del primer modelo básico de IA que utiliza GPU en blockchain. La startup Thumper AI está creando un producto que permitirá a los artistas crear sus propios modelos de IA basados ​​en su trabajo personal y luego vender el acceso a esos modelos. Para hacerlo, necesita acceso a GPU para ajustar su modelo propietario utilizando Stable Diffusion.

Pero el director ejecutivo de Thumper, Logan Cerkovnik, se topó con un problema acquainted: AWS no le daba acceso a la cantidad de GPU que necesitaba para entrenar el modelo. También analizó algunos proveedores y empresas más pequeños que revenden espacio de GPU. Pero dijo que la solución blockchain tenía más sentido. Con los proveedores de centros de datos, dijo, hay conversaciones con los vendedores, negociaciones de precios y un proceso de investigación. En Akash, la transacción es rápida y sencilla, dijo.

Algunas empresas que proporcionan potencia informática a empresas de cifrado han comenzado a ofrecer esos recursos a la industria de la inteligencia synthetic, como Foundry Digital. Reutilizó sus centros de datos, utilizados principalmente para extraer Bitcoin y otras criptomonedas, para ejecutar modelos de inteligencia synthetic a través de otra plataforma descentralizada, Bittensor. También permite alquilar sus GPU en blockchain a través de Akash. «Nos preguntamos ‘¿de qué otra manera podemos respaldar la tesis de la infraestructura descentralizada que sostiene Foundry en su conjunto?'», dijo Tommy Eastman, líder de ingeniería de computación acelerada.

Si bien se utilizan protocolos como Akash para entrenar modelos de IA, Bittensor se utiliza para ejecutar esos modelos, un proceso conocido como «inferencia». En Bittensor, los usuarios pueden jugar con un chatbot very similar a ChatGPT. La diferencia es que cada mensaje se envía a una amplia crimson de entidades en la cadena de bloques, a las que se les asigna el mensaje según las necesidades informáticas. La oferta ganadora recibe criptomonedas como pago.

La vista de Reed

En tecnología, las personas que construyen plataformas a menudo no pueden imaginar cómo se utilizarán en última instancia. Steve Careers probablemente nunca pensó que el Apple iphone habilitaría Uber. Mark Zuckerberg probablemente no imaginó que Facebook conduciría a la creación de Zynga.

La notion detrás de blockchain es construir una plataforma que acabe con todas las plataformas: el lienzo definitivo para el desarrollo de nuevas ideas, sin un propietario central, que no pueda ser corrompido ni manipulado. Claro, es idealista y posiblemente ingenuo. Y la cadena de bloques ha atraído a muchas personas desagradables que vieron la oportunidad de ganar dinero rápido.

Y sin embargo, aquí estamos. Otra plataforma con un caso de uso no deseado que parece, bueno, bastante útil. Es irónico porque los enormes recursos informáticos necesarios para que la industria de la criptografía funcione se consideraban casi como el talón de Aquiles de la industria. Empresas como Tesla dejaron de aceptar Bitcoin porque consumía demasiada energía y, por lo tanto, contribuía en gran medida al cambio climático.

Ese talón de Aquiles puede convertirse en la gracia salvadora de las criptomonedas. Blockchain se volvió realmente bueno en vender eficientemente potencia informática al mejor postor con muy poco problema. Y ahora, la moda de la IA generativa ha generado una nueva industria que eat incluso más energía que las criptomonedas. Y, a diferencia de las criptomonedas, es poco possible que se desacelere en el corto plazo.

Hay otra razón por la que esto podría funcionar: no es un system para hacerse rico rápidamente. Uno de los mayores problemas con las criptomonedas fue que la especulación financiera esencialmente echó a perder todas sus tips. La gente inventó las “ofertas iniciales de monedas” y los esquemas de bombeo y descarga inmediatamente arruinaron la notion. Tan pronto como se crearon los tokens no fungibles (NFT), los especuladores subieron los precios tan rápidamente que la mayoría de la gente no pudo participar.

Este nuevo modelo no está diseñado para la especulación financiera. La mayoría de los clientes que adquieran tiempo de GPU pagarán en moneda usual, y el mercado de tiempo de GPU siempre estará de alguna manera anclado a lo que cobran los proveedores de la nube. Los tokens se utilizarán principalmente en el back again-conclusion para facilitar las transacciones e incentivar a las personas a participar en el mantenimiento del sistema.

Y aquí hay algunas posibilidades interesantes a largo plazo. (Lo siento, pero lo siguiente es súper geek). Si la cadena de bloques mejora en la distribución de la potencia informática y lower significativamente la latencia, se podría ver algo así como una nube descentralizada. En ese escenario, todos esos poderosos dispositivos que llevamos en nuestros bolsillos y que tenemos en casa podrían usarse de manera más eficiente como parte de poderosas computadoras globales, todas interconectadas en una pink de comunicaciones que nos brinda conectividad constante.

Espacio para el desacuerdo

Algunas personas argumentan que democratizar la capacidad de entrenar modelos de IA es un avance potencialmente peligroso. Las personas podrían crear modelos que actúen de manera maliciosa, violen las leyes de derechos de autor y potencialmente incluso se conviertan en actores maliciosos peligrosos y fuera de handle.

Noteworthy

Share.
Leave A Reply