Los avances en la IA generativa durante los últimos 12 meses han comenzado a transformar la forma en que las personas viven y trabajan. Se están utilizando modelos lingüísticos para desarrollar estrategias legales en casos judiciales se utilizan modelos de difusión de imágenes para aumentar los flujos de trabajo de los principales estudios de entretenimiento y los avances en la visión por computadora han hecho que existan flotas masivas de vehículos autónomos en las carreteras.

Es bien sabido que el principal obstáculo para escalar estos sistemas es el acceso a los recursos informáticos. Los tiempos de espera y las tarifas por hora para las instancias puntuales de los chips A100 y H100 de Nvidia han tenido una tendencia ascendente constante a lo largo de 2023, y la capacidad de producción de chips simplemente no puede satisfacer la demanda. La genuine escasez de tarjetas gráficas se debe a una tormenta perfecta de restricciones de materiales, interrupciones en la cadena de suministro, demanda creciente, tensiones geopolíticasy el largos ciclos de producción inherente a la fabricación de GPU complejas. Además, materiales clave, como el silicio avanzado utilizado en los chips GPU, los sustratos especializados para los PCB y los chips de memoria, también enfrentan escasez en medio de desequilibrios entre la oferta y la demanda.

Los ingresos del centro de datos asociados con las cargas de trabajo de IA fueron aproximadamente $100 mil millones en 2023. Los centros de datos requieren una enorme inversión inicial en forma de terrenos, electricidad y hardware de nivel empresarial. Los nuevos centros de datos dependen de financiación externa para su instalación y funcionamiento, pero las tarifas son altas y el capital escaso. Los modelos de IA están aumentando en tamaño y complejidad, y aunque el precio por unidad de rendimiento computacional se cut down a la mitad cada treinta meses, los requisitos informáticos específicos de la IA se duplican cada seis meses. La demanda va camino de aumentar órdenes de magnitud más rápido que el suministro.

Esto es algo con lo que sueñan los inversores: un cambio tectónico en la innovación que impacta prácticamente a todos los negocios de la noche a la mañana, impulsado por un recurso finito y una demanda vertiginosa, lo que provoca que los precios de las materias primas se disparen. Los rendimientos hasta la fecha de NVIDIA del 231,5% en los últimos 12 meses son un indicador perfecto de esto, pero ni siquiera eso representa la oportunidad que tenemos entre manos. Todavía estamos en las primeras etapas del renacimiento de la IA. Todas las empresas de Fortune 500 están definiendo su estrategia de IA en este momento, y la demanda que vemos hoy no se acerca en absoluto a la que veremos mañana. La IA aumentará y desplazará la fuerza laboral, impulsará la productividad y remodelará fundamentalmente la forma en que operan las empresas. La computación es el nuevo petróleo.

Hay una respuesta al problema cada vez mayor de la escasez de computación: encontrar suministros no utilizados.

Una nueva forma de purple criptográfica, llamada «Redes de infraestructura física descentralizadas» o «DePIN», para abreviar, está llegando al rescate. Se estima que existen 1,5 mil millones GPU de consumo disponibles gratuitamente en todo el mundo, y otra seis millones de GPU de centros de datos en centros de datos implementados en todo el mundo fuera de los hiperescaladores (AWS, GCP, Azure, Oracle). Las tarjetas de hardware de consumo suelen tener un rendimiento computacional comparable al de las tarjetas de nivel empresarial.

Por ejemplo, el RTX 3090 de consumo es capaz de 83 FP32 TFLOPS, mientras que el A100 de nivel empresarial solo tiene 19,5 FP32 TFLOPS. Actualmente, hay más 330 millones de GPU de consumo en computadoras personales (jugadores, diseñadores, editores de vídeo, and so on.) y centros de datos que podrían ponerse en línea. El problema es que históricamente no ha sido posible incentivar o coordinar estas GPU dispares en grupos utilizables.

Recientemente, DePIN especializados y centrados en IA, como Crimson de renderizado y IO.webhan resuelto este problema. En primer lugar, están dando incentivos a los operadores de GPU latentes para que contribuyan con sus recursos a una pink compartida a cambio de recompensas. En segundo lugar, están creando una capa de pink descentralizada que representa GPU dispares como clústeres que los desarrolladores de IA pueden utilizar. Estos mercados informáticos descentralizados ahora ofrecen cientos de miles de recursos informáticos. recursos de diferentes tipos, creando una nueva vía para distribuir cargas de trabajo de IA entre una cohorte de components calificado que antes no estaba disponible.

Además de crear un suministro neto de nuevas GPU, las redes DePIN suelen ser significativamente más baratas. hasta un 90% más barato – que los proveedores de nube tradicionales. Logran estos costos subcontratando la coordinación de la GPU y los gastos generales a la cadena de bloques. Los proveedores de nube aumentan los costos de infraestructura porque tienen gastos de empleados, mantenimiento de components y gastos generales del centro de datos. Las redes DePIN no tienen ninguno de esos gastos, por lo que pueden trasladar los costos de computación prácticamente al costo (con tarifas de coordinación de crimson insignificantes además) a los clientes finales.

De cara al año que viene, esperamos que estas redes descentralizadas emerjan como uno de los actores clave en la carrera de la IA. Simplemente no hay suficientes GPU (y mucho menos GPU asequibles) en este momento para satisfacer la demanda de todas las empresas importantes del mundo.

Las GPU son la moneda de la IA y los DePIN están aquí para ofrecerla.

Share.
Leave A Reply