Hace unos años, NVIDIA creó una GPU dedicada a la minería de criptomonedas, la CMP 170HX. Se trataba de una versión muy restringida de su acelerador de centro de datos insignia A100, que utilizaba el mismo chip GA100. Su finalidad era acelerar Ethash, el algoritmo de prueba de trabajo de Ethereum, y nada más. [niconiconi] Compré uno para usarlo para acelerar simulaciones electromagnéticas de PCB y puse un lote de esfuerzo para reparar la tarjeta, convertirla a refrigeración por agua y descubrir cómo utilizar mejor esta GPU dañada.

Por lo general, el silicio GA100 se ubica en el centro de la poderosa tarjeta GPU A100 y se encontraría en un rack de servidores, refrigerado por aire forzado. Esto no era una opción en casa, por lo que se colocó un bloque de refrigeración por agua disponible en el mercado. Durante este proceso, [niconconi] Descubrieron que la placa no se encendía, por lo que se adentraron en el árbol de suministro de energía con la ayuda de un esquema filtrado del A100. La reparación y las modificaciones se pueden encontrar en el apéndice, hasta el final del artículo. Es un largo leer para llegar allí.

Esta GPU Nvidia GA100 está gravemente dañada en esta placa.

NVIDIA tiene un historial de restringir deliberadamente el silicio en manos de los consumidores para justificar los elevados precios de sus ofertas para las grandes empresas, y esta placa no es diferente. El plan era restringir el rendimiento máximo de la placa solo a aplicaciones con los mismos requisitos de cómputo que Ethash, específicamente algoritmos de uso intensivo de memoria. El rendimiento de FP64 se limitó severamente, pero no se eliminaron las instrucciones. Esto significaba que el código se ejecutaría muy mal, considerando lo que la GPU es capaz de hacer.

La memoria se limitó a 8 GB, a pesar de que algunas tarjetas A100 albergaban la friolera de 80 GB. La estrategia fue utilizar fusibles para limitar las instrucciones cruciales, en particular las instrucciones FP32 FMA y MAD, que se utilizan para operaciones de multiplicación-suma y son cruciales para aplicaciones informáticas generales. Por último, el bus PCIe se modificó para que funcionara únicamente como una interfaz Gen 1 con un solo carril. Redujeron el número de carriles eliminando los condensadores de acoplamiento de la PCB, lo que significaba que se podían añadir más tarde, pero sigue siendo una interfaz lenta.

[niconconi] Analizaron en detalle los tipos de instrucciones, teniendo en cuenta su aplicación de simulación EM. Después de algunos ajustes para que funcionara, determinaron que era una buena compra. ¡Vale la pena leer este artículo para todos aquellos fanáticos incondicionales de las GPU!

Si necesitas una introducción a la minería con GPU, tenemos lo que necesitas. Una vez que hayas entendido la criptografía de prueba de trabajo, ¿quizás deberías echarle un vistazo a Chia?

Gracias a [gnif] ¡Por la propina!

Share.
Leave A Reply