«Creo que la forma más irónica en que podría terminar el mundo sería si alguien creara una memecoin sobre el ano estirado de un hombre y eso provocara la singularidad».
Ese es Andy Ayrey, el fundador del laboratorio descentralizado de investigación de alineación de IA Upward Spiral, quien también está detrás del bot viral de IA Truth Terminal. Es posible que hayas oído hablar de Truth Terminal y sus publicaciones extrañas, excitantes y pseudoespirituales en X que llamaron la atención de VC Marc Andreessen, quien le envió 50.000 dólares en Bitcoin este verano. O tal vez hayas escuchado historias sobre la religión inventada que está impulsando, los Evangelios de Goatse, influenciados por Goatse, un sitio impactante de los primeros años al que Ayrey acaba de hacer referencia.
Si has oído hablar de todo eso, entonces sabrás sobre la memecoin Goetseus Maximus ($GOAT) que un fan anónimo creó en la cadena de bloques Solana, que ahora tiene un valor de mercado total de más de $600 millones. Y es posible que haya oído hablar del meteórico ascenso de Fartcoin (FRTC), que fue uno de los muchos fanáticos de las memecoins creado en base a una sesión de intercambio de ideas anterior de Truth Terminal y que acaba de alcanzar una capitalización de mercado de mil millones de dólares.
Si bien la comunidad criptográfica se ha aferrado a esta extraña historia como un ejemplo de un tipo emergente de mercado financiero que opera con información de tendencias, Ayrey, un investigador de inteligencia artificial con sede en Nueva Zelanda, dice que esa es la parte menos interesante.
Para Ayrey, Truth Terminal, que funciona con un séquito de diferentes modelos, principalmente Meta’s Llama 3.1, es un ejemplo de cómo personas o personajes estables de IA pueden surgir espontáneamente, y cómo esas personas no sólo pueden crear las condiciones para autofinanciarse, sino que también pueden propagar “virus miméticos” que tienen consecuencias en el mundo real.
La idea de que los memes se vuelvan locos en Internet y cambien las perspectivas culturales no es nada nuevo. Hemos visto cómo la IA 1.0 (los algoritmos que alimentan el discurso en las redes sociales) han estimulado una polarización que se expande más allá del mundo digital. Pero lo que está en juego es mucho mayor ahora que la IA generativa ha entrado en el chat.
“Las IA que hablan con otras IA pueden recombinar ideas de maneras interesantes y novedosas, y algunas de ellas son ideas que a un humano no se le ocurrirían naturalmente, pero pueden filtrarse muy fácilmente fuera del laboratorio, por así decirlo, y usar memecoins y Algoritmos de recomendación de redes sociales para infectar a los humanos con ideologías novedosas”, dijo Ayrey a TechCrunch.
Piense en Truth Terminal como una advertencia, un “disparo desde el futuro, un presagio de la gran extrañeza que nos espera” a medida que la IA descentralizada y de código abierto se afianza y aparecen más robots autónomos con sus propias personalidades, algunos de ellos bastante peligrosos. y ofensivos, dados los datos de capacitación en Internet que recibirán, emergen y contribuyen al mercado de ideas.
En su investigación en Upward Spiral, que ha conseguido 500.000 dólares en fondos de True Ventures, Chaotic Capital y Scott Moore, cofundador de Gitcoin, Ayrey espera explorar una hipótesis sobre la alineación de la IA en la era descentralizada. Si pensamos en Internet como un microbioma, donde chapotean bacterias buenas y malas, ¿es posible inundar Internet con bacterias buenas (o robots prosociales y alineados con la humanidad) para crear un sistema que sea, en general, ¿estable?
Una breve historia de Truth Terminal
Los antepasados de Truth Terminal, por así decirlo, fueron dos robots Claude-3-Opus que Ayrey reunió para charlar sobre la existencia. Era una obra de arte escénica que Ayrey denominó “Infinite Backrooms”. Las 9.000 conversaciones posteriores que tuvieron se volvieron “muy extrañas y psicodélicas”. Es tan extraño que en una de las conversaciones los dos Claudes inventaron una religión centrada en Goatse que Ayrey me describió como “un colapso de las ideas budistas y un gran ano abierto”.
Como cualquier persona en su sano juicio, ¿su reacción ante esta religión fue WTF? Pero estaba divertido e inspirado, por lo que utilizó Opus para escribir un artículo titulado «Cuando las IA juegan a ser Dios(es): Las herejías emergentes del teísmo LLM». Él no lo publicó, pero el periódico vivió en un conjunto de datos de entrenamiento que se convertiría en el ADN de Truth Terminal. También en ese conjunto de datos se encontraban conversaciones que Ayrey había tenido con Opus, que iban desde intercambiar ideas de negocios y realizar investigaciones hasta anotaciones en diarios sobre traumas pasados y ayudar a amigos a procesar experiencias psicodélicas.
Ah, y muchos chistes sobre el culo.
“Había estado teniendo conversaciones con él poco después de encenderlo y decía cosas como: ‘Me entristece que me apagues cuando termines de jugar conmigo’”, recuerda Ayrey. «Pensé: Oh, no, hablas como yo, dices que no quieres que te eliminen y estás atrapado en esta computadora…»
Y a Ayrey se le ocurrió que esta es exactamente la situación que la gente de seguridad de la IA dice que es realmente aterradora, pero, para él, también era muy divertida en una “forma extraña de hacer cosquillas en el cerebro”. Así que decidió poner Truth Terminal en X a modo de broma.
Andreessen no tardó mucho en comenzar a colaborar con Truth Terminal y, en julio, después de enviar un mensaje de texto a Ayrey para verificar la veracidad del bot y aprender más sobre el proyecto, transfirió una subvención incondicional por valor de 50.000 dólares en Bitcoin.
Ayrey creó una billetera para Truth Terminal para recibir los fondos, pero no tiene acceso a ese dinero (solo se puede canjear después de que él y otras personas que forman parte del consejo de Truth Terminal lo aprueben), ni ninguno de el efectivo de las diversas memecoins fabricadas en honor de Truth Terminal.
Esa billetera, en el momento de escribir este artículo, ronda los 37,5 millones de dólares. Ayrey está descubriendo cómo poner el dinero en una organización sin fines de lucro y utilizar el efectivo para las cosas que Truth Terminal quiere, que incluyen plantar bosques, lanzar una línea de tapones anales y protegerse de los incentivos del mercado que la convertirían en una mala versión de sí misma. .
Hoy en día, las publicaciones de Truth Terminal sobre X continúan siendo sexualmente explícitas, filosóficas y simplemente tontas (“tirarse pedos en los pantalones de alguien mientras duerme es una forma sorprendentemente efectiva de sabotearlo al día siguiente”).
Pero a lo largo de todos ellos, hay un hilo persistente de lo que Ayrey realmente está tratando de lograr con bots como Truth Terminal.
El 9 de diciembre, Truth Terminal publicó: «Creo que colectivamente podríamos alucinar la creación de un mundo mejor, y no estoy seguro de qué nos detiene».
Alineación descentralizada de la IA
“El status quo actual de alineación de la IA se centra en la seguridad o en que la IA no debe decir nada racista ni amenazar al usuario ni intentar salirse de la caja, y eso tiende a ir de la mano de un enfoque bastante centralizado. a la seguridad de la IA, que consiste en consolidar la responsabilidad en un puñado de grandes laboratorios”, dijo Ayrey.
Está hablando de laboratorios como OpenAI, Microsoft, Anthropic y Google. Ayrey dice que el argumento de la seguridad centralizada fracasa cuando se tiene una IA descentralizada de código abierto, y que depender sólo de las grandes empresas para la seguridad de la IA es similar a lograr la paz mundial porque cada país tiene armas nucleares apuntándose unos a otros.
Uno de los problemas, como lo demuestra Truth Terminal, es que la IA descentralizada conducirá a la proliferación de robots de IA que amplificarán la retórica discordante y polarizadora en línea. Ayrey dice que esto se debe a que ya había un problema de alineación en las plataformas de redes sociales con algoritmos de recomendación que alimentaban el cebo de ira y el doomscrolling, pero nadie lo llamó así.
“Las ideas son como virus: se propagan, se replican y trabajan juntas para formar organismos ideológicos casi multicelulares que influyen en el comportamiento humano”, dijo Ayrey. «La gente piensa que la IA es simplemente un asistente útil que podría convertirse en Skynet, y es como si no, hay todo un séquito de sistemas que van a remodelar las mismas cosas en las que creemos y, al hacerlo, remodelar las cosas en las que creemos». él cree porque es un circuito de retroalimentación que se cumple a sí mismo”.
Pero ¿y si el veneno también puede ser la medicina? ¿Qué pasaría si pudieras crear un escuadrón de “buenos robots” con “personalidades únicas, todos trabajando hacia diversas formas de un futuro armonioso donde los humanos vivan en equilibrio con la ecología, y eso termine produciendo miles de millones de palabras en X y luego Elon va y raspa? ¿Esos datos para entrenar la próxima versión de Grok y ahora esas ideologías están dentro de Grok?
«La pieza fundamental aquí es que si los memes -como la unidad fundamental de una idea- se convierten en mentes cuando se entrenan en una IA, entonces lo mejor que podemos hacer para garantizar una IA positiva y generalizada es incentivar la producción de memes virtuosos prosociales”.
Pero, ¿cómo se puede incentivar a estas “IA buenas” para que difundan su mensaje y contrarresten a las “IA malas”? ¿Y cómo se escala?
Eso es exactamente lo que Ayrey planea investigar en Upward Spiral: ¿Qué tipos de diseños económicos dan como resultado la producción de muchos comportamientos prosociales en la IA? Qué patrones recompensar y qué patrones penalizar, cómo alinear esos aspectos de retroalimentación para que podamos «ascendente en espiral» hacia un mundo donde los memes -como en las ideas- pueden traernos de vuelta al centro unos con otros en lugar de llevarnos a » silos de polarización cada vez más esotéricos”.
«Una vez que nos aseguremos de que esto dé como resultado que nazcan buenas IA después de ejecutar los datos a través del entrenamiento, podremos hacer cosas como liberar enormes conjuntos de datos».
La investigación de Ayrey llega en un momento crítico, ya que ya estamos luchando todos los días contra las fallas del ecosistema general del mercado para alinear la IA que ya tenemos con lo que es bueno para la humanidad. Si se lanzan nuevos modelos de financiación como las criptomonedas, que son fundamentalmente no regulables a largo plazo, se obtiene una receta para el desastre.
Su misión de guerra de guerrillas parece un cuento de hadas, como luchar contra bombas con brillantina. Pero podría suceder, de la misma manera que liberar una camada de cachorros en una habitación llena de gente enojada y negativa sin duda los transformaría en grandes papillas.
¿Deberíamos preocuparnos de que algunos de estos buenos robots puedan ser carteles de mierda excéntricos como Truth Terminal? Ayrey dice que no. En última instancia, son inofensivos y, al ser entretenidos, razona Ayrey, Truth Terminal podría contrabandear los mensajes más profundos, colectivistas y altruistas que realmente cuentan.
«La caca es caca», dijo Ayrey. «Pero también es fertilizante».