- Para los desarrolladores, Stack Overflow es un recurso critical.
- A lo largo de los años, la plataforma de preguntas y respuestas les ha ayudado a superar los altibajos de la programación.
- Ahora surgen preocupaciones después de que OpenAI llegó a un acuerdo para utilizar sus datos para entrenar ChatGPT.
Puedes apostar que la mayoría de los desarrolladores han recurrido a Stack Overflow en algún momento de sus carreras.
Desde 2008, el sitio ha servido como un recurso de preguntas y respuestas casi indispensable para los trabajadores tecnológicos que intentan encontrar soluciones a problemas de programación, mejorar sus conocimientos prácticos o simplemente conectarse con otras personas que navegan en el negocio del software.
Según Stack Overflow, se hace una nueva pregunta en el sitio, en promedio, cada 14 segundos, con casi 60 millones de preguntas y respuestas contabilizadas hasta la fecha. En 2021, la empresa fue adquirida por el grupo inversor europeo Prosus por 1.800 millones de dólares.
Eso lo convierte en un recurso de gran valor y uno sobre el que, comprensiblemente, los desarrolladores estarán dispuestos a protegerse bastante.
Quizás no sea una sorpresa que algunos usuarios de Stack Overflow hayan comenzado a armar un escándalo después de que la gran cantidad de información que han contribuido al sitio a lo largo de los años se haya convertido en el objetivo de una empresa ávida de datos: OpenAI.
El acuerdo con OpenAI genera controversia
El lunes, el fabricante de ChatGPT y Stack Overflow anunciaron una asociación para brindar a los usuarios de OpenAI y a sus clientes «la foundation de datos precisa y examinada que las herramientas de IA necesitan» para resolver sus problemas.
OpenAI señaló que «sacaría a la luz conocimientos técnicos validados de Stack Overflow directamente en ChatGPT» para brindar a los usuarios «fácil acceso a conocimientos y códigos confiables, atribuidos, precisos y altamente técnicos respaldados por millones de desarrolladores» en el joven de casi 16 años. sitio.
Para OpenAI, el acuerdo es una obviedad.
Sus modelos de IA, como GPT-4, se benefician enormemente al estar entrenados con la mayor cantidad de datos posible. Si se entrenan con datos altamente técnicos y especializados como los que se encuentran en Stack Overflow, los modelos funcionarán mejor al responder a las indicaciones de los usuarios de ChatGPT.
Stack Overflow también busca beneficiarse de la asociación mediante el uso de modelos de OpenAI en el desarrollo de OverflowAI. El producto, presentado en julio de 2023, fue el intento de la empresa de integrar funciones de IA generativa en sus servicios.
Sin embargo, algunos desarrolladores dedicados a Stack Overflow han comenzado a desahogar sus frustraciones.
En Mastodon, un servicio de redes sociales de código abierto, un usuario de Stack Overflow compartió que intentó eliminar sus «respuestas mejor calificadas» en el sitio para protestar por el acuerdo con OpenAI.
«Stack Overflow no te permite eliminar preguntas que han aceptado respuestas y muchos votos positivos porque eliminaría conocimiento de la comunidad», escribió el usuario llamado Ben. «Así que cambié mis respuestas mejor valoradas por un mensaje de protesta».
Al cabo de una hora, el usuario dijo que su intento de cambiar sus respuestas mejor calificadas había sido revertido, y posteriormente su cuenta fue suspendida durante siete días.
Una captura de pantalla de la respuesta de Stack Overflow, compartida por Ben, decía: «Recientemente eliminaste o desfiguraste contenido de tus publicaciones. Tenga en cuenta que una vez que publica una pregunta o respuesta en este sitio, esas publicaciones se convierten en parte de los esfuerzos colectivos de otros que También he contribuido a ese contenido.»
Ben continuó con Mastodon, sugiriendo que esto era «un recordatorio de que cualquier cosa que publiques en cualquiera de estas plataformas puede y será utilizada con fines de lucro», y que «es sólo cuestión de tiempo hasta que todos tus mensajes en Discord, Twitter, etc. sean raspado, introducido en un modelo y vendido de nuevo.»
Mientras tanto, en el foro de usuarios de Stack Overflow, otro usuario con sede en Europa preguntó «¿dónde está la opción de exclusión voluntaria para que OpenAI no utilice mis respuestas?» al tiempo que plantea la cuestión de si las normas de privacidad de datos de la Unión Europea les permitirían eliminar sus respuestas del sitio.
Los usuarios también opinaron sobre el acuerdo sobre X.
Emily Bender, profesora de la Universidad de Washington, criticó la asociación el jueves y escribió: «Me gustaría recordarle al mundo que en realidad no es necesario acostarse con OpenAI. StackOverflow fue un faro de resistencia, pero supongo después de todo, sus principios estaban en venta».
En una publicación del miércoles, Gergely Orosz, autor del boletín The Pragmatic Engineer, escribió: «¿Cuál es su reacción, como desarrollador, cuando se da cuenta de que sus esfuerzos por ayudar a otros desarrolladores con sus problemas (respondiendo preguntas en StackOverflow) ahora son una ¿Hay alguna manera de que StackOverflow venda estos datos para que OpenAI entrene a ChatGPT para que funcione mejor?
Stack Overflow no respondió a una solicitud de comentarios.
Está claro que la gente está molesta por este acuerdo, pero vale la pena señalar que no es la primera vez que el uso de datos producidos por otros por parte de OpenAI genera preocupación.
La empresa se enfrenta a varias demandas de creadores, como artistas y autores, que afirman que OpenAI está utilizando su trabajo sin permiso para obtener beneficios.
Ahora que Stack Overflow y OpenAI trabajan juntos públicamente, los desarrolladores tendrán que considerar qué tan cómodos se sienten con ChatGPT utilizando sus conocimientos.
Axel Springer, la empresa matriz de Business Insider, tiene un acuerdo global para permitir a OpenAI entrenar sus modelos en los informes de sus marcas de medios.
Axel Springer, la empresa matriz de Company Insider, tiene un acuerdo international para permitir a OpenAI entrenar sus modelos en los informes de sus marcas de medios.