La ciencia y la ingeniería de datos se están simplificando gracias a AI y Place and Time, una startup de «almacén de datos» de Website3 respaldada por Microsoft (NASDAQ: MSFT).
La ciencia e ingeniería de datos implica trabajar en grandes conjuntos de información, generalmente contenidos en algún tipo de foundation de datos. Normalmente, la extracción de estos datos requiere competencia en el lenguaje de consulta estructurado, simplemente conocido como SQL, para recopilar la información exacta que requiere el ingeniero.
SQL es similar a un lenguaje de programación en el sentido de que requiere una sintaxis bien definida y el conocimiento de las palabras clave y los selectores correctos para operar con bases de datos basadas en SQL. Se utiliza en muchas arquitecturas de bases de datos y plataformas de datos como un estándar compartido para «expresar los deseos» de los ingenieros de datos. A diferencia de un verdadero lenguaje de programación, SQL no se puede usar para crear aplicaciones, pero tiene declaraciones condicionales (declaraciones «si esto, entonces eso») y otros instrumentos avanzados.
Trabajar con grandes conjuntos de datos requiere un conocimiento profundo de SQL, lo que puede ser un gran obstáculo para los analistas que no tienen mucha experiencia en programación, especialmente si el análisis de datos no es su función principal. Esto significa que los líderes empresariales y los estrategas a menudo tendrán dificultades para tomar decisiones basadas en datos por su cuenta, a menos que dediquen una cantidad significativa de trabajo.
El bot Houston de Room and Time, impulsado por OpenAI, permite a los desarrolladores y analistas definir un mensaje uncomplicated de IA en un lenguaje «natural» o conversacional. El chatbot luego «traducirá» las instrucciones a un código SQL bien hecho que se puede conectar directamente a la foundation de datos.
La integración va más allá, ya que las indicaciones también se pueden usar para crear un procesamiento de datos totalmente automático, paneles para visualizar los datos y más scripts personalizados para procesar los datos.
La integración está en vivo en Area and Time Studio, una plataforma que proporciona una interfaz fácil de usar para usar el bot de Houston. Funciona a través de una interfaz familiar de chatbot como ChatGPT, y se conecta directamente al «almacén de datos» de Area and Time, que incluye datos de las principales cadenas de bloques como Ethereum (ETH-USD), polígono (MATIC-USD), Cadena BNB, y otros. Los usuarios también pueden importar sus propios conjuntos de datos, incluida la información que no pertenece a la cadena de bloques de otros canales.
Retraso en el análisis de datos en World-wide-web3 y Blockchain
El análisis y la supervisión de datos en Internet3 pueden considerarse un campo incipiente, a pesar de que el historial de cada cadena de bloques es completamente público, mientras que su código casi siempre es de código abierto.
La paradoja de los datos de blockchain es que debido a que hay tantos, se vuelve increíblemente difícil procesarlos y encontrar las señales verdaderamente valiosas. Además, el application de cadena de bloques en sí mismo hace que sea muy difícil consultar la información que contiene, razón por la cual existe una industria de indexación de datos de cadena de bloques de más de mil millones de dólares, con Space and Time como un ejemplo de tal puesta en marcha, así como proveedores como The Graph, Subconsulta, y otros.
Los proyectos de indexación externa tampoco heredan los sistemas de seguridad y antimanipulación inherentes de la cadena de bloques, por lo que deben desarrollar diferentes métodos para garantizar a los usuarios que los datos que reciben son precisos. En el caso de Space and Time, una tecnología criptográfica llamada Evidence of SQL ofrece garantías verificables de la integridad de los datos, mientras que otros proyectos suelen incluir algún tipo de incentivo económico a través de sus tokens.
Debido a que extraer datos de cadenas de bloques es tan difícil, convertirse en un científico de datos en Net3 a menudo requiere un conocimiento de programación complejo para interactuar con los datos sin procesar. Space and Time espera que sus esfuerzos habilitados por IA ayuden a la industria a desarrollar mejores prácticas de análisis de datos, con Scott Dykstra, CTO de Space and Time, afirmando que «SQL impulsado por IA es un cambio de juego para las empresas que ejecutan un equipo de análisis delgado ”, explicando que con su bot de Houston, “[Getting] datos indexados de la cadena de bloques o datos fuera de la cadena de su empresa […] está a solo unas indicaciones de distancia”.
House and Time está fuertemente respaldado por Microsoft, que lideró una ronda de financiación de 20 millones de dólares a través de su brazo de riesgo M12 el año pasado. Anteriormente agregó una integración con Azure de Microsoft, una plataforma de computación en la nube, mientras que esta integración de OpenAI también lo integra aún más en el ecosistema de Microsoft, que tiene una participación significativa en el pionero de la IA.
Desde hace algún tiempo, especialmente desde el lanzamiento de ChatGPT a fines de 2022, la IA ha mejorado y alterado varias industrias al empoderar a los humanos. Herramientas como GitHub Copilot, así como el propio ChatGPT, están siendo utilizadas por decenas de millones de usuarios a diario, con especial éxito en informática. Las plataformas basadas en GPT, incluidas ChatGPT y Houston de Room and Time, son notablemente efectivas y comparativamente precisas cuando se aplican a la codificación.
Las herramientas de IA aún requieren la supervisión humana para producir resultados totalmente precisos, por lo que, por ahora, es mejor considerarlas como ayudantes para programadores ya experimentados. Sin embargo, para tareas más simples como consultas SQL, estamos viendo los primeros atisbos de una revolución completa de IA.
Divulgación