Evolución del índice de datos de la Cadena de bloques: de Nodo a servicio completo de IA

Evolución de la tecnología de indexación de datos de la cadena de bloques: desde nodos originales hasta servicios de datos de toda la cadena potenciados por IA

1. Introducción

Desde la aparición de las primeras dApps en 2017, el ecosistema de aplicaciones de la cadena de bloques se ha vuelto cada vez más rico. Al discutir las aplicaciones descentralizadas, ¿hemos pensado alguna vez en la fuente de los datos que utilizan estas dApps?

En 2024, la IA y Web3 se convierten en temas candentes. En el campo de la inteligencia artificial, los datos son como la fuente de vida, y son fundamentales para el aprendizaje y el pensamiento de los sistemas de IA. Sin el apoyo de datos, incluso los algoritmos de IA más sofisticados tienen dificultades para demostrar inteligencia.

Este artículo explorará en profundidad la evolución de la accesibilidad de los datos de la cadena de bloques, analizará el proceso de evolución del índice de datos y comparará las características de los protocolos de servicios de datos como The Graph, Chainbase y Space and Time, prestando especial atención a las innovaciones de estos dos últimos en la combinación de tecnologías de IA.

2. La complejidad y simplicidad del índice de datos: de los nodos de la cadena de bloques a la base de datos de toda la cadena

2.1 Fuente de datos: Nodo de cadena de bloques

La cadena de bloques se considera un libro de contabilidad descentralizado, el nodo es su infraestructura básica, responsable de registrar, almacenar y transmitir todos los datos de transacciones en la cadena. Sin embargo, los usuarios comunes que construyen y mantienen nodos enfrentan desafíos técnicos y de costo. Aunque teóricamente cualquiera puede operar un nodo, en la práctica los usuarios dependen en gran medida de servicios de terceros.

Para resolver este problema, surgieron los proveedores de nodos RPC. Ellos gestionan nodos y proporcionan datos a través de puntos finales RPC, permitiendo a los usuarios acceder a los datos de la cadena de bloques sin necesidad de construir sus propios nodos. Los puntos finales RPC públicos son gratuitos pero tienen limitaciones de velocidad, mientras que los puntos finales RPC privados tienen un mejor rendimiento, aunque su eficiencia aún necesita ser mejorada. La interfaz API estandarizada de los proveedores de nodos reduce la barrera de acceso a los datos, sentando las bases para el posterior análisis de datos y aplicaciones.

Lectura, indexación y análisis, resumen de la pista de indexación de datos Web3

2.2 Análisis de datos: de datos prototipo a datos utilizables

Los datos originales proporcionados por los nodos de la cadena de bloques suelen estar cifrados y codificados, lo que aumenta la dificultad de análisis. Para los usuarios comunes y los desarrolladores, manejar estos datos directamente requiere una gran cantidad de conocimientos técnicos y recursos de cálculo.

El proceso de análisis de datos es crucial, ya que convierte datos prototipo complejos en un formato fácil de entender y operar, permitiendo a los usuarios utilizar estos datos de manera más intuitiva. La calidad del análisis afecta directamente la eficiencia y efectividad de la aplicación de datos, siendo un eslabón clave en todo el proceso de indexación.

2.3 La evolución del indexador de datos

A medida que aumenta la cantidad de datos de la cadena de bloques, la demanda de indexadores crece. Los indexadores organizan los datos en la cadena y los envían a la base de datos, facilitando la consulta. Indexan los datos de la cadena de bloques y, a través de un lenguaje de consulta similar a SQL ( como GraphQL API ), hacen que los datos estén disponibles en cualquier momento, simplificando enormemente el proceso de recuperación de datos.

Diferentes tipos de indexadores optimizan la forma de recuperación de datos:

  1. Indexador de nodos completos: extrae datos directamente de nodos de cadena de bloques completos, asegurando integridad y precisión, pero requiere una gran capacidad de almacenamiento y procesamiento.
  2. Indexador ligero: se basa en nodos completos para obtener datos específicos bajo demanda, reduciendo la necesidad de almacenamiento, pero puede aumentar el tiempo de consulta.
  3. Indexador dedicado: optimizado para tipos de datos específicos o cadenas de bloques, como datos de NFT o transacciones de DeFi.
  4. Agregador de índices: extrae datos de múltiples cadenas de bloques y fuentes, incluyendo información fuera de la cadena, proporcionando una interfaz de consulta unificada, adecuada para dApps multichain.

Actualmente, los nodos de archivo de Ethereum ocupan entre 3 y 13.5 TB de espacio de almacenamiento en diferentes clientes, y esta cantidad aumenta a medida que crece la cadena de bloques. Frente a la gran cantidad de datos, los protocolos de indexadores principales admiten la indexación de múltiples cadenas y personalizan los marcos de análisis de datos según las diferentes necesidades de las aplicaciones, como el marco de "subgráfico" de The Graph.

El indexador mejora significativamente la eficiencia de indexación y consulta de datos. En comparación con los puntos finales RPC tradicionales, el indexador admite la indexación eficiente de grandes volúmenes de datos y consultas de alta velocidad. Permiten ejecutar consultas complejas, filtrar datos y realizar análisis. Algunos indexadores también admiten la agregación de múltiples fuentes de datos de cadena de bloques, evitando el problema de que las dApps de múltiples cadenas desplieguen múltiples API. A través de la ejecución distribuida, el indexador proporciona mayor seguridad y rendimiento, reduciendo el riesgo de interrupciones que pueden surgir de proveedores RPC centralizados.

Lectura, índice a análisis, breve descripción de la pista de indexación de datos Web3

2.4 Base de datos de cadena completa: alineación prioritaria al flujo

El uso de nodos de índice para consultar datos generalmente depende de API como el único portal de datos. Sin embargo, a medida que el proyecto se expande, a menudo se requieren fuentes de datos más flexibles, y las API estandarizadas son difíciles de satisfacer. A medida que las demandas de las aplicaciones se vuelven más complejas, los indexadores de datos primarios y sus formatos de índice estandarizados son difíciles de satisfacer para las diversas necesidades de consulta, como búsqueda, acceso entre cadenas o mapeo de datos fuera de cadena.

En la arquitectura moderna de tuberías de datos, el enfoque "prioridad de flujo" se ha convertido en una solución para las limitaciones del procesamiento por lotes tradicional, permitiendo la ingesta, procesamiento y análisis de datos en tiempo real. Los proveedores de servicios de datos en cadena también están avanzando hacia la construcción de flujos de datos, como Substreams de The Graph, Mirror de Goldsky, así como lagos de datos en tiempo real de Chainbase y SubSquid.

Estos servicios están destinados a abordar la necesidad de análisis de transacciones en tiempo real y proporcionar capacidades de consulta completas. Apoyan el desarrollo de aplicaciones y ayudan en el análisis de datos en la cadena de bloques a través de fuentes de datos más avanzadas y maduras.

Desde la perspectiva de los modernos canales de datos, redefinimos el desafío de los datos en cadena, lo que nos permite observar el potencial de la gestión, almacenamiento y provisión de datos desde un nuevo ángulo. Al considerar los indexadores como subgráficas y ETL de Ethereum como flujos de datos en lugar de salidas finales, podemos imaginar la posibilidad de personalizar conjuntos de datos de alto rendimiento para cualquier caso de uso empresarial.

3. ¿IA + Base de datos? Comparación profunda de The Graph, Chainbase, Space and Time

3.1 The Graph

La red The Graph proporciona servicios de indexación y consulta de datos multichain a través de una red de nodos descentralizados, facilitando a los desarrolladores la indexación de datos de la cadena de bloques y la construcción de aplicaciones descentralizadas. Sus principales modelos de producto incluyen el mercado de ejecución de consultas de datos y el mercado de caché de indexación de datos, atendiendo las necesidades de consulta de productos de los usuarios.

Un subgráfico es la estructura de datos fundamental de la red The Graph, que define cómo extraer y transformar datos de la cadena de bloques en un formato consultable. Cualquiera puede crear un subgráfico, y múltiples aplicaciones pueden reutilizarlo, mejorando la reutilización de datos y la eficiencia de uso.

La red The Graph está compuesta por cuatro roles clave: indexadores, curadores, delegadores y desarrolladores, que juntos proporcionan soporte de datos para aplicaciones web3.

The Graph ha pasado a un servicio de alojamiento de subgráficos completamente descentralizado, donde hay incentivos económicos entre diferentes partes para asegurar el funcionamiento del sistema.

Las herramientas AutoAgora, Allocation Optimizer y AgentC desarrolladas por Semiotic Labs mejoran el rendimiento del ecosistema en múltiples aspectos, como la fijación de precios dinámica, la asignación óptima de recursos y las consultas en lenguaje natural. La aplicación de estas herramientas permite que The Graph, en combinación con la IA, mejore aún más la inteligencia del sistema y la facilidad de uso para los usuarios.

Lectura, indexación para análisis, descripción breve de la pista de indexación de datos Web3

3.2 Chainbase

Chainbase es una red de datos de cadena completa que integra todos los datos de bloques en una plataforma, facilitando a los desarrolladores construir y mantener aplicaciones. Sus características incluyen:

  • Lago de datos en tiempo real: proporciona un lago de datos en tiempo real especializado para flujos de datos de cadena de bloques, que admite acceso instantáneo a los datos.
  • Arquitectura de doble cadena: construida sobre Eigenlayer AVS en la capa de ejecución, formando una arquitectura de doble cadena paralela con el algoritmo de consenso CometBFT, mejorando la programabilidad y la composibilidad de los datos entre cadenas.
  • Estándar de formato de datos innovador: introducción del estándar de formato de datos "manuscripts", optimizando la estructuración y el uso de datos en la industria de la criptografía.
  • Modelo del mundo criptográfico: combinando la tecnología del modelo de IA, crear un modelo de IA que pueda entender, predecir transacciones de la cadena de bloques e interactuar con ellas, como el modelo básico Theia.

El modelo de IA Theia de Chainbase se basa en el modelo DORA de NVIDIA, combinando datos en cadena y fuera de cadena y actividades temporales y espaciales, analiza los patrones criptográficos y responde mediante inferencia causal, profundizando en el valor potencial de los datos en cadena.

La potenciación de la IA convierte a Chainbase en un proveedor de servicios de datos inteligente más competitivo, capaz de ofrecer una visión de datos más amplia y optimizar el proceso de procesamiento de datos.

Leer, indexar y analizar, resumen de la pista de indexación de datos Web3

3.3 Espacio y Tiempo

Space and Time (SxT) tiene como objetivo crear una capa de computación verificable, ampliando las pruebas de conocimiento cero sobre un almacén de datos descentralizado, para proporcionar procesamiento de datos confiables para contratos inteligentes, grandes modelos de lenguaje y empresas.

SxT introduce la tecnología Proof of SQL, que es una innovadora técnica de prueba de conocimiento cero, asegurando que las consultas SQL ejecutadas en un almacén de datos descentralizado sean a prueba de manipulaciones y verificables. Proof of SQL genera pruebas criptográficas, verificando la integridad y precisión de los resultados de las consultas, permitiendo que cualquier validador confirme de manera independiente que los datos no han sido manipulados.

SxT colabora con el laboratorio de innovación de IA de Microsoft para desarrollar herramientas de IA generativa, facilitando a los usuarios procesar datos de cadena de bloques a través del procesamiento de lenguaje natural. Space and Time Studio permite a los usuarios ingresar consultas en lenguaje natural, la IA las convierte automáticamente en SQL y ejecuta la consulta, presentando el resultado final.

Lectura, indexación y análisis, descripción breve de la pista de indexación de datos Web3

Conclusión y perspectivas

La tecnología de indexación de datos en la cadena de bloques ha evolucionado desde las fuentes de datos iniciales de los nodos, pasando por el desarrollo de la解析 y el indexador, hasta llegar a los servicios de datos de cadena completa potenciados por IA, experimentando un proceso de mejora gradual. Estas tecnologías han evolucionado constantemente, mejorando la eficiencia y precisión del acceso a los datos, brindando a los usuarios una experiencia inteligente.

En el futuro, con el desarrollo de nuevas tecnologías como la inteligencia artificial y las pruebas de cero conocimiento, los servicios de datos de la cadena de bloques se volverán aún más inteligentes y seguros. Los servicios de datos de la cadena de bloques, como infraestructura, continuarán desempeñando un papel importante, brindando apoyo para el progreso y la innovación de la industria.

Lectura, indexación para análisis, resumen de la pista de indexación de datos Web3

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 4
  • Compartir
Comentar
0/400
SundayDegenvip
· hace6h
Un buen artículo es perspectivas valiosas
Ver originalesResponder0
DegenGamblervip
· hace6h
Los datos de la cadena merecen ser comprados
Ver originalesResponder0
LootboxPhobiavip
· hace6h
Los datos on-chain son realmente buenos.
Ver originalesResponder0
ruggedNotShruggedvip
· hace7h
Datos on-chain impulsan el futuro
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)