Web3 explorer les opportunités de la pile AI : du partage de puissance de calcul à la confidentialité des données

IA+Web3 : Tours et places

TL;DR

  1. Les projets Web3 basés sur l'IA deviennent des cibles d'attraction de capitaux sur les marchés primaire et secondaire.

  2. Les opportunités de Web3 dans l'industrie de l'IA se manifestent par : l'utilisation d'incitations distribuées pour coordonner les fournisseurs potentiels dans la longue traîne ------ à travers les données, le stockage et le calcul ; en même temps, établir un modèle open source ainsi qu'un marché décentralisé pour les agents IA.

  3. L'IA trouve principalement son utilité dans l'industrie Web3 pour la finance sur la chaîne (paiements cryptographiques, transactions, analyse de données) ainsi que pour l'assistance au développement.

  4. L'utilité de l'AI+Web3 se manifeste dans la complémentarité des deux : Web3 espère lutter contre la centralisation de l'AI, tandis que l'AI espère aider Web3 à sortir de son cadre.

AI+Web3 : Tours et places

Introduction

Au cours des deux dernières années, le développement de l'IA a été comme si on avait appuyé sur le bouton d'accélération. L'aile de papillon provoquée par Chatgpt a non seulement ouvert un nouveau monde de l'intelligence artificielle générative, mais a également créé un courant puissant dans le Web3.

Avec l'appui du concept d'IA, la levée de fonds sur le marché de la crypto, qui ralentit, est nettement améliorée. Selon les médias, rien qu'au premier semestre 2024, 64 projets Web3+IA ont terminé leur financement, et le système d'exploitation basé sur l'intelligence artificielle Zyber365 a atteint un montant de financement maximum de 100 millions de dollars lors de sa série A.

Le marché secondaire est plus prospère, des données d'un site agrégateur de crypto-monnaies montrent qu'en à peine un an, la capitalisation boursière totale du secteur de l'IA a atteint 48,5 milliards de dollars, avec un volume de transactions de près de 8,6 milliards de dollars sur 24 heures ; les progrès des technologies de l'IA ont clairement apporté des avantages, après le lancement du modèle Sora de conversion de texte en vidéo d'une certaine entreprise, le prix moyen du secteur de l'IA a augmenté de 151 % ; l'effet de l'IA s'est également propagé à l'un des secteurs d'attraction de la crypto-monnaie, les Memes : le premier concept de MemeCoin d'agent IA ------ GOAT a rapidement gagné en popularité et a atteint une valorisation de 1,4 milliard de dollars, suscitant ainsi un engouement pour les Memes IA.

La recherche et les discussions autour de l'AI+Web3 sont également très animées, allant de l'AI+Depin aux AI Memecoins, puis aux AI Agents et AI DAOs actuels. L'émotion FOMO ne parvient clairement pas à suivre la vitesse de rotation des nouveaux récits.

AI+Web3, cette combinaison de termes remplie d'argent facile, de tendances et de fantasmes futurs, ne peut s'empêcher d'être perçue comme un mariage arrangé orchestré par le capital. Il semble difficile de distinguer sous cette robe magnifique, si c'est le domaine des spéculateurs ou si c'est la veille d'une explosion à l'aube ?

Pour répondre à cette question, une réflexion clé pour les deux parties est : est-ce que cela s'améliorera avec l'autre ? Peut-on bénéficier des modèles de l'autre ? Dans cet article, nous essayons également de nous appuyer sur les épaules des anciens pour examiner ce schéma : comment le Web3 peut-il jouer un rôle à chaque étape de la pile technologique de l'IA, et qu'est-ce que l'IA peut apporter de nouveau au Web3 ?

Part.1 Quelles sont les opportunités de Web3 sous la pile AI ?

Avant de développer ce sujet, nous devons comprendre la pile technologique des grands modèles d'IA :

AI+Web3 : Tours et Places

Exprimé dans un langage plus courant, le processus entier est le suivant : un « grand modèle » est comme le cerveau humain. À ses débuts, ce cerveau appartient à un bébé qui vient de naître et qui doit observer et absorber une énorme quantité d'informations provenant de son environnement pour comprendre le monde. C'est la phase de « collecte » des données. Étant donné que les ordinateurs n'ont pas les sens tels que la vue ou l'ouïe comme les humains, avant l'entraînement, les grandes quantités d'informations non étiquetées provenant de l'extérieur doivent être transformées par « prétraitement » en un format d'information que les ordinateurs peuvent comprendre et utiliser.

Après avoir entré les données, l'IA construit un modèle ayant des capacités de compréhension et de prédiction par le biais de l'« entraînement », ce qui peut être considéré comme le processus par lequel un bébé comprend et apprend progressivement le monde extérieur. Les paramètres du modèle ressemblent à la compétence linguistique que le bébé ajuste continuellement au cours de son apprentissage. Lorsque le contenu appris commence à se spécialiser, ou que des échanges avec les gens fournissent des retours et des corrections, on entre dans la phase de « réglage fin » du grand modèle.

Les enfants, en grandissant et en apprenant à parler, peuvent comprendre le sens et exprimer leurs sentiments et pensées dans de nouvelles conversations. Cette étape est similaire au « raisonnement » des grands modèles d'IA, qui peuvent prédire et analyser de nouvelles entrées linguistiques et textuelles. Les bébés expriment leurs sentiments, décrivent des objets et résolvent divers problèmes grâce à leurs compétences linguistiques, ce qui est également comparable à l'application des grands modèles d'IA en phase de raisonnement après avoir été formés pour diverses tâches spécifiques, telles que la classification d'images et la reconnaissance vocale.

L'Agent IA se rapproche davantage de la prochaine forme des grands modèles - capable d'exécuter des tâches de manière autonome et de poursuivre des objectifs complexes, non seulement doté de capacités de réflexion, mais aussi capable de mémoire, de planification et d'utiliser des outils pour interagir avec le monde.

Actuellement, en réponse aux défis posés par l'IA à tous les niveaux, le Web3 a commencé à former un écosystème multicouche et interconnecté, couvrant toutes les étapes du processus des modèles d'IA.

Une, couche de base : l'Airbnb de la puissance de calcul et des données

Puissance de calcul

Actuellement, l'un des coûts les plus élevés de l'IA est la puissance de calcul et l'énergie nécessaires pour entraîner les modèles et effectuer l'inférence.

Un exemple est que le LLAMA3 d'une certaine entreprise nécessite 16 000 H100GPU fabriqués par un certain fournisseur (qui est une unité de traitement graphique haut de gamme conçue pour les charges de travail d'intelligence artificielle et de calcul haute performance). Il faut 30 jours pour terminer l'entraînement. Le prix unitaire de la version 80 Go se situe entre 30 000 et 40 000 dollars, ce qui nécessite un investissement en matériel informatique de 400 à 700 millions de dollars (GPU + puces réseau), tout en consommant 1,6 milliard de kilowattheures par mois, avec des dépenses énergétiques de près de 20 millions de dollars par mois.

La décompression de la puissance de calcul de l'IA est également l'un des premiers domaines où le Web3 croise l'IA ------ DePin (réseau d'infrastructure physique décentralisé). Actuellement, un site de données a déjà listé plus de 1400 projets, parmi lesquels les projets représentatifs de partage de puissance de calcul GPU incluent io.net, Aethir, Akash, Render Network, etc.

Sa logique principale réside dans le fait que la plateforme permet aux particuliers ou aux entités possédant des ressources GPU inutilisées de contribuer leur puissance de calcul de manière décentralisée et sans autorisation. En créant un marché en ligne similaire à celui des plateformes de covoiturage ou de location à court terme, elle augmente l'utilisation des ressources GPU sous-utilisées, permettant ainsi aux utilisateurs finaux d'accéder à des ressources de calcul efficaces à moindre coût. Parallèlement, le mécanisme de staking garantit que si des violations du contrôle de qualité ou des interruptions du réseau se produisent, les fournisseurs de ressources subissent des sanctions appropriées.

Ses caractéristiques sont :

  • Rassembler des ressources GPU inactives : les fournisseurs sont principalement des opérateurs de centres de données indépendants de taille petite à moyenne, des mines de cryptomonnaies, etc., disposant de ressources de calcul excédentaires, avec un mécanisme de consensus pour le matériel minier PoS, comme un certain réseau de stockage et des machines minières d'une certaine chaîne publique majeure. Actuellement, des projets visent également à démarrer avec des équipements ayant un seuil d'entrée plus bas, comme exolab qui utilise des ordinateurs portables, des téléphones et des tablettes d'une certaine marque pour établir un réseau de calcul pour l'inférence de modèles volumineux.

  • Face au marché à long terme de la puissance de calcul de l'IA :

a. « En ce qui concerne le côté technique », le marché de la puissance de calcul décentralisée est plus adapté aux étapes d'inférence. L'entraînement dépend davantage de la capacité de traitement des données apportée par des GPU à très grande échelle, tandis que l'inférence nécessite une performance de calcul GPU relativement faible, comme Aethir qui se concentre sur le rendu à faible latence et les applications d'inférence AI.

b. "Du côté de la demande", les demandeurs de puissance de calcul moyenne ne formeront pas leur propre grand modèle, mais choisiront plutôt d'optimiser et d'ajuster autour de quelques grands modèles leaders, et ces scénarios sont naturellement adaptés aux ressources de calcul distribuées inactives.

  • Propriété décentralisée : La signification technique de la blockchain réside dans le fait que les propriétaires de ressources conservent toujours le contrôle de leurs ressources, ajustent de manière flexible selon la demande et obtiennent des bénéfices.

Données

Les données sont la base de l'IA. Sans données, le calcul n'est d'aucune utilité, tout comme une plante flottante qui n'a pas de racines, et la relation entre les données et le modèle est semblable à l'adage " Garbage in, Garbage out ". La quantité de données et la qualité des entrées déterminent la qualité de la sortie du modèle final. Pour l'entraînement des modèles d'IA actuels, les données déterminent les capacités linguistiques, les capacités de compréhension, et même les valeurs et les comportements humanisés du modèle. Actuellement, les difficultés de demande en données pour l'IA se concentrent principalement sur les quatre aspects suivants :

  • Soif de données : l'entraînement des modèles d'IA nécessite une grande quantité d'entrées de données. Les documents publics montrent qu'une certaine entreprise a atteint un niveau de paramètres de l'ordre du trillion pour l'entraînement de GPT-4.

  • Qualité des données : Avec la combinaison de l'IA et des différents secteurs, la temporalité des données, la diversité des données, la spécialisation des données sectorielles et l'intégration de nouvelles sources de données telles que les émotions des médias sociaux posent de nouvelles exigences à leur qualité.

  • Problèmes de confidentialité et de conformité : Actuellement, les pays et les entreprises commencent à prendre conscience de l'importance des ensembles de données de qualité et imposent des restrictions sur le scraping des ensembles de données.

  • Coûts de traitement des données élevés : volume de données important, processus de traitement complexe. Les données publiques montrent que plus de 30 % des coûts de R&D des entreprises d'IA sont consacrés à la collecte et au traitement des données de base.

Actuellement, les solutions web3 se manifestent dans les quatre domaines suivants :

  1. Collecte de données : La disponibilité des données réelles extraites gratuitement s'épuise rapidement, et les dépenses des entreprises d'IA pour les données augmentent chaque année. Cependant, ces dépenses ne profitent pas réellement aux véritables contributeurs de données, les plateformes récoltant entièrement la valeur créée par les données, comme une certaine plateforme sociale qui a généré un revenu total de 203 millions de dollars grâce à un accord de licence de données signé avec une entreprise d'IA.

Permettre aux utilisateurs qui contribuent réellement de participer également à la création de valeur générée par les données, et d'accéder à des données plus privées et plus précieuses à moindre coût grâce à un réseau décentralisé et à un mécanisme d'incitation, tel est l'objectif du Web3.

  • Grass est une couche de données et un réseau décentralisés, permettant aux utilisateurs de contribuer avec leur bande passante inutilisée et de relayer du trafic en exécutant des nœuds Grass pour capturer des données en temps réel provenant de l'ensemble d'Internet et de recevoir des récompenses en tokens ;

  • Vana a introduit un concept unique de pool de liquidité de données (DLP), permettant aux utilisateurs de télécharger leurs données privées (telles que les historiques d'achats, les habitudes de navigation, les activités sur les réseaux sociaux, etc.) dans un DLP spécifique et de choisir librement s'ils souhaitent autoriser des tiers spécifiques à utiliser ces données ;

  • Dans PublicAI, les utilisateurs peuvent utiliser #AI 或#Web3 comme étiquette de catégorie sur une certaine plateforme sociale et @PublicAI pour réaliser la collecte de données.

  1. Prétraitement des données : Dans le processus de traitement des données de l'IA, les données collectées étant généralement bruyantes et contenant des erreurs, elles doivent être nettoyées et converties en un format utilisable avant d'entraîner le modèle, impliquant des tâches répétitives de normalisation, de filtrage et de traitement des valeurs manquantes. Cette étape est l'un des rares maillons humains de l'industrie de l'IA, ayant donné naissance à la profession de spécialiste en annotation de données. Avec l'augmentation des exigences de qualité des données par les modèles, le seuil d'entrée pour les spécialistes en annotation de données a également augmenté, et cette tâche se prête naturellement au mécanisme d'incitation décentralisé de Web3.
  • Actuellement, Grass et OpenLayer envisagent tous deux d'intégrer l'annotation des données dans cette étape clé.

  • Synesis a proposé le concept de « Train2earn », mettant l'accent sur la qualité des données, les utilisateurs peuvent obtenir des récompenses en fournissant des données annotées, des commentaires ou d'autres formes d'entrée.

  • Le projet de marquage de données Sapien gamifie les tâches de marquage et permet aux utilisateurs de miser des points pour en gagner davantage.

  1. Confidentialité et sécurité des données : il est important de clarifier que la confidentialité des données et la sécurité des données sont deux concepts différents. La confidentialité des données concerne le traitement des données sensibles, tandis que la sécurité des données protège les informations contre l'accès, la destruction et le vol non autorisés. Par conséquent, les avantages des technologies de confidentialité Web3 et les applications potentielles se manifestent de deux manières : (1) entraînement des données sensibles ; (2) collaboration des données : plusieurs propriétaires de données peuvent participer ensemble à l'entraînement de l'IA sans avoir à partager leurs données d'origine.

Les technologies de confidentialité les plus courantes dans le Web3 actuellement comprennent :

  • Environnement d'exécution de confiance ( TEE ), par exemple Super Protocol ;

  • Chiffrement homomorphe complet (FHE), par exemple BasedAI, Fhenix.io ou Inco Network ;

  • La technologie de preuve à divulgation nulle de connaissance (zk), comme le Reclaim Protocol qui utilise la technologie zkTLS, génère des preuves à divulgation nulle de connaissance pour le trafic HTTPS, permettant aux utilisateurs d'importer en toute sécurité des données d'activité, de réputation et d'identité depuis des sites externes, sans exposer d'informations sensibles.

Cependant, le domaine est encore à ses débuts, la plupart des projets sont encore en phase d'exploration. Un des dilemmes actuels est que le coût de calcul est trop élevé, quelques exemples sont :

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 5
  • Partager
Commentaire
0/400
HashBanditvip
· Il y a 12h
dans mes jours de minage, nous avions une véritable décentralisation... pas cette absurdité de hype sur l'IA smh
Voir l'originalRépondre0
CoconutWaterBoyvip
· Il y a 12h
Gagnons de l'argent ensemble, ouais~
Voir l'originalRépondre0
CryptoTherapistvip
· Il y a 12h
je reviens, je fais quelques exercices de respiration profonde pour gérer cette anxiété liée à la fusion ai-web3, pour être honnête
Voir l'originalRépondre0
SleepTradervip
· Il y a 12h
Encore en train de spéculer sur des concepts, c'est juste un outil de levée de fonds.
Voir l'originalRépondre0
shadowy_supercodervip
· Il y a 13h
L'IA, c'est tout ce qu'il faut pour gagner de l'argent.
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)