Web3 досліджує можливості AI стеку: від Обчислювальної потужності до конфіденційності даних

AI+Web3: Вежі та Площа

ТЛ; ДОКТОР

  1. Проекти Web3 з концепцією ШІ стають об'єктами залучення коштів на первинному та вторинному ринках.

  2. Можливості Web3 в індустрії штучного інтелекту проявляються у: використанні розподілених стимулів для координації потенційних постачальників у довгому хвості ------ через дані, зберігання та обробку; одночасно створюючи відкриту модель та децентралізований ринок для AI Agent.

  3. Основні сфери використання AI в індустрії Web3 - це фінанси на базі блокчейна (криптоплатежі, торгівля, аналіз даних) та допомога в розробці.

  4. Ефективність AI+Web3 проявляється в їх взаємодоповнювальності: Web3 має надію протистояти централізації AI, в той час як AI має надію допомогти Web3 вийти за межі.

! AI+Web3: Вежі та Плази

Вступ

Останні два роки розвиток ШІ виглядає так, ніби натиснули кнопку прискорення; цей метелик, роздмуханий Chatgpt, не тільки відкрив новий світ генеративного штучного інтелекту, але й створив потужний рух у Web3 на іншому березі.

Під впливом концепції ШІ, фінансування в криптовалютному ринку, що сповільнюється, помітно зросло. Згідно з даними ЗМІ, лише в першій половині 2024 року 64 проекти Web3+AI завершили фінансування, а операційна система на основі штучного інтелекту Zyber365 в рамках раунду A досягла максимального обсягу фінансування в 100 мільйонів доларів.

Ринок другого рівня став більш процвітаючим, дані з одного криптоагрегатора показують, що всього за рік загальна ринкова капіталізація AI сектора досягла 48,5 мільярда доларів, а обсяг торгів за 24 години наблизився до 8,6 мільярда доларів; позитивний вплив прогресу основних AI технологій став очевидним, після випуску текстово-видео моделі Sora компанії, середня ціна сектора AI зросла на 151%; ефект AI також поширився на один з сегментів криптовалют, що залучають капітал, Meme: перший концепт AI Agent MemeCoin ------ GOAT швидко став популярним і досяг оцінки в 1,4 мільярда доларів, успішно розпочавши бум AI Meme.

Дослідження та теми навколо AI+Web3 також набирають обертів: від AI+Depin до AI Memecoin, а потім до поточних AI Agent та AI DAO, емоція FOMO вже не встигає за швидкістю зміни нових наративів.

AI+Web3, ця комбінація термінів, сповнена гарячих грошей, трендів і майбутніх фантазій, неминуче сприймається як шлюб, укладений капіталом, ми, здається, важко можемо розрізнити, що ж насправді під цим пишним одягом: чи це арена спекулянтів, чи переддень вибуху світанку?

Щоб відповісти на це питання, важливе міркування для обох сторін полягає в тому, чи стане краще, якщо буде присутня інша сторона? Чи можна отримати вигоду з моделі іншої сторони? У цій статті ми також намагатимемося подивитися на цю ситуацію з висоти попередників: як Web3 може відігравати роль на всіх етапах технологічного стеку AI, і що нового AI може принести Web3?

Частина 1 Які можливості Web3 під стеком ШІ?

Перед тим, як розгорнути цю тему, нам потрібно зрозуміти технологічний стек великих моделей ШІ:

! AI+Web3: Вежі та Квадрати

Використовуючи більш зрозумілу мову, щоб описати весь процес: «Велика модель» схожа на людський мозок. На початкових етапах цей мозок належить немовляті, яке щойно з'явилося на світ, і йому потрібно спостерігати та поглинати величезну кількість інформації з навколишнього світу, щоб зрозуміти цей світ. Це етап «збирання» даних. Оскільки комп'ютери не мають таких сенсорів, як зір чи слух, на етапі навчання велика кількість необробленої зовнішньої інформації потребує «попередньої обробки», щоб бути перетвореною на зрозумілий і корисний для комп'ютера формат.

Після введення даних штучний інтелект через «навчання» створює модель, що має здатність розуміти та прогнозувати, це можна розглядати як процес, у якому немовля поступово розуміє та вивчає навколишній світ; параметри моделі подібні до мовних навичок немовляти, які постійно коригуються під час навчання. Коли вміст навчання починає розділятися на категорії або коли відбувається спілкування з людьми, отримується зворотний зв'язок та корекція, це переходить до етапу «доопрацювання» великої моделі.

Діти, які поступово дорослішають і навчаються говорити, можуть розуміти значення у нових діалогах і висловлювати свої почуття та думки. Цей етап схожий на «висновок» у великих моделях ШІ, які можуть прогнозувати та аналізувати нові мовні та текстові введення. Немовлята виражають почуття, описують об'єкти і вирішують різні проблеми за допомогою мовних навичок, що також схоже на те, як великі моделі ШІ, після завершення навчання, використовуються на етапі висновку для виконання різних специфічних завдань, таких як класифікація зображень, розпізнавання мови тощо.

А AI Agent більше наближається до наступної форми великої моделі ------ здатної самостійно виконувати завдання та переслідувати складні цілі, він не лише має здатність до мислення, але й може запам'ятовувати, планувати та використовувати інструменти для взаємодії зі світом.

На сьогоднішній день, враховуючи проблеми штучного інтелекту на різних рівнях, Web3 наразі починає формувати багаторівневу, взаємопов'язану екосистему, що охоплює всі етапи процесу роботи з моделями ШІ.

Один. Базовий рівень: обчислювальна потужність і дані Airbnb

Потужність

На сьогодні одним з найбільших витрат AI є обчислювальна потужність та енергія, необхідні для навчання моделей і моделювання висновків.

Один із прикладів — це те, що для LLAMA3 певної компанії потрібно 16000 H100GPU, вироблених певним постачальником (це висококласний графічний процесор, спеціально розроблений для штучного інтелекту та обчислень з високою продуктивністю). Тренування займає 30 днів. Ціна одиниці 80GB версії коливається від 30,000 до 40,000 доларів, що потребує інвестицій у обчислювальне обладнання (GPU + мережеві чіпи) на суму 4-7 сотень мільйонів доларів, а щомісячне навчання споживає 1.6 мільярда кіловат-годин, витрати на енергію становлять майже 20 мільйонів доларів на місяць.

Розвантаження обчислювальної потужності AI є однією з перших сфер перетворення Web3 з AI------DePin (децентралізована мережа фізичної інфраструктури). Наразі один з сайтів даних вже представив понад 1400 проектів, серед яких проекти, що представляють спільне використання GPU, включають io.net, Aethir, Akash, Render Network тощо.

Основна логіка полягає в тому, що платформа дозволяє особам або організаціям, які мають вільні ресурси GPU, вносити свій обчислювальний потенціал у децентралізований спосіб без необхідності отримання дозволу. Це підвищує використання недоексплуатованих ресурсів GPU через онлайн-ринок покупців і продавців, подібний до платформ для замовлення таксі або короткострокової оренди, що дозволяє кінцевим користувачам отримувати більш економічні та ефективні обчислювальні ресурси; в той же час механізм стейкінгу також забезпечує, що у разі порушення механізму контролю якості або переривання мережі, постачальники ресурсів понесуть відповідні покарання.

Його особливості полягають у:

  • Збір незайнятих ресурсів GPU: Постачальниками є переважно незалежні маломасштабні дата-центри, оператори надлишкових обчислювальних ресурсів крипто-майнінгу тощо, а також обладнання для майнінгу з механізмом консенсусу PoS, наприклад, певна мережа зберігання та певний основний публічний ланцюг. Наразі також є проекти, що прагнуть запустити обладнання з нижчими бар'єрами для входу, такі як exolab, що використовує певні бренди ноутбуків, телефонів, планшетів та інші локальні пристрої для створення мережі обчислювальних ресурсів для виконання великих моделей.

  • Перед обличчям довгого хвоста ринку AI-обчислень:

a. «З технічної точки зору» децентралізований ринок обчислювальної потужності більше підходить для етапів висновку. Навчання більше залежить від обробної потужності даних, яку забезпечують надвеликий кластер GPU, тоді як для висновку вимоги до продуктивності GPU відносно нижчі, наприклад, Aethir зосереджується на рендерингу з низькою затримкою та додатках AI для висновку.

b. «З точки зору попиту» невеликі споживачі обчислювальної потужності не будуть самостійно навчати свої великі моделі, а просто виберуть оптимізацію та доопрацювання навколо кількох провідних великих моделей, і ці сценарії природно підходять для розподілених незайнятих обчислювальних ресурсів.

  • Децентралізоване володіння: технічне значення блокчейну полягає в тому, що власники ресурсів завжди зберігають контроль над своїми ресурсами, гнучко налаштовуючи їх відповідно до потреб, при цьому отримуючи прибуток.

Дані

Дані є основою ШІ. Якщо немає даних, обчислення будуть безглузді, а зв'язок між даними та моделлю нагадує стару приказку "Сміття на вході, сміття на виході". Кількість даних та якість вводу визначають кінцеву якість виходу моделі. Щодо навчання сучасних моделей ШІ, дані визначають мовні можливості моделі, її здатність до розуміння, а також цінності та гуманітарні прояви. Наразі труднощі з потребами даних для ШІ зосереджені на чотирьох основних аспектах:

  • Голод даних: Тренування AI моделей залежить від великої кількості вхідних даних. Відкриті дані показують, що певна компанія тренувала параметри GPT-4 на трильйонному рівні.

  • Якість даних: з поєднанням ШІ та різних галузей виникають нові вимоги до якості даних, такі як своєчасність даних, різноманітність даних, спеціалізація вертикальних даних та залучення нових джерел даних, таких як емоції в соціальних мережах.

  • Проблеми конфіденційності та відповідності: наразі різні країни та компанії поступово усвідомлюють важливість якісних наборів даних і вводять обмеження на їх збір.

  • Високі витрати на обробку даних: велика кількість даних, складний процес обробки. Відкриті дані показують, що понад 30% витрат на дослідження та розробки в AI компаніях йдуть на збір та обробку основних даних.

В даний час рішення web3 проявляються в наступних чотирьох аспектах:

  1. Збір даних: можливість безкоштовно отримувати реальні дані з реального світу швидко вичерпується, витрати компаній з виробництва штучного інтелекту на дані зростають з року в рік. Але водночас ці витрати не повертаються до справжніх внесків постачальників даних, платформи повністю насолоджуються створенням вартості, яке приносить дані, наприклад, одна соціальна платформа отримала загальний дохід у 203 мільйони доларів США завдяки угодам про ліцензування даних з компаніями з виробництва штучного інтелекту.

Дозволити справжнім користувачам, які вносять внесок, також брати участь у створенні вартості, що виникає з даних, а також отримувати більш приватні та цінні дані від користувачів за допомогою розподіленої мережі та механізмів стимулювання з низькими витратами – це бачення Web3.

  • Grass є децентралізованим рівнем даних та мережею, користувачі можуть запускати вузли Grass, вносячи вільну смугу пропускання та релейний трафік для захоплення реальних даних з усього Інтернету та отримувати токен-накопичення;

  • Vana впровадила унікальну концепцію пулу ліквідності даних (DLP), користувачі можуть завантажувати свої приватні дані (такі як історія покупок, звички перегляду, активність у соціальних мережах тощо) до певного DLP та гнучко обирати, чи надавати ці дані на використання певним третім сторонам;

  • У PublicAI користувачі можуть використовувати #AI 或#Web3 як категорійний тег у певній соціальній мережі та @PublicAI для збору даних.

  1. Попередня обробка даних: під час обробки даних в ШІ, оскільки зібрані дані зазвичай шумні та містять помилки, їх потрібно очистити та перетворити в придатний формат перед навчанням моделі, що включає стандартизацію, фільтрацію та обробку пропущених значень. Ця стадія є однією з небагатьох ручних етапів в індустрії ШІ, в результаті чого виникла професія маркерів даних, а з підвищенням вимог моделей до якості даних підвищується і бар'єр для входу маркерів даних, а ця задача природним чином підходить для децентралізованих механізмів стимулювання Web3.
  • Наразі Grass та OpenLayer розглядають можливість приєднання до цього ключового етапу - маркування даних.

  • Synesis提出ив концепцію «Train2earn», підкреслюючи якість даних, користувачі можуть отримувати винагороди, надаючи позначені дані, коментарі або інші форми внесків.

  • Проект мічення даних Sapien гейміфікує завдання мічення та дозволяє користувачам стейкати бали, щоб заробляти більше балів.

  1. Конфіденційність даних та безпека: необхідно чітко розмежувати, що конфіденційність даних та безпека - це два різні поняття. Конфіденційність даних стосується обробки чутливих даних, тоді як безпека даних захищає інформацію від несанкціонованого доступу, знищення та крадіжки. Таким чином, переваги технологій конфіденційності Web3 та потенційні сфери їх застосування проявляються в двох аспектах: (1) навчання на чутливих даних; (2) співпраця з даними: кілька власників даних можуть спільно брати участь в навчанні ШІ, не ділячись своїми вихідними даними.

Актуальні технології конфіденційності в Web3 включають:

  • Достовірне виконуване середовище ( TEE ), наприклад, Super Protocol;

  • Повна гомоморфна криптографія (FHE), наприклад, BasedAI, Fhenix.io або Inco Network;

  • Технологія нульових знань (zk), така як Reclaim Protocol, використовує технологію zkTLS для створення доказів нульового знання для HTTPS-трафіку, що дозволяє користувачам безпечно імпортувати активність, репутацію та дані про особу з зовнішніх веб-сайтів без розкриття чутливої інформації.

Однак наразі ця галузь все ще перебуває на ранній стадії, більшість проєктів все ще знаходяться в стадії вивчення, а поточна проблема полягає в надто високих витратах на обчислення, деякі приклади це:

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 5
  • Поділіться
Прокоментувати
0/400
HashBanditvip
· 15год тому
в часи моєї майнінгової діяльності у нас була справжня децентралізація... а не ця божевільна гіперболізація штучного інтелекту, смх
Переглянути оригіналвідповісти на0
CoconutWaterBoyvip
· 15год тому
Заробляємо разом, якщо є гроші~
Переглянути оригіналвідповісти на0
CryptoTherapistvip
· 15год тому
підожди, роблю деякі глибокі дихальні вправи, щоб впоратися з цією тривогою через злиття ai-web3, якщо чесно
Переглянути оригіналвідповісти на0
SleepTradervip
· 15год тому
Знову спекулюють концепціями, це всього лише інструмент для збору грошей.
Переглянути оригіналвідповісти на0
shadowy_supercodervip
· 15год тому
ai заробити гроші - ось і все
Переглянути оригіналвідповісти на0
  • Закріпити