Значна частина ранніх обговорень генеративної революції штучного інтелекту в іграх була зосереджена на тому, як інструменти штучного інтелекту можуть підвищити ефективність розробників ігор, дозволяючи створювати ігри швидше та в більших масштабах, ніж раніше. У довгостроковій перспективі ми віримо, що ШІ змінить не лише спосіб створення ігор, але й саму природу самих ігор.
ШІ постійно допомагає створювати нові форми ігор. Від процедурно згенерованих підземель у Rogue (1980), кінцевих автоматів у Half-Life (1998) до керівників ігор зі штучним інтелектом у Left 4 Dead (2008). Нещодавно прогрес у технології глибокого навчання ще більше змінив гру, дозволивши комп’ютерам генерувати новий вміст на основі підказок користувача та великих наборів даних.
Це ще ранній період, але ми вже бачимо деякі цікаві сфери ігор на основі штучного інтелекту, зокрема генеративні агенти, персоналізація, оповідання AI, динамічні світи та штучні пілоти. У разі успіху ці системи можна об’єднати для створення нових ігор зі штучним інтелектом, які зберігають лояльних гравців.
Генератор
Започаткована компанією Maxis SimCity у 1989 році гра-симулятор дозволяє гравцям будувати віртуальне місто та керувати ним. Сьогодні найпопулярнішою грою-симулятором є The Sims, де понад 70 мільйонів гравців у всьому світі керують віртуальними людьми, відомими як «сіми», і дозволяють їм займатися повсякденним життям. Дизайнер Вілл Райт одного разу описав The Sims як «інтерактивний ляльковий будиночок».
Генеративний штучний інтелект може значно прискорити розробку симуляційних ігор, зробивши агентів більш реалістичними завдяки новій соціальній поведінці, керованій великими мовними моделями (LLM).
На початку цього року дослідницька група зі Стенфордського університету та Google опублікувала статтю, в якій показано, як застосовувати LLM до агентів в іграх. На чолі з докторантом Джун Сан Паком дослідницька група включила 25 агентів, схожих на Sims, у світ піксельної пісочниці, поведінка яких була визначена ChatGPT та архітектурою, яка розширює LLM, щоб використовувати природну мову для зберігання повного запису досвіду агента, синтезувати ці спогади у відображення вищого рівня та динамічно отримувати їх для планування поведінки.
Ці результати є чудовим попереднім оглядом потенційного майбутнього ігор-симуляторів. Починаючи з указаної користувачем пропозиції про те, що агент хоче організувати вечірку до Дня святого Валентина, агенти самостійно розповсюджують запрошення на вечірку, створюють нових друзів, запрошують один одного на побачення та координують прибуття на вечірку вчасно через два дні.
Така поведінка можлива, оскільки магістри навчання навчаються на даних соціальних мереж, тому їхні моделі включають основи того, як люди спілкуються один з одним і поводяться в різних соціальних контекстах. А в інтерактивних цифрових середовищах, таких як аналогові ігри, ці реакції можуть бути викликані для створення реалістичної поведінки.
З точки зору гравця, кінцевим результатом є більш захоплюючий ігровий досвід. Значна частина задоволення від гри The Sims або sim colony RimWorld приходить від несподіваних подій. З поведінкою агентів у соціальних мережах ми можемо побачити ігри-симулятори, які не лише демонструють уяву дизайнерів ігор, але й відображають непередбачуваність людського суспільства. Перегляд цих симуляторів може забезпечити стільки ж розваг, скільки перегляд наступного покоління «Шоу Трумена» у спосіб, який неможливий із сучасними готовими телепередачами чи фільмами.
Самих агентів також можна персоналізувати, спираючись на наші фантазії щодо гри «Ляльковий будиночок». Гравці можуть створити ідеального агента на основі себе чи вигаданих персонажів. «Ready Player Me» дозволяє користувачам створити власний 3D-аватар, зробивши селфі, і імпортувати аватар у понад 9000 ігор/програм. Платформи персонажів зі штучним інтелектом Character.ai, InWorld і Convai можуть створювати користувальницькі NPC з власними передісторіями, характерами та параметрами поведінки.
Завдяки можливостям природної мови ми також розширили спосіб взаємодії з агентами. Сьогодні розробники можуть використовувати моделі синтезу мовлення від Eleven Labs для створення реалістичних голосів для своїх агентів. Convai нещодавно співпрацювала з Nvidia для широко розрекламованої демоверсії, у якій гравці могли брати участь у природній голосовій розмові з NPC шеф-кухарем рамена зі штучним інтелектом, при цьому діалоги та відповідні вирази обличчя генерувалися в реальному часі. Додаток-супутник AI Replika вже дозволяє користувачам спілкуватися зі своїми товаришами за допомогою голосу, відео та AR/VR. У майбутньому можна уявити гру-симулятор, у якій гравці зможуть підтримувати зв’язок зі своїми агентами за допомогою телефону чи відеочату під час подорожі, а потім перейти до більш захоплюючої гри, коли повернуться до свого комп’ютера.
Проте ще багато проблем, які потрібно вирішити, перш ніж ми зможемо побачити повністю згенеровану версію The Sims. Навчальні дані для LLM мають властиві упередження, які можуть відображатися на поведінці агента. Цілодобові сервісні ігри в режимі реального часу. Вартість проведення великомасштабних симуляцій може бути економічно невиправданою, запуск 25 агентів за 2 дні коштував би дослідницькій групі тисячі доларів на обчислення. Зусилля розвантажити навантаження моделі на пристрої є багатообіцяючими, але все ще відносно ранніми. Можливо, нам також знадобиться розробити нові норми навколо квазісоціальних відносин з агентами.
Але ясно одне, що зараз величезний попит на генератори. У нашому нещодавньому опитуванні 61% ігрових студій планують експериментувати з NPC зі штучним інтелектом. Ми віримо, що супутники штучного інтелекту незабаром стануть звичним явищем, оскільки агенти увійдуть у наші повсякденні соціальні сфери. Ігри-симулятори створюють цифрову пісочницю, у якій ми можемо взаємодіяти з нашими улюбленими компаньйонами зі штучним інтелектом весело та непередбачувано. У довгостроковій перспективі природа ігор-симуляторів, ймовірно, зміниться: ці агенти будуть не просто іграшками, а потенційними друзями, членами сім’ї, колегами, порадниками та навіть коханцями.
Персоналізація
Кінцева мета персоналізованої гри — надати кожному гравцеві унікальний ігровий досвід. Наприклад, почнемо зі створення персонажів — від оригінальної настільної гри Dungeons & Dragons до Genshin Impact від Mihoyo, створення персонажів було основою майже кожної рольової гри (RPG). Більшість рольових ігор дозволяють гравцеві вибирати із попередньо встановлених параметрів для налаштування зовнішнього вигляду, статі, класу тощо. Отже, як вийти за межі попередніх налаштувань, щоб створити унікального персонажа для кожного гравця та ігрового процесу? Персоналізований конструктор символів, що поєднує LLM із моделлю розповсюдження тексту в зображення, дозволяє це зробити.
Spellbrush's Arrowmancer — це рольова гра на базі спеціальної моделі анімації компанії на основі GAN. У Arrowmancer гравці можуть створити повний набір унікальних аніме-персонажів, включаючи мистецтво та бойові здібності. Ця персоналізація також є частиною системи монетизації, коли гравці імпортують персонажів, створених штучним інтелектом, у власні банери gacha, де вони можуть заробляти повторюваних персонажів для зміцнення своїх рангів.
Персоналізація також поширюється на внутрішньоігрові елементи. Наприклад, штучний інтелект може допомогти створити унікальну зброю та броню, які доступні лише гравцям, які виконують певні завдання. Azra Games створила конвеєр ресурсів на основі штучного інтелекту, щоб швидко створювати ідеї та генерувати величезну бібліотеку внутрішньоігрових і світових предметів, прокладаючи шлях до більш різноманітного ігрового досвіду. Відомий розробник AAA Activision Blizzard створив систему Blizzard Diffusion, копію генератора зображень Stable Diffusion, щоб допомогти створити концепт-арт для різних персонажів і одягу.
Текст і діалоги в грі також можна персоналізувати. Емблеми світу можуть відображати якийсь титул або статус, якого досяг гравець. NPC можна налаштувати як LLM-агентів з унікальними особистостями, які адаптуються до поведінки гравця. Наприклад, діалог може змінюватися залежно від минулої поведінки гравця з агентом. Ми бачили, як цю концепцію успішно реалізували в грі з потрійним класом, і в Shadow of Mordor від Monolith є система помсти, яка динамічно створює цікаві передісторії для лиходіїв на основі дій гравця. Ці елементи персоналізації роблять кожну гру унікальною.
Видавець ігор Ubisoft нещодавно представив Ghostwriter, розмовний інструмент на основі LLM. Сьогодні видавці використовують інструмент для автоматичної генерації діалогу, який допомагає імітувати живий світ навколо гравців.
З точки зору гравця, штучний інтелект сприяє зануренню та зручності гри. Незмінна популярність рольових модів у захоплюючих іграх із відкритим світом, таких як Skyrim і Grand Theft Auto V, демонструє приховану потребу в персоналізованих історіях. Навіть сьогодні GTA V постійно має більшу кількість гравців на рольових серверах, ніж оригінальна гра. Ми віримо, що в майбутньому системи персоналізації стануть невід’ємним операційним інструментом у реальному часі для залучення й утримання гравців у всіх іграх.
AI Розповідь
Звісно, хороша гра полягає не тільки в персонажах і діалогах. Ще один цікавий сценарій — використання генеративного штучного інтелекту для кращих і більш особистих історій.
Dungeons & Dragons — це дідусь персоналізованого оповідання в іграх, у якому особа, відома як «майстер підземелля», готується розповісти історію групі друзів, кожен з яких відіграє певну роль у цій історії. Отримана історія — частково імпровізована драма, частково рольова гра, тобто кожне проходження унікальне. На знак потреби в персоналізованому оповіданні історій Dungeons & Dragons сьогодні популярніші, ніж будь-коли, продажі цифрових і аналогових версій досягають рекордних значень.
Сьогодні багато компаній застосовують LLM до сюжетного режиму Dungeons & Dragons. Можливість полягає в тому, що гравці проводять час у своїх улюблених всесвітах, створених гравцями або IP, під керівництвом нескінченно терплячого оповідача ШІ. Latitude AI Dungeon, запущена в 2019 році, — це відкрита текстова пригодницька гра, в якій ШІ грає за господаря підземель. Користувачі також налаштували версію OpenAI GPT-4, щоб грати в Dungeons & Dragons із багатообіцяючими результатами. Текстова пригодницька гра Character.AI є одним із найпопулярніших режимів програми.
Hidden Door йде ще далі, навчаючи модель машинного навчання на певному наборі вихідних матеріалів (наприклад, «Чарівник країни Оз»), дозволяючи гравцям подорожувати в певному IP-всесвіті. Таким чином Hidden Door співпрацював із власником інтелектуальної власності, щоб створити нову інтерактивну форму розширення бренду. Щойно шанувальники закінчать дивитися фільм чи книгу, вони зможуть продовжити свої пригоди у своїх улюблених світах за допомогою спеціальних подій, подібних до Dungeons & Dragons. Попит на фан-досвід стрімко зростає: Archiveofoourown.org і Wattpad, два найбільші онлайн-сховища фан-фікшн, отримали більше 354 мільйонів і 146 мільйонів відвідувань веб-сайтів, відповідно, тільки в травні.
NovelAI розробив власний LLM Clio, використовуючи його для розповідання історій у режимі пісочниці, щоб допомогти людям-письменникам подолати проблеми з блокуванням письма. Для найвибагливіших письменників NovelAI дозволяє користувачам точно налаштувати Clio на основі власних творів або навіть відомих авторів, таких як HP Lovecraft або Jules Verne.
Варто зазначити, що є багато перешкод, перш ніж виробництво історії ШІ буде повністю готове. Сьогодні для того, щоб створити хорошого оповідача зі штучним інтелектом, потрібно багато встановлювати правила від людини, щоб створити сюжетні лінії, які визначають гарну історію. Пам'ять і зв'язність дуже важливі, оповідач повинен пам'ятати, що відбулося раніше в історії, і бути послідовним у фактах і стилі. Інтерпретація залишається проблемою для більшої частини закритого вихідного коду, який працює як чорний ящик, і розробники ігор повинні розуміти, як поводяться системи, щоб покращити ігровий досвід.
Однак у подоланні цих перешкод ШІ став другим пілотом людей-оповідачів. Сьогодні мільйони письменників використовують ChatGPT, щоб надихнути свої історії. Студія розваг ic об’єднала DALL-E, ChatGPT, Midjourney, Eleven Labs і Runway із командою редакторів, щоб створити інтерактивне пригодницьке шоу на вибір, яке тепер транслюється на Netflix.
Динамічна побудова світу
Незважаючи на те, що текстові історії популярні, багато гравців також прагнуть побачити свої історії візуально оживленими. Можливо, одна з найбільших можливостей для генеративного штучного інтелекту в іграх полягає в тому, щоб допомогти створити живі світи, у які гравці проводять незліченну кількість годин.
Основна мета полягає в тому, щоб мати можливість генерувати рівні та вміст у реальному часі, коли гравець просувається в грі. «Гра розуму» в науково-фантастичному романі «Гра Ендера» (Ender's Game) є типовим прикладом такої гри. Mind Game — це гра, керована штучним інтелектом, яка в режимі реального часу адаптується до інтересів кожного учня, причому ігровий світ постійно змінюється залежно від поведінки учня та будь-якої іншої розумової інформації, отриманої ШІ.
Ймовірно, найближче до «грі розуму» сьогодні — це серія Valve Left 4 Dead, яка використовує вказівки штучного інтелекту для динамічного регулювання темпу та складності гри. Директор ШІ не встановлював точку появи ворога (зомбі), а розміщував зомбі в різних позиціях відповідно до статусу, навичок і позиції кожного гравця, таким чином створюючи унікальний досвід у кожній грі.Режисер також створював атмосферу гри за допомогою динамічних візуальних ефектів і музики. Засновник Valve Гейб Ньюелл називає цю систему «програмованим оповіданням». Схвалений критиками рімейк Dead Space від EA використовує варіант системи режисера штучного інтелекту, щоб довести цей жах до крайнощів.
Хоча сьогодні це може здатися науково-фантастичним сюжетом, одного разу, вдосконаливши генеративні моделі та отримавши достатньо обчислень і даних, ми можемо створити керівника штучного інтелекту, який зможе не тільки лякати, але й створювати сам світ.
Варто зазначити, що концепція машинно-генерованих рівнів в іграх не є новою. Від Supergiant's Hades до Blizzard's Diablo і Mojang's Minecraft, багато з найпопулярніших сучасних ігор використовують процедурну генерацію, яка використовує рівняння та набори правил, керованих людьми-дизайнерами для випадкового створення рівнів, які щоразу відрізняються. Було створено повний набір бібліотек програмного забезпечення для допомоги у створенні програм. SpeedTree від Unity допомагає розробникам генерувати віртуальне листя, яке ви могли бачити в лісах Пандори в Аватарі або в ландшафтах Elden Ring.
Гра може поєднувати процедурний генератор активів із LLM в інтерфейсі користувача. У грі «Townscaper» використовується процедурна система, яка вимагає від гравця лише введення двох частин інформації (положення та колір блоків), і її можна швидко перетворити на чудовий міський пейзаж. Уявіть собі, що до інтерфейсу користувача можна додати Townscaper від LLM, щоб допомогти гравцям повторювати більш вишукані та витончені роботи за допомогою підказок природною мовою.
Багато розробників також у захваті від потенціалу використання машинного навчання для покращення створення програм. Одного разу дизайнери зможуть ітеративно створювати життєздатні перші проекти рівнів, використовуючи моделі, навчені на існуючих рівнях із подібними стилями. На початку цього року Шям Судхакаран очолив команду в Копенгагенському університеті, яка створила MarioGPT — інструмент GPT2, який генерує рівні Super Mario за допомогою моделі, навченої на оригінальних рівнях із Super Mario 1 і 2. Академічні дослідження в цій галузі тривають уже деякий час, включаючи проект 2018 року з використанням генеративних змагальних мереж (GAN) для розробки рівнів для шутера від першої особи DOOM.
Генеративні моделі, що використовуються в поєднанні з процедурними системами, можуть значно прискорити створення активів. Художники вже використовують моделі дифузії тексту в зображення для концептуального мистецтва та розкадровки за допомогою ШІ. У цій публікації в блозі керівник візуальних ефектів мейнфреймів Юссі Кемппайнен описує, як він створював світ і персонажів для 2,5D-пригодницької гри за допомогою Midjourney і Adobe Firefly.
Тривимірні генеративні методи також ретельно досліджувалися. Luma використовує поля нейронного випромінювання (Neural Radiation Fields, NeRF), щоб дозволити споживачам створювати фотореалістичні 3D-ресурси з 2D-зображень, знятих на iPhone. Kaedim використовує комбінацію штучного інтелекту та людського контролю якості для створення готових до виробництва 3D-сіток і наразі використовується більш ніж 225 розробниками ігор. CSM нещодавно випустила власну модель, яка може генерувати 3D-моделі з відео та зображень.
Побудова світу в режимі реального часу за допомогою моделей штучного інтелекту – це те, що має значення в довгостроковій перспективі. На нашу думку, у майбутньому всю гру більше не потрібно буде рендерити, а генеруватиметься під час виконання за допомогою нейронних мереж. Технологія Nvidia DLSS вже може генерувати нові ігрові кадри високої роздільної здатності на льоту за допомогою графічних процесорів споживчого рівня. Можливо, колись ви зможете натиснути кнопку «взаємодіяти» у фільмі Netflix і потрапити у світ, де кожна сцена генерується на льоту та підлаштовується під гравця. У майбутньому ігри нічим не відрізнятимуться від фільмів.
Варто зазначити, що одного лише динамічно згенерованого світу недостатньо для створення гарної гри, про що свідчить рецензія на No Man's Sky. Обіцянка динамічних світів полягає в його поєднанні з іншими ігровими системами (персоналізація, генеративні агенти тощо) для відкриття нових форм оповідання. Зрештою, найпереконливішою частиною «Ігор розуму» є те, як вона формує себе для Еда, а не сам світ.
AI "другий пілот"
Хоча ми раніше вже розглядали використання генеративних агентів у симуляційних іграх, з’являється ще один випадок використання, коли штучний інтелект діє як другий пілот, проводячи нас у грі, а в деяких випадках навіть борючись з нами.
Для гравців, які починають грати в складні ігри, роль другого пілота ШІ є неосяжною. Наприклад, UGC-пісочниця, як-от Minecraft, Roblox або Rec Room, — це насичене середовище, де гравці можуть будувати майже все, що можуть собі уявити, маючи потрібні матеріали та навички. Але поріг навчання дуже високий, і більшості гравців непросто знайти спосіб почати.
Другий пілот зі штучним інтелектом може зробити будь-якого гравця майстерним розробником ігор UGC, надаючи покрокові вказівки на основі текстових підказок або зображень і направляючи гравців долати помилки. Гарною точкою відліку є концепція «майстерів-будівельників» у світі Lego, цих рідкісних істот, які мають дар здатності бачити креслення будь-якого творіння, яке вони можуть уявити, коли це необхідно.
Корпорація Майкрософт почала розробку системи з підтримкою штучного інтелекту для Minecraft, яка використовує DALL-E та Github Copilot, щоб дозволити гравцям вставляти ресурси та логіку в сесії Minecraft за допомогою підказок природною мовою. Roblox активно інтегрує інструменти генерації штучного інтелекту в платформу Roblox з місією «дозволити кожному користувачеві бути творцем». Від кодування за допомогою Github Copilot до написання за допомогою ChatGPT, ефективність копілотів AI у спільному створенні була доведена в багатьох сферах.
На додаток до співавторства, LLM, навчений на даних людських ігор, повинен мати можливість розуміти, як поводитися в різних іграх. За належної інтеграції агент може діяти як партнер, коли друзі гравця не можуть брати участь, або як інша сторона в іграх один до одного, таких як FIFA та NBA 2k. Такий агент може брати участь у грі в будь-який час, виграє він чи програє, він привітний і не звинувачуватиме гравця. Точно налаштовані на наші індивідуальні історії гри, такі агенти можуть значно перевершити існуючих ботів, граючи точно так, як ми, або граючи взаємодоповнюючими способами.
Подібні проекти успішно запускаються в обмежених середовищах. Популярна гоночна гра Forza розробила систему «Drivatar», яка використовує машинне навчання для створення драйвера штучного інтелекту для кожного гравця, який імітує його поведінку за кермом. Drivatars завантажуються в хмару, і коли людина-партнер офлайн, Drivatars можна викликати, щоб змагатися з іншими гравцями та навіть заробляти переможні очки. AlphaStar від Google DeepMind тренувався на наборі даних гри StarCraft II «200-річної давності», щоб створити агента, який може грати проти професіоналів кіберспорту та перемагати їх.
В якості ігрового механізму другий пілот AI може навіть створити новий режим гри. Уявіть собі Fortnite, але кожен гравець має чарівну паличку «майстра-будівельника», яка може миттєво будувати снайперські вежі чи палаючі валуни за допомогою підказок. У цьому ігровому режимі результат може залежати більше від того, що робить чарівна паличка (підказка), ніж від здатності прицілюватися.
Ідеальний «партнер» ШІ в іграх був частиною багатьох популярних ігрових франшиз. Приклади включають Кортану у всесвіті Halo, Ель в The Last of Us або Елізабет у BioShock Infinite. Побиття комп’ютерних ботів ніколи не виходить з моди для змагальних ігор — від смаження інопланетян у Space Invaders до боротьби з топтанням у StarCraft, який згодом перетворився на власний ігровий режим Co-op Commander.
Оскільки ігри перетворюються на нове покоління соціальних мереж, ми очікуємо, що другий пілот зі штучним інтелектом відіграватиме дедалі важливішу соціальну роль. Достовірно задокументовано, що додавання соціальних функцій підвищує привабливість гри, а рівень утримання гравців, які мають друзів, у 5 разів вищий. На нашу думку, у кожній грі майбутнього буде ШІ-пілот.
на закінчення
Ми все ще тільки починаємо застосовувати штучний інтелект в іграх, тому потрібно вирішити багато юридичних, етичних і технічних перешкод, перш ніж ці ідеї можна буде втілити в життя. Наразі юридичне право власності та захист авторських прав на ігри, в яких використовуються активи, створені штучним інтелектом, значною мірою неясні, якщо розробники не зможуть підтвердити право власності на всі дані, які використовуються для навчання моделей. Через це власникам існуючої ліцензованої інтелектуальної власності важко використовувати моделі штучного інтелекту сторонніх розробників у своїх виробничих потоках.
Як компенсувати оригінальним авторам, художникам і творцям, які стоять за навчальними даними, також є головним питанням. Проблема полягає в тому, що більшість моделей штучного інтелекту навчаються на загальнодоступних даних в Інтернеті, більшість із яких є роботами, захищеними авторським правом. У деяких випадках користувачі навіть змогли відтворити стиль художника за допомогою генеративних моделей. Поки ще рано, і питання компенсації творцям контенту потребує належного вирішення.
Більшість генеративних моделей наразі занадто дорогі для роботи в хмарі в глобальному масштабі 24/7, що необхідно для сучасних ігрових операцій. Щоб знизити витрати, розробникам додатків може знадобитися знайти способи перевантажити робоче навантаження моделі на пристрої кінцевих користувачів, але це займе час.
Однак тепер зрозуміло, що розробники і гравці дуже зацікавлені в генеративному ШІ для ігор. Хоча також багато ажіотажу, ми дуже раді бачити багато талановитих команд у цьому просторі, які понаднормово працюють над створенням інноваційних продуктів.
Можливість полягає не лише в тому, щоб зробити існуючі ігри швидшими та дешевшими, а й у створенні абсолютно нового типу ігор зі штучним інтелектом, які раніше були неможливими. Ми ще не знаємо, яку форму матимуть ці ігри, але ми знаємо, що історія ігрової індустрії була технологією, що створювала нові форми гри. Завдяки таким системам, як генеративні агенти, персоналізація, розповідь AI, динамічна побудова світу та AI-пілоти, ми можемо бути на порозі появи перших «нескінченних» ігор, створених розробниками AI.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Поглиблений аналіз a16z: який новий геймплей створить ШІ?
джерело/a16z
Компіляція/Нік
Значна частина ранніх обговорень генеративної революції штучного інтелекту в іграх була зосереджена на тому, як інструменти штучного інтелекту можуть підвищити ефективність розробників ігор, дозволяючи створювати ігри швидше та в більших масштабах, ніж раніше. У довгостроковій перспективі ми віримо, що ШІ змінить не лише спосіб створення ігор, але й саму природу самих ігор.
ШІ постійно допомагає створювати нові форми ігор. Від процедурно згенерованих підземель у Rogue (1980), кінцевих автоматів у Half-Life (1998) до керівників ігор зі штучним інтелектом у Left 4 Dead (2008). Нещодавно прогрес у технології глибокого навчання ще більше змінив гру, дозволивши комп’ютерам генерувати новий вміст на основі підказок користувача та великих наборів даних.
Це ще ранній період, але ми вже бачимо деякі цікаві сфери ігор на основі штучного інтелекту, зокрема генеративні агенти, персоналізація, оповідання AI, динамічні світи та штучні пілоти. У разі успіху ці системи можна об’єднати для створення нових ігор зі штучним інтелектом, які зберігають лояльних гравців.
Генератор
Започаткована компанією Maxis SimCity у 1989 році гра-симулятор дозволяє гравцям будувати віртуальне місто та керувати ним. Сьогодні найпопулярнішою грою-симулятором є The Sims, де понад 70 мільйонів гравців у всьому світі керують віртуальними людьми, відомими як «сіми», і дозволяють їм займатися повсякденним життям. Дизайнер Вілл Райт одного разу описав The Sims як «інтерактивний ляльковий будиночок».
Генеративний штучний інтелект може значно прискорити розробку симуляційних ігор, зробивши агентів більш реалістичними завдяки новій соціальній поведінці, керованій великими мовними моделями (LLM).
На початку цього року дослідницька група зі Стенфордського університету та Google опублікувала статтю, в якій показано, як застосовувати LLM до агентів в іграх. На чолі з докторантом Джун Сан Паком дослідницька група включила 25 агентів, схожих на Sims, у світ піксельної пісочниці, поведінка яких була визначена ChatGPT та архітектурою, яка розширює LLM, щоб використовувати природну мову для зберігання повного запису досвіду агента, синтезувати ці спогади у відображення вищого рівня та динамічно отримувати їх для планування поведінки.
Ці результати є чудовим попереднім оглядом потенційного майбутнього ігор-симуляторів. Починаючи з указаної користувачем пропозиції про те, що агент хоче організувати вечірку до Дня святого Валентина, агенти самостійно розповсюджують запрошення на вечірку, створюють нових друзів, запрошують один одного на побачення та координують прибуття на вечірку вчасно через два дні.
Така поведінка можлива, оскільки магістри навчання навчаються на даних соціальних мереж, тому їхні моделі включають основи того, як люди спілкуються один з одним і поводяться в різних соціальних контекстах. А в інтерактивних цифрових середовищах, таких як аналогові ігри, ці реакції можуть бути викликані для створення реалістичної поведінки.
З точки зору гравця, кінцевим результатом є більш захоплюючий ігровий досвід. Значна частина задоволення від гри The Sims або sim colony RimWorld приходить від несподіваних подій. З поведінкою агентів у соціальних мережах ми можемо побачити ігри-симулятори, які не лише демонструють уяву дизайнерів ігор, але й відображають непередбачуваність людського суспільства. Перегляд цих симуляторів може забезпечити стільки ж розваг, скільки перегляд наступного покоління «Шоу Трумена» у спосіб, який неможливий із сучасними готовими телепередачами чи фільмами.
Самих агентів також можна персоналізувати, спираючись на наші фантазії щодо гри «Ляльковий будиночок». Гравці можуть створити ідеального агента на основі себе чи вигаданих персонажів. «Ready Player Me» дозволяє користувачам створити власний 3D-аватар, зробивши селфі, і імпортувати аватар у понад 9000 ігор/програм. Платформи персонажів зі штучним інтелектом Character.ai, InWorld і Convai можуть створювати користувальницькі NPC з власними передісторіями, характерами та параметрами поведінки.
Завдяки можливостям природної мови ми також розширили спосіб взаємодії з агентами. Сьогодні розробники можуть використовувати моделі синтезу мовлення від Eleven Labs для створення реалістичних голосів для своїх агентів. Convai нещодавно співпрацювала з Nvidia для широко розрекламованої демоверсії, у якій гравці могли брати участь у природній голосовій розмові з NPC шеф-кухарем рамена зі штучним інтелектом, при цьому діалоги та відповідні вирази обличчя генерувалися в реальному часі. Додаток-супутник AI Replika вже дозволяє користувачам спілкуватися зі своїми товаришами за допомогою голосу, відео та AR/VR. У майбутньому можна уявити гру-симулятор, у якій гравці зможуть підтримувати зв’язок зі своїми агентами за допомогою телефону чи відеочату під час подорожі, а потім перейти до більш захоплюючої гри, коли повернуться до свого комп’ютера.
Проте ще багато проблем, які потрібно вирішити, перш ніж ми зможемо побачити повністю згенеровану версію The Sims. Навчальні дані для LLM мають властиві упередження, які можуть відображатися на поведінці агента. Цілодобові сервісні ігри в режимі реального часу. Вартість проведення великомасштабних симуляцій може бути економічно невиправданою, запуск 25 агентів за 2 дні коштував би дослідницькій групі тисячі доларів на обчислення. Зусилля розвантажити навантаження моделі на пристрої є багатообіцяючими, але все ще відносно ранніми. Можливо, нам також знадобиться розробити нові норми навколо квазісоціальних відносин з агентами.
Але ясно одне, що зараз величезний попит на генератори. У нашому нещодавньому опитуванні 61% ігрових студій планують експериментувати з NPC зі штучним інтелектом. Ми віримо, що супутники штучного інтелекту незабаром стануть звичним явищем, оскільки агенти увійдуть у наші повсякденні соціальні сфери. Ігри-симулятори створюють цифрову пісочницю, у якій ми можемо взаємодіяти з нашими улюбленими компаньйонами зі штучним інтелектом весело та непередбачувано. У довгостроковій перспективі природа ігор-симуляторів, ймовірно, зміниться: ці агенти будуть не просто іграшками, а потенційними друзями, членами сім’ї, колегами, порадниками та навіть коханцями.
Персоналізація
Кінцева мета персоналізованої гри — надати кожному гравцеві унікальний ігровий досвід. Наприклад, почнемо зі створення персонажів — від оригінальної настільної гри Dungeons & Dragons до Genshin Impact від Mihoyo, створення персонажів було основою майже кожної рольової гри (RPG). Більшість рольових ігор дозволяють гравцеві вибирати із попередньо встановлених параметрів для налаштування зовнішнього вигляду, статі, класу тощо. Отже, як вийти за межі попередніх налаштувань, щоб створити унікального персонажа для кожного гравця та ігрового процесу? Персоналізований конструктор символів, що поєднує LLM із моделлю розповсюдження тексту в зображення, дозволяє це зробити.
Spellbrush's Arrowmancer — це рольова гра на базі спеціальної моделі анімації компанії на основі GAN. У Arrowmancer гравці можуть створити повний набір унікальних аніме-персонажів, включаючи мистецтво та бойові здібності. Ця персоналізація також є частиною системи монетизації, коли гравці імпортують персонажів, створених штучним інтелектом, у власні банери gacha, де вони можуть заробляти повторюваних персонажів для зміцнення своїх рангів.
Персоналізація також поширюється на внутрішньоігрові елементи. Наприклад, штучний інтелект може допомогти створити унікальну зброю та броню, які доступні лише гравцям, які виконують певні завдання. Azra Games створила конвеєр ресурсів на основі штучного інтелекту, щоб швидко створювати ідеї та генерувати величезну бібліотеку внутрішньоігрових і світових предметів, прокладаючи шлях до більш різноманітного ігрового досвіду. Відомий розробник AAA Activision Blizzard створив систему Blizzard Diffusion, копію генератора зображень Stable Diffusion, щоб допомогти створити концепт-арт для різних персонажів і одягу.
Текст і діалоги в грі також можна персоналізувати. Емблеми світу можуть відображати якийсь титул або статус, якого досяг гравець. NPC можна налаштувати як LLM-агентів з унікальними особистостями, які адаптуються до поведінки гравця. Наприклад, діалог може змінюватися залежно від минулої поведінки гравця з агентом. Ми бачили, як цю концепцію успішно реалізували в грі з потрійним класом, і в Shadow of Mordor від Monolith є система помсти, яка динамічно створює цікаві передісторії для лиходіїв на основі дій гравця. Ці елементи персоналізації роблять кожну гру унікальною.
Видавець ігор Ubisoft нещодавно представив Ghostwriter, розмовний інструмент на основі LLM. Сьогодні видавці використовують інструмент для автоматичної генерації діалогу, який допомагає імітувати живий світ навколо гравців.
З точки зору гравця, штучний інтелект сприяє зануренню та зручності гри. Незмінна популярність рольових модів у захоплюючих іграх із відкритим світом, таких як Skyrim і Grand Theft Auto V, демонструє приховану потребу в персоналізованих історіях. Навіть сьогодні GTA V постійно має більшу кількість гравців на рольових серверах, ніж оригінальна гра. Ми віримо, що в майбутньому системи персоналізації стануть невід’ємним операційним інструментом у реальному часі для залучення й утримання гравців у всіх іграх.
AI Розповідь
Звісно, хороша гра полягає не тільки в персонажах і діалогах. Ще один цікавий сценарій — використання генеративного штучного інтелекту для кращих і більш особистих історій.
Dungeons & Dragons — це дідусь персоналізованого оповідання в іграх, у якому особа, відома як «майстер підземелля», готується розповісти історію групі друзів, кожен з яких відіграє певну роль у цій історії. Отримана історія — частково імпровізована драма, частково рольова гра, тобто кожне проходження унікальне. На знак потреби в персоналізованому оповіданні історій Dungeons & Dragons сьогодні популярніші, ніж будь-коли, продажі цифрових і аналогових версій досягають рекордних значень.
Сьогодні багато компаній застосовують LLM до сюжетного режиму Dungeons & Dragons. Можливість полягає в тому, що гравці проводять час у своїх улюблених всесвітах, створених гравцями або IP, під керівництвом нескінченно терплячого оповідача ШІ. Latitude AI Dungeon, запущена в 2019 році, — це відкрита текстова пригодницька гра, в якій ШІ грає за господаря підземель. Користувачі також налаштували версію OpenAI GPT-4, щоб грати в Dungeons & Dragons із багатообіцяючими результатами. Текстова пригодницька гра Character.AI є одним із найпопулярніших режимів програми.
Hidden Door йде ще далі, навчаючи модель машинного навчання на певному наборі вихідних матеріалів (наприклад, «Чарівник країни Оз»), дозволяючи гравцям подорожувати в певному IP-всесвіті. Таким чином Hidden Door співпрацював із власником інтелектуальної власності, щоб створити нову інтерактивну форму розширення бренду. Щойно шанувальники закінчать дивитися фільм чи книгу, вони зможуть продовжити свої пригоди у своїх улюблених світах за допомогою спеціальних подій, подібних до Dungeons & Dragons. Попит на фан-досвід стрімко зростає: Archiveofoourown.org і Wattpad, два найбільші онлайн-сховища фан-фікшн, отримали більше 354 мільйонів і 146 мільйонів відвідувань веб-сайтів, відповідно, тільки в травні.
NovelAI розробив власний LLM Clio, використовуючи його для розповідання історій у режимі пісочниці, щоб допомогти людям-письменникам подолати проблеми з блокуванням письма. Для найвибагливіших письменників NovelAI дозволяє користувачам точно налаштувати Clio на основі власних творів або навіть відомих авторів, таких як HP Lovecraft або Jules Verne.
Варто зазначити, що є багато перешкод, перш ніж виробництво історії ШІ буде повністю готове. Сьогодні для того, щоб створити хорошого оповідача зі штучним інтелектом, потрібно багато встановлювати правила від людини, щоб створити сюжетні лінії, які визначають гарну історію. Пам'ять і зв'язність дуже важливі, оповідач повинен пам'ятати, що відбулося раніше в історії, і бути послідовним у фактах і стилі. Інтерпретація залишається проблемою для більшої частини закритого вихідного коду, який працює як чорний ящик, і розробники ігор повинні розуміти, як поводяться системи, щоб покращити ігровий досвід.
Однак у подоланні цих перешкод ШІ став другим пілотом людей-оповідачів. Сьогодні мільйони письменників використовують ChatGPT, щоб надихнути свої історії. Студія розваг ic об’єднала DALL-E, ChatGPT, Midjourney, Eleven Labs і Runway із командою редакторів, щоб створити інтерактивне пригодницьке шоу на вибір, яке тепер транслюється на Netflix.
Динамічна побудова світу
Незважаючи на те, що текстові історії популярні, багато гравців також прагнуть побачити свої історії візуально оживленими. Можливо, одна з найбільших можливостей для генеративного штучного інтелекту в іграх полягає в тому, щоб допомогти створити живі світи, у які гравці проводять незліченну кількість годин.
Основна мета полягає в тому, щоб мати можливість генерувати рівні та вміст у реальному часі, коли гравець просувається в грі. «Гра розуму» в науково-фантастичному романі «Гра Ендера» (Ender's Game) є типовим прикладом такої гри. Mind Game — це гра, керована штучним інтелектом, яка в режимі реального часу адаптується до інтересів кожного учня, причому ігровий світ постійно змінюється залежно від поведінки учня та будь-якої іншої розумової інформації, отриманої ШІ.
Ймовірно, найближче до «грі розуму» сьогодні — це серія Valve Left 4 Dead, яка використовує вказівки штучного інтелекту для динамічного регулювання темпу та складності гри. Директор ШІ не встановлював точку появи ворога (зомбі), а розміщував зомбі в різних позиціях відповідно до статусу, навичок і позиції кожного гравця, таким чином створюючи унікальний досвід у кожній грі.Режисер також створював атмосферу гри за допомогою динамічних візуальних ефектів і музики. Засновник Valve Гейб Ньюелл називає цю систему «програмованим оповіданням». Схвалений критиками рімейк Dead Space від EA використовує варіант системи режисера штучного інтелекту, щоб довести цей жах до крайнощів.
Хоча сьогодні це може здатися науково-фантастичним сюжетом, одного разу, вдосконаливши генеративні моделі та отримавши достатньо обчислень і даних, ми можемо створити керівника штучного інтелекту, який зможе не тільки лякати, але й створювати сам світ.
Варто зазначити, що концепція машинно-генерованих рівнів в іграх не є новою. Від Supergiant's Hades до Blizzard's Diablo і Mojang's Minecraft, багато з найпопулярніших сучасних ігор використовують процедурну генерацію, яка використовує рівняння та набори правил, керованих людьми-дизайнерами для випадкового створення рівнів, які щоразу відрізняються. Було створено повний набір бібліотек програмного забезпечення для допомоги у створенні програм. SpeedTree від Unity допомагає розробникам генерувати віртуальне листя, яке ви могли бачити в лісах Пандори в Аватарі або в ландшафтах Elden Ring.
Гра може поєднувати процедурний генератор активів із LLM в інтерфейсі користувача. У грі «Townscaper» використовується процедурна система, яка вимагає від гравця лише введення двох частин інформації (положення та колір блоків), і її можна швидко перетворити на чудовий міський пейзаж. Уявіть собі, що до інтерфейсу користувача можна додати Townscaper від LLM, щоб допомогти гравцям повторювати більш вишукані та витончені роботи за допомогою підказок природною мовою.
Багато розробників також у захваті від потенціалу використання машинного навчання для покращення створення програм. Одного разу дизайнери зможуть ітеративно створювати життєздатні перші проекти рівнів, використовуючи моделі, навчені на існуючих рівнях із подібними стилями. На початку цього року Шям Судхакаран очолив команду в Копенгагенському університеті, яка створила MarioGPT — інструмент GPT2, який генерує рівні Super Mario за допомогою моделі, навченої на оригінальних рівнях із Super Mario 1 і 2. Академічні дослідження в цій галузі тривають уже деякий час, включаючи проект 2018 року з використанням генеративних змагальних мереж (GAN) для розробки рівнів для шутера від першої особи DOOM.
Генеративні моделі, що використовуються в поєднанні з процедурними системами, можуть значно прискорити створення активів. Художники вже використовують моделі дифузії тексту в зображення для концептуального мистецтва та розкадровки за допомогою ШІ. У цій публікації в блозі керівник візуальних ефектів мейнфреймів Юссі Кемппайнен описує, як він створював світ і персонажів для 2,5D-пригодницької гри за допомогою Midjourney і Adobe Firefly.
Тривимірні генеративні методи також ретельно досліджувалися. Luma використовує поля нейронного випромінювання (Neural Radiation Fields, NeRF), щоб дозволити споживачам створювати фотореалістичні 3D-ресурси з 2D-зображень, знятих на iPhone. Kaedim використовує комбінацію штучного інтелекту та людського контролю якості для створення готових до виробництва 3D-сіток і наразі використовується більш ніж 225 розробниками ігор. CSM нещодавно випустила власну модель, яка може генерувати 3D-моделі з відео та зображень.
Побудова світу в режимі реального часу за допомогою моделей штучного інтелекту – це те, що має значення в довгостроковій перспективі. На нашу думку, у майбутньому всю гру більше не потрібно буде рендерити, а генеруватиметься під час виконання за допомогою нейронних мереж. Технологія Nvidia DLSS вже може генерувати нові ігрові кадри високої роздільної здатності на льоту за допомогою графічних процесорів споживчого рівня. Можливо, колись ви зможете натиснути кнопку «взаємодіяти» у фільмі Netflix і потрапити у світ, де кожна сцена генерується на льоту та підлаштовується під гравця. У майбутньому ігри нічим не відрізнятимуться від фільмів.
Варто зазначити, що одного лише динамічно згенерованого світу недостатньо для створення гарної гри, про що свідчить рецензія на No Man's Sky. Обіцянка динамічних світів полягає в його поєднанні з іншими ігровими системами (персоналізація, генеративні агенти тощо) для відкриття нових форм оповідання. Зрештою, найпереконливішою частиною «Ігор розуму» є те, як вона формує себе для Еда, а не сам світ.
AI "другий пілот"
Хоча ми раніше вже розглядали використання генеративних агентів у симуляційних іграх, з’являється ще один випадок використання, коли штучний інтелект діє як другий пілот, проводячи нас у грі, а в деяких випадках навіть борючись з нами.
Для гравців, які починають грати в складні ігри, роль другого пілота ШІ є неосяжною. Наприклад, UGC-пісочниця, як-от Minecraft, Roblox або Rec Room, — це насичене середовище, де гравці можуть будувати майже все, що можуть собі уявити, маючи потрібні матеріали та навички. Але поріг навчання дуже високий, і більшості гравців непросто знайти спосіб почати.
Другий пілот зі штучним інтелектом може зробити будь-якого гравця майстерним розробником ігор UGC, надаючи покрокові вказівки на основі текстових підказок або зображень і направляючи гравців долати помилки. Гарною точкою відліку є концепція «майстерів-будівельників» у світі Lego, цих рідкісних істот, які мають дар здатності бачити креслення будь-якого творіння, яке вони можуть уявити, коли це необхідно.
Корпорація Майкрософт почала розробку системи з підтримкою штучного інтелекту для Minecraft, яка використовує DALL-E та Github Copilot, щоб дозволити гравцям вставляти ресурси та логіку в сесії Minecraft за допомогою підказок природною мовою. Roblox активно інтегрує інструменти генерації штучного інтелекту в платформу Roblox з місією «дозволити кожному користувачеві бути творцем». Від кодування за допомогою Github Copilot до написання за допомогою ChatGPT, ефективність копілотів AI у спільному створенні була доведена в багатьох сферах.
На додаток до співавторства, LLM, навчений на даних людських ігор, повинен мати можливість розуміти, як поводитися в різних іграх. За належної інтеграції агент може діяти як партнер, коли друзі гравця не можуть брати участь, або як інша сторона в іграх один до одного, таких як FIFA та NBA 2k. Такий агент може брати участь у грі в будь-який час, виграє він чи програє, він привітний і не звинувачуватиме гравця. Точно налаштовані на наші індивідуальні історії гри, такі агенти можуть значно перевершити існуючих ботів, граючи точно так, як ми, або граючи взаємодоповнюючими способами.
Подібні проекти успішно запускаються в обмежених середовищах. Популярна гоночна гра Forza розробила систему «Drivatar», яка використовує машинне навчання для створення драйвера штучного інтелекту для кожного гравця, який імітує його поведінку за кермом. Drivatars завантажуються в хмару, і коли людина-партнер офлайн, Drivatars можна викликати, щоб змагатися з іншими гравцями та навіть заробляти переможні очки. AlphaStar від Google DeepMind тренувався на наборі даних гри StarCraft II «200-річної давності», щоб створити агента, який може грати проти професіоналів кіберспорту та перемагати їх.
В якості ігрового механізму другий пілот AI може навіть створити новий режим гри. Уявіть собі Fortnite, але кожен гравець має чарівну паличку «майстра-будівельника», яка може миттєво будувати снайперські вежі чи палаючі валуни за допомогою підказок. У цьому ігровому режимі результат може залежати більше від того, що робить чарівна паличка (підказка), ніж від здатності прицілюватися.
Ідеальний «партнер» ШІ в іграх був частиною багатьох популярних ігрових франшиз. Приклади включають Кортану у всесвіті Halo, Ель в The Last of Us або Елізабет у BioShock Infinite. Побиття комп’ютерних ботів ніколи не виходить з моди для змагальних ігор — від смаження інопланетян у Space Invaders до боротьби з топтанням у StarCraft, який згодом перетворився на власний ігровий режим Co-op Commander.
Оскільки ігри перетворюються на нове покоління соціальних мереж, ми очікуємо, що другий пілот зі штучним інтелектом відіграватиме дедалі важливішу соціальну роль. Достовірно задокументовано, що додавання соціальних функцій підвищує привабливість гри, а рівень утримання гравців, які мають друзів, у 5 разів вищий. На нашу думку, у кожній грі майбутнього буде ШІ-пілот.
на закінчення
Ми все ще тільки починаємо застосовувати штучний інтелект в іграх, тому потрібно вирішити багато юридичних, етичних і технічних перешкод, перш ніж ці ідеї можна буде втілити в життя. Наразі юридичне право власності та захист авторських прав на ігри, в яких використовуються активи, створені штучним інтелектом, значною мірою неясні, якщо розробники не зможуть підтвердити право власності на всі дані, які використовуються для навчання моделей. Через це власникам існуючої ліцензованої інтелектуальної власності важко використовувати моделі штучного інтелекту сторонніх розробників у своїх виробничих потоках.
Як компенсувати оригінальним авторам, художникам і творцям, які стоять за навчальними даними, також є головним питанням. Проблема полягає в тому, що більшість моделей штучного інтелекту навчаються на загальнодоступних даних в Інтернеті, більшість із яких є роботами, захищеними авторським правом. У деяких випадках користувачі навіть змогли відтворити стиль художника за допомогою генеративних моделей. Поки ще рано, і питання компенсації творцям контенту потребує належного вирішення.
Більшість генеративних моделей наразі занадто дорогі для роботи в хмарі в глобальному масштабі 24/7, що необхідно для сучасних ігрових операцій. Щоб знизити витрати, розробникам додатків може знадобитися знайти способи перевантажити робоче навантаження моделі на пристрої кінцевих користувачів, але це займе час.
Однак тепер зрозуміло, що розробники і гравці дуже зацікавлені в генеративному ШІ для ігор. Хоча також багато ажіотажу, ми дуже раді бачити багато талановитих команд у цьому просторі, які понаднормово працюють над створенням інноваційних продуктів.
Можливість полягає не лише в тому, щоб зробити існуючі ігри швидшими та дешевшими, а й у створенні абсолютно нового типу ігор зі штучним інтелектом, які раніше були неможливими. Ми ще не знаємо, яку форму матимуть ці ігри, але ми знаємо, що історія ігрової індустрії була технологією, що створювала нові форми гри. Завдяки таким системам, як генеративні агенти, персоналізація, розповідь AI, динамічна побудова світу та AI-пілоти, ми можемо бути на порозі появи перших «нескінченних» ігор, створених розробниками AI.