Команда DeepMind від Google представила нову версію свого AI-модельного світу під назвою Genie 3, яка здатна генерувати 3D середовища, в яких користувачі та AI-агенти можуть взаємодіяти в режимі реального часу. Компанія обіцяє, що користувачі зможуть взаємодіяти з цими світами значно довше, а модель запам’ятає, де знаходяться об’єкти, коли ви відволікетесь на мить.
Модельні світи є типом AI-систем, які можуть симулювати середовища для різних цілей, таких як навчання, розваги або тренування роботів та AI-агентів. З цими моделями ви вводите запит, і система генерує простір, у якому ви можете пересуватися, як у відеогрі, але замість того, щоб світи створювались вручну, вони формуються за допомогою AI. Це напрямок, в який Google вкладає багато зусиль; компанія продемонструвала Genie 2 у грудні, який може створювати інтерактивні світи на основі зображення, а також формує команду для розробки моделей світів, якою керує колишній співкерівник інструменту генерації відео Sora від OpenAI.
Проте поточні моделі мають суттєві недоліки. Наприклад, світи Genie 2 були доступні для гри лише протягом однієї хвилини. Нещодавно я спробував “інтерактивне відео” від компанії, підтримуваної співзасновником Pixar, і це відчувалося як прогулянка розмитою версією Google Street View, де об’єкти деформувалися та змінювалися у несподіваних напрямках при огляді.
Виглядає, що Genie 3 може стати значним кроком вперед. Користувачі зможуть генерувати світи за допомогою запиту, що дозволяє здійснювати “декілька” хвилин безперервної взаємодії, у порівнянні з 10–20 секундами, доступними в Genie 2, згідно з інформацією в блозі. Google стверджує, що Genie 3 може зберігати простори в зоровій пам’яті близько однієї хвилини, що означає, що якщо ви відвертаєтеся від чогось і потім повертаєтеся назад, такі деталі, як фарба на стіні або напис на дошці, залишаться на місці. Світи також будуть мати роздільну здатність 720p і працювати при 24 кадрах на секунду.
DeepMind також додає в Genie 3 те, що називає “світовими подіями за запитом”. Використовуючи запит, ви зможете, наприклад, змінювати погодні умови в світі або додавати нових персонажів.
Однак, ймовірно, це не модель, яку ви зможете спробувати самостійно. Вона запускається як “обмежений дослідницький попередній огляд”, доступний “невеликій групі науковців і творців”, щоб розробники могли краще зрозуміти ризики та як їх можна адекватно зменшувати. Також є ряд обмежень, наприклад, що способи взаємодії користувачів з генерованими світами є обмеженими, а розбірливий текст “часто генерується лише при наданні його в описі світу”. Google зазначає, що “досліджує” можливості розширення доступу до Genie 3 для “додаткових тестувальників” у майбутньому.