Компанія DeepMind, підрозділ штучного інтелекту Google, представила модель Genie 2. Вона здатна генерувати інтерактивні тривимірні світи на основі лише одного зображення та текстового опису.
Можливості генеративного штучного інтелекту Genie 2
Genie 2 є наступником оригінальної моделі Genie, представленої на початку року. Завдяки вдосконаленим алгоритмам, нова версія здатна створювати цілісні 3D-світи протягом 10–20 секунд, дозволяючи користувачам досліджувати їх у режимі реального часу.
Платформа підтримує різні перспективи, зокрема вид від першої особи та ізометричний огляд. Сцени, створені моделлю Genie 2, містять елементи фізики, освітлення, анімацію об’єктів і навіть моделювання поведінки NPC. Взаємодія користувача з віртуальним світом здійснюється через клавіатуру або мишу. Причому модель правильно розпізнає дії, які мають виконувати персонажі, а не інші об’єкти середовища.
Інші платформи генерації 3D-середовищ часто стикаються з проблемами узгодженості, артефактами та зниканням елементів сцен. На відміну від них, Genie 2 здатна запам’ятовувати частини змодельованого світу, які не знаходяться в полі зору, і точно відтворювати їх, коли вони знову стають видимими.
Попри потенціал для створення ігор, підрозділ DeepMind позиціонує Genie 2 передусім як інструмент для досліджень і творчості.