Google представила нову функцію штучного інтелекту Gemini, яка дозволяє перетворювати фотографії на відеоролики. Ця можливість, що базується на відеомоделі Veo 3, дозволяє створювати восьмисекундні відео з вихідних зображень, доповнені звуками, що генеруються штучним інтелектом, такими як фонові шуми, звуки навколишнього середовища та мова.
Оновлення Gemini доступне для підписників Google AI Ultra і Pro в “обраних регіонах”. Запуск функції розпочався на веб-платформі сьогодні і протягом тижня буде доступний на мобільних пристроях.
Користувачі Gemini можуть отримати доступ до цієї функції, вибравши виноску “інструменти” на панелі підказок, обравши “відео” та завантаживши фотографію разом із текстовим описом, як вони хотіли б, щоб зображення рухалося. Можна також включити звукові описи для діалогів, звукових ефектів та амбієнтних шумів, які, як запевняє Google, будуть “ідеально синхронізовані з відео”. Готові ролики доставляються у форматі MP4 з роздільною здатністю 720p та у форматі 16:9.
Google зазначила: “Ви можете проявити креативність, анімуючи повсякденні об’єкти, надаючи життя вашим малюнкам і живопису або додаючи рух до природних сцен.” Усі створені відео матимуть видимий водяний знак, який свідчитиме про те, що вони згенеровані штучним інтелектом, а також невидимий цифровий водяний знак SynthID.
Подібна функція вже доступна в Flow, інструменті для створення фільмів на основі генеративного штучного інтелекту, запущеному Google у березні. Тепер користувачі Gemini можуть анімувати свої фотографії без необхідності відкривати інший додаток. Google також повідомила, що Flow буде запущено в “додаткових 75 країнах” сьогодні, крім впровадження нової відеофункції Gemini.