У вівторок компанія Google представила нову функцію, що покращує взаємодію з чат-ботом Gemini. Тепер ця штучна інтелект система вміє створювати індивідуальні ілюстровані книжки на основі текстових запитів, завантажених зображень або документів. Користувачі можуть також вказувати стиль ілюстрацій, а також давати вказівки щодо імен персонажів, локацій і сюжетних моментів. Ця можливість була розроблена для маленьких дітей, які люблять слухати казки перед сном. Вона доступна для всіх користувачів у всьому світі через вебсайт та мобільні додатки.
Gemini може створювати книжки, використовуючи завантажені фотографії
У блозі Google описали нову функцію, яка наразі впроваджується для всіх користувачів Gemini, включаючи безкоштовних. Створення книжок можливе безпосередньо в інтерфейсі чат-бота: користувачі можуть почати запит з фрази «Створити/Згенерувати книжку…» з подальшим вказанням теми та віку читачів. Крім того, можна зазначити конкретне ім’я персонажа, обстановку та стиль мистецтва.
Gemini підтримує різні стилі ілюстрацій, такі як піксельне мистецтво, комікси, ліплення, в’язання та розмальовки. Ці книжки можуть бути сформовані 45 мовами, а кожна з них може містити до 10 сторінок, при цьому текст розташовуватиметься праворуч, а ілюстрації – ліворуч.
Також функція включає аудіо-озвучення, що дозволяє слухати історію, замість того, щоб читати її. Голос звучить роботизовано і відрізняється від природного голосу, який можна почути в Gemini Live.
Макет книжки в Gemini
Працівники Gadgets 360 змогли протестувати цю функцію і за декілька хвилин чат-бот згенерував книжку з титульною сторінкою, ілюстраціями та десятьма сторінками історії. Також система виявила здатність враховувати всі нюанси, вказані у запитах (жанр, обставини, використання конкретних предметів тощо). Жодних невідповідностей чи артефактів у згенерованих зображеннях ми не помітили.
Google вказує, що користувачі також можуть завантажувати свої фотографії, що дозволяє створити історію, де героями є вони самі, замість випадкових персонажів. Крім того, користувачі можуть завантажувати документи зі своїми написаними історіями та перетворювати їх на ілюстровані книжки за допомогою штучного інтелекту. Окрім читання казок на ніч для дітей, компанія стверджує, що цю функцію також можна використовувати для пояснення складних тем у навчальному процесі.