Команда Google DeepMind представила нові моделі штучного інтелекту під назвою Gemini Robotics. Ця технологія покликана допомогти роботам ефективніше взаємодіяти з реальним світом. Тобто дбайливіше працювати з предметами, орієнтуватися у просторі та виконувати складні завдання на основі голосових команд.
Нова модель ШІ Gemini Robotics
DeepMind продемонструвала серію відео, у яких роботи з новою моделлю складають папір, кладуть окуляри у футляр та виконують інші дії, реагуючи на голосові інструкції. Основна особливість Gemini Robotics – здатність узагальнювати навички для різних типів апаратного забезпечення. Іншими словами, модель дозволяє роботам “бачити” об’єкти та розуміти, які саме дії вони можуть виконати з ними.
За даними DeepMind, моделі Gemini Robotics успішно працюють навіть у невідомих середовищах, які не входили до навчальних даних. Це означає, що роботи можуть адаптуватися до нових умов, що критично важливо для розвитку автономних систем.
Окрім основної моделі, команда DeepMind представила Gemini Robotics-ER – спрощену версію, яку можна використовувати для створення власних алгоритмів керування роботами. А також еталон для вимірювання потенційних ризиків, пов’язаних із використанням роботів на основі ШІ Asimov.