Компанія Sakana AI у вівторок випустила відкритий алгоритм, який дозволяє різним моделям штучного інтелекту (ШІ) співпрацювати у вирішенні складних завдань. Новинка отримала назву Adaptive Branching Monte Carlo Tree Search (AB-MCTS) і є алгоритмом, що масштабує процес розрахунків під час тестування, додаючи третю вимірність до існуючої структури моделей ШІ. Завдяки цьому, стикаючись із новим завданням, система вирішує не лише, чи підходить більш тривале міркування або ширше дослідження, а й обирає найбільш підходящу модель ШІ для виконання роботи. Якщо задача є занадто складною, алгоритм може активувати декілька моделей ШІ.
Sakana AI випустила алгоритм, що дозволяє моделям ШІ взаємодіяти
У публікації на платформі X (раніше Twitter), токійська компанія підкреслила, що її новий алгоритм масштабує під час інферування, створюючи середовище для колективного інтелекту між ШІ-моделями, які, зокрема, включають Gemini 2.5 Pro, o4-mini та DeepSeek-R1.
Компанія прагнула вирішити складну проблему у сфері ШІ — як об’єднати унікальні сильні сторони моделей і усунути їхні упередження з метою досягнення кращої продуктивності. Sakana AI досліджує це питання уже кілька років, а у 2024 році вона опублікувала статтю на тему “еволюційного злиття моделей”.
Тепер, спираючись на свої знахідки, компанія представила алгоритм, який дозволяє моделям ШІ виконувати розрахунки під час тестування у межах визначених бюджетів, генерувати кілька вихідних результатів для дослідження різних точок зору та залучати декілька моделей, що підходять для виконання завдання для досягнення вищої продуктивності.
Дослідники, які працювали над проєктом, змогли протестувати можливості на бенчмарку ARC-AGI-2, де система AB-MCTS використовувала комбінацію o4-mini, Gemini-2.5-Pro та R1-0528, перевищивши продуктивність окремих моделей. Sakana AI зазначила, що в той час як o4-mini самостійно вирішила 23% завдань, цей показник виріс до 27.5% у складі кластера AB-MCTS.
Sakana AI опублікувала алгоритм TreeQuest на своєму профілі GitHub, а також окремо поділилася результатами експериментів на ARC-AGI. Деталі дослідження були опубліковані в статті на arXiv.