Представляємо нову версію Grok 4.1, що значно покращує реальну використуваність моделі. Цей оновлений алгоритм відзначається підвищеною здатністю до креативних, емоційних та колаборативних взаємодій. Grok 4.1 став більш чутливим до нюансів намірів, а його особистість — ще більш відчутною та зрозумілою, при цьому зберігши висоту інтелекту та надійність попередніх версій.
Для досягнення цих поліпшень команда Grok використала масштабну інфраструктуру навчання з підкріпленням, акцентуючи увагу на оптимізації стилю, особистості, корисності та налаштованості моделі. Впроваджені нові методи дозволили вдосконалити обчислення сприйняття та ітерації відповідей в масштабах.
Запуск Grok 4.1 відбувся поетапно, без пафосних анонсів, на різних платформах, включаючи grok.com і мобільні додатки. Протягом двох тижнів проводилися сліпі оцінювання на реальному трафіку, які показали, що Grok 4.1 переважно обирається на 64.78% частіше, ніж попередня версія.
Grok 4.1 встановлює нові стандарти в оцінках на основі сприйняття користувачами. У рейтингу LMArena, цей алгоритм зайняв перше місце зі значним відривом у 31 очко від інших моделей, в наявності яких не використовується інтелектуальна логіка.
Перевіряючи емоційний інтелект моделі, команда оцінила Grok 4.1 за допомогою EQ-Bench3 — тесту, що фокусується на здібностях до емоційного сприйняття, самосвідомості та емпатії через 45 складних рольових сценаріїв. Grok 4.1 уміє висловлювати співчуття, що ілюструє його професіоналізм у спілкуванні.
Також ми перевірили творчі здібності нового алгоритму. Grok 4.1 продемонстрував відмінні результати у виконанні креативних завдань, підтвердивши свою здатність генерувати якісні тексти на запити користувачів.
Крім того, нова версія моделі зосередилася на зменшенні фактичних помилок, виявляючи помітне зниження частоти “галюцинацій”, тобто неточних відповідей на запити. Оцінювання проводилися на основі реальних запитів, що допомогло визначити якість інформації, яку надає модель.
Grok 4.1 підтверджує свою конкурентоспроможність на ринку, демонструючи високий рівень технологічного прогресу, що відкриває нові горизонти у сфері штучного інтелекту. Завдяки своїй вдосконаленій прадуктивності, нова модель стає незамінним інструментом для користувачів, які цінують якість та інтелектуальність у веденні бесіди.