Модель Meta AI здатна відтворити майже половину книги Гаррі Поттер

Попередня справа щодо Google Books, ймовірно, не зможе захистити Meta від другого правового обґрунтування, оскільки Google ніколи не надавав свою бібліотеку книг для завантаження користувачами — компанія, безсумнівно, програла б справу, якби це зробила.

В принципі, Meta все ще могла б переконати суддю, що копіювання 42 відсотків «Гаррі Поттера» є допустимим згідно з гнучкою, створеною судом доктриною добросовісного використання. Проте це буде складна задача.

«Аналіз добросовісного використання, який потрібно провести, полягає не лише в тому, чи є навчальний набір добросовісним використанням, а й у тому, чи є включення в модель добросовісним використанням», — зазначив Лемлі. «Це ускладнює позицію відповідачів.»

Гріммельман також вказав на ризик, що це дослідження може призвести до більшого юридичного ризику для відкритих моделей ваг, ніж для закритих. Дослідники з Корнеллського та Стенфордського університетів змогли провести свою роботу лише тому, що автори мали доступ до базової моделі — і, отже, до ймовірнісних значень токенів, які дозволяли ефективно розраховувати ймовірності для послідовностей токенів.

Більшість провідних лабораторій, включаючи OpenAI, Anthropic та Google, все більше обмежують доступ до цих так званих логітів, ускладнюючи вивчення цих моделей.

Крім того, якщо компанія зберігає ваги моделі на своїх серверах, вона може використовувати фільтри, щоб запобігти потраплянню неправомірного виходу за межі організації. Тож навіть якщо підґрунтеві моделі OpenAI, Anthropic та Google запам’ятали авторські твори так само, як і Llama 3.1 70B, стороннім особам може бути важко це довести.

Цей вид фільтрації робить задіювані моделями з закритими вагами компаній менш вразливими до використання прецеденту Google Books. Коротко кажучи, законодавство про авторські права може створити сильний стимул для компаній утримуватися від випуску моделей з відкритими вагами.

«Це дещо перверсивно», — сказав Марк Лемлі. «Мені не подобається такий результат.»

З іншого боку, судді можуть прийти до висновку, що це було б погано — насправді карати компанії за публікацію моделей з відкритими вагами.

«Є певна міра, в якій бути відкритим і ділитися вагою є свого роду публічною службою», — зазначив Гріммельман. «Я б з честю бачив суддів, які були б менш скептичними щодо Meta та інших, які надають моделі з відкритими вагами.»

Тімоті Б. Лі працював у Ars Technica з 2017 по 2021 рік. Сьогодні він пише у Understanding AI, інформаційному бюлетені, який досліджує, як працює штучний інтелект і як він змінює наш світ. Ви можете підписатися тут.