Новий стандарт ліцензування для веб-публікацій

Введення нового стандарту ліцензування має на меті дозволити веб-видавцям встановлювати умови використання своїх матеріалів для розробників систем штучного інтелекту. У середу такі великі бренди, як Reddit, Yahoo, Medium, Quora та People Inc., оголосили про підтримку Також Простого Ліцензування (RSL), відкритого стандарту, що дає можливість видавцям вказувати, як ботам слід сплачувати за копіювання їхнього контенту для навчання AI. Вони сподіваються, що цей об’єднаний крок надасть їм важелі впливу для залучення AI-компаній.

Основні моменти нової системи

Стандарт RSL базується на протоколі robots.txt, який вже довгий час дозволяє видавцям надсилати вказівки веб-роботам щодо доступу до певних частин їх сайтів. Однак замість простого “так” або “ні” для конкретних ботів, сайти тепер можуть додавати умови ліцензування та роялті до своїх файлів robots.txt. Вони також можуть вбудовувати ці умови в онлайн книги, відео та набори даних, за які хочуть отримати компенсацію.

Хто стоїть за ініціативою

За стандартом RSL стоїть новоутворена організація правозахисту під назвою RSL Collective, очолювана Екартом Вальтером, одним з творців стандарту Really Simple Syndication (RSS), та Дагом Лідсом, колишнім CEO IAC Publishing. “Мета полягає у створенні нової, масштабованої бізнес-моделі для інтернету”, говорить Вальтер. “RSL сприймає деякі з ідей RSS та створює новий рівень для всього інтернету, де визначаються права на ліцензування і компенсацію.”

Моделі ліцензування

Стандарт RSL підтримує різноманітні моделі ліцензування, включаючи безкоштовні. Власники сайтів можуть вимагати від AI-компаній платити підписку або встановлювати плату за кожне сканування через стандарт RSL. Вони також можуть запровадити плату за кожну інтерпретацію, що дозволяє отримувати компенсацію, коли AI-модель використовує їхній контент для генерації відповіді. Боти, які сканують сайти для інших цілей, таких як архівування або додавання в пошукові системи, можуть працювати в звичному режимі.

Спрощення процесу ліцензування

Багато медіа-компаній, включаючи Vox Media (материнську компанію The Verge), News Corp (власник The Wall Street Journal) та The New York Times, уклали ліцензійні угоди з окремими AI-компаніями, такими як OpenAI та Amazon. Однак RSL Collective прагне спростити цей процес, дозволяючи будь-якому власнику сайту або творцю отримувати винагороду за свою працю без необхідності укладати окремі угоди.

Виклики та перспективи

Як і багато стандартів, успіх RSL залежить від підтримки великих гравців ринку — в даному випадку, AI-компаній. Будівельники AI-моделей неодноразово підозрювалися в ігноруванні файлів robots.txt, і немає простого способу підрахувати щось подібне до плати за інтерпретацію без їх участі. RSL Collective сподівається, що об’єднання деяких з найбільших веб-видавців зробить прийняття цього стандарту більш привабливим.

Можливості контенту та правозахисту

Стандарт RSL сам по собі не може заблокувати ботів від відвідування сайту, на відміну від системи “плати за сканування”, вже запропонованої Cloudflare. Тепер RSL Collective працює з Fastly, мережею доставки контенту, яка впускатиме AI-ботів на сайти на основі того, чи погодилися вони на ліцензування контенту. Видавці, які не користуються Fastly, все ще можуть вимагати від AI-компаній ліцензувати свій контент, але їм не вдасться заблокувати AI-сканери, поки інші провайдери не розроблять рішення.

Законодавче підґрунтя та юридична відповідальність

Лідс впевнений, що RSL Collective зможе юридично забезпечити дотримання ліцензій, адже “всі учасники колективної організації прав мають участь у захисті від будь-яких порушень”, таким чином розподіляючи юридичні витрати. Він порівнює цю систему з існуючими організаціями цифрових прав, такими як ASCAP, що збирає ліцензійні платежі і розподіляє їх серед своїх членів. Проте несанкціоноване сканування і використання медіа для навчання AI-моделей залишається правовою сірою зоною.

Також, Лідс та Вальтер підкреслюють, що “завжди існувало питання про те, чи ботів прийняли умови, які вони не бачили”. RSL принципово змінює цю ситуацію, сповіщаючи роботів про умови ще до їх доступу до сайту.