Як авторське право захищає штучний інтелект?
Як захистити свої розробки в сфері ШІ?
Системи штучного інтелекту з точки зору авторського права це програмні рішення, які складаються як з комп’ютерного коду, що дозволяє ШІ-системі навчатись та досліджувати, так і з самої натренованої нейронної мережі.
Модель (натренована нейронна мережа) може бути представлена у вигляді бази даних, що складається з шарів та, відповідно, параметрів такої бази (ваги, умови активації нейронів тощо).
Якщо говоримо про систему ШІ для розпізнавання візуальних зображень, наприклад, визначення, чи є на зображенні кіт, можемо мати таку структуру:
- Перший шар — зіскановує зображення в цілому, визначаючи наявні елементи практично по-піксельно
- Другий шар — оцінює, чи є на зображенні критичні великі паттерни, наприклад вуса / хвіст
- Третій шар, маючи оцінку першого — деталізує її, визначаючи наявність менших елементів та характеристик в цілому відповідно до того, як модель була натренована
- На останньому етапі ми можемо отримати вихідні дані — зображення є на 80% котом

В системах генеративного штучного інтелекту, прогнозування відбувається щодо кожного наступного символу / слова, залежно від запиту користувача і структури ШІ-системи, контексту та ще багатьох параметрів.
В будь-якому випадку, ми говоримо про взаємодію моделі з певними запитами / подразниками. Цю взаємодію забезпечують алгоритми, але сама модель це скоріше база даних, що постійно змінюється (змінюються ваги нейронів — індекси впливу певної інформації на певному етапі на подальше прогнозування).
Як захистити штучний інтелект авторським правом?
Цього слона треба їсти по шматкам. Дивимось, хто в нас був залучений до розробки конкретної ШІ-системи і визначаємо вклад кожного дата інженера / розробника в наш проєкт.
Наприклад:
- Дата-саєнтист підготував дата-сет, очистив його, відредагував під потреби
- ML інженер налаштовував та здійснював навчання моделі
- Дата-аналітик здійснював коректування, писав інсайти та звіти
- Розробник писав фукнції та програмний код для взаємодії з моделлю
Крок 1
Визначаємо той креатив, який вніс кожен і забираємо майнові авторські права на це через гіг-контракт, договір на розробку, авторський договір чи інший інструмент.
Крок 2
Визначаємо нашу ШІ-систему як нематеріальний актив, який складається з багатьох компонентів, деякі з яких захищаються авторським правом, а деякі, можливо, і правом особливого роду.
Крок 3
Саме програмне забезпечення можна зареєструвати як об’єкт авторського права.
Таким чином, в результаті має складатися ланцюг передачі майнових авторських прав на креативи кожного зі стейкхолдерів до компанії, консолідація всіх прав та формування єдиного нематеріального активу, який може бути зареєстрований.
Звісно, це не ультимативний сценарій, але точно хороша практика.
А як захистити авторським правом ШІ-агентів?
Ші агенти це свого роду “правові мутанти:)”, адже до структури ШІ агентів може входити не лише власний код та моделі компанії, а і такі, що використовуються за ліцензійними угодами.
Наприклад, в одному ШІ-агенті може використовуватись 5-6 різних моделей, запити до яких відбуваються на певному етапі, а сам ШІ-агент запрограмований залежно від висновків цих моделей, діяти певним чином.
Тому алгоритм охорони той самий — розбираємо на складові: де і на якій підставі ми використовуємо певні моделі, які у нас права на них; де і як зберігається тимчасова пам’ять ШІ-агента.
Розбираємо нашу машину на запчастинки і намагаємось зрозуміти: які авторські права і в якому об’ємі ми маємо. Збираючи це все назад в єдину систему, ми забезпечимо ефективний контроль над авторськими правами на наш ШІ-агент.
Звісно, може він і не зовсім наш, але ж нам важливо, щоб він був корисним і ліцензії це один зі способів отримати таку корисність.
Як навчати ШІ-системи на об’єктах авторського права?
Ну, тут класичне — “залежить”. Беремо датасет, дивимось ліцензії. Беремо об’єкт, дивимось, чи є у нас правова підстава для його використання саме таким чином (для навчання моделі).
Існує багато датасетів у форматі “оупен-сорсу”. Можна почати з них, а можна укладати ліцензійні договори на використання конкретних наборів даних.
Ще у нас є концепція fair use / fair dealing. Можливість її використання як правової підстави з метою тренування своїх комерційних ШІ систем досить спірна. Кейсів є багато, судів є багато, позицій є багато. Існують навіть спеціальні тести, які можуть допомогти визначити ймовірність можливості використання цієї доктрини, але 100% гарантії, що не буде правових проблем у зв’язку з цим немає.
Тому оцінюємо кейс-бай-кейс, аналізуємо ризики.
В контексті навчання ШІ моделей об’єктами авторського права непогано було б зробити наступне:
- Розкласти свої датасети і подивитись, яка правова підстава в нас є під кожен з них.
- Відкласти ті, де у нас хороші ліцензійні договори, або ж хороші відкриті ліцензії
- Щодо тих, де хочемо використати доктрину добросовісного використання – провести асестменти (оцінювання), наскільки це можливо і які ризики.
Спойлер: ризики використання об’єктів авторського права без “ок” від автора будуть завжди. Треба пропрацьовувати. Наприклад, компанія наукова використала умову про можливість навчати свою ШІ модель для наукових цілей. А потім та компанія стала комерційною. Чи можна використовувати натреновану модель для цілей комерції тепер?
Отже: оцінюємо правові підстави, опрацьовуємо ризики, приймаємо рішення.
Що з авторськими правами на код, коли кодимо з ШІ?
Дуже залежить. Потрібно читати правила користування відповідного ШІ сервісу. У цілому, це можуть бути і права особливого роду, а не авторські. А можуть бути авторські, але у постачальника ШІ-системи. Були ідеї, щоб в коді не було понад 30% ШІ згенерованого коду, і тоді ок, але на практиці визначити, особливо пост-фактум, де згенероване, де ні — досить важко.
Простіше вважати, що весь написаний код — такий, в якому є “пропозиції” від ШІ. Звісно, в договорах на розробку можуть бути відповідні забороняючі положення або ж гарантії, але знову ж, питання реального ефективного контролю.
Рішенням цього питання є наявність в компанії певної IP стратегії в контексті ШІ. Що можна, що не можна. Які системи ШІ використовуємо, які провайдери акредитовані і прозора комунікація цього з усіма контрагентами — як внутрішніми, так і зовнішніми.
Як бачимо, принцип — “розкладаємо все на запчастинки, оцінюємо, і збираємо назад” працює і в цьому випадку.
Як ШІ впливає на авторські права в цілому?
ШІ технології стали елементом, що змінив парадигму. Раніше правники-юристи сперечались, чи є автором фотографії мавпа, що клацнула кнопку на фотоапараті. Тепер же, коли за секунди можна зробити купу картинок неймовірної якості, постає питання: це все ще креатив? Його треба захищати?
Відповідь неоднозначна. Чи заслуговує особа, що просто згенерувала картинку в 2 кліки право на монополію на цю картинку? Де її креативний внесок? Нема.
З іншого боку — створення ШІ-агентів чи ШІ-систем в цілому означає нові виклики для авторського права в контексті охорони нових складних об’єктів і реального захисту бізнес-активів.
Що ж, запрошуємо в світ новий, чудовий.