Використання творів авторства інших осіб для навчання моделей ШІ
За останні роки зовсім різні за призначенням моделі ШІ не тільки досягли значного технологічного прогресу, а й отримали неабиякий розголос, привернувши до себе увагу мільйонів людей. Про це свідчать як статистичні дані, так і розміри приватних інвестицій у цю сферу. Так, відповідно до звіту Стенфордського університету від 3 квітня 2023 року, за результатами 2022 року приватні інвестиції у розвиток штучного інтелекту (Далі – ШІ) у глобальному масштабі сягнули $91,9 млрд., що звісно менше ніж у 2021 році ($125,4 млрд.), проте все одно приголомшливо. Утім, поряд із таким стрімким розвитком з’явилися і правові питання, у більшій мірі пов’язані із правомірністю використання творів авторства інших осіб для вдосконалення, т.з. “тренування”, моделей ШІ.
Актуальність проблеми
Що цікаво, коментована тема досі не знайшла універсальної відповіді, а актуальність цього питання лиш підігрівається новими судовими позовами. Наприклад, один із таких був нещодавно поданий американскими художниками Сарою Андерсен, Келлі Мак-Кернан і Карлою Ортіс проти творців артгенераторів Stable Diffusion, Midjourney та DreamUp, що працюють на базі ШІ. Заявники стверджують, що творці згаданих артгенераторів без дозволу оригінальних художників використали 5 мільярдів зображень, взятих із мережі Інтернет, для тренування власних ШІ моделей, чим порушили права креаторів.
Крім цього, іншим прикладом судового позову проти компанії-розробника ШІ може слугувати позов відомої фотостокової платформи Getty Images про порушення авторських прав до Stability AI, компанії, яка так само тренувала своє програмне забезпечення на основі зображень платформи.
Не обійшла стороною ця проблема і Microsoft, GitHub та OpenAI – колективний позов проти IT-гігантів був поданий через порушення останніми закону про авторське право, оскільки розробники свідомо використовували захищений відкритий код для навчання своїх ШІ-моделей. На відміну від інших прикладів, тут йдеться не стільки про порушення авторських прав, скільки про порушення Закону про авторське право в цифрову епоху (Digital Millennium Copyright Act), положеннями якого забороняється видаляти з твору “інформацію про управління авторськими правами”, яка, у свою чергу, може включати відомості про авторство та ліцензію.
Позиція самих розробників
Тож, чи дійсно компанії-розробники порушують права креаторів, навчаючи власні ШІ-системи на матеріалах, взятих без погодження із останніми? Відповідь на це питання спробувала надати американська компанія OpenAI, відома завдяки розробці чат-боту ChatGPT, у коментарі до Бюро патентів і торгових марок США (United States Patent and Trademark Office). Компанія-розробник вказувала, що використання алгоритмів машинного навчання, які аналізують дані, захищені авторським правом, для навчання ШІ-моделей, повинно підпадати під добросовісне використання (принцип fair use). Інакше, як вказувалося у коментарі, це матиме “катастрофічні наслідки”, під якими компанія розуміла як “виведення інновацій в іноземну юрисдикцію”, так і “серйозне перешкоджання творчим дослідженням у галузі ШІ”.
Така позиція дійсно заслуговує на увагу, оскільки доктрина добросовісного використання (fair use) не є чимось новим для США. Відповідно до цієї концепції, дозволяється використання твору, захищеного авторським правом, без дозволу власника авторського права для таких цілей як критика, коментарі, повідомлення новин, навчання, наукова діяльність або дослідження. Утім, межа правомірності такого використання є досить тонкою, і може відрізнятися в залежності від багатьох факторів, зокрема місцезнаходження компанії (правової юрисдикції), обсягу захищеного матеріалу, який використовувався, та мети використання.
Так, якщо для некомерційних компаній використання творів авторства інших осіб може і справді підпадати під fair use, то у випадку наявності комерційної мети все може бути набагато складніше, що, у свою чергу, стане предметом комплексного судового розгляду.
А яке регулювання цього питання у ЄС та чи відрізняється воно?
З одного боку, там діє Директива Європейського парламенту та ради про авторське право та суміжні права на Єдиному цифровому ринку, що певним чином висвітлює коментовану проблему. Так, винятком, встановленим положенням статті 4 вказаної директиви, передбачено відтворення і вилучення правомірно доступних творів та інших об’єктів для цілей глибинного аналізу текстів і даних, що фактично дає зелене світло для використання використання творів третіх осіб для навчання моделей ШІ у ЄС.
З іншого боку, загальне правило може бути розтрактоване судами у інший спосіб, що лише сприятиме створенню нових судових прецедентів. Крім того, на стадії розробки знаходиться AI Act, положення якого можуть суттєво вплинути на ситуацію, Так, актом може бути передбачена норма, що зобов’язує розкривати органам нагляду за ринком будь-який захищений авторським правом матеріал, що використовується для розробки (що можна тлумачити і як тренування) систем ШІ.
Висновок
Можна презюмувати, що практика з питання правомірності використання творів авторства інших осіб для тренування ШІ-моделей ще досі не сформована, а судові рішення з наведених у статті кейсів ще досі не винесені. На наш погляд, у цій ситуації робити прогнози ще не тільки складно, а й зарано; утім, слідкувати за розвитком законодавства у розрізі роботи штучного інтелекту є необхідним як через актуальність цієї теми, так і через її перспективність та неілюзорну практичність вже у найближчому майбутньому.