Авторське право для AI Medical-стартапів
Штучний інтелект змінив медтех-індустрію швидше, ніж більшість стартапів встигла юридично підготуватися. Поки команди шліфують точність діагностичних моделей, конкуренти можуть спокійно використовувати їхній код, методологію розмітки та навчальні матеріали, бо не кожен стартап розуміє, як і що саме необхідно захистити. Парадокс у тому, що основний інструмент захисту — авторське право — вже є у кожного Medical AI-стартапу, але працює на повну лише тоді, коли правильно оформлені усі механізми співпраці. Сьогодні розберемо, які IP-активи Medical AI компанії вже захищені копірайтом і чому датасети потребують окремої уваги.
Авторське право для Medical AI стартапів
В одній із наших статей про юридичний супровід Medtech-проєктів ми зазначали, що авторське право — це базовий актив, що виникає у Medical-стартапі на самому початку, адже саме авторським правом захищається більша частина ІP-обʼєктів. Так, компʼютерний код охороняється як літературний твір, датасети — як база даних (але про них пізніше).
Саме тому, що авторське право є “ґрунтом” AI-розробок, воно потребує додаткової пильності та уваги, щоб ви змогли правильно підготувати свій продукт до комерціалізації.
Авторське право: захист, який вже є у вас
Найбільше непорозуміння в IP-стратегії Medical AI-стартапів — це думати, що захист треба “отримати”. Авторське право (або просто АП) не потребує реєстрації для підтвердження виникнення, адже воно виникає автоматично в момент створення об’єкта. Це означає, що прямо зараз у вашого стартапу вже є активи.
Які обʼєкти авторського права може мати Medical AI-стартап?
Компʼютерний код та дизайн
Компʼютерний код ШІ-моделі — це літературний твір з точки зору авторського права. Так, авторське право виникає автоматично на написані модулі програми для аналізу медичних даних пацієнтів або на алгоритм для обробки МРТ-знімків. Оскільки авторські права на продукт або його елемент виникають без отримання спеціальних документів, ви отримуєте захищений актив одразу з моменту роботи над ним.
NB: авторські права на розробку виникають у фізичної особи-автора, а не у компанії, адже сам по собі стартап не може створити продукт розумово-інтелектуальною діяльністю, яка притаманна людині. Якщо розробник є найманим працівником, важливо передбачити перехід авторських прав на службові твори в самому трудовому договорі. Якщо ж розробник є фрілансером і момент щодо авторських прав на продукт не закріплено в договорі — права на такий продукт залишаються у нього. Це типова проблема, яка виявляється під час due diligence перед інвестиційним раундом або аудитом активів, і виправити її постфактум буває дуже непросто.

Теж саме стосується дизайну вашої AI-моделі — унікальні іконки, UI, шрифти та загальний макет сайту також цілком можуть підпадати під охорону авторським правом.
Архітектурні специфікації
Технічна документація, яка описує, як влаштована система, — також захищається авторським правом. Для Medical AI це особливо цінно: специфікації моделі для виявлення діабетичної ретинопатії, опис проведення аналізу патологоанатомічних зрізів або архітектура системи клінічної підтримки прийняття рішень — все це конкретні технічні рішення, а не абстрактні ідеї.
Важливо памʼятати, що не сам математичний алгоритм (абстрактні методи авторським правом не захищаються), але конкретна реалізація та її детальний опис — так. Різниця між “ідеєю” і “вираженням ідеї” — ключова концепція авторського права. Для AI-стартапів у медицині вона означає, що ніхто не може заборонити конкуренту створювати модель для діагностики раку легень, але скопіювати вашу архітектурну документацію ваш конкурент не може.
Навчальні матеріали та документація
Це те, про що медтех-стартапи забувають найчастіше. Навчальні посібники медиків, клінічні протоколи верифікації датасету, гайдлайни з контролю якості та самі датасети — все це окремі об’єкти авторського права.
Те саме стосується документації про процес навчання моделі: які клінічні сценарії покривалися, як формувалася тренувальна вибірка, які рішення приймалися на кожному етапі. Це інтелектуальний актив, який формує цінність компанії в очах стратегічних інвесторів і клінічних партнерів — їм важливо розуміти відтворюваність і надійність результату. А кілька років напрацьованої внутрішньої документації — це те, що вирізняє вас серед решти компаній на ринку.
Що авторське право не захищає
Важливо розуміти межі між тим, що захищається авторським правом, та тим, що захищається поза його фокусом. Авторське право захищає форму та інтелектуально-творчу складову. Саме тому під захист авторського права не попадають стандартизовані загальновідомі протоколи лікування, медичні факти тощо. Тобто, окрім нереалізованої ідеї, авторське право не захищає загальновідомі відомості та інформацію.
Датасети: основна цінність ШІ продукту
Повернемося до навчальних матеріалів для ШІ і поговоримо про датасети, адже для медичного AI якісний датасет — це те, чим для фармкомпанії є базові молекулярні сполуки. Датасети формуються роками, проходять перевірку та від них залежить ефективність та безпечність ШІ-розробки. І при цьому більшість стартапів може не мати жодного уявлення, хто, як і на яких умовах може використовувати ці датасети.
Що таке датасет?
Датасет у сфері медичного ШІ — це структурована сукупність медичних даних (візуальних, текстових або сигнальних), зібраних, систематизованих та анотованих для цілей машинного навчання.
Що може входити в датасет?
Склад датасету здебільшого залежить від цілей навчання ШІ. Так, до сукупності даних можуть входити:
- Візуальні дані (знімки КТ, МРТ, рентген, УЗД).
- Текстові дані: (анамнези, електронні медичні картки, результати лабораторних аналізів, протоколи операцій)
- Сигнали: (записи ЕКГ, ЕЕГ, дані з пристроїв (моніторинг пульсу чи цукру))
- Генетичні дані: (послідовності ДНК/РНК)
- Стандартні загальновідомі дані та інформація, яка не охороняється авторським правом (стандартизовані та загально відомі протоколи лікування, референтні значення показників крові тощо)
Що таке датасет з точки зору авторського права?
Перш за все, слід памʼятати, що датасет – це сукупність даних. Отже, основний обʼєкт авторського права, під який “мімікрує” датасет — це база даних.
База даних може охоронятися авторським правом за умови, що цей масив даних є результатом унікальної наукової логіки виконавця, а не механічним збором даних. Тобто, має бути не просто “копі-паст” інформації, а творчий відбір матеріалу та його творча уніфікація.
Важливо памʼятати співвідношення між самою базою даних та її складовими (тобто тими самими даними, що до неї входять): правова охорона самої бази даних ≠ автоматична охорона складових такої бази даних. Як ми зʼясували вище, до датасету можуть входити дані, що не захищаються авторським правом, тому завжди необхідно розмежовувати масив даних та окремі його елементи.
ШІ та датасети — є перетин?
Коли мова йде про AI-розробки, важливо розуміти, що навчальні датасети можуть в цілому створюватися штучним інтелектом або структуруватися машинним навчанням. Як у такому разі захистити свій актив? Адже все одно такий датасет — це економічна цінність стартапу. У такому випадку на допомогу приходить право sui generis.
За загальним правилом, результати, створені штучним інтелектом, не підпадають під охорону авторського права через відсутність людського творчого внеску. Однак у випадку датасетів як баз даних діє інша логіка. Право sui generis не вимагає оригінальності чи творчості — його фокус зміщений на захист інвестицій, вкладених у формування бази.
Для medical AI-стартапів це особливо актуально. Навчальні вибірки часто формуються шляхом значних фінансових витрат, залучення фахівців (наприклад, лікарів для анотації даних), використання складних алгоритмів очищення та верифікації інформації. Такий внесок може мати як кількісний характер (обсяг ресурсів, часу, даних), так і якісний (спеціалізована експертиза, складність обробки медичних даних).
Відповідно, навіть якщо сам датасет не відповідає критеріям авторського права, він може бути захищений як база даних через право sui generis. Це означає, що творець (тобто стартап або компанія, яка організувала створення датасету та інвестувала в нього) отримує можливість забороняти третім особам вилучення або повторне використання такого датасету.
Договірне регулювання та право на захист
Важливо памʼятати, що умови приналежності права sui generis можуть визначатися договором. Це створює як можливості, так і певні юридичні пастки для стартапів, що використовують сторонні ШІ-інструменти для генерації або обробки своїх даних:
- Ризики договорів приєднання: Найчастіше стартапи взаємодіють із ШІ-платформами через Terms of Use або договори оферти. Важливо ретельно аналізувати ці умови: наприклад, сервіси можуть не претендувати на згенерований контент, але водночас можуть вимагати від користувача право надавати цей контент усім третім особам. Це фактично нівелює можливість стартапу здійснювати право sui generis, адже він втрачає ключову прерогативу — право забороняти вилучення чи повторне використання свого активу.
- Можливість заявляти про власне право: Якщо умови використання AI-tool прямо дозволяють комерційне використання і не обмежують майнові права користувача, стартап отримує юридичне підґрунтя заявити про своє право sui generis на фінальний датасет. У такому разі стартап стає “творцем бази даних”, оскільки саме він взяв на себе ініціативу та фінансовий ризик створення цього ресурсу.
Практично це має велике значення: конкурент не може просто скопіювати значну частину навчальних медичних даних або використати їх у своїх алгоритмах без дозволу, навіть якщо цей датасет не є базою даних у класичному сенсі. Таким чином, право sui generis стає одним із ключових інструментів юридичного захисту датасетів у сфері медичного штучного інтелекту, компенсуючи прогалину, яка виникає через обмежену застосовність авторського права до AI-згенерованих об’єктів.

Як використовувати датасети на користь ШІ стартапу
Як ми зʼясували, датасет для медтеху — це стратегічна перевага на ринку. Тому перш ніж завантажити черговий набір медичних зображень і запустити тренування ШІ-моделі, варто зрозуміти, на яких умовах цей датасет існує і як можна і не можна його використовувати.
Відкриті та ліцензовані датасети
Частина медичних датасетів доступна публічно на інтернет-платформах. Але “публічно доступний” не означає “можна використовувати як завгодно”. Кожен такий датасет має ліцензійні умови, які визначають допустиме використання — і ігнорувати їх так само ризиковано, як ігнорувати умови будь-якого іншого договору.
Типові обмеження: лише для некомерційних досліджень, вимога укладення договорів для комерційного використання тощо. Якщо стартап навчив комерційну модель на датасеті з некомерційною ліцензією — це порушення, яке може обернутись юридичними наслідками.
Ще один нюанс: ліцензійні умови можуть змінюватися. Датасет, який був доступний для комерційного використання рік тому, міг змінити умови ліцензії. Якщо стартап не відстежує ці зміни — він може опинитися у ситуації, коли його модель навчена на даних, використання яких більше не є правомірним.
Що важливо врахувати в ліцензійному договорі?
Перше — хто є володільцем прав на датасет. Стартап, який обʼєднав дані? Установа, яка їх надала? Відповідь не очевидна і залежить від того, що написано в договорі між сторонами.
Друге — чи можна використовувати дані для навчання моделей третіх сторін. Це питання прямо впливає на бізнес-модель: чи може стартап продавати доступ до навченої моделі, чи ліцензувати технологію іншим компаніям.
Третє — що відбувається з даними після завершення партнерства. Партнер може заявити, що дані належать йому, і вимагати їх повернення або знищення. Якщо договір мовчить — ризики несе та сторона, яка менше думала наперед.
Власний датасет як конкурентний актив
Якщо стартап формує власний датасет через партнерства з клініками, проводить власні дослідження і залучає сторонніх виконавців — цей масив даних стає стратегічним активом. І тут логіка перевертається: тепер вже стартап є стороною, чиї права треба захищати.
Договори з партнерами мають чітко визначати, що стартап отримує права на використання даних для навчання моделей, їх вдосконалення та комерційного застосування результатів. Без таких умов партнери можуть в будь-який момент заявити, що датасети належать їм. Добре структурована ліцензія і договір на власний датасет — це також аргумент на переговорах з інвесторами: вони показують, що стартап контролює свій ключовий актив.
Висновки
Авторське право для Medical AI-стартапу має особливу цінність, адже за його рахунок будується весь проєкт: від ідеї до практичної реалізації. Особливу увагу варто звертати на датасети — “основі” ШІ-моделі, завдяки яким ця ШІ напрацьовується та дає результати. Хочете захистити свої медичні датасети та запустити медичний AI правильно? Зверніться до Legal IT Group уже сьогодні.