Персональні дані у контексті обробки штучним інтелектом
ІТ індустрія досягла етапу, коли здається, що розвиток сповільнюється, а нововведення зосереджені на покращенні вже наявних технологій. Однак революція відбувається всередині, в тому, як програмне забезпечення створюється, функціонує та розвивається. Елементи Artificial intelligence (АІ) все більше використовуються для розробки та покращення програмного забезпечення. Штучний інтелект відкриває безліч нових можливостей та напрямків розвитку, в тому числі і для взаємодії з користувачами та їх оточенням.
Одночасно з перевагами АІ має і негативні аспекти. Навчання таких алгоритми потребує значних об’ємів даних, обчислювальної потужності та часу. З точки зору роботи з особистою інформацією потреба у великій кількості даних створює найбільші перешкоди розробникам. В більшості випадків така інформація не знаходиться у вільному доступі, навіть, соціальні мережі не розцінюють сторінки користувачів, як відкрите джерело. Таким чином пріоритетом для розробників АІ та МL є пошук якісного та легального джерела даних.
Обіг особистої інформації має певні відмінності в залежності від регіону чи країни, однак базові принципи залишаються незмінними. Головною метою є надати користувачам контроль над своїми даним та протидіяти їх неправомірному збору, збереженню та використанню. Прикладами таких нормативних актів є GDPR, GB GDPR та CCPA.
Що таке аrtificial intelligence та на що він здатний?
На цей час відсутня єдність у визначенні штучного інтелекту. З науково-фантастичної точки зору штучний інтелект – це система, що повністю відтворює процес мислення, здатна до творчості, усвідомлює себе та має абстрактне мислення та тому подібне. Більш наближений до сучасних реалій погляд позбавлений елементів самосвідомості, творчості й зосереджується виключно на процесі мислення та взаємодії з оточенням. Така система формує власні логічні ланцюги, визначає пріоритети, накопичує знання, отримує досвід з результатів своїх дій, на основі якого покращує внутрішні процеси та має соціальну складову у достатньому для взаємодії з користувачами ступені. Можливо навіть сказати, що такий АІ більше наближений до мислення тварини ніж людини.
Machine learning (МL) є одним з різновидів штучного інтелекту, який зосереджений виключно на обробці даних, накопиченні досвіду та покращенні алгоритму. Зазвичай МL використовують в алгоритмах для вузького кола завдань, відповідно усю отриману інформацію алгоритм розглядає з точки зору користі конкретного завдання. Такі алгоритми є найпростішими АІ, при тому досить ефективними, що і допомогло їм здобути найбільшого поширення.
АІ в автомобілях, чи є приховані небезпеки?
У механічному плані, сучасні автомобілі кардинально не відрізняються від зібраних десять років тому, однак ситуація зовсім інша в контексті мікроелектроніки та програмного забезпечення. Кожне нове покоління автомобілів отримує інтелектуальні системи, сенсори та покращене програмне забезпечення, що стабільно наближає до впровадження систем автоматичного керування автомобілем (автопілот). Такі системи зможуть функціонувати повністю самостійно, або допомагати водіям у критичних ситуаціях, коли людська реакція занадто повільна.
З іншого боку автомобілі з автопілотом приховують значну небезпеку приватності. Чисельні камери, датчики, радари, системи геолокації, постійне з’єднання з хмарними сервісами, у поєднанні з високою ймовірністю кібератак та можливістю використання зібраних даних не за прямим призначенням.
Цікавим казусом стала заборона владою Китаю використання автомобілів Tesla. У 2021 році влада заборонила автомобілі виробника на військових та стратегічних об’єктах. У 2022 аналогічна заборона була введена у місті Бейдайху на період зборів комуністичної партії Китаю. Причиною обмежень є велика кількість камер, що постійно фіксують оточення автомобіля. Теоретично така система дійсно може бути використана для спостереження та відстежування окремих об’єктів чи осіб без згоди власника авто, однак конкретних доказів подібного наведено не було.
GDPR вимагає цільового обмеження, мінімізації даних, обмеженого зберігання та забезпечення конфіденційності, однак коли ми говоримо про повноцінні системи автопілота, то визначити обсяг мінімально необхідної інформації важко у контексті АІ. На відміну від маленьких дорнів доставки, автомобіль несе підвищену небезпеку для оточення. Відповідно необхідно додаткове стеження за ефективністю роботи алгоритмів та корегування процесу навчання АІ через аналіз логів та записів оточення за різних обставин та непередбачуваних подій.
Окрім технічної інформації такі записи побічно будуть містити особисті дані власника (типові маршрути, місця паркування) та третіх осіб (пішоходів, інших учасників дорожнього руху). У такому контексті дотримання актів, як GDPR значно сповільнить, або навіть унеможливить імплементацію повністю автономних транспортних засобів. Рішення можливе шляхом створення спеціалізованих регламентів для дорожніх АІ.
Чи можлива ідентифікація по біометричних без вашої згоди?
Нещодавно фільми де була технологія розпізнавання обличчя вважались фантастикою, а тепер подібні алгоритми частина нашого життя. Через майже нульову вірогідність існування двох осіб з повністю однаковими біометричними даними, цей спосіб є найкращім для ідентифікації особи. Навіть в ідентичних ззовні братів чи сестер будуть відрізнятися відбитки та райдужні оболонки ока. Тому більшість країн і додає чіпи з біометричними даними до ID карток та паспортів. Навіть на побутовому рівні розпізнавання відбитків та обличчя нікого вже не дивує. Потужність алгоритмів розпізнавання обличчя дозволяє ідентифікувати глядачів кінотеатрів чи відвідувачів супермаркетів, присвоювати їм унікальні номери та надалі підв’язувати через різні механізми бонусних карток. Дещо подібне, але у світовому масштабі здійснила компанія Clearview AI.
Європейські та Британські контролюючі органи виявили значні порушення GDPR та GB GDPR продуктом Clearview AI. Компанія використовувала зображення з пошукових систем, сайтів новин та соціальних мереж і створювала профайли на основі біометрії обличчя. Пропустивши зображення людини через алгоритм будь-хто мав можливість отримати інші зображення особи та ресурси де вони опубліковані, а завдяки соціальним мережам легкістю її ідентифікувати. Позиція контролюючого органу полягала у тому, що користувачі соціальних мереж не давали згоди на подібну обробку та використання їх інформації. Окрім того, їм не було відомо та не могло бути відомо про подібні дії Clearview AI. В результаті на компанію було накладено штраф у розмірі 7,5 млн фунтів.
За логікою компанії всі оброблені дані були у відкритому доступі та не вимагали жодних додаткових дій чи маніпуляцій. Цей кейс є ідеальною демонстрацією неналежного джерела особистої інформації. Компанія не мала платформи або партнерів, які могли б забезпечити належне для їх цілей джерело біометричних даних. Це призвело до таких порушень:
- непрозоре використання персональної інформації;
- відсутність законних підстав для збору інформації;
- відсутність підстав для необмеженого зберігання інформації.
Чи можливо, що Ви спілкувались з АІ та не помітили цього?
АІ для спілкування – це алгоритм, що націлений імітувати людське мислення в процесі спілкування. Йдеться про формування, абстрактного мислення, розпізнавання емоційного окрасу, впровадження гумору, розвиток ланцюгів аргументації та інших аспектів спілкування. Кожний сучасний АІ для спілкування намагається пройти так званий тест Алана Тюрінга. Тест полягає у веденні діалогу, у якому алгоритм намагається видати себе за людину, а людина попередньо не знає хто з нею спілкується. Якщо людина нічого не запідозрить, то тест пройдено. У сучасному трактуванні тест складається з 3 частин:
Змістовна – оцінюється зміст та хід ведення діалогу, незалежно від його форми (письмово, усно)
Візуальна – включає сприйняття візуальної інформації та ведення бесіди з приводу побаченого.
Мовна – відтворення усної мови.
Головне завдання такого виду АІ полягає у взаємодії з людиною та створення інтерфейсу, який буде максимально природнім та відповідати соціальним потребам. Такі алгоритми можуть замінити людину у монотонних та однотипних сценаріях або відкрити нові можливості для взаємодії. Наприклад у сфері комерції та послуг.
Різновидом АІ для спілкування є асистенти. Такі алгоритми з елементами АІ, як Siri, Google, Alexa та Cortana імплементовані в операційні систем, та наділені певним рівнем доступу до процесів, файлів та налаштувань системи. В першу чергу, вони створені, як додатковий інтерфейс, а вже потім для спілкування на вільні теми. При тому асистенти несуть значно більшу загрозу безпеці особистої інформації ніж інші подібні системи.
У більшості випадків обробка даних відбувається у хмарі, а пристрій постійно прослуховує оточення в очікуванні запиту. Теоретично, дані отримані в ході спілкування з алгоритмом або у фоновому режимі досить легко використати не за прямим призначенням, чи для формування профайлів користувачів. Поточне прослухування алгоритмом дозволяє визначити актуальні для покупця теми та товари, що можливо використати в маркетингу та рекламі.
Що знають про вас пошукові сервіси?
Сучасні пошукові інтернет сервіси це теж алгоритми з елементами АІ, що складаються з двох складових акумулювання бази даних та система запит-відповідь. Пошукові сервіси постійно сканують мережу на предмет нових сайтів, індексують та вносять їх до бази даних, відстежують зміни, ведуть статистику, оцінюють корисність та безпечність сайтів для користувачів. Для пошуку інформації використовуються запити.
Самі по собі запиті можуть не ідентифікувати користувача, однак за наявності контексту чи у сукупності це може стати можливим. Наприклад за сукупністю запитів «Купити дитячу коляску, Київ», «Задня ліва фара Audi А4 В8» та «Туристичні місця, Львів» можливо зробити припущення, які допоможуть ідентифікувати особу з великою ймовірністю. І з кожним запитом точність ідентифікації зростатиме. Наприклад Google формує перелік асоціацій та вподобань кожного користувача на основі частих, та цікавих користувачу запитів. Таким чином в акаунті створюється унікальний відбиток, що додатково може бути прив’язаний до соціальних мереж, веб-сайтів чи додатків.
Як АІ використовують в augmented reality?
Зараз технології доповненої реальності (AR) не є незамінною частиною нашого життя, однак кількість корисних сценаріїв їх використання стабільно збільшується. AR – доповнює середовище у якому знаходиться користувач. Наприклад, додаткова інформація про оточення, інтерфейс керування приладами, доповнення віртуальними об’єкти чи накладання іншого зображення на реальні предмети. І в обох випадках використовують АІ для обробки особистої інформації. АІ в AR обробляє зображення у потоковому режими та накладає елементи віртуального світу. Таким чином алгоритм має постійний доступ до зображення з камер, оцінює розміри, наповненість приміщення, знаходження людини у ньому. Перспективи даних технологій сильно пов’язані з хмарними обчисленнями, бо вони потребують значної потужності, яку важко забезпечити мобільними девайсами. Таким чином компанії навіть зможуть бачити нашим очима, відстежувати як фокусується увага користувача, яка візуальна інформація впливає на прийняття рішень та що є ключовими факторами.
Висновки
Впровадження штучного інтелекту – наступний крок у розробці програмного забезпечення та інтелектуального обладнання, однак одночасно з тим збільшується потреба у даних та ставиться під загрозу приватність.
Контроль за дотримання конфіденційності, та безпеки персональных даних здійснюється відповідними органами, однак вони не здатні відстежувати та вчасно звертати увагу на всі порушення. Користувач має усвідомлювати, яку інформацію надає, та передбачати можливість її протиправного використання. Особливо це стосується соціальних мереж.
Користувачу завжди має бути забезпечена можливість обмежити поширення його особистої інформації, або надане право видалити її із вже наявних баз даних.
Приведення програмного забезпечення у відповідність до актуальних норм законодавства має починатись ще на етапі формування ідеї. Внесення змін у вже готовий продукт може вимагати значних ресурсів та часу.