Штучний інтелект виділив головне в правилах і умовах застосунків

Розробники університету Карнегі-Меллон вирішили навчити алгоритм читати політику конфіденційності та умови користування на сайтах і застосунках за себе, і той зі 92-відсотковою точністю визначив найважливіші пункти, які варто прочитати. Так замість сліпо погоджуватися з правилами користування, штучний інтелект сам обере ті, які вам варто було б побачити. Наскільки цю справу можна довірити алгоритму, розробники описали у препринті на arXiv.

GIPHY

GIPHY

Навіщо ШІ читати за мене T&Cs?

Якщо ви дійсно читаєте всі умови користування (Terms and conditions, T&Cs) застосунків, якими користуєтеся, то ви, звісно, робите правильно. Однак таких як ви, ледве набігло в один відсоток. Згідно з дослідженням ProPrivacy 2019 року, 99 відсотків

людей відмовилися від прав на ім'я свого первістка, дали доступ матерям до історії браузера та дозволили заповнювати свої стрімінгові платформи низькосортними стенд-апами і при цьому 70 відсотків з них повідомили, що «прочитали угоду».

Найчастіше користувачі не дочитують далі другого абзацу і так з-посеред великої кількості тексту пропускають важливу інформацію на кшталт автоматичної підписки після безкоштовного пробного періоду, складні правила скасування або повернення, заборони на колективні позови тощо. І дослідники вже намагалися узагальнити правила користування і політику конфіденційності застосунків та категоризувати «найважливіше», наприклад, за тим, чи збирається контактна інформація або дані про місцеположення.

Однак враховуючи величезну кількість вебсайтів та часті оновлення, їхній різноманітний контент ускладнює виокремлення важливих пунктів з використанням заздалегідь визначених параметрів. Тому у своїй роботі дослідники університету Карнегі-Меллон звернулися до штучного інтелекту, який зможе визначати важливість певних пунктів і читати весь текст договору за вас.

Як довіряти у цьому ШІ?

Перш ніж довірити штучному інтелекту читати умови на сайтах, дослідники дали 3 462 добровольцям перечитати 1 551 таких договір з 27 торгових сайтів, де вони попарно порівнювали різні пункти за рівнем «важливості». Так, використовуючи результати, вчені змогли маркувати весь текст за рівнем важливості для користувачів. Цікаво, що респонденти зійшлися один з одним у розумінні того, які саме пункти будуть для них важливими. Переважно вони обирали частини, які визначають права споживачів на повернення, ремонт чи заміну товарів, а також можливість отримати відшкодування чи умови купівлі у кредит.

Потім цю інформацію використали для навчання нейромережі, навчаючи її шукати важливі пункти. Так вона у 92 відсотках випадків обирала у текстах ті ж частини, що і попередньо респонденти, однак помилялася у реченнях, у яких використовувалося слово «ні».

Цікаво, що модель виявилася навіть більш прискіпливою, ніж добровольці, та визначала як важливі багато тверджень типу «повернення коштів здійснюється на вихідний метод оплати», хоча самим респондентам це важливим не здалося. Хоча важко визначити, що є «юридично важливим» в умовах та положеннях, з якими ви часто сліпо погоджуєтеся у застосунках, на думку дослідників, використаний ними підхід, орієнтований на відповіді респондентів, може принаймні надати споживачам ту інформацію, яку інші користувачі вважають важливою перш ніж погодитися.