Упередженість рекомендаційних алгоритмів спотворила репрезентацію смаків користувачів

Рекомендаційні сервіси схильні до упередженості та з часом пропонують користувачам усе більш далекі від їхніх смаків позиції. Система закріплює власні похибки через алгоритм, який запам’ятовує дії відвідувачів сайтів, через що вибірка стає невідповідною та менш різноманітною. Зокрема, це стосується стрімінгових сервісів. Найбільше від упередженості рекомендацій страждають соціальні меншини, повідомляють автори дослідження, доступного на сайті препринтів Arxiv.org.

Алгоритми рекомендацій використовують спільну фільтрацію — техніку, що запам’ятовує взаємодію користувачів з представленими на сервісах позиціями та враховує їх для створення подальших персональних рекомендацій. Зокрема, так складаються рейтинги шоу, програм та серіалів. Але такий метод страждає від упередженості щодо певних користувачів чи типів елементів, які оцінюються. З часом ці похибки посилюються через те, що відвідувачі сайтів змушені взаємодіяти з помилково відібраними рекомендаціями, зокрема, з найбільш популярними елементами.

Щоб дослідити наслідки такого підходу, дослідники імітували процес рекомендацій: генерували списки запропонованих позицій та оновлювали профілі користувачів, додаючи до них ті елементи, які, ймовірно, підходять їм за смаками. Упередженість системи відслідковувалася за допомогою порівняння рейтингів, наданих користувачами, та збільшенням популярності рекомендацій, наданих алгоритмом. Під час експерименту дослідники використовували набір даних некомерційного сайту MovieLens, який містить рейтинги понад одного мільйону фільмів.

Виявилося, що навіть у випадках, коли алгоритм рекомендував найпопулярніші стрічки, враховуючи вже переглянуті користувачами, його упередженість посилювалася та з часом призводила до відхилення від уподобань глядачів. Ці рекомендації ставали або більш загальними, або занадто зосереджувалися лише на кількох пунктах, що призвело до однотипності пропозицій. Також набір даних сервісу MovieLens містив більше рейтингів від чоловіків, вподобання жіночих профілей враховувалися менше. Це свідчить про те, що упередження алгоритмів найбільше впливають на соціальні меншини.

Дослідники пропонують рішення проблеми: групувати користувачів на основі середнього розміру їхнього профілю та популярності рейтингових позицій, а також використовувати різні алгоритми, які контролюють упередженість щодо популярних елементів. Крім того, необхідно не обмежувати позиції, які з’являються в оновлених профілях користувачів.