Координована протидія виявилася кращим методом протистояти мові ненависті

Вчені використали ансамблеве машинне навчання та мільйони твітів дискусій навколо політичних і соціальних питань Німеччини, щоб натренувати алгоритм розрізняти пости з мовою ненависті та із мовою протидії. Це дозволило вивчити їхню частоту та взаємодію, а також виявити, що організовані рухи для протидії мові ненависті в соціальних мережах ефективніші, ніж самостійні зусилля користувачів. Результати роботи дослідники представили на конференції Conference on Empirical Methods in Natural Language Processing.

До чого призводить мова ненависті та як їй протидіяти?

Мова ворожнечі стає проблемою у багатьох країнах, вона може мати серйозні психологічні наслідки, а також пов’язана з реальним насильством і, можливо, навіть сприяє йому. Хоча цензура може допомогти стримувати її, цей метод також посягає на громадянські свободи та у кращому випадку сприяє лише трохи меншому розповсюдженню, а не зниканню явища. Перспективний альтернативний підхід до зменшення токсичного дискурсу без звернення до цензури — так звана мова протидії (counter speech), що в основному стосується негативної реакції громадян на мову ненависті. Однак невідомо, чи є такий спосіб ефективним через відсутність систематичних широкомасштабних досліджень щодо його впливу. Автоматизованим алгоритмам складно розпізнавати мову ненависті та протидію їй.

Яку ситуацію досліджували вчені?

Дослідники провели першу масштабну класифікацію мови ненависті та мови протидії, використовуючи унікальну ситуацію у німецькому Твіттері, де організовані групи користувачів брали участь в дискусіях навколо поточних соціальних тем, таких як імміграція та вибори. Одна з них, Reconquista Germanica, була націлена зривати політичні дискусії за допомогою мови ненависті та просувати праву, націоналістичну партію Alternative für Deutschland (AfD). Ця група мала від 1500 до 3000 активних членів. Інша група, Reconquista Internet, була самоорганізована та сформувалася наприкінці квітня 2018 року з метою протидії Reconquista Germanica. На піку активності Reconquista Internet мала, за оцінками, близько 62 тисяч зареєстрованих членів, з яких понад 4000 були активними протягом перших кількох місяців.

Вчені зібрали мільйони твітів від членів цих двох груп і за допомогою них навчили алгоритм визначати мову ненависті та мову протидії їй. Потім вчені використали цю систему для вивчення більше 135 000 тредів у німецькому Твіттері, щоб зрозуміти взаємодію між групами, що поширюють та протидіють мові ненависті в інтернеті. Це дозволило визначити вплив протидії мові ненависті на великих масштабах. Виявилося, що організовані рухи проти мови ненависті є більш ефективними, ніж самостійні зусилля користувачів.

Приклади тредів у Твіттері (дерева відповідей) із позначеннями мови ненависті (червоний колір), мови протидії (синій) та нейтральної мови (білий). Початкові пости відображаються як великі квадрати. Garland et al / EMNLP 2020

Приклади тредів у Твіттері (дерева відповідей) із позначеннями мови ненависті (червоний колір), мови протидії (синій) та нейтральної мови (білий). Початкові пости відображаються як великі квадрати. Garland et al / EMNLP 2020