У Львові створили проєкт для виявлення педофілів у соцмережах

Новини 09 Вересня, 2019 515

Ілюстрація: Волинь24

За допомогою мовних шаблонів можна виявити гіпотетичних педофілів

Кандидатка технічних наук, доцент кафедри НУ «Львівська політехніка» Соломія Федушко 9 серпня отримала грант президента України для підтримки свого проєкту, завдяки якому можна звірити інформацію з профайлів та коментарів користувачів і з допомогою мовних шаблонів виявити гіпотетичних педофілів, кіберзлочинців та інших «бабаїв» у мережі. Адже кожен лишає в інтернеті свій інформаційний слід.

Про це повідомляє газета «Ратуша».

Як зазначається, маніпулятори, кіберзлочинці, кібербулери, педофіли — весь той чагарник може процвітати на просторах інтернету, замаскувавшись під добропорядними акаунтами, отруювати життя іншим користувачам, а нерідко й становити реальну загрозу. Але тепер на те є рада.

Інформаційні загрози, що постають перед нами

Цьогоріч, крім пані Соломії, таку підтримку одержать ще 59 молодих учених з усієї України, зокрема двоє — також із Львівської політехніки. Проєкт має назву «Комп’ютерно-лінгвістичні методи перевірки достовірності персональних даних користувачів віртуальних спільнот». Як вирахувати в мережі провокаторів, маніпуляторів, шахраїв, педофілів — про це «Ратуша» поспілкувалася з молодою науковицею.

— А яку мету Ви ставили перед собою?

— Це методика, з допомогою якої можна перевірити на достовірність персональні дані користувачів віртуальних спільнот. Суть дослідження — розробити методи для перевірки великих текстових масивів інформації, щоб виявляти інформаційно-комунікаційні загрози у соціальних середовищах інтернету. Бо активність учасників популярних соціальних середовищ мережі зростає, натомість інформаційне наповнення, яке вони генерують, не завжди якісне та адекватне. Нині в вебпавутині шаленими темпами поширюють багато невірогідної, фейкової, брехливої та провокативної інформації. До того ж, спілкуючись у соціальних сервісах інтернет-комунікації, ми оперативно, часто миттєво, реагуємо на події у суспільстві, даємо їм оцінку. А це впливає на правдивість інформації, збільшує шанси того, що хтось, скажімо, використає проти нас маніпулятивні техніки спілкування.

— Кому насамперед будуть корисні результати проєкту, яка їх цільова аудиторія? Я так розумію, найбільше зацікавлення вони викличуть у батьків, діти-підлітки яких багато часу проводять у віртуальному світі, і з допомогою цієї методики можна буде виявляти підозрілі акаунти в дитячій стрічці. Також, мабуть, можна буде виявляти ботів, провокаторів, диверсантів? Усі ці «Сині кити» та поради від «Момо» — це ж тільки верхівка айсберга?

— Думаю, розроблена методика стане в пригоді багатьом. Зокрема власникам та розробникам соцмереж; власникам інтернет-порталів; фахівцям з PR-технологій для підбору та перевірки працівників; психологам. Звісно, журналістам для якісної перевірки інформаційного наповнення; політтехнологам — щоб визначати цільову аудиторію серед користувачів соцмережі та фокусувати увагу виборців на потрібній інформації.

Також — працівникам спецслужб, які в умовах інтенсивних інформаційних війн моніторять та виявляють маскованих професіоналів у сфері пропаганди та кібертероризму; працівникам правоохоронних органів та органів масової інформації та державної безпеки, що спеціалізуються на безпеці особистості в соціальних середовищ комунікації у мережі інтернет. І, звісно, пересічним користувачам соцмереж ці засоби допоможуть уникнути шкідливого впливу недостовірного, шкідливого, дезінформаційного контенту. До того ж — методика зменшить загрози порушення законодавства та етичних засад з боку окремих учасників, а саме недопустимих форм мережевого спілкування, таких, що несуть загрозу іншим учасникам (інтернет-шахрайство, педофілія тощо).

— Чи відомі приклади застосування таких методик у світі?

— Такі методи дослідження вебконтенту є, але вони зводяться до фрагментарного аналізу, не є комплексні. Наприклад, уже розроблено програмні засоби, які виявляють «домальовані» ділянки на зображенні, розкривають так звані метадані зображення. Американські фахівці розробили засіб для ідентифікації інтернет-користувача та виявлення його інформаційних слідів. Є сервіси, які дають можливість визначати фальшиві облікові записи користувачів. Але ці системи неадаптовані для слов’янських мов, а здебільшого орієнтовані тільки для англомовний контент. До того ж більшість наявних досліджень у цій галузі мають лише теоретичний характер та результати цих досліджень на практиці не апробовані.

Хто «наслідив» у мережі, або Що таке інформаційний слід

Пані Соломія деталізує: всі дані з профілів, створених користувачем, — це його так званий інформаційний слід. Але наголошує: перевірятиметься лише та інформація, яка є у відкритому доступі. Адже без відповідного дозволу простежувати особисте листування користувачів усіх сервісів або влазити у програмний код таких сервісів, як вайбер, соцмережі, — протизаконно.

— Розкажіть, будь ласка, детальніше — пошук відбуватиметься на основі аналізу текстів, виявлення якихось характерних, суперечливих, неадекватних слів-фраз?

— Так. На основі мовних шаблонів.

— Найбільше зацікавлює методика з погляду пересічного користувача. Зокрема мене як маму двох підлітків. Чи можна буде батькам виявити підозрілі акаунти — недоброзичливців, припустімо, гіпотетичних педофілів у стрічці дитини — скажімо, в інстаграмі чи фейсбуку? Наскільки це буде об’єктивно?

— Задум такий: є акаунти з вказаною інформацією — вік, стать, освіта тощо — в різних соцмережах, віртуальних спільнотах, блогах, інтернет-газетах тощо Усі відкриті дані користувача з профілів ми консолідуємо — це й називається інформаційний слід. І тоді вже на основі комп’ютерно-лінгвістичних індикаторів — мовних та графічних маркерів — ми проводимо аналіз цього контенту. Далі звіряємо отриманий інформаційний портрет користувача, що є результатом аналізу, та інформацію у профілі, що її вказав користувач.

— А якщо користувач у різних соцмережах, блогах і т. д. фігурує під різними іменами, вказує різний вік тощо, чи можна виявити, що це одна й та сама людина?

— Суть в тому, що мова видає людину, якщо вона замаскувалась. І саме за стилістикою написаного контенту формується портрет людини. Тоді ці портрети звіряються.

— Тобто таким чином, якщо ці портрети не збігаються, можна зрозуміти, що профіль є підозрілим. Але встановити, що це педофіл-кіберзлочинець-кібербулер — це вже наступні етапи. Їх методика не охоплює, вона лише дозволяє припустити?

— Так, ця методика дозволяє відфільтрувати. З величезної кількості профілів виділити підозрілі. Це суттєво економить фінансові затрати та час модераторів, адміністраторів.

— У підсумку такі підозрілі акаунти можна буде лише заблокувати, чи можна з такою інформацією звертатися у відповідні органи, як-от кіберполіція?

— Можна поставити на перманентну перевірку, або ж заблокувати. Це вже на розгляд адміністраторів. Все вирішує специфіка та правила вебсервісу, а також рівень безпеки у спільноті. Акценти ставлять власники. Наприклад, у вебспільноті дітей основний акцент — це вік.

— Повернімось усе-таки до пересічних користувачів. Скажімо, батьки виявили з допомогою Вашої методики в стрічці дитини підозрілий акаунт, дані з профілю й дані у постах користувача не збігаються, можливо, ще знайшли якісь агресивні слова-маркери. Чи можуть вони з таким звертатись до правоохоронців, чи лише заблокувати в стрічці дитини цього користувача?

— Звичайно, вони можуть звертатись до кіберполіції, та повинна відповідним чином відреагувати.

— Але тут ще такий момент: якщо цю людину знайшли, і поліція нічого не довела — може, десь методика помилилася — тоді чи не може той користувач подати позов за образу гідності?

— Може, ось чому я кажу, що ця методика не є стовідсотковою панацеєю, треба зважати на людський фактор. І ще. Наше законодавство, на жаль, не осучаснене до нових викликів суспільства.