Categories: МИР

LLM раскрывают анонимов, ИИ способен идентифицировать пользователей с точностью до 90%

Группа исследователей из Швейцарской высшей технической школы Цюриха (ETH Zurich) и Anthropic выяснила, что большие языковые модели (LLM) способны выявлять личности пользователей, скрывающихся за анонимными аккаунтами в интернете. Согласно отчету, такие методы могут работать в больших масштабах и с высокой точностью.

Это ставит под сомнение традиционную роль псевдонимности как базовой формы защиты конфиденциальности, считают аналитики.

Общая схема деанонимизации пользователей с помощью LLM. Источник: ETH Zurich.

В опубликованной научной статье говорится, что ИИ способен сопоставлять аккаунты и сообщения пользователей на разных платформах. При этом модели анализируют свободный текст и косвенные признаки.

В экспериментах показатель так называемой «полноты» — доли успешно деанонимизированных пользователей — достиг 68%. Что касается точности идентификации, то она доходила до 90%.

Как это работает?

В рамках исследования ученые использовали несколько наборов данных из публичных источников.

Один из экспериментов связывал профили пользователей Hacker News и LinkedIn через межплатформенные ссылки. После этого из сообщений удаляли все прямые идентификаторы и анализировали их с помощью языковой модели.

Другой метод использовал данные, похожие на набор Netflix Prize, содержащий микроидентификаторы вроде предпочтений и истории действий пользователей. Такие данные позволяют восстановить личность человека даже при отсутствии прямых указаний на его имя.

Пример идентификации анонимного аккаунта на основе извлеченных признаков. Источник: ETH Zurich.

В отдельных тестах исследователи анализировали активность пользователей Reddit.

Например, обсуждение фильмов в нескольких тематических сообществах позволяло выявлять часть пользователей с высокой точностью. При обсуждении более десяти фильмов точность идентификации достигала 90% для почти половины пользователей и 99% для примерно 17%.

Угроза для приватности

По словам одного из авторов исследования Саймона Лермена, ключевое отличие современных методов в том, что LLM способны анализировать свободный текст и постепенно выстраивать полную картину личности человека. Ранее для таких задач требовались структурированные базы данных и сложные алгоритмы сопоставления.

Исследователи предупреждают, что такие технологии могут сделать массовую деанонимизацию дешевой и быстрой. Это открывает возможности для доксинга, преследования и создания детальных маркетинговых профилей пользователей.

Авторы работы считают, что платформам следует ограничивать массовый доступ к пользовательским данным через API.

Кроме того, они предложили отслеживать автоматический сбор. Разработчики ИИ также могли бы внедрять механизмы, которые предотвращают использование моделей для целенаправленной деанонимизации, считают ученые.

В противном случае, отмечают авторы, подобные инструменты могут использоваться государствами для выявления онлайн-критиков. При этом компании будут использовать их для гипертаргетированной рекламы, а злоумышленниками — для создания масштабных мошеннических схем.

Напомним, что США использовали ИИ-модель Anthropic для атаки на Иран.

Rada Dar

Next Скандал в «Нафтогазе», коррупционный «бэк-офис» контролирует стратегические закупки »

Previous « Суд признал дискриминацию пенсионеров незаконной, выплаты 2021–2024 годов будут пересчитаны

Published by

Rada Dar

3 недели ago

ЕЦБ запускает стандарты для цифрового евро, что будет с платежами в Европе к 2027 году

Европейский центральный банк (ЕЦБ) планирует внедрить технические стандарты для дальнейшей интеграции цифрового евро (CBDC) летом…

13 часов ago

Статьи

НАБУ и САП рассматривают возможность расследования дела против Арахамии

СМИ, близкие к НАБУ и САП, намекают на вероятное возбуждение уголовного дела против лидера фракции…

15 часов ago

Crypto

Биткоин опережает золото, криптовалюта укрепляется на фоне падения цен на традиционные активы

Золото демонстрирует самую продолжительную серию падения в истории наблюдений — уже 10 дней подряд. Об…

16 часов ago

Коррупция

Чиновница из Винниччины присваивала 2,7 млн грн с бюджета лицея

В Винницкой области разоблачили чиновницу, которая три года подряд превращала бюджет учебного заведения в свою…

18 часов ago

Новости

Украина готовится к худшему зимнему сезону, дефицит энергии и рост цен на газ

Следующая зима может ударить сильнее – энергосистема до сих пор не восстановлена после атак россиян.…

19 часов ago

Новости

Энергетический парадокс, как избыточная «зеленая» энергия приводит к росту тарифов для украинцев

Масштабная ставка Украины на возобновляемую энергетику, еще недавно представлявшуюся как прорыв в будущее, сегодня обернулась серьезной финансовой…

21 час ago

This website uses cookies.