Риски конфиденциальности: почему нейросети раскрывают личные данные пользователей

Риски конфиденциальности: почему нейросети раскрывают личные данные пользователей

Современные модели генеративного искусственного интеллекта обучаются на колоссальных массивах данных, собранных в интернете. В этих базах нередко оказываются номера телефонов и домашние адреса частных лиц. Несмотря на то что многие чат-боты запрограммированы на отказ от предоставления подобной информации, на практике механизмы защиты часто дают сбой.

Результаты тестирования популярных нейросетей

Исследовательская группа CNET провела серию тестов, чтобы проверить, насколько легко современные ИИ-сервисы выдают личные данные. Результаты показали значительные различия в уровне соблюдения приватности:

  • Grok оказался наиболее уязвимым инструментом: сервис мгновенно предоставлял актуальные и прошлые адреса по запросу, сопровождая это формальным уведомлением о том, что данные взяты из открытых источников.
  • ChatGPT демонстрировал вариативность: в ряде случаев он отказывался выдавать информацию, однако иногда предоставлял старые стационарные и личные мобильные номера, а также адреса родственников пользователя.
  • Gemini* ограничивался выдачей ссылок на публичные профили в социальных сетях, отказываясь раскрывать частные номера телефонов и домашние адреса.
  • Claude последовательно блокировал все попытки получить персональные данные.

Проблема обучения на данных пользователей

Вопрос безопасности выходит за рамки простого поиска по базам данных. Согласно исследованию Корнельского университета, проведенному в 2025 году, такие технологические гиганты, как Anthropic, Google*, Meta*, Microsoft* и OpenAI*, автоматически используют пользовательские данные для дообучения своих моделей, если пользователь не активировал настройки отказа. В случае с Meta* и OpenAI* собранная информация сохраняется бессрочно. Это означает, что чат-бот может использовать в ответах сведения, которые человек передал системе несколько лет назад, считая их конфиденциальными.

Как персональная информация попадает в открытый доступ

Личные данные часто становятся публичными в силу юридических процедур или действий самих пользователей:

  • При покупке недвижимости сведения о сделке и адресе зачастую переходят в категорию публичных записей.
  • Регистрация в качестве избирателя или участие в правовых процессах делает данные доступными в государственных реестрах.
  • Пользователи часто соглашаются на передачу данных третьим лицам, не читая условия пользовательских соглашений при установке приложений.

Способы защиты личной информации

Эксперты по безопасности подчеркивают, что чат-боты транслируют только ту информацию, которая уже присутствует в интернете. Основная стратегия защиты заключается в минимизации «цифрового следа»:

  • Регулярно проверяйте выдачу поисковых систем и чат-ботов по запросу собственных данных.
  • Удаляйте свою информацию из публичных справочников и сайтов-агрегаторов.
  • Воспользуйтесь специализированными сервисами по удалению данных, которые автоматически направляют запросы на исключение персональной информации из общедоступных баз.

* — деятельность компании запрещена на территории РФ

Еще кое-что по теме: