Риски конфиденциальности: почему нейросети раскрывают личные данные пользователей

в Новости 15.05.2026 Комментарии к записи Риски конфиденциальности: почему нейросети раскрывают личные данные пользователей отключены

Современные модели генеративного искусственного интеллекта обучаются на колоссальных массивах данных, собранных в интернете. В этих базах нередко оказываются номера телефонов и домашние адреса частных лиц. Несмотря на то что многие чат-боты запрограммированы на отказ от предоставления подобной информации, на практике механизмы защиты часто дают сбой.

Содержание

1 Результаты тестирования популярных нейросетей
2 Проблема обучения на данных пользователей
3 Как персональная информация попадает в открытый доступ
4 Способы защиты личной информации

Результаты тестирования популярных нейросетей

Исследовательская группа CNET провела серию тестов, чтобы проверить, насколько легко современные ИИ-сервисы выдают личные данные. Результаты показали значительные различия в уровне соблюдения приватности:

Grok оказался наиболее уязвимым инструментом: сервис мгновенно предоставлял актуальные и прошлые адреса по запросу, сопровождая это формальным уведомлением о том, что данные взяты из открытых источников.
ChatGPT демонстрировал вариативность: в ряде случаев он отказывался выдавать информацию, однако иногда предоставлял старые стационарные и личные мобильные номера, а также адреса родственников пользователя.
Gemini* ограничивался выдачей ссылок на публичные профили в социальных сетях, отказываясь раскрывать частные номера телефонов и домашние адреса.
Claude последовательно блокировал все попытки получить персональные данные.

Проблема обучения на данных пользователей

Вопрос безопасности выходит за рамки простого поиска по базам данных. Согласно исследованию Корнельского университета, проведенному в 2025 году, такие технологические гиганты, как Anthropic, Google*, Meta*, Microsoft* и OpenAI*, автоматически используют пользовательские данные для дообучения своих моделей, если пользователь не активировал настройки отказа. В случае с Meta* и OpenAI* собранная информация сохраняется бессрочно. Это означает, что чат-бот может использовать в ответах сведения, которые человек передал системе несколько лет назад, считая их конфиденциальными.

Как персональная информация попадает в открытый доступ

Личные данные часто становятся публичными в силу юридических процедур или действий самих пользователей:

При покупке недвижимости сведения о сделке и адресе зачастую переходят в категорию публичных записей.
Регистрация в качестве избирателя или участие в правовых процессах делает данные доступными в государственных реестрах.
Пользователи часто соглашаются на передачу данных третьим лицам, не читая условия пользовательских соглашений при установке приложений.

Способы защиты личной информации

Эксперты по безопасности подчеркивают, что чат-боты транслируют только ту информацию, которая уже присутствует в интернете. Основная стратегия защиты заключается в минимизации «цифрового следа»:

Регулярно проверяйте выдачу поисковых систем и чат-ботов по запросу собственных данных.
Удаляйте свою информацию из публичных справочников и сайтов-агрегаторов.
Воспользуйтесь специализированными сервисами по удалению данных, которые автоматически направляют запросы на исключение персональной информации из общедоступных баз.

* — деятельность компании запрещена на территории РФ

Еще кое-что по теме: