Искусственный интеллект учится на ваших разговорах: исследование предупреждает о рисках приватности

13:10 22.10.2025

Нестор Обуховский

Исследователи Стэнфордского университета обнаружили, что ведущие разработчики искусственного интеллекта используют диалоги пользователей для обучения своих моделей, что вызывает серьезные беспокойства относительно приватности.

Источник: techxplore.com, перевод: Хроники Обухова

В прошлом месяце компания Anthropic незаметно изменила условия пользования: теперь разговоры с ее чат-ботом Claude автоматически попадают в учебные данные, если пользователь не откажется от этого вручную.

Как выяснила команда под руководством Дженнифер Кинг, эксперта из Стэнфордского института человечного ИИ, подобную политику имеют и другие шесть крупных американских компаний - среди них OpenAI, Google, Meta, Microsoft и Amazon.

"Если вы делитесь личным - оно может оказаться в обучающих данных"

Кинг предупреждает:

"Если вы вводите конфиденциальную информацию - даже в прикрепленном файле - она может быть сохранена и использована для тренировки моделей ChatGPT, Gemini или других систем".

Команда Стэнфорда проанализировала 28 документов - политики конфиденциальности, FAQ и внутренние ссылки разработчиков, - обнаружив недостаток прозрачности, долгие сроки хранения данных и даже случаи обучения на детских данных.

Многие компании оставляют за собой право хранить диалоги бессрочно и привлекать к их просмотру людей для улучшения моделей.

Слияние данных из разных сервисов: как это работает

В многопродуктовых корпорациях, таких как Google, Meta или Microsoft, данные пользователей из чатов могут объединяться с поисковыми запросами, историей покупок или активностью в соцсетях.

Это создает риски, когда пользователь невольно сообщает чувствительные данные - например, о состоянии здоровья. Если человек попросит чат-бота посоветовать "низкоуглеводное меню", система может классифицировать его как "уязвимого по состоянию здоровья", а впоследствии это отразится в рекламе или даже в страховых предложениях.

"Такие "выводы" могут распространяться по всей экосистеме разработчика - и последствия со временем будут только нарастать", - объясняет Кинг.

Особая тревога - данные детей

Исследователи обнаружили, что ни одна из компаний не имеет четкой политики по исключению детских данных.
Google разрешает использовать данные подростков, если они соглашаются. Anthropic заявляет, что не собирает данные несовершеннолетних, но не проверяет возраст пользователей. Microsoft признает, что собирает детские данные, но не использует их для тренировки моделей.

Такие практики, отмечают авторы, нарушают принцип информированного согласия, ведь дети юридически не могут соглашаться на обработку своих персональных данных.

Почему нужен "частный ИИ" и федеральное регулирование

Команда Стэнфорда пришла к выводу, что все шесть ведущих компаний используют чат-данные пользователей по умолчанию, а политики конфиденциальности не дают полного понимания, как именно данные собираются, обрабатываются и используются.

Исследователи предлагают три основных шага:

Федеральный закон о защите данных - чтобы унифицировать правила вместо разрозненных штатных законов.
Активное согласие пользователя (opt-in), а не автоматическое включение данных в тренировку.
Автоматическая фильтрация персональной информации при вводе в чат.

"Мы должны взвесить, стоит ли польза от улучшения ИИ цены потери приватности миллионов людей, - говорит Кинг. - Развитие технологий не должно превращать конфиденциальность в побочный эффект".

Итог

Исследование Стэнфорда показывает, что пользовательские диалоги стали топливом для ИИ-индустрии, но правила защиты данных за ними не поспевают. Без прозрачности, реального согласия и технических барьеров приватность пользователей рискует стать очередной жертвой технологической гонки.

Искусственный интеллект учится на ваших разговорах: исследование предупреждает о рисках приватности

"Если вы делитесь личным - оно может оказаться в обучающих данных"

Слияние данных из разных сервисов: как это работает

Особая тревога - данные детей

Почему нужен "частный ИИ" и федеральное регулирование

Итог

Читайте также