Компания представила инструмент Google-Extended. Его можно настроить через документ robots.txt, который сообщает веб-сканерам о том, к какой информации они могут получить доступ.
Издатели смогут скрыть свои ресурсы от роботов, которые собирают данные для обучения моделей Bard и VertexAI. При этом сайты продолжат индексироваться поиском Google.
По мере расширения технологий ИИ компания также намерена предлагать владельцам сайтов новые возможности по контролю за доступом к данным. О каких возможностях идёт речь — не уточняется.
В июле 2023 года Google обновила политику конфиденциальности, включив свои модели ИИ в список сервисов, которые могут обучаться на общедоступных данных из интернета.
В августе OpenAI разрешила владельцам сайтов блокировать доступ к данным для своего сканера GPTBot через robots.txt.