В последнее время стало известно, что многие крупные веб-сайты, включая популярные соцсети и известные новостные ресурсы, такие как The New York Times и The Atlantic, отказались от участия в обучении искусственного интеллекта Apple.
Это решение связано с тем, что Apple использует свои технологии, такие как Applebot, для сбора данных и обучения своих языковых моделей.
Applebot собирает информацию с веб-страниц, что позволяет улучшать функции, такие как Siri и поиск Spotlight.
Однако эта практика вызывает споры, так как ИИ может использовать защищенные авторским правом материалы для создания новых версий контента. Некоторые модели даже воспроизводят целые абзацы текста без изменений.
Apple предоставляет возможность издателям отказаться от использования их контента для обучения ИИ. Это делается через файл robots.txt, что позволяет сохранить индексацию сайта в поиске, но исключает данные из процесса обучения.
Многие крупные издательства воспользовались этой возможностью. Журналисты подтвердили, что среди них — такие организации, как Craigslist, Tumblr и Vox Media.
По данным анализа, более четверти опрошенных англоязычных новостных сайтов уже заблокировали доступ Applebot-Extended, что подчеркивает растущую озабоченность по поводу использования их материалов для обучения искусственного интеллекта.