В мире искусственного интеллекта назревает очередной скандал. На этот раз в центре внимания оказалась NVIDIA — компания, чьи чипы стоят за многими современными ИИ-системами. Причина конфликта кроется в использовании книг, защищённых авторским правом, для обучения ИИ-моделей.
Всё началось с признания NVIDIA в использовании набора данных 'Books3'. Этот набор, по сути, представляет собой библиотеку текстов с сайта Bibliotik, который многие считают «пиратским». Такое признание вызвало бурю негодования среди писателей. Группа авторов не стала медлить и подала коллективный иск, обвинив NVIDIA в нарушении их авторских прав. Стоит отметить, что NVIDIA здесь не одинока — подобные иски поданы и против других техногигантов: OpenAI, Microsoft и Meta.
Однако NVIDIA не собирается сдаваться без боя. Компания выдвинула неожиданный аргумент: использование книг для обучения ИИ — это, по их мнению, «добросовестное использование». Их объяснение заключается в том, что ИИ-модели не «читают» книги в привычном нам смысле. Вместо этого они анализируют «статистические корреляции» в текстах.
«Обучение измеряет статистические корреляции в совокупности, на основе огромного массива данных, и кодирует их в параметры модели», — заявляет NVIDIA в судебных документах. По их словам, этот процесс полностью меняет изначальное назначение книг, что и позволяет отнести его к добросовестному использованию.
NVIDIA идёт ещё дальше в своей аргументации. Компания утверждает, что авторы вообще не могут претендовать на авторские права на «факты и идеи» в своих книгах. Их логика такова: если принять противоположную точку зрения, то получится, что писатели могут защищать авторским правом даже правила грамматики или базовые факты о мире.
В поддержку своей позиции NVIDIA ссылается на прецеденты. Например, дело Authors Guild против Google, где суд решил, что копирование книг для создания поисковой базы данных — это добросовестное использование. Именно благодаря этому решению Google Books продолжает существовать.
До окончательного решения ещё далеко. Предварительные слушания могут начаться не раньше ноября 2026 года. NVIDIA же хочет ускорить процесс и планирует в течение года подать ходатайство о вынесении решения в упрощенном порядке. Их цель — как можно скорее прояснить вопрос о добросовестном использовании.
Этот спор — лишь верхушка айсберга. Он поднимает фундаментальные вопросы о будущем ИИ и границах авторского права в цифровую эпоху. И дело не ограничивается только текстами. Недавно суд в Калифорнии разрешил продолжить рассмотрение иска от художников против компаний, создающих ИИ для работы с изображениями.