Иск Джорджа Мартина по ChatGPT может навсегда изменить правила для искусственного интеллекта

В индустрии искусственного интеллекта может наступить зима, поскольку иск против OpenAI подается в суд. В иске, поданном группой авторов в 2023 году, в том числе автором «Игры престолов» Джорджем Р.Р. Мартином, утверждается, что данные и результаты обучения ChatGPT представляют собой нарушение авторских прав. Это далеко не новый аргумент, но он очевиден, и, возможно, он, наконец, приживется в суде.

Закон об авторском праве уже прогнулся под тяжестью Интернета, который всегда проявлял склонность к ремиксу защищенного контента. Трещины начали проявляться еще тогда, когда подростки еще публиковали GIF-изображения из «Сверхъестественного» на Tumblr, и генеративный искусственный интеллект нанес удар по этим основам, поскольку он способен сам создавать контент. Через три года после публичного запуска ChatGPT любой желающий может снять видео боя мистера Роджерса и мистера Т. на световых мечах на Звезде Смерти. Никто не приблизился к тому, чтобы остановить индустрию искусственного интеллекта, поскольку она поглощает защищенный авторским правом контент (и экономику) и изрыгает помои. Даже у кодирования ИИ есть проблемы, которые становятся только хуже.

Но новые события в деле авторов свидетельствуют о том, что технологические компании не выиграли битву за авторские права. Федеральный судья отклонил ходатайство OpenAI об отклонении иска, что позволило Мартину и его коллегам-авторам выдвинуть свою точку зрения и вынудило OpenAI сделать то же самое. То, что произойдет дальше, может разрушить сами основы индустрии искусственного интеллекта или нанести смертельный удар по закону об авторском праве в том виде, в каком мы его знаем.

Судья по правилам ChatGPT может быть незаконно большим фанатом «Игры престолов»

Палец указывает на интерфейс ChatGPT на ноутбуке

Судя по всему, Джордж Р. Р. Мартин и его группа претендентов готовы одержать значительную победу над OpenAI и ChatGPT — по крайней мере, если обе стороны не договорятся об урегулировании. 28 октября судья Сидни Стайн, старший судья Окружного суда США Южного округа Нью-Йорка, отклонил ходатайство адвокатов OpenAI об отклонении иска. Множественные иски, поданные несколькими группами авторов, теперь могут рассматриваться как объединенные усилия. В судебном процессе участвуют несколько других известных авторов, в том числе лауреат Пулитцеровской премии Майкл Шейбон, Макартур и обладатель Национальной книжной премии Та-Нехиси Коутс, а также лауреат премии Уайтинга Джиа Толентино. В прошлом году художники-визуалисты подали отдельный иск против Stable Diffusion.

Судья Штайн пришел к своему решению после сравнения краткого изложения «Песни льда и пламени» Мартина, созданного ChatGPT, с самой книгой. Как сообщает Publishers Weekly, LLM воссоздал весь сюжет, представив при этом состав персонажей и уловив при этом общий тон романов. Business Insider также сообщил, что, когда его спросили об идеях продолжения, предложения LLM были достаточно похожи на работу Мартина, и Штейн не исключил потенциального нарушения авторских прав. «Разумное жюри могло бы прийти к выводу, что предположительно нарушающие авторские права произведения по существу аналогичны работам истцов», — написал он в постановлении, с которым ознакомилось издание.

Авторское право против права на копирование лежит в основе дела против OpenAI

Деревянные блоки с изображениями AI-чипа, авторских прав и масштаба.

В основе иска, поданного авторами против OpenAI и ее партнера Microsoft, лежат обучающие данные. Большие языковые модели, такие как ChatGPT, загружают как можно больше высококачественного текста для повышения их производительности. Книги являются основой этих наборов данных, и авторы утверждают, что само обучение нарушает закон об авторском праве. Этот аргумент не так уж надежен, как кажется — модели ИИ работают не так просто. Но у истцов есть еще два аргумента, которые могут принести больше пользы.

Второй аргумент заключается в том, что, как и распространение пиратских фильмов через торрент, загрузка самих книг была незаконной, независимо от того, для чего они использовались. Это требование подпадает под гораздо более четкое применение закона. Речь идет о так называемых «теневых библиотеках» — термине, обозначающем большие коллекции книг и статей, принадлежащие брокерам, продающим незаконный доступ.

Но третий аргумент, касающийся сходства результатов, созданных ChatGPT, с работой, защищенной авторским правом, продвинул дело вперед в этом последнем решении. В законе об авторском праве существует щедрое исключение о добросовестном использовании, согласно которому относительно небольшое количество контента может быть использовано в преобразовательных целях — например, кинокритик показывает строку диалога из фильма в рамках рецензии. OpenAI почти наверняка будет утверждать, что ее продукты подпадают под добросовестное использование, но такая интерпретация радикально расширит сферу того, что до сих пор было защищено законом. Важно отметить, что использование, которое наносит вред рынку оригинального продукта, труднее доказать как добросовестное использование, и это юридическое препятствие, которое другие виды использования ИИ не смогли устранить в суде.