OpenAI отстает в «гонке вооружений» искусственного интеллекта?

Описание развития ИИ как «гонки вооружений» может показаться излишне напыщенным, но есть причина, по которой этот термин вошел в обиход. Он отражает скорость и интенсивность, с которой компании разрабатывают и внедряют системы искусственного интеллекта. Каждый должен двигаться быстро, потому что его соперники движутся быстро, и никто не хочет отставать.

2 декабря 2025 года широко распространилось сообщение о том, что Сэм Альтман ввел «красный код» во внутренней служебной записке. Выпуск Google Gemini 3 (включая Gemini 3 Pro и 3 Deep Think) 18 ноября и выпуск Claude Opus 4.5 компанией Anthropic 24 ноября привели к предположению, что ChatGPT OpenAI теряет свое преимущество. 9 декабря газета Atlantic опубликовала статью, в которой говорилось, что OpenAI «отстает в гонке ИИ», заявляя, что «OpenAI уже много месяцев не имеет стабильного или даже убедительного лидерства в основных тестах ИИ». Однако два дня — это большой срок для обновлений искусственного интеллекта, потому что 11 декабря OpenAI выпустила версию 5.2, и внезапно ChatGPT снова набрал обороты.

Так является ли ChatGPT лучшей моделью искусственного интеллекта? Как и следовало ожидать, все гораздо сложнее. OpenAI утверждает, что GPT-5.2 лучше подходит для профессиональной работы, такой как многоэтапные проекты, презентации и электронные таблицы. Последний выпуск Gemini от Google был посвящен мультимодальности и пониманию нюансов, а Claude от Anthropic преуспевает в агентном кодировании и исправлении ошибок. А поскольку разные системы ИИ хороши в разных вещах, ни одна модель не может быть лучшей во всем.

Насколько хорошо ChatGPT справляется с тестами

Крупный план значков искусственного интеллекта на экране телефона, включая Gemini, Grok, Perplexity, Claude, ChatGPT и Copilot.

Когда дело доходит до ранжирования моделей ИИ, много говорят о тестах. Людям нравится приводить цифры к вещам, поэтому исследователи ИИ и компании составляют стандартизированные тесты, чтобы измерить и оценить, насколько хорошо система ИИ справляется с конкретными задачами. Бенчмарки не лишены ограничений. Высокие оценки не обязательно означают лучший пользовательский опыт, и модели могут быть оптимизированы для прохождения тестов на высшем уровне за счет того, что они на самом деле станут более полезными. Тем не менее, тесты остаются лучшими данными для объективного сравнения моделей ИИ.

В GPQA Diamond, сложном научно обоснованном тесте на рассуждение, ChatGPT 5.2 Pro набрал 93,2%, что лучше, чем у любой другой модели искусственного интеллекта. Gemini 3 Pro занимает второе место с 91,9%. В тесте ARC-AGI 2 ChatGPT показал худшие результаты. В этом тесте используются визуальные головоломки, которые должны быть интуитивно понятны для людей, но сложны для ИИ, что-то вроде головоломок CAPTCHA, которые доказывают, что вы не робот. Здесь вы можете сами попробовать разгадать головоломки. Claude Opus 4.5 здесь значительно превосходит всех своих соперников.

Другой тест, «Последний экзамен человечества» (HLE), использует открытые задачи экспертного уровня, с которыми сталкиваются даже самые умные люди. Предполагается, что это будет последний значимый академический экзамен, который люди могут сдать для ИИ. Как только ИИ будет постоянно работать лучше, чем люди, он станет умнее нас, и мы больше не сможем проводить значимые тесты для измерения искусственного интеллекта. Лучше всего на HLE на данный момент работает ИИ — Gemini 3 Pro с 45,8%. OpenAI утверждает, что ChatGPT 5.2 Pro набирает 36,6%, что является улучшением по сравнению с показателем GPT-5 (35,2%), но все же ставит его на третье место после Gemini и менее известного искусственного интеллекта с открытым исходным кодом Kimi K2 Thinking, который набирает 44,9%.

Итак, у OpenAI проблемы?

Руки держат смартфон, на котором отображается ChatGPT, и ноутбук, на заднем плане также отображается ChatGPT.

Во многих тестах ChatGPT от OpenAI стабильно входит в пятерку лучших моделей искусственного интеллекта, а по некоторым специальностям занимает первое место. Поэтому сказать, что он отстает, кажется несколько преувеличением. То есть, пока не подумаешь, насколько раньше он опережал своих конкурентов. На протяжении 2023 года и большей части 2024 года у него было гораздо больше шансов стать лидером по показателям. Помимо тестов, существуют и другие способы оценки моделей ИИ, например, LMArena, общедоступная платформа, где пользователи анонимно сравнивают модели ИИ друг с другом.

На момент написания статьи фаворитом на LMArena является Gemini 3 Pro, а ChatGPT занимает 8-е место. В 2023 году ChatGPT постоянно занимал первое место на платформе (тогда называвшейся Chatbot Arena). В середине 2024 года он по-прежнему возглавлял список. Однако к концу 2024 года ChatGPT столкнулся с конкуренцией со стороны Gemini, которая впервые вышла в лидеры. На протяжении 2025 года крупные компании, занимающиеся искусственным интеллектом, обгоняли друг друга, часто вырываясь вперед после нового релиза, но их затмило следующее обновление конкурента.

Такие компании, как Google и Microsoft, имеют преимущество перед OpenAI, поскольку они могут включать Gemini и Copilot в инструменты, которые люди уже используют, стремясь расширить внедрение ИИ. Однако, когда дело доходит до количества пользователей, конкурентам OpenAI предстоит пройти долгий и долгий путь, чтобы догнать их, прежде чем они хотя бы приблизится к показателям OpenAI. ChatGPT имеет 5,6 миллиардов посещений в месяц, и на его долю приходится около 60% всего использования ИИ. Его рыночная доля больше, чем у Gemini, Claude, Grok, Copilot и всех остальных инструментов искусственного интеллекта вместе взятых. Хотя это не обязательно является фаворитом технических экспертов, большинство людей на самом деле не заботятся о тестах. Место ChatGPT номер один среди постоянных пользователей остается неоспоримым.