Сора против Соры 2: вот на что способна новейшая видеомодель OpenAI

Когда в феврале 2024 года было анонсировано Sora, это была первая модель OpenAI для генерации видео. Но официально он не был выпущен до декабря, когда стал доступен подписчикам ChatGPT Plus и Pro. С Sora пользователи могут просто использовать текст или другие подсказки для создания видео. Визуальное содержание этих видеороликов впечатляло, но чего-то не хватало; в нем отсутствовал звук, и это главное обновление Sora 2.

Видеогенератор OpenAI Sora 2 теперь добавляет звук в виде синхронизированных диалогов и звуковых эффектов. Обновление было выпущено 30 сентября, и компания описала его как модель, которая «может делать вещи, которые исключительно сложны, а в некоторых случаях совершенно невозможны для предыдущих моделей поколения видео». Sora 2 улучшает ограничения Sora, особенно в отношении реализма видео. В Sora анимация не казалась обоснованной, иногда казалось, что алгоритм забыл применить основные законы физики к сгенерированным видео. OpenAI посчитала, что модель слишком оптимистична и слишком сильно полагается на выполнение подсказок, а не на сохранение реалистичности видео.

Помимо улучшенного реализма, в Sora 2 представлена ​​новая функция «Камеи», которая запускается вместе с приложением Sora iOS. Это позволит пользователям включать свои изображения в создаваемые видеоролики. После того как вы запишете короткую одноразовую видео- и аудиозапись для подтверждения вашей личности, Sora 2 сможет перенести вас в любую сгенерированную сцену с точной передачей внешнего вида и голоса. Это работает с людьми, животными и даже объектами. Это также показывает, почему OpenAI называет Sora 2 «моментом GPT-3.5» для видео, предполагая, что с этим выпуском они продвинулись на несколько поколений вперед.

Доступ к Sora 2 и структура ценообразования

OpenAI применила очень стратегический подход к развертыванию Sora 2. Модель была запущена сначала в США и Канаде через доступ только по приглашению, а затем компания распространила ее на азиатский континент, в частности в Японию, Южную Корею, Таиланд, Вьетнам и Тайвань. Доступ только по приглашению означает, что на данный момент пользователи, которые хотят использовать приложение Sora (с Sora 2), должны присоединиться к списку ожидания приложения iOS, прежде чем получить доступ к бесплатному использованию модели. Интеграция Sora 2 с Android пока не объявлена. Однако приложение Sora для Android (вместе с Sora) было запущено в этом месяце и в первый день его загрузили около 470 000 раз.

Когда дело доходит до ценообразования, Sora 2 использует кредитную систему, поэтому каждое видео будет потреблять кредиты в зависимости от разрешения, продолжительности и того, используете ли вы стандартную модель или модель Pro. Текущая версия iOS и веб-версия позволяют только приглашенным использовать стандартную версию Sora 2 бесплатно. Сюда входят все основные функции, такие как создание видео, звуковые эффекты и базовое редактирование. Но если у вас есть ежемесячная подписка на ChatGPT Pro за 200 долларов, вы получаете доступ к Sora 2 Pro без дополнительной оплаты. Это даст вам доступ к созданию видео более высокого качества, хотя это все еще экспериментально.

В Sora 2 10-секундные видеоролики будут стоить 10 кредитов, а 15-секундные — 20 кредитов, и вы получите только одно и два поколения видео. Для Sora 2 Pro, которая доступна только для ChatGPT Pro, 10-секундные видео со стандартным разрешением будут стоить 40 кредитов с четырьмя поколениями видео, 15-секундные — 80 кредитов с восемью поколениями видео, а 25-секундные видео будут стоить 120 кредитов с 12 поколениями видео. 10- и 15-секундные видеоролики высокого разрешения имеют 25 и 50 поколений видео и стоят 250 и 500 кредитов соответственно. OpenAI также заявила о своих планах представить Sora 2 в API и подтвердила, что Sora 1 Turbo останется доступной.