Сора (модель преобразования текста в видео)
- Sora – новая модель генеративного искусственного интеллекта от OpenAI, специализирующаяся на преобразовании текста в видео.
- Модель генерирует короткие видеоклипы, соответствующие запросам пользователей.
- Sora также может дополнять существующие короткие видеоролики.
- До появления Sora было создано несколько других моделей преобразования текста в видео.
- Команда, разработавшая Sora, назвала его в честь японского слова, обозначающего небо.
- OpenAI планирует сделать Sora доступной для широкой публики, но это произойдет не скоро.
- Технология, лежащая в основе Sora, является адаптацией технологии, лежащей в основе DALL-E 3.
- Видео генерируется в скрытом пространстве путем устранения шумов в 3D-“заплатках”.
- OpenAI обучала модель, используя общедоступные видеоролики и видеоролики, защищенные авторским правом.
- Уилл Дуглас Хэвен назвал демонстрационные видеоролики “впечатляющими”, но отметил, что они могут не соответствовать типичным результатам работы Sora.
Полный текст статьи: