- Shorts Video Maker (Создатель коротких видео)
Shorts Video Maker (Создатель коротких видео)
Shorts Video Maker (Создатель коротких видео)
Открытый инструмент для автоматизированного создания коротких видеороликов. Shorts Video Maker объединяет технологии преобразования текста в речь, автоматические субтитры, фоновое видео и музыку для создания увлекательных коротких видео из простых текстовых входных данных.
Этот репозиторий был открыт Youtube-каналом AI Agents A-Z. Рекомендуем ознакомиться с каналом для получения большего количества контента и уроков по искусственному интеллекту.
Требования к оборудованию
- CPU: рекомендуется минимум 2 ядра
- GPU: не обязателен, но значительно ускоряет генерацию субтитров (whisper.cpp) и рендеринг видео
Официальное видео о генерации видео с помощью n8n
Запуск проекта
Через NPX (рекомендуется)
Самый простой способ запустить проект с поддержкой GPU:
LOG_LEVEL=debug PEXELS_API_KEY= npx short-video-maker
Через Docker
Образ для CPU
docker run -it --rm --name short-video-maker -p 3123:3123 \
-e PEXELS_API_KEY= \
gyoridavid/short-video-maker:latest
NVIDIA GPU
docker run -it --rm --name shorts-video-maker -p 3123:3123 \
-e PEXELS_API_KEY= --gpus=all \
gyoridavid/short-video-maker:latest-cuda
Где найти помощь
Присоединяйтесь к нашему сообществу в Discord для поддержки и обсуждений.
Переменные окружения
| Переменная | Описание |
|---|---|
| PEXELS_API_KEY | Ваш API-ключ Pexels для поиска фоновых видео |
| PORT | Порт для API/MCP сервера (по умолчанию: 3123) |
| LOG_LEVEL | Уровень логирования сервера (по умолчанию: info, варианты: trace, debug, info, warn, error) |
| WHISPER_VERBOSE | Подробный режим для Whisper (по умолчанию: false) |
Пример
|
Возможности
- Генерация полных коротких видео из текстовых подсказок
- Преобразование текста в речь
- Автоматическая генерация и стилизация субтитров
- Поиск и выбор фонового видео через Pexels
- Фоновая музыка с выбором жанра/настроения
- Работа как REST API и сервер Model Context Protocol (MCP)
Как это работает
Shorts Creator принимает простые текстовые входные данные и поисковые запросы, затем:
- Преобразует текст в речь с помощью Kokoro TTS
- Генерирует точные субтитры через Whisper
- Находит релевантные фоновые видео с Pexels
- Компилирует все элементы с помощью Remotion
- Рендерит профессиональное короткое видео с идеально синхронизированными субтитрами
Зависимости для генерации видео
| Зависимость | Версия | Лицензия | Назначение |
|---|---|---|---|
| Remotion | ^4.0.286 | Remotion License | Композиция и рендеринг видео |
| Whisper CPP | v1.5.5 | MIT | Преобразование речи в текст |
| FFmpeg | ^2.1.3 | LGPL/GPL | Работа с аудио/видео |
| Kokoro.js | ^1.2.0 | MIT | Генерация речи из текста |
| Pexels API | N/A | Pexels Terms | Фоновые видео |
Как внести вклад?
PR приветствуются. Смотрите файл CONTRIBUTING.md для инструкций по настройке локального окружения для разработки.
Использование API
REST API
Доступны следующие REST endpoints:
GET /api/video/:id- Получить видео по IDPOST /api/video- Создать новое видео{ "scenes": [ { "text": "Это текст, который будет озвучен в видео", "searchTerms": ["природа закат"] } ], "config": { "paddingBack": 3000, "music": "спокойный" } }DELETE /api/video/:id- Удалить видео по IDGET /api/music-tags- Получить доступные теги музыки
Model Context Protocol (MCP)
Сервис также реализует Model Context Protocol:
GET /mcp/sse- Server-sent events для MCPPOST /mcp/messages- Отправить сообщения MCP серверу
Доступные инструменты MCP:
create-short-video- Создать видео из списка сценget-video-status- Проверить статус создания видео
Лицензия
Этот проект лицензирован на условиях MIT License.
