AI агенти за генериране на видео
AI агенти, които генерират и редактират висококачествени видеоклипове
i2v
Kling Image to Video
Моделът Kling генерира висококачествени видеоклипове от изображения. Запазва характеристиките на оригиналното изображение, добавя естествени движения и позволява посочване на посоката на движение с текстова заявка.
i2v-kling-v1Kling Image to Video Pro
Моделът Kling Pro генерира висококачествени видеоклипове от изображения. Запазва характеристиките на оригиналното изображение, добавя естествени движения и позволява посочване на посоката на движение с текстова заявка. Позволява изход с по-високо качество от стандартната версия. Поддържа контрол на движението чрез статични и динамични маски.
i2v-kling-v1-proKling Image to Video v1.5 Pro
Модел Kling v1.5 Pro за генериране на видео от изображения. Генерира висококачествени видеоклипове с естествени движения. Поддържа по-усъвършенствано изразяване и по-дълго време за генериране от стандартната версия. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true. Максимално време: 10 секунди
i2v-kling-v1.5-proKling Image to Video v1.6
Модел Kling v1.6 за генериране на видео от изображения. Реализира естествени движения и висококачествено визуално изражение в най-новата версия. Поддържа разнообразни стилове. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true. Максимално време: 5 секунди
i2v-kling-v1.6Kling Image to Video v2.0
Модел Kling v2.0 за генериране на видео от изображения. Позволява преобразуване на ултра висока резолюция и сложни сцени във видео. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
i2v-kling-v2.0Kling Image to Video v2.1
agents.video.i2v.agents.i2v-kling-v2-1.description
Незадължителни параметри
- duration動画の長さ(5または10秒)。デフォルト: "5"YAML設定: parameters.duration
- aspect_ratioアスペクト比("16:9", "9:16", "1:1")。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
- negative_prompt生成を避ける要素の指定。デフォルト: "blur, distort, and low quality"YAML設定: parameters.negative_prompt
- cfg_scaleCFG(Classifier Free Guidance)スケール。プロンプトへの忠実度(0.0-1.0)。デフォルト: 0.5YAML設定: parameters.cfg_scale
Съвети
開始画像は依存画像として指定します。durationとaspect_ratioは文字列で指定する必要があります。高品質な動画を生成するために、詳細で具体的なプロンプトを推奨します。
common.code_example
src:
structure.yaml:
content: |-
Project: Creating Innovative Digital Art Fusing Surrealism and Futurism
- Fantastical world of crystal islands floating on an ocean of liquid starlight
- Surreal landscape with clockwork mechanical trees and luminous butterflies
- Photorealistic yet dreamlike still image generation using t2i-imagen3
- Magical motion and cosmic energy animation using Kling i2v v2.1
- Unique visual expression where fantasy meets steampunk
- Mystical space with gravity-defying upward waterfalls and multiple moons
- Fantastical ecosystem of bioluminescent plants and cosmic energy flows
agent_selection_reason: Selected claude-3-5-sonnet-20241022 for its excellence in managing project structure design and multiple media generation requirements. Particularly suited for planning surreal artworks and integrated multimedia production management.
dependency: []
agent: claude-3-5-sonnet-20241022
api: []
image-generation:
beautifle_landscape.png:
content: A surreal dreamscape where floating crystal islands hover above an ocean of liquid starlight. Ancient clockwork trees with gears for leaves stretch toward a sky filled with multiple moons in different phases. Ethereal butterflies made of pure light weave between cascading waterfalls that flow upward, defying gravity. The entire scene is painted in vibrant purples, electric blues, and golden amber hues, creating a mystical atmosphere that blends fantasy with steampunk aesthetics. Intricate details include floating geometric structures, bioluminescent flora, and streams of cosmic energy connecting the floating islands.
agent_selection_reason: t2i-imagen3, Google's cutting-edge image generation model, excels at simultaneously expressing surreal elements and photorealistic textures. It particularly demonstrates advanced capabilities in convincingly depicting liquid starlight, luminous organisms, complex light interactions, and gravity-defying physical phenomena. It also shows superior ability in integrating the complex aesthetics of fantasy and steampunk fusion into a single work.
dependency: []
note: Prompts must be in English only.
agent: t2i-imagen3
api: []
video-generation:
beautifle_landscape.mp4:
content: |-
Transform this surreal dreamscape into a mesmerizing animated masterpiece.
The crystal islands gently rotate and pulse with inner light while floating gracefully.
Clockwork trees' gear-leaves turn slowly, creating hypnotic mechanical rhythms.
Light-butterflies dance in spiraling patterns, leaving trails of stardust.
The upward-flowing waterfalls shimmer and undulate with magical energy.
Multiple moons slowly orbit across the cosmic sky, casting shifting shadows.
Bioluminescent plants pulse in synchronized waves of color.
Streams of cosmic energy flow between islands like living aurora.
The liquid starlight ocean below ripples with celestial reflections.
Camera slowly pans across this fantastical realm with cinematic grandeur.
dependency:
- src/image-generation/beautifle_landscape.png
dependency_wait: true
agent: i2v-kling-v2.1
api: []
parameters:
duration: 5
aspect_ratio: "1:1"
negative_prompt: low quality, blurry, static camera
cfg_scale: 0.6i2v-kling-v2.1Kling Image to Video v2.1 Standard
agents.video.i2v.agents.i2v-kling-2-1-standard.description
Незадължителни параметри
- duration動画の長さ(5または10秒)。デフォルト: "5"YAML設定: parameters.duration
- aspect_ratioアスペクト比("16:9", "9:16", "1:1")。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
- negative_prompt生成を避ける要素の指定。デフォルト: "blur, distort, and low quality"YAML設定: parameters.negative_prompt
- cfg_scaleCFG(Classifier Free Guidance)スケール。プロンプトへの忠実度(0.0-1.0)。デフォルト: 0.5YAML設定: parameters.cfg_scale
Съвети
マスター版と同じAPIパラメータを使用しますが、標準設定による安定した生成が期待できます。開始画像は依存画像として指定します。durationとaspect_ratioは文字列で指定する必要があります。
common.code_example
src:
structure.yaml:
content: |-
Project: Standard Quality Video Generation with Kling v2.1 Standard Edition
- High-quality image-to-video conversion with standard settings
- Multiple aspect ratio support (16:9, 9:16, 1:1)
- Duration options (5 or 10 seconds)
- Consistent and reliable video generation
agent_selection_reason: Using i2v-kling-2.1-standard for stable and consistent video generation with standard settings
agent: t2i-flux-schnell
dependency: []
image-generation:
sample-image.png:
content: |-
A serene landscape with a calm lake reflecting mountains
agent: t2i-flux-schnell
dependency: []
api: []
video-generation:
landscape-video.mp4:
content: |-
Gentle breeze creating ripples on the water surface
Clouds slowly drifting across the sky
Subtle light changes as time passes
Natural and peaceful atmosphere
dependency:
- src/image-generation/sample-image.png
dependency_wait: true
agent: i2v-kling-2.1-standard
api: []
parameters:
duration: 5
aspect_ratio: "16:9"
negative_prompt: low quality, unnatural movement
cfg_scale: 0.5i2v-kling-2.1-standardKling Image to Video v2.5 Turbo Pro
agents.video.i2v.agents.i2v-kling-v2-5-turbo-pro.description
Незадължителни параметри
- duration動画の長さ(5または10秒)。デフォルト: "5"YAML設定: parameters.duration
- aspect_ratioアスペクト比("16:9", "9:16", "1:1")。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
- negative_prompt生成を避ける要素の指定。デフォルト: "blur, distort, and low quality"YAML設定: parameters.negative_prompt
- cfg_scaleCFG(Classifier Free Guidance)スケール。プロンプトへの忠実度(0.0-1.0)。デフォルト: 0.5YAML設定: parameters.cfg_scale
Съвети
開始画像は依存画像として指定し、durationとaspect_ratioは文字列で指定してください。
common.code_example
src:
structure.yaml:
content: |-
Project: Cinematic Orbit Shot of Futuristic Explorer
- Single still image converted into a moving shot
- Camera arcs around subject at sunset
- Tail frame highlights silhouette against the sun
agent_selection_reason: Selected i2v-kling-v2.5-turbo-pro for smooth cinematic motion.
dependency:
- src/local_image/explorer.png
dependency_wait: true
agent: i2v-kling-v2.5-turbo-pro
api: []
parameters:
duration: "10"
aspect_ratio: "16:9"
negative_prompt: blur, distort, and low quality
cfg_scale: 0.5i2v-kling-v2.5-turbo-proKling Image to Video v1.6 Pro
Модел Kling v1.6 Pro за генериране на висококачествени видеоклипове от изображения. Най-новата Pro версия позволява по-дълго време за генериране на видео и усъвършенствано визуално изражение. Позволява и задаване на плавен преход от начално към крайно изображение (по избор). Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
Незадължителни параметри
- start_image_urlПът към началното изображение (по избор)YAML設定: parameters.start_image_url
- end_image_urlПът към крайното изображение (по избор). Ако е посочено, ще бъде генерирано видео с плавен преход от началното към крайното изображение.YAML設定: parameters.end_image_url
Съвети
Ако посочвате начално и крайно изображение, са необходими поне две зависими изображения. Ако не са посочени, ще бъде генерирано стандартно видео само от началното изображение.
i2v-kling-v1.6-proByteDance Seedance v1 Lite Reference to Video
agents.video.i2v.agents.i2v-bytedance-seedance-v1-lite-reference-to-video.description
Незадължителни параметри
- prompt生成する動画の説明。参照画像にどのような動きを付けるか詳細に記述YAML設定: parameters.prompt
- reference_image_urls参照画像URLの配列(1〜4件)。依存画像を指定する場合はdependency_wait: trueを推奨YAML設定: parameters.reference_image_urls
- aspect_ratio動画のアスペクト比(デフォルト: auto。21:9, 16:9, 4:3, 1:1, 3:4, 9:16, auto)YAML設定: parameters.aspect_ratio
- resolution動画解像度(デフォルト: 720p。480p/720pに対応)YAML設定: parameters.resolution
- duration動画の長さ(秒)。デフォルト: 5。3〜12秒に対応YAML設定: parameters.duration
- camera_fixedカメラモーションを固定するか。デフォルト: falseYAML設定: parameters.camera_fixed
- enable_safety_checkerセーフティチェッカーを有効化するか。デフォルト: trueYAML設定: parameters.enable_safety_checker
- seedシード値(-1でランダム)。デフォルト: -1YAML設定: parameters.seed
Съвети
参照画像を依存ファイルとして指定する場合は dependency_wait: true を設定し、1〜4枚までの画像を読み込ませてください。
common.code_example
src:
structure.yaml:
content: |-
Project: Cinematic Intro with Seedance Lite Reference-to-Video
- Use multiple reference stills to control motion
- Focus on neon-lit cyberpunk ambience and flowing garments
- Track the subject with a gentle forward-moving camera
agent_selection_reason: Using i2v-bytedance-seedance-v1-lite-reference-to-video for reference-driven motion control.
agent: t2i-flux-schnell
dependency: []
image-generation:
reference-main.png:
content: |-
A cyberpunk hero standing in a neon-lit alley, dramatic lighting on the coat.
agent: t2i-flux-schnell
dependency: []
api: []
reference-style.png:
content: |-
Stylized lighting accents and atmosphere for the same alley scene.
agent: t2i-flux-schnell
dependency: []
api: []
video-generation:
hero-intro.mp4:
content: |-
Generate a cinematic opener where the protagonist walks through the neon-lit alley, coat flowing in the wind. Maintain a gentle tracking shot from a slightly elevated angle.
dependency:
- src/image-generation/reference-main.png
- src/image-generation/reference-style.png
dependency_wait: true
agent: i2v-bytedance-seedance-v1-lite-reference-to-video
api: []
parameters:
aspect_ratio: "16:9"
resolution: "720p"
duration: "5"
camera_fixed: false
seed: -1i2v-bytedance-seedance-v1-lite-reference-to-videoByteDance Seedance v1 Pro I2V
agents.video.i2v.agents.i2v-bytedance-seedance-v1-pro.description
Незадължителни параметри
- prompt生成する動画の説明。画像の内容と動きを詳細に記述YAML設定: parameters.prompt
- resolution生成する動画の解像度("720p", "1080p")。デフォルト: "1080p"YAML設定: parameters.resolution
- duration生成する動画の長さ(秒)。デフォルト: "5"(固定値)YAML設定: parameters.duration
- camera_fixedカメラを固定するかどうか。デフォルト: falseYAML設定: parameters.camera_fixed
- seedシード値(-1でランダム)。デフォルト: -1YAML設定: parameters.seed
Съвети
カメラモーションを制御したい場合は camera_fixed: true を設定します。同じシード値を使用することで、同じプロンプトから同じ動画を再現できます。
common.code_example
src:
structure.yaml:
content: |-
Project: Natural Motion Video Generation with ByteDance Seedance v1 Pro
- High-quality image-to-video conversion
- Camera motion control options
- Reproducible generation with seed values
- Multiple resolution support (720p/1080p)
agent_selection_reason: Using i2v-bytedance-seedance-v1-pro for high-quality motion generation with camera control
agent: t2i-flux-schnell
dependency: []
image-generation:
base-image.png:
content: |-
A peaceful garden scene with blooming flowers
agent: t2i-flux-schnell
dependency: []
api: []
video-generation:
garden-motion.mp4:
content: |-
Gentle breeze moving through the flowers, petals swaying naturally
Butterflies flying between the flowers
Soft sunlight filtering through leaves
dependency:
- src/image-generation/base-image.png
dependency_wait: true
agent: i2v-bytedance-seedance-v1-pro
api: []
parameters:
resolution: "1080p"
camera_fixed: false
seed: -1i2v-bytedance-seedance-v1-proByteDance OmniHuman v1.5
agents.video.i2v.agents.i2v-bytedance-omnihuman-v1-5.description
Задължителни параметри
- audio_url音声ファイルのURL(必須)。30秒以内の音声を指定YAML設定: parameters.audio_urlЗадължително
Съвети
依存関係として人物画像と音声ファイルを登録し、dependency_wait: true を設定してください。
common.code_example
src:
structure.yaml:
content: |-
Project: Talking Avatar with OmniHuman
- Combine a portrait still with voice-over audio
- Generate expressive lip-sync aligned to speech
agent_selection_reason: Using i2v-bytedance-omnihuman-v1.5 for high-fidelity facial motion and lip-sync.
agent: claude-3-5-sonnet-20241022
dependency: []
image-generation:
avatar.png:
content: |-
A friendly presenter facing the camera with soft studio lighting.
agent: t2i-flux-schnell
dependency: []
api: []
audio:
voice-line.mp3:
content: |-
"Welcome to our product showcase. Let me guide you through the highlights."
agent: t2s-gpt-4o-mini-tts
dependency: []
api: []
video-generation:
talking-avatar.mp4:
content: |-
Synchronize the speech with natural facial expressions and subtle head movements.
dependency:
- src/image-generation/avatar.png
- src/audio/voice-line.mp3
dependency_wait: true
agent: i2v-bytedance-omnihuman-v1.5
api: []
parameters:
audio_url: src/audio/voice-line.mp3
i2v-bytedance-omnihuman-v1.5MiniMax Video-01 I2V
Модел за генериране на видео от изображения на MiniMax. Генерира висококачествени видеоклипове с естествени движения. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
i2v-minimax-video-01MiniMax Video-01 Live I2V
Модел за генериране на видео от изображения на MiniMax, оптимизиран за реално време. Постига бърза обработка и естествени движения едновременно. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
i2v-minimax-video-01-liveMiniMax Subject Reference I2V
Модел за генериране на видео от изображения на MiniMax, базиран на препратка към обект. Добавя естествени движения, като запазва характеристиките на обекта. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
i2v-minimax-video-01-subject-referenceMiniMax Director I2V
Модел за генериране на video от изображения на MiniMax с указания от режисьор. Позволява генериране на video въз основа на подробни режисьорски инструкции. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
i2v-minimax-video-01-directorMiniMax Hailuo-02 Pro I2V
agents.video.i2v.agents.i2v-minimax-hailuo-02-pro.description
Незадължителни параметри
- prompt_optimizerプロンプト最適化機能の有効/無効。デフォルト: trueYAML設定: parameters.prompt_optimizer
Съвети
プロンプト最適化機能により、自動的により詳細で適切なプロンプトに変換されます。依存画像として指定された開始画像を基に、自然で洗練された動画を生成します。
common.code_example
src:
structure.yaml:
content: |-
Project: High-Quality Video Generation with MiniMax Hailuo-02 Pro
- Advanced image-to-video conversion with prompt optimization
- Natural and sophisticated video generation
- Enhanced detail and motion quality
agent_selection_reason: Using i2v-minimax-hailuo-02-pro for enhanced video quality with prompt optimization
agent: t2i-flux-schnell
dependency: []
image-generation:
source-image.png:
content: |-
A vibrant cityscape at golden hour with bustling street life
agent: t2i-flux-schnell
dependency: []
api: []
video-generation:
city-animation.mp4:
content: |-
Gentle movement of people walking through the streets
Soft lighting changes as the golden hour progresses
Natural urban atmosphere with subtle life and energy
Camera slowly pans across the vibrant cityscape
dependency:
- src/image-generation/source-image.png
dependency_wait: true
agent: i2v-minimax-hailuo-02-pro
api: []
parameters:
prompt_optimizer: truei2v-minimax-hailuo-02-proWAN Image to Video
Модел за генериране на видео от изображения на WAN. Генерира висококачествени видеоклипове с естествени движения. Поддържа разнообразни резолюции и пропорции. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
i2v-wanWAN 2.5 Preview Image to Video
agents.video.i2v.agents.i2v-wan-25-preview.description
common.code_example
src:
structure.yaml:
content: |-
Project: Cinematic WAN 2.5 Preview shot
- Generate a 10 second tracking shot from a still hero image
- Maintain character fidelity while adding dynamic camera motion
- Use 1080p output for presentation footage
agent_selection_reason: Selecting i2v-wan-25-preview to leverage WAN 2.5 Preview's long clip support and smooth motion quality.
agent: claude-3-5-sonnet-20241022
dependency: []
image-generation:
hero-frame.png:
content: |-
A heroic warrior standing on a cliff at sunset, cape flowing in the wind.
agent: t2i-flux-pro
dependency: []
api: []
video-generation:
cinematic-shot.mp4:
content: |-
Create a 10-second 1080p clip with subtle camera push-in and atmospheric motion around the character.
dependency:
- src/image-generation/hero-frame.png
dependency_wait: true
agent: i2v-wan-25-preview
api: []
parameters:
duration: "5"
resolution: "1080p"
aspect_ratio: "16:9"
i2v-wan-25-previewWAN Image to Video Pro
Висококачествена версия на модела WAN за генериране на видео от изображения. Позволява по-детайлно визуално изражение от стандартната версия. Генерира висококачествени видеоклипове с повече стъпки на инференция. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
i2v-wan-proWAN Effects Image to Video
Модел WAN за генериране на видео от изображения с прилагане на специални ефекти. Автоматично прилага различни ефекти като зуумване, зуумване навън и т.н. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
i2v-wan-effectsHunyuan Video I2V
Модел за генериране на видео от изображения на Hunyuan. Генерира плавни видеоклипове с висока честота на кадрите и резолюция. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
i2v-hunyuan-videoHunyuan Video LoRA I2V
Модел за генериране на видео от изображения на Hunyuan с приложен LoRA. Генерира видеоклипове с конкретен стил или тема, прилагайки персонализиран LoRA. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
i2v-hunyuan-video-loraVeo 3.1 Image to Video
agents.video.i2v.agents.i2v-veo3-1.description
Незадължителни параметри
- aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
- resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
- generate_audio音声付き動画を生成する場合は true。不要な場合は false。YAML設定: parameters.generate_audio
- duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration
Съвети
被写体の動きやカメラワーク、スタイルを具体的にプロンプトへ記述すると効果的です。音声が不要な場合は generate_audio を false に設定してください。
i2v-veo3.1Veo 3.1 Fast Image to Video
agents.video.i2v.agents.i2v-veo3-1-fast-image-to-video.description
Незадължителни параметри
- aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
- resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
- generate_audio音声付き動画を生成する場合は true。不要な場合は false。false にするとクレジットを節約できます。YAML設定: parameters.generate_audio
- duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration
Съвети
被写体の動きやカメラワーク、演出イメージを具体的に記述すると滑らかなアニメーションになります。ローカル画像を使用する際は dependency_wait: true を忘れずに。
i2v-veo3.1-fast-image-to-videoVeo 3.1 Reference to Video
agents.video.i2v.agents.i2v-veo3-1-reference-to-video.description
Незадължителни параметри
- image_urls参照画像URLの配列。依存画像を指定すると自動的にFal.aiストレージURLへ変換されますYAML設定: parameters.image_urls
- aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
- resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
- generate_audio音声付き動画を生成する場合は true。不要な場合は false。YAML設定: parameters.generate_audio
- duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration
Съвети
参照画像ごとにポーズや角度を変えると滑らかな被写体遷移が得られます。local_imageを依存画像に使う場合は dependency_wait: true を設定してください。
i2v-veo3.1-reference-to-videoVeo 3.1 First/Last Frame
agents.video.i2v.agents.i2v-veo3-1-first-last-frame-to-video.description
Незадължителни параметри
- first_frame_url開始フレームの画像パス。依存画像から解決される場合は省略可能ですYAML設定: parameters.first_frame_url
- last_frame_url終了フレームの画像パス。依存画像から解決される場合は省略可能ですYAML設定: parameters.last_frame_url
- aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
- resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
- generate_audio音声付き動画を生成する場合は true。不要な場合は false。YAML設定: parameters.generate_audio
- duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration
Съвети
開始と終了の2フレームを的確に選び、プロンプトでは動き方・カメラワーク・雰囲気を丁寧に指定すると上質な補間結果が得られます。音声が不要な場合は generate_audio を false に設定してください。
i2v-veo3.1-first-last-frame-to-videoVeo 3.1 First/Last Frame (Fast)
agents.video.i2v.agents.i2v-veo3-1-fast-first-last-frame-to-video.description
Незадължителни параметри
- first_frame_url開始フレームの画像パス。依存画像から解決される場合は省略可能ですYAML設定: parameters.first_frame_url
- last_frame_url終了フレームの画像パス。依存画像から解決される場合は省略可能ですYAML設定: parameters.last_frame_url
- aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
- resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
- generate_audio音声付き動画を生成する場合は true。不要な場合は false。YAML設定: parameters.generate_audio
- duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration
Съвети
開始フレームと終了フレームの2枚を依存画像として必ず用意してください。動きの説明やカメラワーク、雰囲気をプロンプトで詳細に指定すると表現力が向上します。音声が不要な場合は generate_audio を false に設定してください。
i2v-veo3.1-fast-first-last-frame-to-videoRay 2 Image to Video
Висококачествен модел на Luma за генериране на видео от изображения. Постига реалистични движения и детайлно изражение. Поддържа разнообразни пропорции и резолюции. Позволява и задаване на плавен преход от начално към крайно изображение (по избор). Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
Незадължителни параметри
- start_image_urlПът към началното изображение (по избор)YAML設定: parameters.start_image_url
- end_image_urlПът към крайното изображение (по избор). Ако е посочено, ще бъде генерирано видео с плавен преход от началното към крайното изображение.YAML設定: parameters.end_image_url
Съвети
Ако посочвате начално и крайно изображение, са необходими поне две зависими изображения. Ако не са посочени, ще бъде генерирано стандартно видео само от началното изображение.
i2v-ray-2Luma Dream Machine I2V
Модел на Luma за генериране на видео от изображения. Позволява творческо и артистично визуално изражение във видео. Поддържа разнообразни пропорции и резолюции. Позволява и задаване на плавен преход от начално към крайно изображение (по избор). Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
Незадължителни параметри
- start_image_urlПът към началното изображение (по избор)YAML設定: parameters.start_image_url
- end_image_urlПът към крайното изображение (по избор). Ако е посочено, ще бъде генерирано видео с плавен преход от началното към крайното изображение.YAML設定: parameters.end_image_url
Съвети
Ако посочвате начално и крайно изображение, са необходими поне две зависими изображения. Ако не са посочени, ще бъде генерирано стандартно видео само от началното изображение.
i2v-luma-dream-machineVidu Image to Video
Модел на Vidu за генериране на видео от изображения. Реализира визуално изражение от едно изображение с отлично качество на картината и естествени движения. Позволява регулиране на големината на движението. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
i2v-viduVidu Reference Image to Video
Модел на Vidu за генериране на видео, използващ референтни изображения. Генерира видео, което запазва последователно изобразяване на обекта от множество референтни изображения. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
Зависимости
Могат да бъдат посочени множество зависими изображения, които се интегрират за генериране на последователно видео.
i2v-vidu-referenceVidu Start-End Image to Video
Модел на Vidu за генериране на видео, като се посочват начално и крайно изображение. Генерира видео с плавен преход между две изображения. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
Задължителни параметри
- start_image_urlПът към началното изображениеYAML設定: parameters.start_image_urlЗадължително
- end_image_urlПът към крайното изображениеYAML設定: parameters.end_image_urlЗадължително
i2v-vidu-start-endVidu Template Image to Video
Модел на Vidu за генериране на видео сцени от множество изображения, базиран на шаблон. Генерира видео въз основа на различни шаблони. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
Задължителни параметри
- templateИме на шаблонаYAML設定: parameters.templateЗадължителноНалични стойности:dreamy_weddingromantic_liftsweet_proposalcouple_arrivalcupid_arrowpet_loverslunar_newyearhugkissdynasty_dresswish_senderlove_posehair_swapyouth_rewindmorphlablive_photoemotionlablive_memoryinteractionchristmasИзисквания според стойност:
- wish_sender - Изисква 3 зависими изображения
- dynasty_dress - Препоръчително 2 зависими изображения
- shop_frame - Препоръчително 2 зависими изображения
- other - Работи с 1 зависимо изображение
Зависимости
Могат да бъдат посочени множество зависими изображения, като е необходим броят изображения според шаблона.
i2v-vidu-templatePika v1.5 Pikaffects
agents.video.i2v.agents.i2v-pika-v1-5-pikaffects.description
i2v-pika-v1.5-pikaffectsPika v2 Turbo
Бърз модел на Pika за генериране на видео от изображения. Обработката е 3 пъти по-бърза от стандартната версия, реализира висококачествено визуално изражение във видео. Поддържа 720p резолюция. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true. Максимално време: 5 секунди
i2v-pika-v2-turboPika v2.1
Висококачествен модел на Pika за генериране на видео от изображения. Постига остри детайли и естествени движения едновременно. Поддържа 1080p резолюция. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
i2v-pika-v2.1Pika v2.2
Най-новият модел на Pika за генериране на видео от изображения. Реализира усъвършенствовани движения и естествено визуално изражение. Може да генерира видеоклипове с максимална продължителност 10 секунди. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true. Максимално време: 10 секунди
i2v-pika-v2.2Pika v2.2 Scenes
Модел на Pika за генериране на видео сцени от множество изображения. Интегрира множество изображения за генериране на последователно видео. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
i2v-pika-v2.2-pikascenesPixverse v3.5 I2V
Модел на Pixverse за генериране на видео от изображения. Генерира висококачествени видеоклипове с естествени движения и поддържа разнообразни сцени и стилове. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
i2v-pixverse-v3.5Pixverse v3.5 Fast I2V
Бърза версия на модела Pixverse v3.5 за генериране на видео от изображения. Обработката е по-бърза от стандартната версия, идеална за бързи творчески процеси. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
i2v-pixverse-v3.5-fastSkyReels I2V
Модел на Skyreels за генериране на видео от изображения. Позволява генериране на висококачествени видеоклипове с естествени движения. Поддържа различни сцени и реализира плавни анимационни ефекти. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true. Максимално време: 5 секунди
i2v-skyreelsCogVideoX-5B I2V
Модел CogVideoX-5B за генериране на видео от изображения. Създава детайлни, висококачествени видеоклипове, използвайки модел от 5 милиарда параметри. Отличен в изразяването на сложни сцени и движения. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
i2v-cogvideox-5bLTX Video v0.95 I2V
agents.video.i2v.agents.i2v-ltx-video-v0-95.description
i2v-ltx-video-v0.95Stable Video I2V
Модел Stable Video за генериране на видео от изображения. Създава видеоклипове с отлична стабилност и последователност, подходящи за широк спектър от приложения. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
i2v-stable-videoFast SVD LCM I2V
Ултрабърз модел за генериране на видео от изображения, използващ Stable Video Diffusion LCM. Реализира ултрабързо време за обработка с Lightning Speed и генерира висококачествено видео. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.
i2v-fast-svd-lcmv2v
Sync-Lipsync
Модел, който генерира липсинхрон (движения на устата) за съществуващи видеоклипове, съобразени с аудиото. Постига естествени движения на устата. Изисква задължително посочване на зависимо видео и зависимо аудио и настройка dependency_wait: true.
v2v-sync-lipsyncs2v
VEED Avatars
agents.video.s2v.agents.s2v-veed-avatars.description
Съвети
音声ファイルは依存音声として指定します。アバターIDはavatar_idパラメータで指定可能。デフォルトはemily_vertical_primaryです。音声の長さに合わせて動画が生成されます。
common.code_example
src:
structure.yaml:
content: |-
Project: Speech to Avatar Video Project
- 音声からアバター動画を生成
- 30種類のアバターから選択可能
- 自然な口パクとジェスチャー
agent_selection_reason: Project structure definition
dependency: []
agent: claude-3-5-sonnet-20241022
api: []
audio:
sample_speech.mp3:
content: "こんにちは!私はVEED Avatarsを使用したアバターです。音声に合わせて自然に話すことができます。"
agent_selection_reason: 音声ファイルの生成
dependency: []
agent: t2s-gpt-4o-mini-tts
api: []
video:
avatar_video.mp4:
content: |-
音声からアバター動画を生成
- Emily(縦向き・基本)アバターを使用
- 音声に合わせた自然な口パクとジェスチャー
agent_selection_reason: s2v-veed-avatarsは音声からリアルなアバター動画を生成でき、30種類のアバターから選択可能
dependency:
- src/audio/sample_speech.mp3
dependency_wait: true
agent: s2v-veed-avatars
parameters:
avatar_id: emily_vertical_primary
api: []s2v-veed-avatarsAI Avatar Multi
agents.video.s2v.agents.s2v-ai-avatar-multi.description
Съвети
2つの音声ファイルと1つの画像が必須です。すべてdependency配列で指定し、dependency_wait: trueを設定してください。contentの内容がpromptとして使用されます。parametersにはnum_frames、turbo、seedなどの生成オプションのみ指定します。
common.code_example
src:
structure.yaml:
content: KAMUI Anime Avatar 8-Second Conversation Test
agent_selection_reason: プロジェクト構造定義とKAMUI日本語アバター機能のテスト
dependency: []
agent: claude-3-5-sonnet-20241022
api: []
audio:
japanese_greeting.mp3:
content: みなさん、こんにちは!新しいアニメアバターが登場しました!
agent_selection_reason: |-
t2s-minimax-speech-02-turboは日本語の自然な発音と抑揚に対応しており、
親しみやすい挨拶メッセージの生成に適しています。
dependency: []
agent: t2s-minimax-speech-02-turbo
parameters:
voice_setting:
voice_id: Decent_Boy
speed: 1.4
emotion: neutral
language_boost: Japanese
audio_setting:
format: mp3
sample_rate: 44100
api: []
japanese_response.mp3:
content: わあ、すごい!どんなことができるんですか?
agent_selection_reason: |-
t2s-minimax-speech-02-turboのDeep_Voice_Manを使用して男性の声で応答を生成。
対話の自然な流れを作るため、異なる音声IDを使用します。
dependency: []
agent: t2s-minimax-speech-02-turbo
parameters:
voice_setting:
voice_id: Lively_Girl
speed: 1.2
emotion: neutral
language_boost: Japanese
audio_setting:
format: mp3
sample_rate: 44100
api: []
image:
conversation_scene.jpg:
content: Animation Taste, Animation TasteAnimation Taste, Two realistic forest animals having an animated conversation in a beautiful woodland setting. A wise old brown bear sitting upright with expressive eyes and gentle facial expression, appearing to be speaking earnestly to a clever red fox who is sitting attentively with tilted head and bright, intelligent eyes showing curiosity. The bear's mouth is slightly open as if mid-sentence, with natural body language showing engagement. The fox has perked ears and an alert, listening posture. Surrounding them is a lush forest with dappled sunlight filtering through tall trees, creating a warm, magical atmosphere. Moss-covered rocks and wildflowers scattered around. Photorealistic style with incredible detail in fur texture, natural lighting, and authentic woodland environment. The scene captures the essence of two friends sharing stories in nature.
agent_selection_reason: t2i-flux-proを使用してアニメテイストの男女キャラクターを生成。FLUX
dependency: []
agent: t2i-imagen4
api: []
video:
kamui_japanese_avatar_conversation.mp4:
content: |-
Two Japanese professionals having a friendly conversation about the new KAMUI grimoire update in a modern office setting.
Natural dialogue flow with expressive gestures and eye contact, showcasing the advanced Japanese language avatar capabilities.
agent_selection_reason: s2v-ai-avatar-multiはデュアル音声対応でWise_WomanとDeep_Voice_Manの2つの声を使った自然な日本語対話動画を生成
dependency:
- src/audio/japanese_greeting.mp3
- src/audio/japanese_response.mp3
- src/image/conversation_scene.jpg
dependency_wait: true
agent: s2v-ai-avatar-multi
parameters:
num_frames: 192
turbo: true
seed: 12345
api: []s2v-ai-avatar-multit2v
Veo2 Text to Video
Моделът Veo2 позволява висококачествено генериране на видео от текст. Поддържа естествени движения и изход с висока резолюция
t2v-veo2Veo3 Text to Video
agents.video.t2v.agents.t2v-veo3.description
t2v-veo3Veo 3.1 Text to Video
agents.video.t2v.agents.t2v-veo3-1.description
t2v-veo3.1Veo 3.1 Fast Text to Video
agents.video.t2v.agents.t2v-veo3-1-fast.description
t2v-veo3.1-fastHunyuan Text to Video
Отворен модел за генериране на видео, характеризиращ се с висока визуална качество, разнообразни движения, съответствие между текст и видео и стабилно генериране
t2v-hunyuan-videoHunyuan Video LoRA
Генериране на видео с Hunyuan, използващо LoRA модел. Позволява генериране на видеоклипове с персонализиран стил. Генерира висококачествено съдържание. Максимално време: 5 секунди
t2v-hunyuan-video-loraWan Text to Video
Модел за генериране на висококачествено видео от текст. Постига естествени движения и изразителни визуални ефекти
t2v-wanWan 2.5 Preview Text to Video
agents.video.t2v.agents.t2v-wan-25-preview.description
common.code_example
src:
storyboard.yaml:
content: |-
Project: Futuristic City Reveal with Cinematic Lighting
- From text prompt to Wan 2.5 Preview video generation
- Lean camera move that circles around the hero subject
- Optional background score supplied via audio_url
- Use 1080p resolution and 10 second duration for presentation reels
- Deliver both vertical and landscape cuts for social media
- Include fallback prompts for negative details (noise, low quality)
agent_selection_reason: Gemini 2.5 Flash organizes requirements and prepares prompts for multi-agent video generation.
dependency: []
agent: gemini-2.5-flash-preview-04-17
api: []
video-generation:
wan25_preview_demo.mp4:
content: |-
Cinematic reveal of a cyberpunk city skyline at sunset.
The camera begins with a wide aerial shot, then glides around a lone android hero standing on a balcony.
Neon reflections ripple across glass towers while drones pass overhead.
Include atmospheric haze, volumetric light shafts, and dynamic clouds.
Keep movements smooth and emphasize premium cinematic lighting.
agent_selection_reason: Wan 2.5 Preview handles 1080p output, long motion, and nuanced lighting in 10 second clips.
dependency: []
agent: t2v-wan-25-preview
api: []
parameters:
duration: "5"
aspect_ratio: "16:9"
resolution: "1080p"
enable_prompt_expansion: true
negative_prompt: "low resolution, muted colors, jitter, artifacts"
t2v-wan-25-previewWan 2.1 Pro
Висококачествен модел за генериране на видео от текст. Позволява по-висока резолюция и детайлно изражение от стандартната версия. Максимално време: 5 секунди
t2v-wan-proHailuo T2V-01-Live
Превръща 2D илюстрации в живи видеоклипове. Вдъхва живот на героите с плавни движения и ярки изражения. Оптимизиран за стабилност и фини изражения, поддържа широк спектър от артистични стилове. Максимално време: 5 секунди
t2v-hailuo-t2v-01-liveHailuo T2V-01-Director
Модел за генериране на видео от текст с функция за управление на камерата. Позволява прецизно движение на камерата за кинематографично разказване. Включването на инструкции за камерата като [Push in] или [Pan left] в заявката позволява кинематографично изразяване
t2v-hailuo-t2v-01-directorKling 1.0
Първият модел на Kling за генериране на видео от текст. Реализира прост и лесен за използване интерфейс и висококачествено генериране на видео. Максимално време: 5 секунди
t2v-kling-1.0Kling 1.0 Pro
Висококачествена версия на Kling 1.0. Реализира по-усъвършенствано рендериране и фини детайли. Максимално време: 5 секунди
t2v-kling-1.0-proKling 1.6 (std) Text to Video
Модел Kling 1.6 (стандартна версия) позволява висококачествено генериране на видео от текст
t2v-kling-1.6Kling 1.6 (pro) Text to Video
Модел Kling 1.6 (професионална версия) позволява висококачествено генериране на видео от текст. Позволява по-усъвършенствано визуално изражение. Максимално време: 5 секунди
t2v-kling-1.6-proKling 2.0 Text to Video
Модел за генериране на висококачествено видео от текст от следващо поколение. Поддържа ултра висока резолюция, сложни сцени, усъвършенствано управление на камерата и обектите. Максимално време: 15 секунди
t2v-kling-2.0Kling 2.1 Text to Video
agents.video.t2v.agents.t2v-kling-2-1.description
Незадължителни параметри
- duration動画の長さ(5または10秒)。デフォルト: 5YAML設定: parameters.duration
- aspect_ratioアスペクト比(16:9, 9:16, 1:1)。デフォルト: 16:9YAML設定: parameters.aspect_ratio
- style映像スタイル(例: cinematic, fantasy, realistic)。オプションYAML設定: parameters.style
- seed再現性のための乱数シード(0-2147483647)。オプションYAML設定: parameters.seed
- negative_prompt生成を避ける要素の指定。デフォルト: 'blur, distort, and low quality'YAML設定: parameters.negative_prompt
- cfg_scaleプロンプトへの忠実度(0.0-1.0)。デフォルト: 0.5YAML設定: parameters.cfg_scale
Съвети
duration, aspect_ratio, negative_prompt, cfg_scaleはAPIでサポートされているパラメータです。styleパラメータはプロンプトの一部として処理されます。高品質な動画を生成するために、詳細で具体的なプロンプトを推奨します。
common.code_example
src:
video:
magical_forest.mp4:
content: |-
A magical forest at dawn with glowing fireflies dancing between ancient trees.
Soft mist rolls through the undergrowth as golden sunlight filters through the canopy.
Ethereal and cinematic atmosphere with smooth camera movement.
dependency: []
agent: "t2v-kling-2.1"
parameters:
duration: 10 # 5または10秒を指定
aspect_ratio: "16:9" # 16:9, 9:16, 1:1から選択
style: "cinematic fantasy" # スタイル指定(プロンプトに追加)
negative_prompt: "low quality, blurry, static camera" # 除外したい要素
cfg_scale: 0.7 # プロンプトへの忠実度(0.0-1.0)
seed: 123456 # 再現性のためのシード値(オプション)
api: []
# 最小構成の例
simple_scene.mp4:
content: "A serene lake at sunset with rippling water"
dependency: []
agent: "t2v-kling-2.1"
api: [] # parametersを省略するとデフォルト値が使用されますt2v-kling-2.1Kling 2.5 Turbo Pro
agents.video.t2v.agents.t2v-kling-2-5-turbo-pro.description
Незадължителни параметри
- duration動画の長さ(5または10秒)。デフォルト: 5YAML設定: parameters.duration
- aspect_ratioアスペクト比(16:9, 9:16, 1:1)。デフォルト: 16:9YAML設定: parameters.aspect_ratio
- negative_prompt生成を避ける要素の指定。デフォルト: 'blur, distort, and low quality'YAML設定: parameters.negative_prompt
- cfg_scaleプロンプトへの忠実度。デフォルト: 0.5YAML設定: parameters.cfg_scale
- seed再現性のための乱数シード(0-2147483647)。オプションYAML設定: parameters.seed
Съвети
動きのディテールを細かく記述したプロンプトが高品質な結果につながります。
common.code_example
src:
video:
futuristic_city.mp4:
content: |-
A futuristic city skyline at sunset with flying cars weaving between holographic billboards.
- Neon reflections on glass buildings
- Dynamic aerial traffic
- Warm cinematic lighting
dependency: []
agent: "t2v-kling-2.5-turbo-pro"
parameters:
duration: "5"
aspect_ratio: "16:9"
cfg_scale: 0.6
seed: 12345
api: []t2v-kling-2.5-turbo-proVidu Q1 Text to Video
agents.video.t2v.agents.t2v-vidu-q1.description
Незадължителни параметри
- aspect_ratio動画のアスペクト比(16:9, 9:16, 1:1)YAML設定: parameters.aspect_ratio
- movement_amplitude動きの大きさ(auto, small, medium, large)YAML設定: parameters.movement_amplitude
- style映像スタイル(general, anime)YAML設定: parameters.style
- seed再現性のための乱数シードYAML設定: parameters.seed
Съвети
「movement_amplitude」を「auto」に設定すると、AIが自動的に適切な動きの大きさを判断します。「style」パラメータでは映像の全体的なスタイルを指定できます。
t2v-vidu-q1Pika v2 Turbo Text to Video
Моделът Pika v2 Turbo генерира висококачествени видеоклипове от текстова заявка. Реализира бърза обработка с качествено видео извеждане. Максимално време: 5 секунди
t2v-pika-v2-turboPika v2.1 Text to Video
Моделът Pika v2.1 генерира висококачествени видеоклипове от текстова заявка. Реализира отлично визуално изражение и естествени движения. Максимално време: 5 секунди
t2v-pika-v2.1Pika v2.2 Text to Video
Най-новият модел на Pika генерира висококачествени видеоклипове от текст. Реализира отлично визуално изражение и естествени движения от текстова заявка. Максимално време: 5 секунди
t2v-pika-v2.2Pixverse Text to Video
Висококачествен модел за генериране на видео от текст. Поддържа разнообразни стилове и настройки на резолюцията. Постига естествени движения и изразителни визуални ефекти
t2v-pixversePixverse Fast Text to Video
Бърз модел за генериране на видео от текст. Поддържа разнообразни стилове и настройки на резолюцията. Обработката е по-бърза от стандартната версия
t2v-pixverse-fastRay-2 Text to Video
Висококачествено генериране на видео от текст от най-съвременния модел Ray2 на Luma. Реализира реалистично видео и естествени движения. Поддържа текстови и графични въвеждания
t2v-ray-2Ray2 Flash
Бърз модел на Luma за генериране на видео от текст. Реализира бърза обработка, като същевременно запазва високото качество на Ray2. Максимално време: 5 секунди
t2v-ray-2-flashLuma Dream Machine
Модел на Luma за генериране на креативно видео от текст. Оптимален за артистично и творческо изразяване. Максимално време: 5 секунди
t2v-luma-dream-machineFast SVD Text to Video
Бърз модел за генериране на видео от текст. Постига естествени движения и изразителни визуални ефекти. Позволява персонализирани ID на контейнери за движение и настройки на дълбок кеш
t2v-fast-svdFast SVD LCM Text to Video
Ултрабърз модел за генериране на видео от текст. Използва LCM (Latent Consistency Model) за генериране на висококачествени видеоклипове с по-малък брой стъпки. Постига естествени движения и изразителни визуални ефекти
t2v-fast-svd-lcmMochi V1
Висококачествен модел за генериране на видео от текст. Постига естествени движения и изразителни визуални ефекти. Подобрява творчеството с функция за разширяване на заявките
t2v-mochi-v1CogVideoX-5B
Модел за генериране на видео от текст от следващо поколение. Реализира високо качество, естествени движения и изразителни визуални ефекти. Позволява персонализирани размери на видеото и честота на кадрите
t2v-cogvideox-5bT2V Turbo
Ултрабърз модел за генериране на видео от текст. Генерира висококачествени видеоклипове с малък брой стъпки. Постига естествени движения и изразителни визуални ефекти. Максимално време: 5 секунди
t2v-turboMiniMax Video 01
Висококачествен модел на MiniMax за генериране на видео. Генерира универсално видео съдържание. Максимално време: 5 секунди
t2v-minimax-video-01LTX Video v0.95
Висококачествен модел за генериране на видео от текст. Генерира естествени движения и изразителни визуални ефекти. Максимално време: 5 секунди
t2v-ltx-video-v095OpenAI Sora 2 Text to Video
agents.video.t2v.agents.t2v-sora-2.description
t2v-sora-2OpenAI Sora 2 Pro Text to Video
agents.video.t2v.agents.t2v-sora-2-pro.description
t2v-sora-2-pros2v
VEED Avatars Speech to Video
agents.video.s2v.agents.s2v-veed-avatars.description
Задължителни параметри
- avatar_id使用するアバターIDYAML設定: parameters.avatar_id例: emily_vertical_primaryЗадължителноНалични стойности:emily_vertical_primaryemily_vertical_secondarymarcus_vertical_primarymarcus_vertical_secondarymira_vertical_primarymira_vertical_secondaryjasmine_vertical_primaryjasmine_vertical_secondaryjasmine_vertical_walkingaisha_vertical_walkingelena_vertical_primaryelena_vertical_secondaryany_male_vertical_primaryany_female_vertical_primaryany_male_vertical_secondaryany_female_vertical_secondaryany_male_vertical_walkingany_female_vertical_walkingemily_primaryemily_sidemarcus_primarymarcus_sideaisha_walkingelena_primaryelena_sideany_male_primaryany_female_primaryany_male_sideany_female_side
Незадължителни параметри
- dependency音声ファイルの依存関係を指定。mp3, wav, m4a等の音声ファイルをサポートYAML設定: parameters.dependency
- dependency_wait依存関係の処理完了を待つかどうか。音声ファイル使用時は必須でtrueに設定YAML設定: parameters.dependency_wait
Съвети
音声ファイルを依存関係として指定し、dependency_wait: trueを設定することで、音声に同期したアバター動画を生成できます。アバターは縦向き(vertical)と横向きのバリエーションがあります。30種類のアバターから選択可能です。
common.code_example
src:
structure.yaml:
content: |-
Project: Speech to Avatar Video Project
- 音声からアバター動画を生成
- 30種類のアバターから選択可能
- 自然な口パクとジェスチャー
agent_selection_reason: Project structure definition
dependency: []
agent: claude-3-5-sonnet-20241022
api: []
audio:
sample_speech.mp3:
content: "こんにちは!私はVEED Avatarsを使用したアバターです。音声に合わせて自然に話すことができます。"
agent_selection_reason: 音声ファイルの生成
dependency: []
agent: t2s-gpt-4o-mini-tts
api: []
video:
avatar_video.mp4:
content: |-
音声からアバター動画を生成
- Emily(縦向き・基本)アバターを使用
- 音声に合わせた自然な口パクとジェスチャー
agent_selection_reason: s2v-veed-avatarsは音声からリアルなアバター動画を生成でき、30種類のアバターから選択可能
dependency:
- src/audio/sample_speech.mp3
dependency_wait: true
agent: s2v-veed-avatars
parameters:
avatar_id: emily_vertical_primary
api: []s2v-veed-avatarsi2vの使用例
Kling Image to Video v2.1
src:
structure.yaml:
content: |-
Project: Creating Innovative Digital Art Fusing Surrealism and Futurism
- Fantastical world of crystal islands floating on an ocean of liquid starlight
- Surreal landscape with clockwork mechanical trees and luminous butterflies
- Photorealistic yet dreamlike still image generation using t2i-imagen3
- Magical motion and cosmic energy animation using Kling i2v v2.1
- Unique visual expression where fantasy meets steampunk
- Mystical space with gravity-defying upward waterfalls and multiple moons
- Fantastical ecosystem of bioluminescent plants and cosmic energy flows
agent_selection_reason: Selected claude-3-5-sonnet-20241022 for its excellence in managing project structure design and multiple media generation requirements. Particularly suited for planning surreal artworks and integrated multimedia production management.
dependency: []
agent: claude-3-5-sonnet-20241022
api: []
image-generation:
beautifle_landscape.png:
content: A surreal dreamscape where floating crystal islands hover above an ocean of liquid starlight. Ancient clockwork trees with gears for leaves stretch toward a sky filled with multiple moons in different phases. Ethereal butterflies made of pure light weave between cascading waterfalls that flow upward, defying gravity. The entire scene is painted in vibrant purples, electric blues, and golden amber hues, creating a mystical atmosphere that blends fantasy with steampunk aesthetics. Intricate details include floating geometric structures, bioluminescent flora, and streams of cosmic energy connecting the floating islands.
agent_selection_reason: t2i-imagen3, Google's cutting-edge image generation model, excels at simultaneously expressing surreal elements and photorealistic textures. It particularly demonstrates advanced capabilities in convincingly depicting liquid starlight, luminous organisms, complex light interactions, and gravity-defying physical phenomena. It also shows superior ability in integrating the complex aesthetics of fantasy and steampunk fusion into a single work.
dependency: []
note: Prompts must be in English only.
agent: t2i-imagen3
api: []
video-generation:
beautifle_landscape.mp4:
content: |-
Transform this surreal dreamscape into a mesmerizing animated masterpiece.
The crystal islands gently rotate and pulse with inner light while floating gracefully.
Clockwork trees' gear-leaves turn slowly, creating hypnotic mechanical rhythms.
Light-butterflies dance in spiraling patterns, leaving trails of stardust.
The upward-flowing waterfalls shimmer and undulate with magical energy.
Multiple moons slowly orbit across the cosmic sky, casting shifting shadows.
Bioluminescent plants pulse in synchronized waves of color.
Streams of cosmic energy flow between islands like living aurora.
The liquid starlight ocean below ripples with celestial reflections.
Camera slowly pans across this fantastical realm with cinematic grandeur.
dependency:
- src/image-generation/beautifle_landscape.png
dependency_wait: true
agent: i2v-kling-v2.1
api: []
parameters:
duration: 5
aspect_ratio: "1:1"
negative_prompt: low quality, blurry, static camera
cfg_scale: 0.6Kling Image to Video v2.1 Standard
src:
structure.yaml:
content: |-
Project: Standard Quality Video Generation with Kling v2.1 Standard Edition
- High-quality image-to-video conversion with standard settings
- Multiple aspect ratio support (16:9, 9:16, 1:1)
- Duration options (5 or 10 seconds)
- Consistent and reliable video generation
agent_selection_reason: Using i2v-kling-2.1-standard for stable and consistent video generation with standard settings
agent: t2i-flux-schnell
dependency: []
image-generation:
sample-image.png:
content: |-
A serene landscape with a calm lake reflecting mountains
agent: t2i-flux-schnell
dependency: []
api: []
video-generation:
landscape-video.mp4:
content: |-
Gentle breeze creating ripples on the water surface
Clouds slowly drifting across the sky
Subtle light changes as time passes
Natural and peaceful atmosphere
dependency:
- src/image-generation/sample-image.png
dependency_wait: true
agent: i2v-kling-2.1-standard
api: []
parameters:
duration: 5
aspect_ratio: "16:9"
negative_prompt: low quality, unnatural movement
cfg_scale: 0.5Kling Image to Video v2.5 Turbo Pro
src:
structure.yaml:
content: |-
Project: Cinematic Orbit Shot of Futuristic Explorer
- Single still image converted into a moving shot
- Camera arcs around subject at sunset
- Tail frame highlights silhouette against the sun
agent_selection_reason: Selected i2v-kling-v2.5-turbo-pro for smooth cinematic motion.
dependency:
- src/local_image/explorer.png
dependency_wait: true
agent: i2v-kling-v2.5-turbo-pro
api: []
parameters:
duration: "10"
aspect_ratio: "16:9"
negative_prompt: blur, distort, and low quality
cfg_scale: 0.5ByteDance Seedance v1 Lite Reference to Video
src:
structure.yaml:
content: |-
Project: Cinematic Intro with Seedance Lite Reference-to-Video
- Use multiple reference stills to control motion
- Focus on neon-lit cyberpunk ambience and flowing garments
- Track the subject with a gentle forward-moving camera
agent_selection_reason: Using i2v-bytedance-seedance-v1-lite-reference-to-video for reference-driven motion control.
agent: t2i-flux-schnell
dependency: []
image-generation:
reference-main.png:
content: |-
A cyberpunk hero standing in a neon-lit alley, dramatic lighting on the coat.
agent: t2i-flux-schnell
dependency: []
api: []
reference-style.png:
content: |-
Stylized lighting accents and atmosphere for the same alley scene.
agent: t2i-flux-schnell
dependency: []
api: []
video-generation:
hero-intro.mp4:
content: |-
Generate a cinematic opener where the protagonist walks through the neon-lit alley, coat flowing in the wind. Maintain a gentle tracking shot from a slightly elevated angle.
dependency:
- src/image-generation/reference-main.png
- src/image-generation/reference-style.png
dependency_wait: true
agent: i2v-bytedance-seedance-v1-lite-reference-to-video
api: []
parameters:
aspect_ratio: "16:9"
resolution: "720p"
duration: "5"
camera_fixed: false
seed: -1ByteDance Seedance v1 Pro I2V
src:
structure.yaml:
content: |-
Project: Natural Motion Video Generation with ByteDance Seedance v1 Pro
- High-quality image-to-video conversion
- Camera motion control options
- Reproducible generation with seed values
- Multiple resolution support (720p/1080p)
agent_selection_reason: Using i2v-bytedance-seedance-v1-pro for high-quality motion generation with camera control
agent: t2i-flux-schnell
dependency: []
image-generation:
base-image.png:
content: |-
A peaceful garden scene with blooming flowers
agent: t2i-flux-schnell
dependency: []
api: []
video-generation:
garden-motion.mp4:
content: |-
Gentle breeze moving through the flowers, petals swaying naturally
Butterflies flying between the flowers
Soft sunlight filtering through leaves
dependency:
- src/image-generation/base-image.png
dependency_wait: true
agent: i2v-bytedance-seedance-v1-pro
api: []
parameters:
resolution: "1080p"
camera_fixed: false
seed: -1ByteDance OmniHuman v1.5
src:
structure.yaml:
content: |-
Project: Talking Avatar with OmniHuman
- Combine a portrait still with voice-over audio
- Generate expressive lip-sync aligned to speech
agent_selection_reason: Using i2v-bytedance-omnihuman-v1.5 for high-fidelity facial motion and lip-sync.
agent: claude-3-5-sonnet-20241022
dependency: []
image-generation:
avatar.png:
content: |-
A friendly presenter facing the camera with soft studio lighting.
agent: t2i-flux-schnell
dependency: []
api: []
audio:
voice-line.mp3:
content: |-
"Welcome to our product showcase. Let me guide you through the highlights."
agent: t2s-gpt-4o-mini-tts
dependency: []
api: []
video-generation:
talking-avatar.mp4:
content: |-
Synchronize the speech with natural facial expressions and subtle head movements.
dependency:
- src/image-generation/avatar.png
- src/audio/voice-line.mp3
dependency_wait: true
agent: i2v-bytedance-omnihuman-v1.5
api: []
parameters:
audio_url: src/audio/voice-line.mp3
MiniMax Hailuo-02 Pro I2V
src:
structure.yaml:
content: |-
Project: High-Quality Video Generation with MiniMax Hailuo-02 Pro
- Advanced image-to-video conversion with prompt optimization
- Natural and sophisticated video generation
- Enhanced detail and motion quality
agent_selection_reason: Using i2v-minimax-hailuo-02-pro for enhanced video quality with prompt optimization
agent: t2i-flux-schnell
dependency: []
image-generation:
source-image.png:
content: |-
A vibrant cityscape at golden hour with bustling street life
agent: t2i-flux-schnell
dependency: []
api: []
video-generation:
city-animation.mp4:
content: |-
Gentle movement of people walking through the streets
Soft lighting changes as the golden hour progresses
Natural urban atmosphere with subtle life and energy
Camera slowly pans across the vibrant cityscape
dependency:
- src/image-generation/source-image.png
dependency_wait: true
agent: i2v-minimax-hailuo-02-pro
api: []
parameters:
prompt_optimizer: trueWAN 2.5 Preview Image to Video
src:
structure.yaml:
content: |-
Project: Cinematic WAN 2.5 Preview shot
- Generate a 10 second tracking shot from a still hero image
- Maintain character fidelity while adding dynamic camera motion
- Use 1080p output for presentation footage
agent_selection_reason: Selecting i2v-wan-25-preview to leverage WAN 2.5 Preview's long clip support and smooth motion quality.
agent: claude-3-5-sonnet-20241022
dependency: []
image-generation:
hero-frame.png:
content: |-
A heroic warrior standing on a cliff at sunset, cape flowing in the wind.
agent: t2i-flux-pro
dependency: []
api: []
video-generation:
cinematic-shot.mp4:
content: |-
Create a 10-second 1080p clip with subtle camera push-in and atmospheric motion around the character.
dependency:
- src/image-generation/hero-frame.png
dependency_wait: true
agent: i2v-wan-25-preview
api: []
parameters:
duration: "5"
resolution: "1080p"
aspect_ratio: "16:9"
s2vの使用例
VEED Avatars
src:
structure.yaml:
content: |-
Project: Speech to Avatar Video Project
- 音声からアバター動画を生成
- 30種類のアバターから選択可能
- 自然な口パクとジェスチャー
agent_selection_reason: Project structure definition
dependency: []
agent: claude-3-5-sonnet-20241022
api: []
audio:
sample_speech.mp3:
content: "こんにちは!私はVEED Avatarsを使用したアバターです。音声に合わせて自然に話すことができます。"
agent_selection_reason: 音声ファイルの生成
dependency: []
agent: t2s-gpt-4o-mini-tts
api: []
video:
avatar_video.mp4:
content: |-
音声からアバター動画を生成
- Emily(縦向き・基本)アバターを使用
- 音声に合わせた自然な口パクとジェスチャー
agent_selection_reason: s2v-veed-avatarsは音声からリアルなアバター動画を生成でき、30種類のアバターから選択可能
dependency:
- src/audio/sample_speech.mp3
dependency_wait: true
agent: s2v-veed-avatars
parameters:
avatar_id: emily_vertical_primary
api: []AI Avatar Multi
src:
structure.yaml:
content: KAMUI Anime Avatar 8-Second Conversation Test
agent_selection_reason: プロジェクト構造定義とKAMUI日本語アバター機能のテスト
dependency: []
agent: claude-3-5-sonnet-20241022
api: []
audio:
japanese_greeting.mp3:
content: みなさん、こんにちは!新しいアニメアバターが登場しました!
agent_selection_reason: |-
t2s-minimax-speech-02-turboは日本語の自然な発音と抑揚に対応しており、
親しみやすい挨拶メッセージの生成に適しています。
dependency: []
agent: t2s-minimax-speech-02-turbo
parameters:
voice_setting:
voice_id: Decent_Boy
speed: 1.4
emotion: neutral
language_boost: Japanese
audio_setting:
format: mp3
sample_rate: 44100
api: []
japanese_response.mp3:
content: わあ、すごい!どんなことができるんですか?
agent_selection_reason: |-
t2s-minimax-speech-02-turboのDeep_Voice_Manを使用して男性の声で応答を生成。
対話の自然な流れを作るため、異なる音声IDを使用します。
dependency: []
agent: t2s-minimax-speech-02-turbo
parameters:
voice_setting:
voice_id: Lively_Girl
speed: 1.2
emotion: neutral
language_boost: Japanese
audio_setting:
format: mp3
sample_rate: 44100
api: []
image:
conversation_scene.jpg:
content: Animation Taste, Animation TasteAnimation Taste, Two realistic forest animals having an animated conversation in a beautiful woodland setting. A wise old brown bear sitting upright with expressive eyes and gentle facial expression, appearing to be speaking earnestly to a clever red fox who is sitting attentively with tilted head and bright, intelligent eyes showing curiosity. The bear's mouth is slightly open as if mid-sentence, with natural body language showing engagement. The fox has perked ears and an alert, listening posture. Surrounding them is a lush forest with dappled sunlight filtering through tall trees, creating a warm, magical atmosphere. Moss-covered rocks and wildflowers scattered around. Photorealistic style with incredible detail in fur texture, natural lighting, and authentic woodland environment. The scene captures the essence of two friends sharing stories in nature.
agent_selection_reason: t2i-flux-proを使用してアニメテイストの男女キャラクターを生成。FLUX
dependency: []
agent: t2i-imagen4
api: []
video:
kamui_japanese_avatar_conversation.mp4:
content: |-
Two Japanese professionals having a friendly conversation about the new KAMUI grimoire update in a modern office setting.
Natural dialogue flow with expressive gestures and eye contact, showcasing the advanced Japanese language avatar capabilities.
agent_selection_reason: s2v-ai-avatar-multiはデュアル音声対応でWise_WomanとDeep_Voice_Manの2つの声を使った自然な日本語対話動画を生成
dependency:
- src/audio/japanese_greeting.mp3
- src/audio/japanese_response.mp3
- src/image/conversation_scene.jpg
dependency_wait: true
agent: s2v-ai-avatar-multi
parameters:
num_frames: 192
turbo: true
seed: 12345
api: []t2vの使用例
Wan 2.5 Preview Text to Video
src:
storyboard.yaml:
content: |-
Project: Futuristic City Reveal with Cinematic Lighting
- From text prompt to Wan 2.5 Preview video generation
- Lean camera move that circles around the hero subject
- Optional background score supplied via audio_url
- Use 1080p resolution and 10 second duration for presentation reels
- Deliver both vertical and landscape cuts for social media
- Include fallback prompts for negative details (noise, low quality)
agent_selection_reason: Gemini 2.5 Flash organizes requirements and prepares prompts for multi-agent video generation.
dependency: []
agent: gemini-2.5-flash-preview-04-17
api: []
video-generation:
wan25_preview_demo.mp4:
content: |-
Cinematic reveal of a cyberpunk city skyline at sunset.
The camera begins with a wide aerial shot, then glides around a lone android hero standing on a balcony.
Neon reflections ripple across glass towers while drones pass overhead.
Include atmospheric haze, volumetric light shafts, and dynamic clouds.
Keep movements smooth and emphasize premium cinematic lighting.
agent_selection_reason: Wan 2.5 Preview handles 1080p output, long motion, and nuanced lighting in 10 second clips.
dependency: []
agent: t2v-wan-25-preview
api: []
parameters:
duration: "5"
aspect_ratio: "16:9"
resolution: "1080p"
enable_prompt_expansion: true
negative_prompt: "low resolution, muted colors, jitter, artifacts"
Kling 2.1 Text to Video
src:
video:
magical_forest.mp4:
content: |-
A magical forest at dawn with glowing fireflies dancing between ancient trees.
Soft mist rolls through the undergrowth as golden sunlight filters through the canopy.
Ethereal and cinematic atmosphere with smooth camera movement.
dependency: []
agent: "t2v-kling-2.1"
parameters:
duration: 10 # 5または10秒を指定
aspect_ratio: "16:9" # 16:9, 9:16, 1:1から選択
style: "cinematic fantasy" # スタイル指定(プロンプトに追加)
negative_prompt: "low quality, blurry, static camera" # 除外したい要素
cfg_scale: 0.7 # プロンプトへの忠実度(0.0-1.0)
seed: 123456 # 再現性のためのシード値(オプション)
api: []
# 最小構成の例
simple_scene.mp4:
content: "A serene lake at sunset with rippling water"
dependency: []
agent: "t2v-kling-2.1"
api: [] # parametersを省略するとデフォルト値が使用されますKling 2.5 Turbo Pro
src:
video:
futuristic_city.mp4:
content: |-
A futuristic city skyline at sunset with flying cars weaving between holographic billboards.
- Neon reflections on glass buildings
- Dynamic aerial traffic
- Warm cinematic lighting
dependency: []
agent: "t2v-kling-2.5-turbo-pro"
parameters:
duration: "5"
aspect_ratio: "16:9"
cfg_scale: 0.6
seed: 12345
api: []s2vの使用例
VEED Avatars Speech to Video
src:
structure.yaml:
content: |-
Project: Speech to Avatar Video Project
- 音声からアバター動画を生成
- 30種類のアバターから選択可能
- 自然な口パクとジェスチャー
agent_selection_reason: Project structure definition
dependency: []
agent: claude-3-5-sonnet-20241022
api: []
audio:
sample_speech.mp3:
content: "こんにちは!私はVEED Avatarsを使用したアバターです。音声に合わせて自然に話すことができます。"
agent_selection_reason: 音声ファイルの生成
dependency: []
agent: t2s-gpt-4o-mini-tts
api: []
video:
avatar_video.mp4:
content: |-
音声からアバター動画を生成
- Emily(縦向き・基本)アバターを使用
- 音声に合わせた自然な口パクとジェスチャー
agent_selection_reason: s2v-veed-avatarsは音声からリアルなアバター動画を生成でき、30種類のアバターから選択可能
dependency:
- src/audio/sample_speech.mp3
dependency_wait: true
agent: s2v-veed-avatars
parameters:
avatar_id: emily_vertical_primary
api: []