動画生成AIエージェント
高品質な動画生成と編集を行うAIエージェント
i2v
Kling Image to Video
画像から高品質な動画を生成するKlingモデル。元画像の特徴を保ちながら自然な動きを付加し、テキストプロンプトで動きの方向性を指定可能
i2v-kling-v1Kling Image to Video Pro
画像から高品質な動画を生成するKling Proモデル。元画像の特徴を保ちながら自然な動きを付加し、テキストプロンプトで動きの方向性を指定可能。標準版より高品質な出力が可能。静的・動的マスクによるモーションコントロールにも対応
i2v-kling-v1-proKling Image to Video v1.5 Pro
Kling v1.5 Proの画像から動画生成モデル。高品質で自然な動きの動画を生成。標準版より高度な表現力と長い生成時間に対応。依存画像の指定とdependency_wait: trueの設定が必須です。最大時間: 10秒
i2v-kling-v1.5-proKling Image to Video v1.6
Kling v1.6の画像から動画生成モデル。最新版での自然な動きと高品質な映像表現を実現。多様なスタイルに対応。依存画像の指定とdependency_wait: trueの設定が必須です。最大時間: 5秒
i2v-kling-v1.6Kling Image to Video v2.0
Kling v2.0の画像から動画生成モデル。超高解像度と複雑なシーンの動画変換が可能。依存画像の指定とdependency_wait: trueの設定が必須です。
i2v-kling-v2.0Kling Image to Video v2.1
Kling v2.1の最新画像から動画生成モデル。v2.0よりさらに向上した動画品質と安定性を実現。複数のアスペクト比と動画長に対応。依存画像の指定とdependency_wait: trueの設定が必須です。
オプションパラメータ
- duration動画の長さ(5または10秒)。デフォルト: "5"YAML設定: parameters.duration
- aspect_ratioアスペクト比("16:9", "9:16", "1:1")。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
- negative_prompt生成を避ける要素の指定。デフォルト: "blur, distort, and low quality"YAML設定: parameters.negative_prompt
- cfg_scaleCFG(Classifier Free Guidance)スケール。プロンプトへの忠実度(0.0-1.0)。デフォルト: 0.5YAML設定: parameters.cfg_scale
ヒント
開始画像は依存画像として指定します。durationとaspect_ratioは文字列で指定する必要があります。高品質な動画を生成するために、詳細で具体的なプロンプトを推奨します。
コード例
src:
structure.yaml:
content: |-
Project: Creating Innovative Digital Art Fusing Surrealism and Futurism
- Fantastical world of crystal islands floating on an ocean of liquid starlight
- Surreal landscape with clockwork mechanical trees and luminous butterflies
- Photorealistic yet dreamlike still image generation using t2i-imagen3
- Magical motion and cosmic energy animation using Kling i2v v2.1
- Unique visual expression where fantasy meets steampunk
- Mystical space with gravity-defying upward waterfalls and multiple moons
- Fantastical ecosystem of bioluminescent plants and cosmic energy flows
agent_selection_reason: Selected claude-3-5-sonnet-20241022 for its excellence in managing project structure design and multiple media generation requirements. Particularly suited for planning surreal artworks and integrated multimedia production management.
dependency: []
agent: claude-3-5-sonnet-20241022
api: []
image-generation:
beautifle_landscape.png:
content: A surreal dreamscape where floating crystal islands hover above an ocean of liquid starlight. Ancient clockwork trees with gears for leaves stretch toward a sky filled with multiple moons in different phases. Ethereal butterflies made of pure light weave between cascading waterfalls that flow upward, defying gravity. The entire scene is painted in vibrant purples, electric blues, and golden amber hues, creating a mystical atmosphere that blends fantasy with steampunk aesthetics. Intricate details include floating geometric structures, bioluminescent flora, and streams of cosmic energy connecting the floating islands.
agent_selection_reason: t2i-imagen3, Google's cutting-edge image generation model, excels at simultaneously expressing surreal elements and photorealistic textures. It particularly demonstrates advanced capabilities in convincingly depicting liquid starlight, luminous organisms, complex light interactions, and gravity-defying physical phenomena. It also shows superior ability in integrating the complex aesthetics of fantasy and steampunk fusion into a single work.
dependency: []
note: Prompts must be in English only.
agent: t2i-imagen3
api: []
video-generation:
beautifle_landscape.mp4:
content: |-
Transform this surreal dreamscape into a mesmerizing animated masterpiece.
The crystal islands gently rotate and pulse with inner light while floating gracefully.
Clockwork trees' gear-leaves turn slowly, creating hypnotic mechanical rhythms.
Light-butterflies dance in spiraling patterns, leaving trails of stardust.
The upward-flowing waterfalls shimmer and undulate with magical energy.
Multiple moons slowly orbit across the cosmic sky, casting shifting shadows.
Bioluminescent plants pulse in synchronized waves of color.
Streams of cosmic energy flow between islands like living aurora.
The liquid starlight ocean below ripples with celestial reflections.
Camera slowly pans across this fantastical realm with cinematic grandeur.
dependency:
- src/image-generation/beautifle_landscape.png
dependency_wait: true
agent: i2v-kling-v2.1
api: []
parameters:
duration: 5
aspect_ratio: "1:1"
negative_prompt: low quality, blurry, static camera
cfg_scale: 0.6i2v-kling-v2.1Kling Image to Video v2.1 Standard
Kling v2.1 Standardの画像から動画生成モデル。マスター版と同じ高品質を標準的な設定で提供。複数のアスペクト比と動画長に対応。依存画像の指定とdependency_wait: trueの設定が必須です。
オプションパラメータ
- duration動画の長さ(5または10秒)。デフォルト: "5"YAML設定: parameters.duration
- aspect_ratioアスペクト比("16:9", "9:16", "1:1")。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
- negative_prompt生成を避ける要素の指定。デフォルト: "blur, distort, and low quality"YAML設定: parameters.negative_prompt
- cfg_scaleCFG(Classifier Free Guidance)スケール。プロンプトへの忠実度(0.0-1.0)。デフォルト: 0.5YAML設定: parameters.cfg_scale
ヒント
マスター版と同じAPIパラメータを使用しますが、標準設定による安定した生成が期待できます。開始画像は依存画像として指定します。durationとaspect_ratioは文字列で指定する必要があります。
コード例
src:
structure.yaml:
content: |-
Project: Standard Quality Video Generation with Kling v2.1 Standard Edition
- High-quality image-to-video conversion with standard settings
- Multiple aspect ratio support (16:9, 9:16, 1:1)
- Duration options (5 or 10 seconds)
- Consistent and reliable video generation
agent_selection_reason: Using i2v-kling-2.1-standard for stable and consistent video generation with standard settings
agent: t2i-flux-schnell
dependency: []
image-generation:
sample-image.png:
content: |-
A serene landscape with a calm lake reflecting mountains
agent: t2i-flux-schnell
dependency: []
api: []
video-generation:
landscape-video.mp4:
content: |-
Gentle breeze creating ripples on the water surface
Clouds slowly drifting across the sky
Subtle light changes as time passes
Natural and peaceful atmosphere
dependency:
- src/image-generation/sample-image.png
dependency_wait: true
agent: i2v-kling-2.1-standard
api: []
parameters:
duration: 5
aspect_ratio: "16:9"
negative_prompt: low quality, unnatural movement
cfg_scale: 0.5i2v-kling-2.1-standardKling Image to Video v2.5 Turbo Pro
Kling v2.5 Turbo Proの画像から動画生成モデル。Turbo Pro版ならではの滑らかなカメラワークと高精細で映画的な映像表現が可能。依存画像の指定とdependency_wait: trueの設定が必須です。tail_image_urlで動画の終了フレームも制御できます。
オプションパラメータ
- duration動画の長さ(5または10秒)。デフォルト: "5"YAML設定: parameters.duration
- aspect_ratioアスペクト比("16:9", "9:16", "1:1")。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
- negative_prompt生成を避ける要素の指定。デフォルト: "blur, distort, and low quality"YAML設定: parameters.negative_prompt
- cfg_scaleCFG(Classifier Free Guidance)スケール。プロンプトへの忠実度(0.0-1.0)。デフォルト: 0.5YAML設定: parameters.cfg_scale
ヒント
開始画像は依存画像として指定し、durationとaspect_ratioは文字列で指定してください。
コード例
src:
structure.yaml:
content: |-
Project: Cinematic Orbit Shot of Futuristic Explorer
- Single still image converted into a moving shot
- Camera arcs around subject at sunset
- Tail frame highlights silhouette against the sun
agent_selection_reason: Selected i2v-kling-v2.5-turbo-pro for smooth cinematic motion.
dependency:
- src/local_image/explorer.png
dependency_wait: true
agent: i2v-kling-v2.5-turbo-pro
api: []
parameters:
duration: "10"
aspect_ratio: "16:9"
negative_prompt: blur, distort, and low quality
cfg_scale: 0.5i2v-kling-v2.5-turbo-proKling Image to Video v1.6 Pro
Kling v1.6 Proの高品質画像から動画生成モデル。最新のPro版で、より長い動画生成時間と高度な映像表現が可能。開始画像から終了画像への自然な遷移も設定可能(オプション)。依存画像の指定とdependency_wait: trueの設定が必須です。
オプションパラメータ
- start_image_url開始画像のパス(オプション)YAML設定: parameters.start_image_url
- end_image_url終了画像のパス(オプション)。指定すると開始画像から終了画像へスムーズに遷移する動画が生成されますYAML設定: parameters.end_image_url
ヒント
スタートエンドで画像を指定する場合は、最低2つの依存画像が必要です。指定がない場合は開始画像のみから通常の動画が生成されます。
i2v-kling-v1.6-proByteDance Seedance v1 Lite Reference to Video
ByteDance Seedance v1 Liteの参照画像から動画生成モデル。最大4枚の参照画像とテキストで、構図と動きを制御した高品質動画を生成できます。
オプションパラメータ
- prompt生成する動画の説明。参照画像にどのような動きを付けるか詳細に記述YAML設定: parameters.prompt
- reference_image_urls参照画像URLの配列(1〜4件)。依存画像を指定する場合はdependency_wait: trueを推奨YAML設定: parameters.reference_image_urls
- aspect_ratio動画のアスペクト比(デフォルト: auto。21:9, 16:9, 4:3, 1:1, 3:4, 9:16, auto)YAML設定: parameters.aspect_ratio
- resolution動画解像度(デフォルト: 720p。480p/720pに対応)YAML設定: parameters.resolution
- duration動画の長さ(秒)。デフォルト: 5。3〜12秒に対応YAML設定: parameters.duration
- camera_fixedカメラモーションを固定するか。デフォルト: falseYAML設定: parameters.camera_fixed
- enable_safety_checkerセーフティチェッカーを有効化するか。デフォルト: trueYAML設定: parameters.enable_safety_checker
- seedシード値(-1でランダム)。デフォルト: -1YAML設定: parameters.seed
ヒント
参照画像を依存ファイルとして指定する場合は dependency_wait: true を設定し、1〜4枚までの画像を読み込ませてください。
コード例
src:
structure.yaml:
content: |-
Project: Cinematic Intro with Seedance Lite Reference-to-Video
- Use multiple reference stills to control motion
- Focus on neon-lit cyberpunk ambience and flowing garments
- Track the subject with a gentle forward-moving camera
agent_selection_reason: Using i2v-bytedance-seedance-v1-lite-reference-to-video for reference-driven motion control.
agent: t2i-flux-schnell
dependency: []
image-generation:
reference-main.png:
content: |-
A cyberpunk hero standing in a neon-lit alley, dramatic lighting on the coat.
agent: t2i-flux-schnell
dependency: []
api: []
reference-style.png:
content: |-
Stylized lighting accents and atmosphere for the same alley scene.
agent: t2i-flux-schnell
dependency: []
api: []
video-generation:
hero-intro.mp4:
content: |-
Generate a cinematic opener where the protagonist walks through the neon-lit alley, coat flowing in the wind. Maintain a gentle tracking shot from a slightly elevated angle.
dependency:
- src/image-generation/reference-main.png
- src/image-generation/reference-style.png
dependency_wait: true
agent: i2v-bytedance-seedance-v1-lite-reference-to-video
api: []
parameters:
aspect_ratio: "16:9"
resolution: "720p"
duration: "5"
camera_fixed: false
seed: -1i2v-bytedance-seedance-v1-lite-reference-to-videoByteDance Seedance v1 Pro I2V
ByteDance Seedance v1 Proの画像から動画生成モデル。高品質で自然な動きの動画を生成し、プロンプトに忠実な映像表現が可能。依存画像の指定とdependency_wait: trueの設定が必須です。
オプションパラメータ
- prompt生成する動画の説明。画像の内容と動きを詳細に記述YAML設定: parameters.prompt
- resolution生成する動画の解像度("720p", "1080p")。デフォルト: "1080p"YAML設定: parameters.resolution
- duration生成する動画の長さ(秒)。デフォルト: "5"(固定値)YAML設定: parameters.duration
- camera_fixedカメラを固定するかどうか。デフォルト: falseYAML設定: parameters.camera_fixed
- seedシード値(-1でランダム)。デフォルト: -1YAML設定: parameters.seed
ヒント
カメラモーションを制御したい場合は camera_fixed: true を設定します。同じシード値を使用することで、同じプロンプトから同じ動画を再現できます。
コード例
src:
structure.yaml:
content: |-
Project: Natural Motion Video Generation with ByteDance Seedance v1 Pro
- High-quality image-to-video conversion
- Camera motion control options
- Reproducible generation with seed values
- Multiple resolution support (720p/1080p)
agent_selection_reason: Using i2v-bytedance-seedance-v1-pro for high-quality motion generation with camera control
agent: t2i-flux-schnell
dependency: []
image-generation:
base-image.png:
content: |-
A peaceful garden scene with blooming flowers
agent: t2i-flux-schnell
dependency: []
api: []
video-generation:
garden-motion.mp4:
content: |-
Gentle breeze moving through the flowers, petals swaying naturally
Butterflies flying between the flowers
Soft sunlight filtering through leaves
dependency:
- src/image-generation/base-image.png
dependency_wait: true
agent: i2v-bytedance-seedance-v1-pro
api: []
parameters:
resolution: "1080p"
camera_fixed: false
seed: -1i2v-bytedance-seedance-v1-proByteDance OmniHuman v1.5
ByteDance OmniHuman v1.5の画像と音声から動画生成モデル。人物画像と音声ファイルを入力し、音声に合わせた自然な口元・表情・身体の動きを再現するトーキングヘッド動画を生成します。依存画像と音声の指定、および dependency_wait: true の設定が必須です。
必須パラメータ
- audio_url音声ファイルのURL(必須)。30秒以内の音声を指定YAML設定: parameters.audio_url必須
ヒント
依存関係として人物画像と音声ファイルを登録し、dependency_wait: true を設定してください。
コード例
src:
structure.yaml:
content: |-
Project: Talking Avatar with OmniHuman
- Combine a portrait still with voice-over audio
- Generate expressive lip-sync aligned to speech
agent_selection_reason: Using i2v-bytedance-omnihuman-v1.5 for high-fidelity facial motion and lip-sync.
agent: claude-3-5-sonnet-20241022
dependency: []
image-generation:
avatar.png:
content: |-
A friendly presenter facing the camera with soft studio lighting.
agent: t2i-flux-schnell
dependency: []
api: []
audio:
voice-line.mp3:
content: |-
"Welcome to our product showcase. Let me guide you through the highlights."
agent: t2s-gpt-4o-mini-tts
dependency: []
api: []
video-generation:
talking-avatar.mp4:
content: |-
Synchronize the speech with natural facial expressions and subtle head movements.
dependency:
- src/image-generation/avatar.png
- src/audio/voice-line.mp3
dependency_wait: true
agent: i2v-bytedance-omnihuman-v1.5
api: []
parameters:
audio_url: src/audio/voice-line.mp3
i2v-bytedance-omnihuman-v1.5MiniMax Video-01 I2V
MiniMaxの画像から動画生成モデル。高品質で自然な動きの動画を生成。依存画像の指定とdependency_wait: trueの設定が必須です
i2v-minimax-video-01MiniMax Video-01 Live I2V
MiniMaxのリアルタイム最適化された画像から動画生成モデル。高速な処理と自然な動きを両立。依存画像の指定とdependency_wait: trueの設定が必須です
i2v-minimax-video-01-liveMiniMax Subject Reference I2V
MiniMaxの被写体参照型画像から動画生成モデル。被写体の特徴を保ちながら自然な動きを付加。依存画像の指定とdependency_wait: trueの設定が必須です
i2v-minimax-video-01-subject-referenceMiniMax Director I2V
MiniMaxのディレクター指示型画像から動画生成モデル。詳細な演出指示に基づく動画生成が可能。依存画像の指定とdependency_wait: trueの設定が必須です
i2v-minimax-video-01-directorMiniMax Hailuo-02 Pro I2V
MiniMax Hailuo-02 Proの高品質画像から動画生成モデル。プロンプト最適化機能により、より自然で洗練された動画を生成します。依存画像の指定とdependency_wait: trueの設定が必須です。
オプションパラメータ
- prompt_optimizerプロンプト最適化機能の有効/無効。デフォルト: trueYAML設定: parameters.prompt_optimizer
ヒント
プロンプト最適化機能により、自動的により詳細で適切なプロンプトに変換されます。依存画像として指定された開始画像を基に、自然で洗練された動画を生成します。
コード例
src:
structure.yaml:
content: |-
Project: High-Quality Video Generation with MiniMax Hailuo-02 Pro
- Advanced image-to-video conversion with prompt optimization
- Natural and sophisticated video generation
- Enhanced detail and motion quality
agent_selection_reason: Using i2v-minimax-hailuo-02-pro for enhanced video quality with prompt optimization
agent: t2i-flux-schnell
dependency: []
image-generation:
source-image.png:
content: |-
A vibrant cityscape at golden hour with bustling street life
agent: t2i-flux-schnell
dependency: []
api: []
video-generation:
city-animation.mp4:
content: |-
Gentle movement of people walking through the streets
Soft lighting changes as the golden hour progresses
Natural urban atmosphere with subtle life and energy
Camera slowly pans across the vibrant cityscape
dependency:
- src/image-generation/source-image.png
dependency_wait: true
agent: i2v-minimax-hailuo-02-pro
api: []
parameters:
prompt_optimizer: truei2v-minimax-hailuo-02-proWAN Image to Video
WANの画像から動画生成モデル。高品質で自然な動きの動画を生成。多様な解像度とアスペクト比に対応。依存画像の指定とdependency_wait: trueの設定が必須です
i2v-wanWAN 2.5 Preview Image to Video
WAN 2.5 Previewの画像から動画生成モデル。5秒/10秒の動画生成に対応し、プレビュー版ながら滑らかなモーションと1080p出力を実現。依存画像の指定とdependency_wait: trueの設定が必須です
コード例
src:
structure.yaml:
content: |-
Project: Cinematic WAN 2.5 Preview shot
- Generate a 10 second tracking shot from a still hero image
- Maintain character fidelity while adding dynamic camera motion
- Use 1080p output for presentation footage
agent_selection_reason: Selecting i2v-wan-25-preview to leverage WAN 2.5 Preview's long clip support and smooth motion quality.
agent: claude-3-5-sonnet-20241022
dependency: []
image-generation:
hero-frame.png:
content: |-
A heroic warrior standing on a cliff at sunset, cape flowing in the wind.
agent: t2i-flux-pro
dependency: []
api: []
video-generation:
cinematic-shot.mp4:
content: |-
Create a 10-second 1080p clip with subtle camera push-in and atmospheric motion around the character.
dependency:
- src/image-generation/hero-frame.png
dependency_wait: true
agent: i2v-wan-25-preview
api: []
parameters:
duration: "5"
resolution: "1080p"
aspect_ratio: "16:9"
i2v-wan-25-previewWAN Image to Video Pro
WANの高品質版画像から動画生成モデル。標準版より高精細な映像表現が可能。より多くの推論ステップによる高品質な動画生成。依存画像の指定とdependency_wait: trueの設定が必須です
i2v-wan-proWAN Effects Image to Video
WANの特殊効果適用型画像から動画生成モデル。ズームイン、ズームアウト等の様々なエフェクトを自動適用。依存画像の指定とdependency_wait: trueの設定が必須です
i2v-wan-effectsHunyuan Video I2V
Hunyuanの画像から動画生成モデル。高いフレームレートと解像度で滑らかな動画を生成。依存画像の指定とdependency_wait: trueの設定が必須です
i2v-hunyuan-videoHunyuan Video LoRA I2V
HunyuanのLoRA適用画像から動画生成モデル。カスタムLoRAを適用して特定のスタイルやテーマの動画を生成。依存画像の指定とdependency_wait: trueの設定が必須です
i2v-hunyuan-video-loraVeo 3.1 Image to Video
agents.video.i2v.agents.i2v-veo3-1.description
オプションパラメータ
- aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
- resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
- generate_audio音声付き動画を生成する場合は true。不要な場合は false。YAML設定: parameters.generate_audio
- duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration
ヒント
被写体の動きやカメラワーク、スタイルを具体的にプロンプトへ記述すると効果的です。音声が不要な場合は generate_audio を false に設定してください。
i2v-veo3.1Veo 3.1 Fast Image to Video
agents.video.i2v.agents.i2v-veo3-1-fast-image-to-video.description
オプションパラメータ
- aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
- resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
- generate_audio音声付き動画を生成する場合は true。不要な場合は false。false にするとクレジットを節約できます。YAML設定: parameters.generate_audio
- duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration
ヒント
被写体の動きやカメラワーク、演出イメージを具体的に記述すると滑らかなアニメーションになります。ローカル画像を使用する際は dependency_wait: true を忘れずに。
i2v-veo3.1-fast-image-to-videoVeo 3.1 Reference to Video
agents.video.i2v.agents.i2v-veo3-1-reference-to-video.description
オプションパラメータ
- image_urls参照画像URLの配列。依存画像を指定すると自動的にFal.aiストレージURLへ変換されますYAML設定: parameters.image_urls
- aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
- resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
- generate_audio音声付き動画を生成する場合は true。不要な場合は false。YAML設定: parameters.generate_audio
- duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration
ヒント
参照画像ごとにポーズや角度を変えると滑らかな被写体遷移が得られます。local_imageを依存画像に使う場合は dependency_wait: true を設定してください。
i2v-veo3.1-reference-to-videoVeo 3.1 First/Last Frame
agents.video.i2v.agents.i2v-veo3-1-first-last-frame-to-video.description
オプションパラメータ
- first_frame_url開始フレームの画像パス。依存画像から解決される場合は省略可能ですYAML設定: parameters.first_frame_url
- last_frame_url終了フレームの画像パス。依存画像から解決される場合は省略可能ですYAML設定: parameters.last_frame_url
- aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
- resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
- generate_audio音声付き動画を生成する場合は true。不要な場合は false。YAML設定: parameters.generate_audio
- duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration
ヒント
開始と終了の2フレームを的確に選び、プロンプトでは動き方・カメラワーク・雰囲気を丁寧に指定すると上質な補間結果が得られます。音声が不要な場合は generate_audio を false に設定してください。
i2v-veo3.1-first-last-frame-to-videoVeo 3.1 First/Last Frame (Fast)
agents.video.i2v.agents.i2v-veo3-1-fast-first-last-frame-to-video.description
オプションパラメータ
- first_frame_url開始フレームの画像パス。依存画像から解決される場合は省略可能ですYAML設定: parameters.first_frame_url
- last_frame_url終了フレームの画像パス。依存画像から解決される場合は省略可能ですYAML設定: parameters.last_frame_url
- aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
- resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
- generate_audio音声付き動画を生成する場合は true。不要な場合は false。YAML設定: parameters.generate_audio
- duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration
ヒント
開始フレームと終了フレームの2枚を依存画像として必ず用意してください。動きの説明やカメラワーク、雰囲気をプロンプトで詳細に指定すると表現力が向上します。音声が不要な場合は generate_audio を false に設定してください。
i2v-veo3.1-fast-first-last-frame-to-videoRay 2 Image to Video
Lumaの高品質画像から動画生成モデル。リアルな動きと詳細な表現を実現。多様なアスペクト比と解像度に対応。オプションとして終了画像(end_image_url)を指定することで開始画像から終了画像へのスムーズな遷移も可能。依存画像の指定とdependency_wait: trueの設定が必須です
オプションパラメータ
- start_image_url開始画像のパス(オプション)YAML設定: parameters.start_image_url
- end_image_url終了画像のパス(オプション)。指定すると開始画像から終了画像へスムーズに遷移する動画が生成されますYAML設定: parameters.end_image_url
ヒント
スタートエンドで画像を指定する場合は、最低2つの依存画像が必要です。指定がない場合は開始画像のみから通常の動画が生成されます。
i2v-ray-2Luma Dream Machine I2V
Lumaの画像から動画生成モデル。創造的でアーティスティックな動画表現が可能。多様なアスペクト比と解像度に対応。オプションとして終了画像(end_image_url)を指定することで開始画像から終了画像へのスムーズな遷移も可能。依存画像の指定とdependency_wait: trueの設定が必須です
オプションパラメータ
- start_image_url開始画像のパス(オプション)YAML設定: parameters.start_image_url
- end_image_url終了画像のパス(オプション)。指定すると開始画像から終了画像へスムーズに遷移する動画が生成されますYAML設定: parameters.end_image_url
ヒント
スタートエンドで画像を指定する場合は、最低2つの依存画像が必要です。指定がない場合は開始画像のみから通常の動画が生成されます。
i2v-luma-dream-machineVidu Image to Video
Viduの画像から動画生成モデル。優れた画質と自然な動きで一枚の画像から映像表現を実現。動きの大きさを調整可能。依存画像の指定とdependency_wait: trueの設定が必須です。
i2v-viduVidu Reference Image to Video
Viduの参照画像を使った動画生成モデル。複数の参照画像から一貫した被写体表現を維持した動画を生成。依存画像の指定とdependency_wait: trueの設定が必須です。
依存関係
依存画像は複数指定可能で、すべての画像が統合されて一貫性のある動画が生成されます。
i2v-vidu-referenceVidu Start-End Image to Video
Viduの開始・終了画像を指定した動画生成モデル。2枚の画像間をスムーズに遷移する映像を生成。依存画像の指定とdependency_wait: trueの設定が必須です。
必須パラメータ
- start_image_url開始画像のパスYAML設定: parameters.start_image_url必須
- end_image_url終了画像のパスYAML設定: parameters.end_image_url必須
i2v-vidu-start-endVidu Template Image to Video
Viduのテンプレートを使った動画生成モデル。各種テンプレートに基づいた動画を生成。依存画像の指定とdependency_wait: trueの設定が必須です。
必須パラメータ
- templateテンプレート名YAML設定: parameters.template必須使用可能な値:dreamy_weddingromantic_liftsweet_proposalcouple_arrivalcupid_arrowpet_loverslunar_newyearhugkissdynasty_dresswish_senderlove_posehair_swapyouth_rewindmorphlablive_photoemotionlablive_memoryinteractionchristmas値別の要件:
- wish_sender - 3枚の依存画像が必要
- dynasty_dress - 2枚の依存画像が推奨
- shop_frame - 2枚の依存画像が推奨
- other - 1枚の依存画像で動作
依存関係
依存画像は複数指定可能で、テンプレートに応じた枚数の画像が必要です。
i2v-vidu-templatePika v1.5 Pikaffects
agents.video.i2v.agents.i2v-pika-v1-5-pikaffects.description
i2v-pika-v1.5-pikaffectsPika v2 Turbo
Pikaの高速画像から動画生成モデル。標準より3倍速く処理可能で、高品質な動画表現を実現。720p解像度対応。依存画像の指定とdependency_wait: trueの設定が必須です。最大時間: 5秒
i2v-pika-v2-turboPika v2.1
Pikaの高品質画像から動画生成モデル。シャープな詳細表現と自然な動きを両立。1080p解像度対応。依存画像の指定とdependency_wait: trueの設定が必須です。
i2v-pika-v2.1Pika v2.2
Pikaの最新画像から動画生成モデル。高度な動きと自然な映像表現を実現。最大10秒間の動画生成が可能。依存画像の指定とdependency_wait: trueの設定が必須です。最大時間: 10秒
i2v-pika-v2.2Pika v2.2 Scenes
Pikaの複数画像からのシーン動画生成モデル。複数の画像を統合し一貫性のある動画を生成。依存画像の指定とdependency_wait: trueの設定が必須です。
i2v-pika-v2.2-pikascenesPixverse v3.5 I2V
Pixverseの画像から動画生成モデル。高品質で自然な動きの動画を生成し、多様なシーンやスタイルに対応。依存画像の指定とdependency_wait: trueの設定が必須です。
i2v-pixverse-v3.5Pixverse v3.5 Fast I2V
Pixverse v3.5の高速版画像から動画生成モデル。標準版より処理速度が速く、迅速なクリエイティブワークフローに最適。依存画像の指定とdependency_wait: trueの設定が必須です。
i2v-pixverse-v3.5-fastSkyReels I2V
Skyreelsの画像から動画生成モデル。高品質で自然な動きの動画生成が可能。様々なシーン表現に対応し、滑らかなアニメーション効果を実現。依存画像の指定とdependency_wait: trueの設定が必須です。最大時間: 5秒
i2v-skyreelsCogVideoX-5B I2V
CogVideoX-5Bの画像から動画生成モデル。5B規模のモデルにより、高品質で詳細な動画表現を実現。複雑なシーンや動きの表現に優れています。依存画像の指定とdependency_wait: trueの設定が必須です。
i2v-cogvideox-5bLTX Video v0.95 I2V
agents.video.i2v.agents.i2v-ltx-video-v0-95.description
i2v-ltx-video-v0.95Stable Video I2V
Stable Videoの画像から動画生成モデル。安定性と一貫性に優れた動画表現を実現し、広範な用途に適用可能。依存画像の指定とdependency_wait: trueの設定が必須です。
i2v-stable-videoFast SVD LCM I2V
Stable Video Diffusion LCMによる超高速画像から動画生成モデル。Lightning Speedによる超高速な処理時間で高品質なビデオを生成。依存画像の指定とdependency_wait: trueの設定が必須です。
i2v-fast-svd-lcmv2v
Sync-Lipsync
既存の動画に音声を合わせてリップシンク(口の動き)を生成するモデル。自然な口の動きを実現。依存動画と依存音声の指定とdependency_wait: trueの設定が必須です
v2v-sync-lipsyncs2v
VEED Avatars
音声からアバター動画を生成するモデル。30種類のアバターから選択可能。音声に合わせてアバターが自然に話す動画を生成。依存音声ファイルの指定とdependency_wait: trueの設定が必須です。
必須パラメータ
- avatar_id使用するアバターID(必須)YAML設定: parameters.avatar_id例: elena_vertical_primary必須使用可能な値:emily_vertical_primary - Emily(縦向き・基本)emily_vertical_secondary - Emily(縦向き・セカンダリ)marcus_vertical_primary - Marcus(縦向き・基本)marcus_vertical_secondary - Marcus(縦向き・セカンダリ)mira_vertical_primary - Mira(縦向き・基本)mira_vertical_secondary - Mira(縦向き・セカンダリ)jasmine_vertical_primary - Jasmine(縦向き・基本)jasmine_vertical_secondary - Jasmine(縦向き・セカンダリ)jasmine_vertical_walking - Jasmine(縦向き・歩行)aisha_vertical_walking - Aisha(縦向き・歩行)elena_vertical_primary - Elena(縦向き・基本)elena_vertical_secondary - Elena(縦向き・セカンダリ)any_male_vertical_primary - 汎用男性(縦向き・基本)any_female_vertical_primary - 汎用女性(縦向き・基本)any_male_vertical_secondary - 汎用男性(縦向き・セカンダリ)any_female_vertical_secondary - 汎用女性(縦向き・セカンダリ)any_male_vertical_walking - 汎用男性(縦向き・歩行)any_female_vertical_walking - 汎用女性(縦向き・歩行)emily_primary - Emily(標準・基本)emily_side - Emily(標準・サイド)marcus_primary - Marcus(標準・基本)marcus_side - Marcus(標準・サイド)aisha_walking - Aisha(標準・歩行)elena_primary - Elena(標準・基本)elena_side - Elena(標準・サイド)any_male_primary - 汎用男性(標準・基本)any_female_primary - 汎用女性(標準・基本)any_male_side - 汎用男性(標準・サイド)any_female_side - 汎用女性(標準・サイド)
ヒント
音声ファイルは依存音声として指定します。アバターIDはavatar_idパラメータで指定可能。デフォルトはemily_vertical_primaryです。音声の長さに合わせて動画が生成されます。
コード例
src:
structure.yaml:
content: |-
Project: Speech to Avatar Video Project
- 音声からアバター動画を生成
- 30種類のアバターから選択可能
- 自然な口パクとジェスチャー
agent_selection_reason: Project structure definition
dependency: []
agent: claude-3-5-sonnet-20241022
api: []
audio:
sample_speech.mp3:
content: "こんにちは!私はVEED Avatarsを使用したアバターです。音声に合わせて自然に話すことができます。"
agent_selection_reason: 音声ファイルの生成
dependency: []
agent: t2s-gpt-4o-mini-tts
api: []
video:
avatar_video.mp4:
content: |-
音声からアバター動画を生成
- Emily(縦向き・基本)アバターを使用
- 音声に合わせた自然な口パクとジェスチャー
agent_selection_reason: s2v-veed-avatarsは音声からリアルなアバター動画を生成でき、30種類のアバターから選択可能
dependency:
- src/audio/sample_speech.mp3
dependency_wait: true
agent: s2v-veed-avatars
parameters:
avatar_id: emily_vertical_primary
api: []s2v-veed-avatarsAI Avatar Multi
デュアル音声からAIアバター動画を生成するモデル。2つの音声ファイルと画像を組み合わせてリアルなアバター動画を生成。高度な音声合成とリップシンク技術を使用。
必須パラメータ
- first_audio_url第1音声ファイルのURL(必須)YAML設定: parameters.first_audio_url例: https://example.com/audio1.wav必須
- second_audio_url第2音声ファイルのURL(必須)YAML設定: parameters.second_audio_url例: https://example.com/audio2.wav必須
- image_urlベース画像のURL(必須)YAML設定: parameters.image_url例: https://example.com/avatar.jpg必須
- prompt動画生成のための説明プロンプトYAML設定: parameters.prompt例: 二人の対話シーンを生成してください必須
ヒント
2つの音声ファイルと1つの画像が必須です。すべてdependency配列で指定し、dependency_wait: trueを設定してください。contentの内容がpromptとして使用されます。parametersにはnum_frames、turbo、seedなどの生成オプションのみ指定します。
コード例
src:
structure.yaml:
content: KAMUI Anime Avatar 8-Second Conversation Test
agent_selection_reason: プロジェクト構造定義とKAMUI日本語アバター機能のテスト
dependency: []
agent: claude-3-5-sonnet-20241022
api: []
audio:
japanese_greeting.mp3:
content: みなさん、こんにちは!新しいアニメアバターが登場しました!
agent_selection_reason: |-
t2s-minimax-speech-02-turboは日本語の自然な発音と抑揚に対応しており、
親しみやすい挨拶メッセージの生成に適しています。
dependency: []
agent: t2s-minimax-speech-02-turbo
parameters:
voice_setting:
voice_id: Decent_Boy
speed: 1.4
emotion: neutral
language_boost: Japanese
audio_setting:
format: mp3
sample_rate: 44100
api: []
japanese_response.mp3:
content: わあ、すごい!どんなことができるんですか?
agent_selection_reason: |-
t2s-minimax-speech-02-turboのDeep_Voice_Manを使用して男性の声で応答を生成。
対話の自然な流れを作るため、異なる音声IDを使用します。
dependency: []
agent: t2s-minimax-speech-02-turbo
parameters:
voice_setting:
voice_id: Lively_Girl
speed: 1.2
emotion: neutral
language_boost: Japanese
audio_setting:
format: mp3
sample_rate: 44100
api: []
image:
conversation_scene.jpg:
content: Animation Taste, Animation TasteAnimation Taste, Two realistic forest animals having an animated conversation in a beautiful woodland setting. A wise old brown bear sitting upright with expressive eyes and gentle facial expression, appearing to be speaking earnestly to a clever red fox who is sitting attentively with tilted head and bright, intelligent eyes showing curiosity. The bear's mouth is slightly open as if mid-sentence, with natural body language showing engagement. The fox has perked ears and an alert, listening posture. Surrounding them is a lush forest with dappled sunlight filtering through tall trees, creating a warm, magical atmosphere. Moss-covered rocks and wildflowers scattered around. Photorealistic style with incredible detail in fur texture, natural lighting, and authentic woodland environment. The scene captures the essence of two friends sharing stories in nature.
agent_selection_reason: t2i-flux-proを使用してアニメテイストの男女キャラクターを生成。FLUX
dependency: []
agent: t2i-imagen4
api: []
video:
kamui_japanese_avatar_conversation.mp4:
content: |-
Two Japanese professionals having a friendly conversation about the new KAMUI grimoire update in a modern office setting.
Natural dialogue flow with expressive gestures and eye contact, showcasing the advanced Japanese language avatar capabilities.
agent_selection_reason: s2v-ai-avatar-multiはデュアル音声対応でWise_WomanとDeep_Voice_Manの2つの声を使った自然な日本語対話動画を生成
dependency:
- src/audio/japanese_greeting.mp3
- src/audio/japanese_response.mp3
- src/image/conversation_scene.jpg
dependency_wait: true
agent: s2v-ai-avatar-multi
parameters:
num_frames: 192
turbo: true
seed: 12345
api: []s2v-ai-avatar-multit2v
Veo2 Text to Video
高品質なテキストから動画生成が可能なVeo2モデル。自然な動きと高解像度出力に対応
t2v-veo2Veo3 Text to Video
Googleの最新動画生成モデル。音声・音楽を含むマルチモーダル動画生成、最大8秒の動画生成に対応
t2v-veo3Veo 3.1 Text to Video
agents.video.t2v.agents.t2v-veo3-1.description
t2v-veo3.1Veo 3.1 Fast Text to Video
agents.video.t2v.agents.t2v-veo3-1-fast.description
t2v-veo3.1-fastHunyuan Text to Video
高い視覚品質、多様な動き、テキストと映像の一致性、安定した生成を特徴とするオープンな動画生成モデル
t2v-hunyuan-videoHunyuan Video LoRA
LoRAモデルを活用したHunyuanビデオ生成。カスタムスタイルでの動画生成が可能。高品質なコンテンツを生成します。最大時間: 5秒
t2v-hunyuan-video-loraWan Text to Video
高品質なテキストから動画生成モデル。自然な動きと表現力豊かな映像を実現
t2v-wanWan 2.5 Preview Text to Video
WAN 2.5 Previewの最新テキスト動画生成モデル。5秒/10秒クリップ、16:9・9:16・1:1のアスペクト比、最大1080p出力、任意の背景音声URLに対応
コード例
src:
storyboard.yaml:
content: |-
Project: Futuristic City Reveal with Cinematic Lighting
- From text prompt to Wan 2.5 Preview video generation
- Lean camera move that circles around the hero subject
- Optional background score supplied via audio_url
- Use 1080p resolution and 10 second duration for presentation reels
- Deliver both vertical and landscape cuts for social media
- Include fallback prompts for negative details (noise, low quality)
agent_selection_reason: Gemini 2.5 Flash organizes requirements and prepares prompts for multi-agent video generation.
dependency: []
agent: gemini-2.5-flash-preview-04-17
api: []
video-generation:
wan25_preview_demo.mp4:
content: |-
Cinematic reveal of a cyberpunk city skyline at sunset.
The camera begins with a wide aerial shot, then glides around a lone android hero standing on a balcony.
Neon reflections ripple across glass towers while drones pass overhead.
Include atmospheric haze, volumetric light shafts, and dynamic clouds.
Keep movements smooth and emphasize premium cinematic lighting.
agent_selection_reason: Wan 2.5 Preview handles 1080p output, long motion, and nuanced lighting in 10 second clips.
dependency: []
agent: t2v-wan-25-preview
api: []
parameters:
duration: "5"
aspect_ratio: "16:9"
resolution: "1080p"
enable_prompt_expansion: true
negative_prompt: "low resolution, muted colors, jitter, artifacts"
t2v-wan-25-previewWan 2.1 Pro
高品質テキストから動画生成モデル。標準版より高解像度と詳細な表現が可能。最大時間: 5秒
t2v-wan-proHailuo T2V-01-Live
2Dイラストを生き生きとした動画に変換。滑らかな動きと鮮やかな表現で、キャラクターに命を吹き込みます。安定性と繊細な表現に最適化され、幅広い芸術スタイルをサポート。最大時間: 5秒
t2v-hailuo-t2v-01-liveHailuo T2V-01-Director
カメラ制御機能付きのテキストから動画生成モデル。映画的なストーリーテリングのための正確なカメラワークを実現。[Push in]や[Pan left]などのカメラ指示をプロンプトに含めることで、映画のような演出が可能
t2v-hailuo-t2v-01-directorKling 1.0
Klingの初代テキストから動画生成モデル。シンプルで使いやすいインターフェースと高品質な動画生成を実現。最大時間: 5秒
t2v-kling-1.0Kling 1.0 Pro
Kling 1.0の高品質版。より高度なレンダリングと精細なディテールを実現。最大時間: 5秒
t2v-kling-1.0-proKling 1.6 (std) Text to Video
高品質なテキストから動画生成が可能なKling 1.6モデル(標準版)
t2v-kling-1.6Kling 1.6 (pro) Text to Video
高品質なテキストから動画生成が可能なKling 1.6モデル(プロ版)。より高度な映像表現が可能。最大時間: 5秒
t2v-kling-1.6-proKling 2.0 Text to Video
次世代の高品質テキストから動画生成モデル。超高解像度・複雑なシーン・高度なカメラ/被写体制御に対応。最大時間: 15秒
t2v-kling-2.0Kling 2.1 Text to Video
Kling最新版の高品質テキストから動画生成モデル。v2.1 APIエンドポイントによる最新機能とパフォーマンス向上。最新技術による高品質動画生成。パラメータ: duration(5,10秒), aspect_ratio(16:9,9:16,1:1), negative_prompt(ネガティブプロンプト), cfg_scale(0.5デフォルト), seed(再現性用)
オプションパラメータ
- duration動画の長さ(5または10秒)。デフォルト: 5YAML設定: parameters.duration
- aspect_ratioアスペクト比(16:9, 9:16, 1:1)。デフォルト: 16:9YAML設定: parameters.aspect_ratio
- style映像スタイル(例: cinematic, fantasy, realistic)。オプションYAML設定: parameters.style
- seed再現性のための乱数シード(0-2147483647)。オプションYAML設定: parameters.seed
- negative_prompt生成を避ける要素の指定。デフォルト: 'blur, distort, and low quality'YAML設定: parameters.negative_prompt
- cfg_scaleプロンプトへの忠実度(0.0-1.0)。デフォルト: 0.5YAML設定: parameters.cfg_scale
ヒント
duration, aspect_ratio, negative_prompt, cfg_scaleはAPIでサポートされているパラメータです。styleパラメータはプロンプトの一部として処理されます。高品質な動画を生成するために、詳細で具体的なプロンプトを推奨します。
コード例
src:
video:
magical_forest.mp4:
content: |-
A magical forest at dawn with glowing fireflies dancing between ancient trees.
Soft mist rolls through the undergrowth as golden sunlight filters through the canopy.
Ethereal and cinematic atmosphere with smooth camera movement.
dependency: []
agent: "t2v-kling-2.1"
parameters:
duration: 10 # 5または10秒を指定
aspect_ratio: "16:9" # 16:9, 9:16, 1:1から選択
style: "cinematic fantasy" # スタイル指定(プロンプトに追加)
negative_prompt: "low quality, blurry, static camera" # 除外したい要素
cfg_scale: 0.7 # プロンプトへの忠実度(0.0-1.0)
seed: 123456 # 再現性のためのシード値(オプション)
api: []
# 最小構成の例
simple_scene.mp4:
content: "A serene lake at sunset with rippling water"
dependency: []
agent: "t2v-kling-2.1"
api: [] # parametersを省略するとデフォルト値が使用されますt2v-kling-2.1Kling 2.5 Turbo Pro
Kling 2.5 Turbo Proエンドポイントによる最新テキストから動画生成モデル。滑らかなモーションと高解像度映像を高速生成。パラメータ: duration(5,10秒), aspect_ratio(16:9,9:16,1:1), negative_prompt, cfg_scale, seed
オプションパラメータ
- duration動画の長さ(5または10秒)。デフォルト: 5YAML設定: parameters.duration
- aspect_ratioアスペクト比(16:9, 9:16, 1:1)。デフォルト: 16:9YAML設定: parameters.aspect_ratio
- negative_prompt生成を避ける要素の指定。デフォルト: 'blur, distort, and low quality'YAML設定: parameters.negative_prompt
- cfg_scaleプロンプトへの忠実度。デフォルト: 0.5YAML設定: parameters.cfg_scale
- seed再現性のための乱数シード(0-2147483647)。オプションYAML設定: parameters.seed
ヒント
動きのディテールを細かく記述したプロンプトが高品質な結果につながります。
コード例
src:
video:
futuristic_city.mp4:
content: |-
A futuristic city skyline at sunset with flying cars weaving between holographic billboards.
- Neon reflections on glass buildings
- Dynamic aerial traffic
- Warm cinematic lighting
dependency: []
agent: "t2v-kling-2.5-turbo-pro"
parameters:
duration: "5"
aspect_ratio: "16:9"
cfg_scale: 0.6
seed: 12345
api: []t2v-kling-2.5-turbo-proVidu Q1 Text to Video
agents.video.t2v.agents.t2v-vidu-q1.description
オプションパラメータ
- aspect_ratio動画のアスペクト比(16:9, 9:16, 1:1)YAML設定: parameters.aspect_ratio
- movement_amplitude動きの大きさ(auto, small, medium, large)YAML設定: parameters.movement_amplitude
- style映像スタイル(general, anime)YAML設定: parameters.style
- seed再現性のための乱数シードYAML設定: parameters.seed
ヒント
「movement_amplitude」を「auto」に設定すると、AIが自動的に適切な動きの大きさを判断します。「style」パラメータでは映像の全体的なスタイルを指定できます。
t2v-vidu-q1Pika v2 Turbo Text to Video
テキストプロンプトから高品質な動画を生成するPika v2 Turboモデル。高速処理で質の高い映像出力を実現。最大時間: 5秒
t2v-pika-v2-turboPika v2.1 Text to Video
テキストプロンプトから高品質な動画を生成するPika v2.1モデル。優れた映像表現と自然な動きを実現。最大時間: 5秒
t2v-pika-v2.1Pika v2.2 Text to Video
Pikaの最新テキストから高品質な動画を生成するモデル。テキストプロンプトから優れた映像表現と自然な動きを実現します。最大時間: 5秒
t2v-pika-v2.2Pixverse Text to Video
高品質なテキストから動画生成モデル。多様なスタイルオプションと解像度設定に対応。自然な動きと表現力豊かな映像を実現
t2v-pixversePixverse Fast Text to Video
高速なテキストから動画生成モデル。多様なスタイルオプションと解像度設定に対応。標準版より高速に処理が可能
t2v-pixverse-fastRay-2 Text to Video
Lumaの最先端Ray2モデルによる高品質なテキストから動画生成。リアルな映像と自然な動きを実現。テキストや画像入力に対応
t2v-ray-2Ray2 Flash
Lumaの高速テキストから動画生成モデル。Ray2の高品質を維持しながら高速処理を実現。最大時間: 5秒
t2v-ray-2-flashLuma Dream Machine
Lumaのクリエイティブテキストから動画生成モデル。芸術的で創造的な表現に最適。最大時間: 5秒
t2v-luma-dream-machineFast SVD Text to Video
高速なテキストから動画生成モデル。自然な動きと表現力豊かな映像を実現。カスタマイズ可能なモーションバケットIDとディープキャッシュ設定
t2v-fast-svdFast SVD LCM Text to Video
超高速なテキストから動画生成モデル。LCM(Latent Consistency Model)を活用し、少ないステップ数で高品質な動画を生成。自然な動きと表現力豊かな映像を実現
t2v-fast-svd-lcmMochi V1
高品質なテキストから動画生成モデル。自然な動きと表現力豊かな映像を実現。プロンプト拡張機能で創造性を向上
t2v-mochi-v1CogVideoX-5B
次世代テキストから動画生成モデル。高品質で自然な動きと表現力豊かな映像を実現。カスタマイズ可能なビデオサイズとフレームレート
t2v-cogvideox-5bT2V Turbo
超高速なテキストから動画生成モデル。少ないステップ数で高品質な動画を生成。自然な動きと表現力豊かな映像を実現。最大時間: 5秒
t2v-turboMiniMax Video 01
MiniMaxの高品質な動画生成モデル。汎用性の高いビデオコンテンツを生成します。最大時間: 5秒
t2v-minimax-video-01LTX Video v0.95
高品質テキストから動画生成モデル。自然な動きと表現力豊かな映像を生成。最大時間: 5秒
t2v-ltx-video-v095OpenAI Sora 2 Text to Video
OpenAIの高速テキスト→動画生成モデル。コンセプト検討やSNS向けクリップに最適で、自然なカメラワークを短時間で確認できます。
t2v-sora-2OpenAI Sora 2 Pro Text to Video
OpenAIのプロダクション向けSoraモデル。シネマティックな映像品質と安定した長尺モーションで、広告やマーケティング動画に適しています。
t2v-sora-2-pros2v
VEED Avatars Speech to Video
音声からアバター動画を生成するモデル。30種類のアバターから選択可能。音声に合わせてアバターが自然に話す動画を生成。依存音声ファイルの指定とdependency_wait: trueの設定が必須です。
必須パラメータ
- avatar_id使用するアバターID(必須)YAML設定: parameters.avatar_id例: elena_vertical_primary必須使用可能な値:emily_vertical_primary - Emily(縦向き・基本)emily_vertical_secondary - Emily(縦向き・セカンダリ)marcus_vertical_primary - Marcus(縦向き・基本)marcus_vertical_secondary - Marcus(縦向き・セカンダリ)mira_vertical_primary - Mira(縦向き・基本)mira_vertical_secondary - Mira(縦向き・セカンダリ)jasmine_vertical_primary - Jasmine(縦向き・基本)jasmine_vertical_secondary - Jasmine(縦向き・セカンダリ)jasmine_vertical_walking - Jasmine(縦向き・歩行)aisha_vertical_walking - Aisha(縦向き・歩行)elena_vertical_primary - Elena(縦向き・基本)elena_vertical_secondary - Elena(縦向き・セカンダリ)any_male_vertical_primary - 汎用男性(縦向き・基本)any_female_vertical_primary - 汎用女性(縦向き・基本)any_male_vertical_secondary - 汎用男性(縦向き・セカンダリ)any_female_vertical_secondary - 汎用女性(縦向き・セカンダリ)any_male_vertical_walking - 汎用男性(縦向き・歩行)any_female_vertical_walking - 汎用女性(縦向き・歩行)emily_primary - Emily(標準・基本)emily_side - Emily(標準・サイド)marcus_primary - Marcus(標準・基本)marcus_side - Marcus(標準・サイド)aisha_walking - Aisha(標準・歩行)elena_primary - Elena(標準・基本)elena_side - Elena(標準・サイド)any_male_primary - 汎用男性(標準・基本)any_female_primary - 汎用女性(標準・基本)any_male_side - 汎用男性(標準・サイド)any_female_side - 汎用女性(標準・サイド)
オプションパラメータ
- dependency音声ファイルの依存関係を指定。mp3, wav, m4a等の音声ファイルをサポートYAML設定: parameters.dependency
- dependency_wait依存関係の処理完了を待つかどうか。音声ファイル使用時は必須でtrueに設定YAML設定: parameters.dependency_wait
ヒント
音声ファイルを依存関係として指定し、dependency_wait: trueを設定することで、音声に同期したアバター動画を生成できます。アバターは縦向き(vertical)と横向きのバリエーションがあります。30種類のアバターから選択可能です。
コード例
src:
structure.yaml:
content: |-
Project: Speech to Avatar Video Project
- 音声からアバター動画を生成
- 30種類のアバターから選択可能
- 自然な口パクとジェスチャー
agent_selection_reason: Project structure definition
dependency: []
agent: claude-3-5-sonnet-20241022
api: []
audio:
sample_speech.mp3:
content: "こんにちは!私はVEED Avatarsを使用したアバターです。音声に合わせて自然に話すことができます。"
agent_selection_reason: 音声ファイルの生成
dependency: []
agent: t2s-gpt-4o-mini-tts
api: []
video:
avatar_video.mp4:
content: |-
音声からアバター動画を生成
- Emily(縦向き・基本)アバターを使用
- 音声に合わせた自然な口パクとジェスチャー
agent_selection_reason: s2v-veed-avatarsは音声からリアルなアバター動画を生成でき、30種類のアバターから選択可能
dependency:
- src/audio/sample_speech.mp3
dependency_wait: true
agent: s2v-veed-avatars
parameters:
avatar_id: emily_vertical_primary
api: []s2v-veed-avatarsi2vの使用例
Kling Image to Video v2.1
src:
structure.yaml:
content: |-
Project: Creating Innovative Digital Art Fusing Surrealism and Futurism
- Fantastical world of crystal islands floating on an ocean of liquid starlight
- Surreal landscape with clockwork mechanical trees and luminous butterflies
- Photorealistic yet dreamlike still image generation using t2i-imagen3
- Magical motion and cosmic energy animation using Kling i2v v2.1
- Unique visual expression where fantasy meets steampunk
- Mystical space with gravity-defying upward waterfalls and multiple moons
- Fantastical ecosystem of bioluminescent plants and cosmic energy flows
agent_selection_reason: Selected claude-3-5-sonnet-20241022 for its excellence in managing project structure design and multiple media generation requirements. Particularly suited for planning surreal artworks and integrated multimedia production management.
dependency: []
agent: claude-3-5-sonnet-20241022
api: []
image-generation:
beautifle_landscape.png:
content: A surreal dreamscape where floating crystal islands hover above an ocean of liquid starlight. Ancient clockwork trees with gears for leaves stretch toward a sky filled with multiple moons in different phases. Ethereal butterflies made of pure light weave between cascading waterfalls that flow upward, defying gravity. The entire scene is painted in vibrant purples, electric blues, and golden amber hues, creating a mystical atmosphere that blends fantasy with steampunk aesthetics. Intricate details include floating geometric structures, bioluminescent flora, and streams of cosmic energy connecting the floating islands.
agent_selection_reason: t2i-imagen3, Google's cutting-edge image generation model, excels at simultaneously expressing surreal elements and photorealistic textures. It particularly demonstrates advanced capabilities in convincingly depicting liquid starlight, luminous organisms, complex light interactions, and gravity-defying physical phenomena. It also shows superior ability in integrating the complex aesthetics of fantasy and steampunk fusion into a single work.
dependency: []
note: Prompts must be in English only.
agent: t2i-imagen3
api: []
video-generation:
beautifle_landscape.mp4:
content: |-
Transform this surreal dreamscape into a mesmerizing animated masterpiece.
The crystal islands gently rotate and pulse with inner light while floating gracefully.
Clockwork trees' gear-leaves turn slowly, creating hypnotic mechanical rhythms.
Light-butterflies dance in spiraling patterns, leaving trails of stardust.
The upward-flowing waterfalls shimmer and undulate with magical energy.
Multiple moons slowly orbit across the cosmic sky, casting shifting shadows.
Bioluminescent plants pulse in synchronized waves of color.
Streams of cosmic energy flow between islands like living aurora.
The liquid starlight ocean below ripples with celestial reflections.
Camera slowly pans across this fantastical realm with cinematic grandeur.
dependency:
- src/image-generation/beautifle_landscape.png
dependency_wait: true
agent: i2v-kling-v2.1
api: []
parameters:
duration: 5
aspect_ratio: "1:1"
negative_prompt: low quality, blurry, static camera
cfg_scale: 0.6Kling Image to Video v2.1 Standard
src:
structure.yaml:
content: |-
Project: Standard Quality Video Generation with Kling v2.1 Standard Edition
- High-quality image-to-video conversion with standard settings
- Multiple aspect ratio support (16:9, 9:16, 1:1)
- Duration options (5 or 10 seconds)
- Consistent and reliable video generation
agent_selection_reason: Using i2v-kling-2.1-standard for stable and consistent video generation with standard settings
agent: t2i-flux-schnell
dependency: []
image-generation:
sample-image.png:
content: |-
A serene landscape with a calm lake reflecting mountains
agent: t2i-flux-schnell
dependency: []
api: []
video-generation:
landscape-video.mp4:
content: |-
Gentle breeze creating ripples on the water surface
Clouds slowly drifting across the sky
Subtle light changes as time passes
Natural and peaceful atmosphere
dependency:
- src/image-generation/sample-image.png
dependency_wait: true
agent: i2v-kling-2.1-standard
api: []
parameters:
duration: 5
aspect_ratio: "16:9"
negative_prompt: low quality, unnatural movement
cfg_scale: 0.5Kling Image to Video v2.5 Turbo Pro
src:
structure.yaml:
content: |-
Project: Cinematic Orbit Shot of Futuristic Explorer
- Single still image converted into a moving shot
- Camera arcs around subject at sunset
- Tail frame highlights silhouette against the sun
agent_selection_reason: Selected i2v-kling-v2.5-turbo-pro for smooth cinematic motion.
dependency:
- src/local_image/explorer.png
dependency_wait: true
agent: i2v-kling-v2.5-turbo-pro
api: []
parameters:
duration: "10"
aspect_ratio: "16:9"
negative_prompt: blur, distort, and low quality
cfg_scale: 0.5ByteDance Seedance v1 Lite Reference to Video
src:
structure.yaml:
content: |-
Project: Cinematic Intro with Seedance Lite Reference-to-Video
- Use multiple reference stills to control motion
- Focus on neon-lit cyberpunk ambience and flowing garments
- Track the subject with a gentle forward-moving camera
agent_selection_reason: Using i2v-bytedance-seedance-v1-lite-reference-to-video for reference-driven motion control.
agent: t2i-flux-schnell
dependency: []
image-generation:
reference-main.png:
content: |-
A cyberpunk hero standing in a neon-lit alley, dramatic lighting on the coat.
agent: t2i-flux-schnell
dependency: []
api: []
reference-style.png:
content: |-
Stylized lighting accents and atmosphere for the same alley scene.
agent: t2i-flux-schnell
dependency: []
api: []
video-generation:
hero-intro.mp4:
content: |-
Generate a cinematic opener where the protagonist walks through the neon-lit alley, coat flowing in the wind. Maintain a gentle tracking shot from a slightly elevated angle.
dependency:
- src/image-generation/reference-main.png
- src/image-generation/reference-style.png
dependency_wait: true
agent: i2v-bytedance-seedance-v1-lite-reference-to-video
api: []
parameters:
aspect_ratio: "16:9"
resolution: "720p"
duration: "5"
camera_fixed: false
seed: -1ByteDance Seedance v1 Pro I2V
src:
structure.yaml:
content: |-
Project: Natural Motion Video Generation with ByteDance Seedance v1 Pro
- High-quality image-to-video conversion
- Camera motion control options
- Reproducible generation with seed values
- Multiple resolution support (720p/1080p)
agent_selection_reason: Using i2v-bytedance-seedance-v1-pro for high-quality motion generation with camera control
agent: t2i-flux-schnell
dependency: []
image-generation:
base-image.png:
content: |-
A peaceful garden scene with blooming flowers
agent: t2i-flux-schnell
dependency: []
api: []
video-generation:
garden-motion.mp4:
content: |-
Gentle breeze moving through the flowers, petals swaying naturally
Butterflies flying between the flowers
Soft sunlight filtering through leaves
dependency:
- src/image-generation/base-image.png
dependency_wait: true
agent: i2v-bytedance-seedance-v1-pro
api: []
parameters:
resolution: "1080p"
camera_fixed: false
seed: -1ByteDance OmniHuman v1.5
src:
structure.yaml:
content: |-
Project: Talking Avatar with OmniHuman
- Combine a portrait still with voice-over audio
- Generate expressive lip-sync aligned to speech
agent_selection_reason: Using i2v-bytedance-omnihuman-v1.5 for high-fidelity facial motion and lip-sync.
agent: claude-3-5-sonnet-20241022
dependency: []
image-generation:
avatar.png:
content: |-
A friendly presenter facing the camera with soft studio lighting.
agent: t2i-flux-schnell
dependency: []
api: []
audio:
voice-line.mp3:
content: |-
"Welcome to our product showcase. Let me guide you through the highlights."
agent: t2s-gpt-4o-mini-tts
dependency: []
api: []
video-generation:
talking-avatar.mp4:
content: |-
Synchronize the speech with natural facial expressions and subtle head movements.
dependency:
- src/image-generation/avatar.png
- src/audio/voice-line.mp3
dependency_wait: true
agent: i2v-bytedance-omnihuman-v1.5
api: []
parameters:
audio_url: src/audio/voice-line.mp3
MiniMax Hailuo-02 Pro I2V
src:
structure.yaml:
content: |-
Project: High-Quality Video Generation with MiniMax Hailuo-02 Pro
- Advanced image-to-video conversion with prompt optimization
- Natural and sophisticated video generation
- Enhanced detail and motion quality
agent_selection_reason: Using i2v-minimax-hailuo-02-pro for enhanced video quality with prompt optimization
agent: t2i-flux-schnell
dependency: []
image-generation:
source-image.png:
content: |-
A vibrant cityscape at golden hour with bustling street life
agent: t2i-flux-schnell
dependency: []
api: []
video-generation:
city-animation.mp4:
content: |-
Gentle movement of people walking through the streets
Soft lighting changes as the golden hour progresses
Natural urban atmosphere with subtle life and energy
Camera slowly pans across the vibrant cityscape
dependency:
- src/image-generation/source-image.png
dependency_wait: true
agent: i2v-minimax-hailuo-02-pro
api: []
parameters:
prompt_optimizer: trueWAN 2.5 Preview Image to Video
src:
structure.yaml:
content: |-
Project: Cinematic WAN 2.5 Preview shot
- Generate a 10 second tracking shot from a still hero image
- Maintain character fidelity while adding dynamic camera motion
- Use 1080p output for presentation footage
agent_selection_reason: Selecting i2v-wan-25-preview to leverage WAN 2.5 Preview's long clip support and smooth motion quality.
agent: claude-3-5-sonnet-20241022
dependency: []
image-generation:
hero-frame.png:
content: |-
A heroic warrior standing on a cliff at sunset, cape flowing in the wind.
agent: t2i-flux-pro
dependency: []
api: []
video-generation:
cinematic-shot.mp4:
content: |-
Create a 10-second 1080p clip with subtle camera push-in and atmospheric motion around the character.
dependency:
- src/image-generation/hero-frame.png
dependency_wait: true
agent: i2v-wan-25-preview
api: []
parameters:
duration: "5"
resolution: "1080p"
aspect_ratio: "16:9"
s2vの使用例
VEED Avatars
src:
structure.yaml:
content: |-
Project: Speech to Avatar Video Project
- 音声からアバター動画を生成
- 30種類のアバターから選択可能
- 自然な口パクとジェスチャー
agent_selection_reason: Project structure definition
dependency: []
agent: claude-3-5-sonnet-20241022
api: []
audio:
sample_speech.mp3:
content: "こんにちは!私はVEED Avatarsを使用したアバターです。音声に合わせて自然に話すことができます。"
agent_selection_reason: 音声ファイルの生成
dependency: []
agent: t2s-gpt-4o-mini-tts
api: []
video:
avatar_video.mp4:
content: |-
音声からアバター動画を生成
- Emily(縦向き・基本)アバターを使用
- 音声に合わせた自然な口パクとジェスチャー
agent_selection_reason: s2v-veed-avatarsは音声からリアルなアバター動画を生成でき、30種類のアバターから選択可能
dependency:
- src/audio/sample_speech.mp3
dependency_wait: true
agent: s2v-veed-avatars
parameters:
avatar_id: emily_vertical_primary
api: []AI Avatar Multi
src:
structure.yaml:
content: KAMUI Anime Avatar 8-Second Conversation Test
agent_selection_reason: プロジェクト構造定義とKAMUI日本語アバター機能のテスト
dependency: []
agent: claude-3-5-sonnet-20241022
api: []
audio:
japanese_greeting.mp3:
content: みなさん、こんにちは!新しいアニメアバターが登場しました!
agent_selection_reason: |-
t2s-minimax-speech-02-turboは日本語の自然な発音と抑揚に対応しており、
親しみやすい挨拶メッセージの生成に適しています。
dependency: []
agent: t2s-minimax-speech-02-turbo
parameters:
voice_setting:
voice_id: Decent_Boy
speed: 1.4
emotion: neutral
language_boost: Japanese
audio_setting:
format: mp3
sample_rate: 44100
api: []
japanese_response.mp3:
content: わあ、すごい!どんなことができるんですか?
agent_selection_reason: |-
t2s-minimax-speech-02-turboのDeep_Voice_Manを使用して男性の声で応答を生成。
対話の自然な流れを作るため、異なる音声IDを使用します。
dependency: []
agent: t2s-minimax-speech-02-turbo
parameters:
voice_setting:
voice_id: Lively_Girl
speed: 1.2
emotion: neutral
language_boost: Japanese
audio_setting:
format: mp3
sample_rate: 44100
api: []
image:
conversation_scene.jpg:
content: Animation Taste, Animation TasteAnimation Taste, Two realistic forest animals having an animated conversation in a beautiful woodland setting. A wise old brown bear sitting upright with expressive eyes and gentle facial expression, appearing to be speaking earnestly to a clever red fox who is sitting attentively with tilted head and bright, intelligent eyes showing curiosity. The bear's mouth is slightly open as if mid-sentence, with natural body language showing engagement. The fox has perked ears and an alert, listening posture. Surrounding them is a lush forest with dappled sunlight filtering through tall trees, creating a warm, magical atmosphere. Moss-covered rocks and wildflowers scattered around. Photorealistic style with incredible detail in fur texture, natural lighting, and authentic woodland environment. The scene captures the essence of two friends sharing stories in nature.
agent_selection_reason: t2i-flux-proを使用してアニメテイストの男女キャラクターを生成。FLUX
dependency: []
agent: t2i-imagen4
api: []
video:
kamui_japanese_avatar_conversation.mp4:
content: |-
Two Japanese professionals having a friendly conversation about the new KAMUI grimoire update in a modern office setting.
Natural dialogue flow with expressive gestures and eye contact, showcasing the advanced Japanese language avatar capabilities.
agent_selection_reason: s2v-ai-avatar-multiはデュアル音声対応でWise_WomanとDeep_Voice_Manの2つの声を使った自然な日本語対話動画を生成
dependency:
- src/audio/japanese_greeting.mp3
- src/audio/japanese_response.mp3
- src/image/conversation_scene.jpg
dependency_wait: true
agent: s2v-ai-avatar-multi
parameters:
num_frames: 192
turbo: true
seed: 12345
api: []t2vの使用例
Wan 2.5 Preview Text to Video
src:
storyboard.yaml:
content: |-
Project: Futuristic City Reveal with Cinematic Lighting
- From text prompt to Wan 2.5 Preview video generation
- Lean camera move that circles around the hero subject
- Optional background score supplied via audio_url
- Use 1080p resolution and 10 second duration for presentation reels
- Deliver both vertical and landscape cuts for social media
- Include fallback prompts for negative details (noise, low quality)
agent_selection_reason: Gemini 2.5 Flash organizes requirements and prepares prompts for multi-agent video generation.
dependency: []
agent: gemini-2.5-flash-preview-04-17
api: []
video-generation:
wan25_preview_demo.mp4:
content: |-
Cinematic reveal of a cyberpunk city skyline at sunset.
The camera begins with a wide aerial shot, then glides around a lone android hero standing on a balcony.
Neon reflections ripple across glass towers while drones pass overhead.
Include atmospheric haze, volumetric light shafts, and dynamic clouds.
Keep movements smooth and emphasize premium cinematic lighting.
agent_selection_reason: Wan 2.5 Preview handles 1080p output, long motion, and nuanced lighting in 10 second clips.
dependency: []
agent: t2v-wan-25-preview
api: []
parameters:
duration: "5"
aspect_ratio: "16:9"
resolution: "1080p"
enable_prompt_expansion: true
negative_prompt: "low resolution, muted colors, jitter, artifacts"
Kling 2.1 Text to Video
src:
video:
magical_forest.mp4:
content: |-
A magical forest at dawn with glowing fireflies dancing between ancient trees.
Soft mist rolls through the undergrowth as golden sunlight filters through the canopy.
Ethereal and cinematic atmosphere with smooth camera movement.
dependency: []
agent: "t2v-kling-2.1"
parameters:
duration: 10 # 5または10秒を指定
aspect_ratio: "16:9" # 16:9, 9:16, 1:1から選択
style: "cinematic fantasy" # スタイル指定(プロンプトに追加)
negative_prompt: "low quality, blurry, static camera" # 除外したい要素
cfg_scale: 0.7 # プロンプトへの忠実度(0.0-1.0)
seed: 123456 # 再現性のためのシード値(オプション)
api: []
# 最小構成の例
simple_scene.mp4:
content: "A serene lake at sunset with rippling water"
dependency: []
agent: "t2v-kling-2.1"
api: [] # parametersを省略するとデフォルト値が使用されますKling 2.5 Turbo Pro
src:
video:
futuristic_city.mp4:
content: |-
A futuristic city skyline at sunset with flying cars weaving between holographic billboards.
- Neon reflections on glass buildings
- Dynamic aerial traffic
- Warm cinematic lighting
dependency: []
agent: "t2v-kling-2.5-turbo-pro"
parameters:
duration: "5"
aspect_ratio: "16:9"
cfg_scale: 0.6
seed: 12345
api: []s2vの使用例
VEED Avatars Speech to Video
src:
structure.yaml:
content: |-
Project: Speech to Avatar Video Project
- 音声からアバター動画を生成
- 30種類のアバターから選択可能
- 自然な口パクとジェスチャー
agent_selection_reason: Project structure definition
dependency: []
agent: claude-3-5-sonnet-20241022
api: []
audio:
sample_speech.mp3:
content: "こんにちは!私はVEED Avatarsを使用したアバターです。音声に合わせて自然に話すことができます。"
agent_selection_reason: 音声ファイルの生成
dependency: []
agent: t2s-gpt-4o-mini-tts
api: []
video:
avatar_video.mp4:
content: |-
音声からアバター動画を生成
- Emily(縦向き・基本)アバターを使用
- 音声に合わせた自然な口パクとジェスチャー
agent_selection_reason: s2v-veed-avatarsは音声からリアルなアバター動画を生成でき、30種類のアバターから選択可能
dependency:
- src/audio/sample_speech.mp3
dependency_wait: true
agent: s2v-veed-avatars
parameters:
avatar_id: emily_vertical_primary
api: []