動画生成AIエージェント

高品質な動画生成と編集を行うAIエージェント

i2v

Kling Image to Video

v1.0

画像から高品質な動画を生成するKlingモデル。元画像の特徴を保ちながら自然な動きを付加し、テキストプロンプトで動きの方向性を指定可能

Maxtime: 5s
i2v-kling-v1

Kling Image to Video Pro

v1.0

画像から高品質な動画を生成するKling Proモデル。元画像の特徴を保ちながら自然な動きを付加し、テキストプロンプトで動きの方向性を指定可能。標準版より高品質な出力が可能。静的・動的マスクによるモーションコントロールにも対応

Maxtime: 5s
i2v-kling-v1-pro

Kling Image to Video v1.5 Pro

v1.5

Kling v1.5 Proの画像から動画生成モデル。高品質で自然な動きの動画を生成。標準版より高度な表現力と長い生成時間に対応。依存画像の指定とdependency_wait: trueの設定が必須です。最大時間: 10秒

Maxtime: 5s
i2v-kling-v1.5-pro

Kling Image to Video v1.6

v1.6

Kling v1.6の画像から動画生成モデル。最新版での自然な動きと高品質な映像表現を実現。多様なスタイルに対応。依存画像の指定とdependency_wait: trueの設定が必須です。最大時間: 5秒

Maxtime: 5s
i2v-kling-v1.6

Kling Image to Video v2.0

v1.6

Kling v2.0の画像から動画生成モデル。超高解像度と複雑なシーンの動画変換が可能。依存画像の指定とdependency_wait: trueの設定が必須です。

Maxtime: 5s
i2v-kling-v2.0

Kling Image to Video v2.1

v2.1

Kling v2.1の最新画像から動画生成モデル。v2.0よりさらに向上した動画品質と安定性を実現。複数のアスペクト比と動画長に対応。依存画像の指定とdependency_wait: trueの設定が必須です。

オプションパラメータ

  • duration動画の長さ(5または10秒)。デフォルト: "5"YAML設定: parameters.duration
  • aspect_ratioアスペクト比("16:9", "9:16", "1:1")。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
  • negative_prompt生成を避ける要素の指定。デフォルト: "blur, distort, and low quality"YAML設定: parameters.negative_prompt
  • cfg_scaleCFG(Classifier Free Guidance)スケール。プロンプトへの忠実度(0.0-1.0)。デフォルト: 0.5YAML設定: parameters.cfg_scale

ヒント

開始画像は依存画像として指定します。durationとaspect_ratioは文字列で指定する必要があります。高品質な動画を生成するために、詳細で具体的なプロンプトを推奨します。

Maxtime: 10s

コード例

src:
  structure.yaml:
    content: |-
      Project: Creating Innovative Digital Art Fusing Surrealism and Futurism
      - Fantastical world of crystal islands floating on an ocean of liquid starlight
      - Surreal landscape with clockwork mechanical trees and luminous butterflies
      - Photorealistic yet dreamlike still image generation using t2i-imagen3
      - Magical motion and cosmic energy animation using Kling i2v v2.1
      - Unique visual expression where fantasy meets steampunk
      - Mystical space with gravity-defying upward waterfalls and multiple moons
      - Fantastical ecosystem of bioluminescent plants and cosmic energy flows
    agent_selection_reason: Selected claude-3-5-sonnet-20241022 for its excellence in managing project structure design and multiple media generation requirements. Particularly suited for planning surreal artworks and integrated multimedia production management.
    dependency: []
    agent: claude-3-5-sonnet-20241022
    api: []
  image-generation:
    beautifle_landscape.png:
      content: A surreal dreamscape where floating crystal islands hover above an ocean of liquid starlight. Ancient clockwork trees with gears for leaves stretch toward a sky filled with multiple moons in different phases. Ethereal butterflies made of pure light weave between cascading waterfalls that flow upward, defying gravity. The entire scene is painted in vibrant purples, electric blues, and golden amber hues, creating a mystical atmosphere that blends fantasy with steampunk aesthetics. Intricate details include floating geometric structures, bioluminescent flora, and streams of cosmic energy connecting the floating islands.
      agent_selection_reason: t2i-imagen3, Google's cutting-edge image generation model, excels at simultaneously expressing surreal elements and photorealistic textures. It particularly demonstrates advanced capabilities in convincingly depicting liquid starlight, luminous organisms, complex light interactions, and gravity-defying physical phenomena. It also shows superior ability in integrating the complex aesthetics of fantasy and steampunk fusion into a single work.
      dependency: []
      note: Prompts must be in English only.
      agent: t2i-imagen3
      api: []
  video-generation:
    beautifle_landscape.mp4:
      content: |-
        Transform this surreal dreamscape into a mesmerizing animated masterpiece.
        The crystal islands gently rotate and pulse with inner light while floating gracefully.
        Clockwork trees' gear-leaves turn slowly, creating hypnotic mechanical rhythms.
        Light-butterflies dance in spiraling patterns, leaving trails of stardust.
        The upward-flowing waterfalls shimmer and undulate with magical energy.
        Multiple moons slowly orbit across the cosmic sky, casting shifting shadows.
        Bioluminescent plants pulse in synchronized waves of color.
        Streams of cosmic energy flow between islands like living aurora.
        The liquid starlight ocean below ripples with celestial reflections.
        Camera slowly pans across this fantastical realm with cinematic grandeur.
      dependency:
        - src/image-generation/beautifle_landscape.png
      dependency_wait: true
      agent: i2v-kling-v2.1
      api: []
      parameters:
        duration: 5
        aspect_ratio: "1:1"
        negative_prompt: low quality, blurry, static camera
        cfg_scale: 0.6
i2v-kling-v2.1

Kling Image to Video v2.1 Standard

v2.1

Kling v2.1 Standardの画像から動画生成モデル。マスター版と同じ高品質を標準的な設定で提供。複数のアスペクト比と動画長に対応。依存画像の指定とdependency_wait: trueの設定が必須です。

オプションパラメータ

  • duration動画の長さ(5または10秒)。デフォルト: "5"YAML設定: parameters.duration
  • aspect_ratioアスペクト比("16:9", "9:16", "1:1")。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
  • negative_prompt生成を避ける要素の指定。デフォルト: "blur, distort, and low quality"YAML設定: parameters.negative_prompt
  • cfg_scaleCFG(Classifier Free Guidance)スケール。プロンプトへの忠実度(0.0-1.0)。デフォルト: 0.5YAML設定: parameters.cfg_scale

ヒント

マスター版と同じAPIパラメータを使用しますが、標準設定による安定した生成が期待できます。開始画像は依存画像として指定します。durationとaspect_ratioは文字列で指定する必要があります。

Maxtime: 10s

コード例

src:
  structure.yaml:
    content: |-
      Project: Standard Quality Video Generation with Kling v2.1 Standard Edition
      - High-quality image-to-video conversion with standard settings
      - Multiple aspect ratio support (16:9, 9:16, 1:1)
      - Duration options (5 or 10 seconds)
      - Consistent and reliable video generation
    agent_selection_reason: Using i2v-kling-2.1-standard for stable and consistent video generation with standard settings
    agent: t2i-flux-schnell
    dependency: []
  image-generation:
    sample-image.png:
      content: |-
        A serene landscape with a calm lake reflecting mountains
      agent: t2i-flux-schnell
      dependency: []
      api: []
  video-generation:
    landscape-video.mp4:
      content: |-
        Gentle breeze creating ripples on the water surface
        Clouds slowly drifting across the sky
        Subtle light changes as time passes
        Natural and peaceful atmosphere
      dependency:
        - src/image-generation/sample-image.png
      dependency_wait: true
      agent: i2v-kling-2.1-standard
      api: []
      parameters:
        duration: 5
        aspect_ratio: "16:9"
        negative_prompt: low quality, unnatural movement
        cfg_scale: 0.5
i2v-kling-2.1-standard

Kling Image to Video v2.5 Turbo Pro

v2.5 Turbo Pro

Kling v2.5 Turbo Proの画像から動画生成モデル。Turbo Pro版ならではの滑らかなカメラワークと高精細で映画的な映像表現が可能。依存画像の指定とdependency_wait: trueの設定が必須です。tail_image_urlで動画の終了フレームも制御できます。

オプションパラメータ

  • duration動画の長さ(5または10秒)。デフォルト: "5"YAML設定: parameters.duration
  • aspect_ratioアスペクト比("16:9", "9:16", "1:1")。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
  • negative_prompt生成を避ける要素の指定。デフォルト: "blur, distort, and low quality"YAML設定: parameters.negative_prompt
  • cfg_scaleCFG(Classifier Free Guidance)スケール。プロンプトへの忠実度(0.0-1.0)。デフォルト: 0.5YAML設定: parameters.cfg_scale

ヒント

開始画像は依存画像として指定し、durationとaspect_ratioは文字列で指定してください。

Maxtime: 10s

コード例

src:
  structure.yaml:
    content: |-
      Project: Cinematic Orbit Shot of Futuristic Explorer
      - Single still image converted into a moving shot
      - Camera arcs around subject at sunset
      - Tail frame highlights silhouette against the sun
    agent_selection_reason: Selected i2v-kling-v2.5-turbo-pro for smooth cinematic motion.
    dependency:
      - src/local_image/explorer.png
    dependency_wait: true
    agent: i2v-kling-v2.5-turbo-pro
    api: []
    parameters:
      duration: "10"
      aspect_ratio: "16:9"
      negative_prompt: blur, distort, and low quality
      cfg_scale: 0.5
i2v-kling-v2.5-turbo-pro

Kling Image to Video v1.6 Pro

v1.6

Kling v1.6 Proの高品質画像から動画生成モデル。最新のPro版で、より長い動画生成時間と高度な映像表現が可能。開始画像から終了画像への自然な遷移も設定可能(オプション)。依存画像の指定とdependency_wait: trueの設定が必須です。

オプションパラメータ

  • start_image_url開始画像のパス(オプション)YAML設定: parameters.start_image_url
  • end_image_url終了画像のパス(オプション)。指定すると開始画像から終了画像へスムーズに遷移する動画が生成されますYAML設定: parameters.end_image_url

ヒント

スタートエンドで画像を指定する場合は、最低2つの依存画像が必要です。指定がない場合は開始画像のみから通常の動画が生成されます。

Maxtime: 5s
i2v-kling-v1.6-pro

ByteDance Seedance v1 Lite Reference to Video

v1.0 Lite

ByteDance Seedance v1 Liteの参照画像から動画生成モデル。最大4枚の参照画像とテキストで、構図と動きを制御した高品質動画を生成できます。

オプションパラメータ

  • prompt生成する動画の説明。参照画像にどのような動きを付けるか詳細に記述YAML設定: parameters.prompt
  • reference_image_urls参照画像URLの配列(1〜4件)。依存画像を指定する場合はdependency_wait: trueを推奨YAML設定: parameters.reference_image_urls
  • aspect_ratio動画のアスペクト比(デフォルト: auto。21:9, 16:9, 4:3, 1:1, 3:4, 9:16, auto)YAML設定: parameters.aspect_ratio
  • resolution動画解像度(デフォルト: 720p。480p/720pに対応)YAML設定: parameters.resolution
  • duration動画の長さ(秒)。デフォルト: 5。3〜12秒に対応YAML設定: parameters.duration
  • camera_fixedカメラモーションを固定するか。デフォルト: falseYAML設定: parameters.camera_fixed
  • enable_safety_checkerセーフティチェッカーを有効化するか。デフォルト: trueYAML設定: parameters.enable_safety_checker
  • seedシード値(-1でランダム)。デフォルト: -1YAML設定: parameters.seed

ヒント

参照画像を依存ファイルとして指定する場合は dependency_wait: true を設定し、1〜4枚までの画像を読み込ませてください。

Maxtime: 12s

コード例

src:
  structure.yaml:
    content: |-
      Project: Cinematic Intro with Seedance Lite Reference-to-Video
      - Use multiple reference stills to control motion
      - Focus on neon-lit cyberpunk ambience and flowing garments
      - Track the subject with a gentle forward-moving camera
    agent_selection_reason: Using i2v-bytedance-seedance-v1-lite-reference-to-video for reference-driven motion control.
    agent: t2i-flux-schnell
    dependency: []
  image-generation:
    reference-main.png:
      content: |-
        A cyberpunk hero standing in a neon-lit alley, dramatic lighting on the coat.
      agent: t2i-flux-schnell
      dependency: []
      api: []
    reference-style.png:
      content: |-
        Stylized lighting accents and atmosphere for the same alley scene.
      agent: t2i-flux-schnell
      dependency: []
      api: []
  video-generation:
    hero-intro.mp4:
      content: |-
        Generate a cinematic opener where the protagonist walks through the neon-lit alley, coat flowing in the wind. Maintain a gentle tracking shot from a slightly elevated angle.
      dependency:
        - src/image-generation/reference-main.png
        - src/image-generation/reference-style.png
      dependency_wait: true
      agent: i2v-bytedance-seedance-v1-lite-reference-to-video
      api: []
      parameters:
        aspect_ratio: "16:9"
        resolution: "720p"
        duration: "5"
        camera_fixed: false
        seed: -1
i2v-bytedance-seedance-v1-lite-reference-to-video

ByteDance Seedance v1 Pro I2V

v1.0 Pro

ByteDance Seedance v1 Proの画像から動画生成モデル。高品質で自然な動きの動画を生成し、プロンプトに忠実な映像表現が可能。依存画像の指定とdependency_wait: trueの設定が必須です。

オプションパラメータ

  • prompt生成する動画の説明。画像の内容と動きを詳細に記述YAML設定: parameters.prompt
  • resolution生成する動画の解像度("720p", "1080p")。デフォルト: "1080p"YAML設定: parameters.resolution
  • duration生成する動画の長さ(秒)。デフォルト: "5"(固定値)YAML設定: parameters.duration
  • camera_fixedカメラを固定するかどうか。デフォルト: falseYAML設定: parameters.camera_fixed
  • seedシード値(-1でランダム)。デフォルト: -1YAML設定: parameters.seed

ヒント

カメラモーションを制御したい場合は camera_fixed: true を設定します。同じシード値を使用することで、同じプロンプトから同じ動画を再現できます。

Maxtime: 5s

コード例

src:
  structure.yaml:
    content: |-
      Project: Natural Motion Video Generation with ByteDance Seedance v1 Pro
      - High-quality image-to-video conversion
      - Camera motion control options
      - Reproducible generation with seed values
      - Multiple resolution support (720p/1080p)
    agent_selection_reason: Using i2v-bytedance-seedance-v1-pro for high-quality motion generation with camera control
    agent: t2i-flux-schnell
    dependency: []
  image-generation:
    base-image.png:
      content: |-
        A peaceful garden scene with blooming flowers
      agent: t2i-flux-schnell
      dependency: []
      api: []
  video-generation:
    garden-motion.mp4:
      content: |-
        Gentle breeze moving through the flowers, petals swaying naturally
        Butterflies flying between the flowers
        Soft sunlight filtering through leaves
      dependency:
        - src/image-generation/base-image.png
      dependency_wait: true
      agent: i2v-bytedance-seedance-v1-pro
      api: []
      parameters:
        resolution: "1080p"
        camera_fixed: false
        seed: -1
i2v-bytedance-seedance-v1-pro

ByteDance OmniHuman v1.5

v1.5

ByteDance OmniHuman v1.5の画像と音声から動画生成モデル。人物画像と音声ファイルを入力し、音声に合わせた自然な口元・表情・身体の動きを再現するトーキングヘッド動画を生成します。依存画像と音声の指定、および dependency_wait: true の設定が必須です。

必須パラメータ

  • audio_url
    必須
    音声ファイルのURL(必須)。30秒以内の音声を指定YAML設定: parameters.audio_url

ヒント

依存関係として人物画像と音声ファイルを登録し、dependency_wait: true を設定してください。

Maxtime: 30s

コード例

src:
  structure.yaml:
    content: |-
      Project: Talking Avatar with OmniHuman
      - Combine a portrait still with voice-over audio
      - Generate expressive lip-sync aligned to speech
    agent_selection_reason: Using i2v-bytedance-omnihuman-v1.5 for high-fidelity facial motion and lip-sync.
    agent: claude-3-5-sonnet-20241022
    dependency: []
  image-generation:
    avatar.png:
      content: |-
        A friendly presenter facing the camera with soft studio lighting.
      agent: t2i-flux-schnell
      dependency: []
      api: []
  audio:
    voice-line.mp3:
      content: |-
        "Welcome to our product showcase. Let me guide you through the highlights."
      agent: t2s-gpt-4o-mini-tts
      dependency: []
      api: []
  video-generation:
    talking-avatar.mp4:
      content: |-
        Synchronize the speech with natural facial expressions and subtle head movements.
      dependency:
        - src/image-generation/avatar.png
        - src/audio/voice-line.mp3
      dependency_wait: true
      agent: i2v-bytedance-omnihuman-v1.5
      api: []
      parameters:
        audio_url: src/audio/voice-line.mp3
i2v-bytedance-omnihuman-v1.5

MiniMax Video-01 I2V

v1.0

MiniMaxの画像から動画生成モデル。高品質で自然な動きの動画を生成。依存画像の指定とdependency_wait: trueの設定が必須です

Maxtime: 5s
i2v-minimax-video-01

MiniMax Video-01 Live I2V

v1.0

MiniMaxのリアルタイム最適化された画像から動画生成モデル。高速な処理と自然な動きを両立。依存画像の指定とdependency_wait: trueの設定が必須です

Maxtime: 5s
i2v-minimax-video-01-live

MiniMax Subject Reference I2V

v1.0

MiniMaxの被写体参照型画像から動画生成モデル。被写体の特徴を保ちながら自然な動きを付加。依存画像の指定とdependency_wait: trueの設定が必須です

Maxtime: 5s
i2v-minimax-video-01-subject-reference

MiniMax Director I2V

v1.0

MiniMaxのディレクター指示型画像から動画生成モデル。詳細な演出指示に基づく動画生成が可能。依存画像の指定とdependency_wait: trueの設定が必須です

Maxtime: 5s
i2v-minimax-video-01-director

MiniMax Hailuo-02 Pro I2V

v02-pro

MiniMax Hailuo-02 Proの高品質画像から動画生成モデル。プロンプト最適化機能により、より自然で洗練された動画を生成します。依存画像の指定とdependency_wait: trueの設定が必須です。

オプションパラメータ

  • prompt_optimizerプロンプト最適化機能の有効/無効。デフォルト: trueYAML設定: parameters.prompt_optimizer

ヒント

プロンプト最適化機能により、自動的により詳細で適切なプロンプトに変換されます。依存画像として指定された開始画像を基に、自然で洗練された動画を生成します。

Maxtime: 5s

コード例

src:
  structure.yaml:
    content: |-
      Project: High-Quality Video Generation with MiniMax Hailuo-02 Pro
      - Advanced image-to-video conversion with prompt optimization
      - Natural and sophisticated video generation
      - Enhanced detail and motion quality
    agent_selection_reason: Using i2v-minimax-hailuo-02-pro for enhanced video quality with prompt optimization
    agent: t2i-flux-schnell
    dependency: []
  image-generation:
    source-image.png:
      content: |-
        A vibrant cityscape at golden hour with bustling street life
      agent: t2i-flux-schnell
      dependency: []
      api: []
  video-generation:
    city-animation.mp4:
      content: |-
        Gentle movement of people walking through the streets
        Soft lighting changes as the golden hour progresses
        Natural urban atmosphere with subtle life and energy
        Camera slowly pans across the vibrant cityscape
      dependency:
        - src/image-generation/source-image.png
      dependency_wait: true
      agent: i2v-minimax-hailuo-02-pro
      api: []
      parameters:
        prompt_optimizer: true
i2v-minimax-hailuo-02-pro

WAN Image to Video

v1.0

WANの画像から動画生成モデル。高品質で自然な動きの動画を生成。多様な解像度とアスペクト比に対応。依存画像の指定とdependency_wait: trueの設定が必須です

Maxtime: 4s
i2v-wan

WAN 2.5 Preview Image to Video

v2.5 Preview

WAN 2.5 Previewの画像から動画生成モデル。5秒/10秒の動画生成に対応し、プレビュー版ながら滑らかなモーションと1080p出力を実現。依存画像の指定とdependency_wait: trueの設定が必須です

Maxtime: 10s

コード例

src:
  structure.yaml:
    content: |-
      Project: Cinematic WAN 2.5 Preview shot
      - Generate a 10 second tracking shot from a still hero image
      - Maintain character fidelity while adding dynamic camera motion
      - Use 1080p output for presentation footage
    agent_selection_reason: Selecting i2v-wan-25-preview to leverage WAN 2.5 Preview's long clip support and smooth motion quality.
    agent: claude-3-5-sonnet-20241022
    dependency: []
  image-generation:
    hero-frame.png:
      content: |-
        A heroic warrior standing on a cliff at sunset, cape flowing in the wind.
      agent: t2i-flux-pro
      dependency: []
      api: []
  video-generation:
    cinematic-shot.mp4:
      content: |-
        Create a 10-second 1080p clip with subtle camera push-in and atmospheric motion around the character.
      dependency:
        - src/image-generation/hero-frame.png
      dependency_wait: true
      agent: i2v-wan-25-preview
      api: []
      parameters:
        duration: "5"
        resolution: "1080p"
        aspect_ratio: "16:9"
i2v-wan-25-preview

WAN Image to Video Pro

v1.0

WANの高品質版画像から動画生成モデル。標準版より高精細な映像表現が可能。より多くの推論ステップによる高品質な動画生成。依存画像の指定とdependency_wait: trueの設定が必須です

Maxtime: 4s
i2v-wan-pro

WAN Effects Image to Video

v1.0

WANの特殊効果適用型画像から動画生成モデル。ズームイン、ズームアウト等の様々なエフェクトを自動適用。依存画像の指定とdependency_wait: trueの設定が必須です

Maxtime: 4s
i2v-wan-effects

Hunyuan Video I2V

v1.0

Hunyuanの画像から動画生成モデル。高いフレームレートと解像度で滑らかな動画を生成。依存画像の指定とdependency_wait: trueの設定が必須です

Maxtime: 5s
i2v-hunyuan-video

Hunyuan Video LoRA I2V

v1.0

HunyuanのLoRA適用画像から動画生成モデル。カスタムLoRAを適用して特定のスタイルやテーマの動画を生成。依存画像の指定とdependency_wait: trueの設定が必須です

Maxtime: 5s
i2v-hunyuan-video-lora

Veo 3.1 Image to Video

v3.1

agents.video.i2v.agents.i2v-veo3-1.description

オプションパラメータ

  • aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
  • resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
  • generate_audio音声付き動画を生成する場合は true。不要な場合は false。YAML設定: parameters.generate_audio
  • duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration

ヒント

被写体の動きやカメラワーク、スタイルを具体的にプロンプトへ記述すると効果的です。音声が不要な場合は generate_audio を false に設定してください。

Maxtime: 8s
i2v-veo3.1

Veo 3.1 Fast Image to Video

v3.1 Fast

agents.video.i2v.agents.i2v-veo3-1-fast-image-to-video.description

オプションパラメータ

  • aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
  • resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
  • generate_audio音声付き動画を生成する場合は true。不要な場合は false。false にするとクレジットを節約できます。YAML設定: parameters.generate_audio
  • duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration

ヒント

被写体の動きやカメラワーク、演出イメージを具体的に記述すると滑らかなアニメーションになります。ローカル画像を使用する際は dependency_wait: true を忘れずに。

Maxtime: 8s
i2v-veo3.1-fast-image-to-video

Veo 3.1 Reference to Video

v3.1

agents.video.i2v.agents.i2v-veo3-1-reference-to-video.description

オプションパラメータ

  • image_urls参照画像URLの配列。依存画像を指定すると自動的にFal.aiストレージURLへ変換されますYAML設定: parameters.image_urls
  • aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
  • resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
  • generate_audio音声付き動画を生成する場合は true。不要な場合は false。YAML設定: parameters.generate_audio
  • duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration

ヒント

参照画像ごとにポーズや角度を変えると滑らかな被写体遷移が得られます。local_imageを依存画像に使う場合は dependency_wait: true を設定してください。

Maxtime: 8s
i2v-veo3.1-reference-to-video

Veo 3.1 First/Last Frame

v3.1

agents.video.i2v.agents.i2v-veo3-1-first-last-frame-to-video.description

オプションパラメータ

  • first_frame_url開始フレームの画像パス。依存画像から解決される場合は省略可能ですYAML設定: parameters.first_frame_url
  • last_frame_url終了フレームの画像パス。依存画像から解決される場合は省略可能ですYAML設定: parameters.last_frame_url
  • aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
  • resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
  • generate_audio音声付き動画を生成する場合は true。不要な場合は false。YAML設定: parameters.generate_audio
  • duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration

ヒント

開始と終了の2フレームを的確に選び、プロンプトでは動き方・カメラワーク・雰囲気を丁寧に指定すると上質な補間結果が得られます。音声が不要な場合は generate_audio を false に設定してください。

Maxtime: 8s
i2v-veo3.1-first-last-frame-to-video

Veo 3.1 First/Last Frame (Fast)

v3.1 Fast

agents.video.i2v.agents.i2v-veo3-1-fast-first-last-frame-to-video.description

オプションパラメータ

  • first_frame_url開始フレームの画像パス。依存画像から解決される場合は省略可能ですYAML設定: parameters.first_frame_url
  • last_frame_url終了フレームの画像パス。依存画像から解決される場合は省略可能ですYAML設定: parameters.last_frame_url
  • aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
  • resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
  • generate_audio音声付き動画を生成する場合は true。不要な場合は false。YAML設定: parameters.generate_audio
  • duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration

ヒント

開始フレームと終了フレームの2枚を依存画像として必ず用意してください。動きの説明やカメラワーク、雰囲気をプロンプトで詳細に指定すると表現力が向上します。音声が不要な場合は generate_audio を false に設定してください。

Maxtime: 8s
i2v-veo3.1-fast-first-last-frame-to-video

Ray 2 Image to Video

v1.0

Lumaの高品質画像から動画生成モデル。リアルな動きと詳細な表現を実現。多様なアスペクト比と解像度に対応。オプションとして終了画像(end_image_url)を指定することで開始画像から終了画像へのスムーズな遷移も可能。依存画像の指定とdependency_wait: trueの設定が必須です

オプションパラメータ

  • start_image_url開始画像のパス(オプション)YAML設定: parameters.start_image_url
  • end_image_url終了画像のパス(オプション)。指定すると開始画像から終了画像へスムーズに遷移する動画が生成されますYAML設定: parameters.end_image_url

ヒント

スタートエンドで画像を指定する場合は、最低2つの依存画像が必要です。指定がない場合は開始画像のみから通常の動画が生成されます。

Maxtime: 5s
i2v-ray-2

Luma Dream Machine I2V

v1.5

Lumaの画像から動画生成モデル。創造的でアーティスティックな動画表現が可能。多様なアスペクト比と解像度に対応。オプションとして終了画像(end_image_url)を指定することで開始画像から終了画像へのスムーズな遷移も可能。依存画像の指定とdependency_wait: trueの設定が必須です

オプションパラメータ

  • start_image_url開始画像のパス(オプション)YAML設定: parameters.start_image_url
  • end_image_url終了画像のパス(オプション)。指定すると開始画像から終了画像へスムーズに遷移する動画が生成されますYAML設定: parameters.end_image_url

ヒント

スタートエンドで画像を指定する場合は、最低2つの依存画像が必要です。指定がない場合は開始画像のみから通常の動画が生成されます。

Maxtime: 5s
i2v-luma-dream-machine

Vidu Image to Video

v1.0

Viduの画像から動画生成モデル。優れた画質と自然な動きで一枚の画像から映像表現を実現。動きの大きさを調整可能。依存画像の指定とdependency_wait: trueの設定が必須です。

Maxtime: 4s
i2v-vidu

Vidu Reference Image to Video

v1.0

Viduの参照画像を使った動画生成モデル。複数の参照画像から一貫した被写体表現を維持した動画を生成。依存画像の指定とdependency_wait: trueの設定が必須です。

依存関係

依存画像は複数指定可能で、すべての画像が統合されて一貫性のある動画が生成されます。

Maxtime: 4s
i2v-vidu-reference

Vidu Start-End Image to Video

v1.0

Viduの開始・終了画像を指定した動画生成モデル。2枚の画像間をスムーズに遷移する映像を生成。依存画像の指定とdependency_wait: trueの設定が必須です。

必須パラメータ

  • start_image_url
    必須
    開始画像のパスYAML設定: parameters.start_image_url
  • end_image_url
    必須
    終了画像のパスYAML設定: parameters.end_image_url
Maxtime: 4s
i2v-vidu-start-end

Vidu Template Image to Video

v1.0

Viduのテンプレートを使った動画生成モデル。各種テンプレートに基づいた動画を生成。依存画像の指定とdependency_wait: trueの設定が必須です。

必須パラメータ

  • template
    必須
    テンプレート名YAML設定: parameters.template
    使用可能な値:
    dreamy_wedding
    romantic_lift
    sweet_proposal
    couple_arrival
    cupid_arrow
    pet_lovers
    lunar_newyear
    hug
    kiss
    dynasty_dress
    wish_sender
    love_pose
    hair_swap
    youth_rewind
    morphlab
    live_photo
    emotionlab
    live_memory
    interaction
    christmas
    値別の要件:
    • wish_sender - 3枚の依存画像が必要
    • dynasty_dress - 2枚の依存画像が推奨
    • shop_frame - 2枚の依存画像が推奨
    • other - 1枚の依存画像で動作

依存関係

依存画像は複数指定可能で、テンプレートに応じた枚数の画像が必要です。

Maxtime: 4s
i2v-vidu-template

Pika v1.5 Pikaffects

v1.5

agents.video.i2v.agents.i2v-pika-v1-5-pikaffects.description

Maxtime: 5s
i2v-pika-v1.5-pikaffects

Pika v2 Turbo

v2.0

Pikaの高速画像から動画生成モデル。標準より3倍速く処理可能で、高品質な動画表現を実現。720p解像度対応。依存画像の指定とdependency_wait: trueの設定が必須です。最大時間: 5秒

Maxtime: 5s
i2v-pika-v2-turbo

Pika v2.1

v2.1

Pikaの高品質画像から動画生成モデル。シャープな詳細表現と自然な動きを両立。1080p解像度対応。依存画像の指定とdependency_wait: trueの設定が必須です。

Maxtime: 5s
i2v-pika-v2.1

Pika v2.2

v2.2

Pikaの最新画像から動画生成モデル。高度な動きと自然な映像表現を実現。最大10秒間の動画生成が可能。依存画像の指定とdependency_wait: trueの設定が必須です。最大時間: 10秒

Maxtime: 5s
i2v-pika-v2.2

Pika v2.2 Scenes

v2.2

Pikaの複数画像からのシーン動画生成モデル。複数の画像を統合し一貫性のある動画を生成。依存画像の指定とdependency_wait: trueの設定が必須です。

Maxtime: 5s
i2v-pika-v2.2-pikascenes

Pixverse v3.5 I2V

v3.5

Pixverseの画像から動画生成モデル。高品質で自然な動きの動画を生成し、多様なシーンやスタイルに対応。依存画像の指定とdependency_wait: trueの設定が必須です。

Maxtime: 5s
i2v-pixverse-v3.5

Pixverse v3.5 Fast I2V

v3.5

Pixverse v3.5の高速版画像から動画生成モデル。標準版より処理速度が速く、迅速なクリエイティブワークフローに最適。依存画像の指定とdependency_wait: trueの設定が必須です。

Maxtime: 5s
i2v-pixverse-v3.5-fast

SkyReels I2V

v1.0

Skyreelsの画像から動画生成モデル。高品質で自然な動きの動画生成が可能。様々なシーン表現に対応し、滑らかなアニメーション効果を実現。依存画像の指定とdependency_wait: trueの設定が必須です。最大時間: 5秒

Maxtime: 5s
i2v-skyreels

CogVideoX-5B I2V

v1.0

CogVideoX-5Bの画像から動画生成モデル。5B規模のモデルにより、高品質で詳細な動画表現を実現。複雑なシーンや動きの表現に優れています。依存画像の指定とdependency_wait: trueの設定が必須です。

Maxtime: 5s
i2v-cogvideox-5b

LTX Video v0.95 I2V

v0.95

agents.video.i2v.agents.i2v-ltx-video-v0-95.description

Maxtime: 5s
i2v-ltx-video-v0.95

Stable Video I2V

v1.0

Stable Videoの画像から動画生成モデル。安定性と一貫性に優れた動画表現を実現し、広範な用途に適用可能。依存画像の指定とdependency_wait: trueの設定が必須です。

Maxtime: 5s
i2v-stable-video

Fast SVD LCM I2V

v1.0

Stable Video Diffusion LCMによる超高速画像から動画生成モデル。Lightning Speedによる超高速な処理時間で高品質なビデオを生成。依存画像の指定とdependency_wait: trueの設定が必須です。

Maxtime: 5s
i2v-fast-svd-lcm

v2v

Sync-Lipsync

v1.0

既存の動画に音声を合わせてリップシンク(口の動き)を生成するモデル。自然な口の動きを実現。依存動画と依存音声の指定とdependency_wait: trueの設定が必須です

Maxtime: 5s
v2v-sync-lipsync

s2v

VEED Avatars

v1.0

音声からアバター動画を生成するモデル。30種類のアバターから選択可能。音声に合わせてアバターが自然に話す動画を生成。依存音声ファイルの指定とdependency_wait: trueの設定が必須です。

必須パラメータ

  • avatar_id
    必須
    使用するアバターID(必須)YAML設定: parameters.avatar_id例: elena_vertical_primary
    使用可能な値:
    emily_vertical_primary - Emily(縦向き・基本)
    emily_vertical_secondary - Emily(縦向き・セカンダリ)
    marcus_vertical_primary - Marcus(縦向き・基本)
    marcus_vertical_secondary - Marcus(縦向き・セカンダリ)
    mira_vertical_primary - Mira(縦向き・基本)
    mira_vertical_secondary - Mira(縦向き・セカンダリ)
    jasmine_vertical_primary - Jasmine(縦向き・基本)
    jasmine_vertical_secondary - Jasmine(縦向き・セカンダリ)
    jasmine_vertical_walking - Jasmine(縦向き・歩行)
    aisha_vertical_walking - Aisha(縦向き・歩行)
    elena_vertical_primary - Elena(縦向き・基本)
    elena_vertical_secondary - Elena(縦向き・セカンダリ)
    any_male_vertical_primary - 汎用男性(縦向き・基本)
    any_female_vertical_primary - 汎用女性(縦向き・基本)
    any_male_vertical_secondary - 汎用男性(縦向き・セカンダリ)
    any_female_vertical_secondary - 汎用女性(縦向き・セカンダリ)
    any_male_vertical_walking - 汎用男性(縦向き・歩行)
    any_female_vertical_walking - 汎用女性(縦向き・歩行)
    emily_primary - Emily(標準・基本)
    emily_side - Emily(標準・サイド)
    marcus_primary - Marcus(標準・基本)
    marcus_side - Marcus(標準・サイド)
    aisha_walking - Aisha(標準・歩行)
    elena_primary - Elena(標準・基本)
    elena_side - Elena(標準・サイド)
    any_male_primary - 汎用男性(標準・基本)
    any_female_primary - 汎用女性(標準・基本)
    any_male_side - 汎用男性(標準・サイド)
    any_female_side - 汎用女性(標準・サイド)

ヒント

音声ファイルは依存音声として指定します。アバターIDはavatar_idパラメータで指定可能。デフォルトはemily_vertical_primaryです。音声の長さに合わせて動画が生成されます。

Maxtime: 60s

コード例

src:
  structure.yaml:
    content: |-
      Project: Speech to Avatar Video Project
      - 音声からアバター動画を生成
      - 30種類のアバターから選択可能
      - 自然な口パクとジェスチャー
    agent_selection_reason: Project structure definition
    dependency: []
    agent: claude-3-5-sonnet-20241022
    api: []
  audio:
    sample_speech.mp3:
      content: "こんにちは!私はVEED Avatarsを使用したアバターです。音声に合わせて自然に話すことができます。"
      agent_selection_reason: 音声ファイルの生成
      dependency: []
      agent: t2s-gpt-4o-mini-tts
      api: []
  video:
    avatar_video.mp4:
      content: |-
        音声からアバター動画を生成
        - Emily(縦向き・基本)アバターを使用
        - 音声に合わせた自然な口パクとジェスチャー
      agent_selection_reason: s2v-veed-avatarsは音声からリアルなアバター動画を生成でき、30種類のアバターから選択可能
      dependency:
        - src/audio/sample_speech.mp3
      dependency_wait: true
      agent: s2v-veed-avatars
      parameters:
        avatar_id: emily_vertical_primary
      api: []
s2v-veed-avatars

AI Avatar Multi

v1.0

デュアル音声からAIアバター動画を生成するモデル。2つの音声ファイルと画像を組み合わせてリアルなアバター動画を生成。高度な音声合成とリップシンク技術を使用。

必須パラメータ

  • first_audio_url
    必須
    第1音声ファイルのURL(必須)YAML設定: parameters.first_audio_url例: https://example.com/audio1.wav
  • second_audio_url
    必須
    第2音声ファイルのURL(必須)YAML設定: parameters.second_audio_url例: https://example.com/audio2.wav
  • image_url
    必須
    ベース画像のURL(必須)YAML設定: parameters.image_url例: https://example.com/avatar.jpg
  • prompt
    必須
    動画生成のための説明プロンプトYAML設定: parameters.prompt例: 二人の対話シーンを生成してください

ヒント

2つの音声ファイルと1つの画像が必須です。すべてdependency配列で指定し、dependency_wait: trueを設定してください。contentの内容がpromptとして使用されます。parametersにはnum_frames、turbo、seedなどの生成オプションのみ指定します。

Maxtime: 90s

コード例

src:
  structure.yaml:
    content: KAMUI Anime Avatar 8-Second Conversation Test
    agent_selection_reason: プロジェクト構造定義とKAMUI日本語アバター機能のテスト
    dependency: []
    agent: claude-3-5-sonnet-20241022
    api: []
  audio:
    japanese_greeting.mp3:
      content: みなさん、こんにちは!新しいアニメアバターが登場しました!
      agent_selection_reason: |-
        t2s-minimax-speech-02-turboは日本語の自然な発音と抑揚に対応しており、
        親しみやすい挨拶メッセージの生成に適しています。
      dependency: []
      agent: t2s-minimax-speech-02-turbo
      parameters:
        voice_setting:
          voice_id: Decent_Boy
          speed: 1.4
          emotion: neutral
        language_boost: Japanese
        audio_setting:
          format: mp3
          sample_rate: 44100
      api: []
    japanese_response.mp3:
      content: わあ、すごい!どんなことができるんですか?
      agent_selection_reason: |-
        t2s-minimax-speech-02-turboのDeep_Voice_Manを使用して男性の声で応答を生成。
        対話の自然な流れを作るため、異なる音声IDを使用します。
      dependency: []
      agent: t2s-minimax-speech-02-turbo
      parameters:
        voice_setting:
          voice_id: Lively_Girl
          speed: 1.2
          emotion: neutral
        language_boost: Japanese
        audio_setting:
          format: mp3
          sample_rate: 44100
      api: []
  image:
    conversation_scene.jpg:
      content: Animation Taste, Animation TasteAnimation Taste, Two realistic forest animals having an animated conversation in a beautiful woodland setting. A wise old brown bear sitting upright with expressive eyes and gentle facial expression, appearing to be speaking earnestly to a clever red fox who is sitting attentively with tilted head and bright, intelligent eyes showing curiosity. The bear's mouth is slightly open as if mid-sentence, with natural body language showing engagement. The fox has perked ears and an alert, listening posture. Surrounding them is a lush forest with dappled sunlight filtering through tall trees, creating a warm, magical atmosphere. Moss-covered rocks and wildflowers scattered around. Photorealistic style with incredible detail in fur texture, natural lighting, and authentic woodland environment. The scene captures the essence of two friends sharing stories in nature.

      agent_selection_reason: t2i-flux-proを使用してアニメテイストの男女キャラクターを生成。FLUX
      dependency: []
      agent: t2i-imagen4
      api: []
  video:
    kamui_japanese_avatar_conversation.mp4:
      content: |-
        Two Japanese professionals having a friendly conversation about the new KAMUI grimoire update in a modern office setting. 
        Natural dialogue flow with expressive gestures and eye contact, showcasing the advanced Japanese language avatar capabilities.
      agent_selection_reason: s2v-ai-avatar-multiはデュアル音声対応でWise_WomanとDeep_Voice_Manの2つの声を使った自然な日本語対話動画を生成
      dependency:
        - src/audio/japanese_greeting.mp3
        - src/audio/japanese_response.mp3
        - src/image/conversation_scene.jpg
      dependency_wait: true
      agent: s2v-ai-avatar-multi
      parameters:
        num_frames: 192
        turbo: true
        seed: 12345
      api: []
s2v-ai-avatar-multi

t2v

Veo2 Text to Video

v2.0

高品質なテキストから動画生成が可能なVeo2モデル。自然な動きと高解像度出力に対応

Maxtime: 5s
t2v-veo2

Veo3 Text to Video

v3.0

Googleの最新動画生成モデル。音声・音楽を含むマルチモーダル動画生成、最大8秒の動画生成に対応

Maxtime: 10s
t2v-veo3

Veo 3.1 Text to Video

v3.1

agents.video.t2v.agents.t2v-veo3-1.description

Maxtime: 8s
t2v-veo3.1

Veo 3.1 Fast Text to Video

v3.1 Fast

agents.video.t2v.agents.t2v-veo3-1-fast.description

Maxtime: 8s
t2v-veo3.1-fast

Hunyuan Text to Video

v1.0

高い視覚品質、多様な動き、テキストと映像の一致性、安定した生成を特徴とするオープンな動画生成モデル

Maxtime: 5s
t2v-hunyuan-video

Hunyuan Video LoRA

v1.0

LoRAモデルを活用したHunyuanビデオ生成。カスタムスタイルでの動画生成が可能。高品質なコンテンツを生成します。最大時間: 5秒

Maxtime: 5s
t2v-hunyuan-video-lora

Wan Text to Video

v1.0

高品質なテキストから動画生成モデル。自然な動きと表現力豊かな映像を実現

Maxtime: 5s
t2v-wan

Wan 2.5 Preview Text to Video

v2.5 Preview

WAN 2.5 Previewの最新テキスト動画生成モデル。5秒/10秒クリップ、16:9・9:16・1:1のアスペクト比、最大1080p出力、任意の背景音声URLに対応

Maxtime: 10s

コード例

src:
  storyboard.yaml:
    content: |-
      Project: Futuristic City Reveal with Cinematic Lighting
      - From text prompt to Wan 2.5 Preview video generation
      - Lean camera move that circles around the hero subject
      - Optional background score supplied via audio_url
      - Use 1080p resolution and 10 second duration for presentation reels
      - Deliver both vertical and landscape cuts for social media
      - Include fallback prompts for negative details (noise, low quality)
    agent_selection_reason: Gemini 2.5 Flash organizes requirements and prepares prompts for multi-agent video generation.
    dependency: []
    agent: gemini-2.5-flash-preview-04-17
    api: []
video-generation:
  wan25_preview_demo.mp4:
    content: |-
      Cinematic reveal of a cyberpunk city skyline at sunset.
      The camera begins with a wide aerial shot, then glides around a lone android hero standing on a balcony.
      Neon reflections ripple across glass towers while drones pass overhead.
      Include atmospheric haze, volumetric light shafts, and dynamic clouds.
      Keep movements smooth and emphasize premium cinematic lighting.
    agent_selection_reason: Wan 2.5 Preview handles 1080p output, long motion, and nuanced lighting in 10 second clips.
    dependency: []
    agent: t2v-wan-25-preview
    api: []
    parameters:
      duration: "5"
      aspect_ratio: "16:9"
      resolution: "1080p"
      enable_prompt_expansion: true
      negative_prompt: "low resolution, muted colors, jitter, artifacts"

t2v-wan-25-preview

Wan 2.1 Pro

v1.0

高品質テキストから動画生成モデル。標準版より高解像度と詳細な表現が可能。最大時間: 5秒

Maxtime: 4s
t2v-wan-pro

Hailuo T2V-01-Live

v1.0

2Dイラストを生き生きとした動画に変換。滑らかな動きと鮮やかな表現で、キャラクターに命を吹き込みます。安定性と繊細な表現に最適化され、幅広い芸術スタイルをサポート。最大時間: 5秒

Maxtime: 5s
t2v-hailuo-t2v-01-live

Hailuo T2V-01-Director

v1.0

カメラ制御機能付きのテキストから動画生成モデル。映画的なストーリーテリングのための正確なカメラワークを実現。[Push in]や[Pan left]などのカメラ指示をプロンプトに含めることで、映画のような演出が可能

Maxtime: 5s
t2v-hailuo-t2v-01-director

Kling 1.0

v1.0

Klingの初代テキストから動画生成モデル。シンプルで使いやすいインターフェースと高品質な動画生成を実現。最大時間: 5秒

Maxtime: 5s
t2v-kling-1.0

Kling 1.0 Pro

v1.0

Kling 1.0の高品質版。より高度なレンダリングと精細なディテールを実現。最大時間: 5秒

Maxtime: 5s
t2v-kling-1.0-pro

Kling 1.6 (std) Text to Video

v1.6

高品質なテキストから動画生成が可能なKling 1.6モデル(標準版)

Maxtime: 5s
t2v-kling-1.6

Kling 1.6 (pro) Text to Video

v1.6 Pro

高品質なテキストから動画生成が可能なKling 1.6モデル(プロ版)。より高度な映像表現が可能。最大時間: 5秒

Maxtime: 5s
t2v-kling-1.6-pro

Kling 2.0 Text to Video

v2.0

次世代の高品質テキストから動画生成モデル。超高解像度・複雑なシーン・高度なカメラ/被写体制御に対応。最大時間: 15秒

Maxtime: 8s
t2v-kling-2.0

Kling 2.1 Text to Video

v2.1

Kling最新版の高品質テキストから動画生成モデル。v2.1 APIエンドポイントによる最新機能とパフォーマンス向上。最新技術による高品質動画生成。パラメータ: duration(5,10秒), aspect_ratio(16:9,9:16,1:1), negative_prompt(ネガティブプロンプト), cfg_scale(0.5デフォルト), seed(再現性用)

オプションパラメータ

  • duration動画の長さ(5または10秒)。デフォルト: 5YAML設定: parameters.duration
  • aspect_ratioアスペクト比(16:9, 9:16, 1:1)。デフォルト: 16:9YAML設定: parameters.aspect_ratio
  • style映像スタイル(例: cinematic, fantasy, realistic)。オプションYAML設定: parameters.style
  • seed再現性のための乱数シード(0-2147483647)。オプションYAML設定: parameters.seed
  • negative_prompt生成を避ける要素の指定。デフォルト: 'blur, distort, and low quality'YAML設定: parameters.negative_prompt
  • cfg_scaleプロンプトへの忠実度(0.0-1.0)。デフォルト: 0.5YAML設定: parameters.cfg_scale

ヒント

duration, aspect_ratio, negative_prompt, cfg_scaleはAPIでサポートされているパラメータです。styleパラメータはプロンプトの一部として処理されます。高品質な動画を生成するために、詳細で具体的なプロンプトを推奨します。

Maxtime: 10s

コード例

src:
  video:
    magical_forest.mp4:
      content: |-
        A magical forest at dawn with glowing fireflies dancing between ancient trees. 
        Soft mist rolls through the undergrowth as golden sunlight filters through the canopy. 
        Ethereal and cinematic atmosphere with smooth camera movement.
      dependency: []
      agent: "t2v-kling-2.1"
      parameters:
        duration: 10                               # 5または10秒を指定
        aspect_ratio: "16:9"                       # 16:9, 9:16, 1:1から選択
        style: "cinematic fantasy"                 # スタイル指定(プロンプトに追加)
        negative_prompt: "low quality, blurry, static camera"  # 除外したい要素
        cfg_scale: 0.7                            # プロンプトへの忠実度(0.0-1.0)
        seed: 123456                              # 再現性のためのシード値(オプション)
      api: []
      
    # 最小構成の例
    simple_scene.mp4:
      content: "A serene lake at sunset with rippling water"
      dependency: []
      agent: "t2v-kling-2.1"
      api: []  # parametersを省略するとデフォルト値が使用されます
t2v-kling-2.1

Kling 2.5 Turbo Pro

v2.5 Turbo Pro

Kling 2.5 Turbo Proエンドポイントによる最新テキストから動画生成モデル。滑らかなモーションと高解像度映像を高速生成。パラメータ: duration(5,10秒), aspect_ratio(16:9,9:16,1:1), negative_prompt, cfg_scale, seed

オプションパラメータ

  • duration動画の長さ(5または10秒)。デフォルト: 5YAML設定: parameters.duration
  • aspect_ratioアスペクト比(16:9, 9:16, 1:1)。デフォルト: 16:9YAML設定: parameters.aspect_ratio
  • negative_prompt生成を避ける要素の指定。デフォルト: 'blur, distort, and low quality'YAML設定: parameters.negative_prompt
  • cfg_scaleプロンプトへの忠実度。デフォルト: 0.5YAML設定: parameters.cfg_scale
  • seed再現性のための乱数シード(0-2147483647)。オプションYAML設定: parameters.seed

ヒント

動きのディテールを細かく記述したプロンプトが高品質な結果につながります。

Maxtime: 10s

コード例

src:
  video:
    futuristic_city.mp4:
      content: |-
        A futuristic city skyline at sunset with flying cars weaving between holographic billboards.
        - Neon reflections on glass buildings
        - Dynamic aerial traffic
        - Warm cinematic lighting
      dependency: []
      agent: "t2v-kling-2.5-turbo-pro"
      parameters:
        duration: "5"
        aspect_ratio: "16:9"
        cfg_scale: 0.6
        seed: 12345
      api: []
t2v-kling-2.5-turbo-pro

Vidu Q1 Text to Video

v1.0

agents.video.t2v.agents.t2v-vidu-q1.description

オプションパラメータ

  • aspect_ratio動画のアスペクト比(16:9, 9:16, 1:1)YAML設定: parameters.aspect_ratio
  • movement_amplitude動きの大きさ(auto, small, medium, large)YAML設定: parameters.movement_amplitude
  • style映像スタイル(general, anime)YAML設定: parameters.style
  • seed再現性のための乱数シードYAML設定: parameters.seed

ヒント

「movement_amplitude」を「auto」に設定すると、AIが自動的に適切な動きの大きさを判断します。「style」パラメータでは映像の全体的なスタイルを指定できます。

Maxtime: 5s
t2v-vidu-q1

Pika v2 Turbo Text to Video

v2.0

テキストプロンプトから高品質な動画を生成するPika v2 Turboモデル。高速処理で質の高い映像出力を実現。最大時間: 5秒

Maxtime: 5s
t2v-pika-v2-turbo

Pika v2.1 Text to Video

v2.1

テキストプロンプトから高品質な動画を生成するPika v2.1モデル。優れた映像表現と自然な動きを実現。最大時間: 5秒

Maxtime: 5s
t2v-pika-v2.1

Pika v2.2 Text to Video

v2.2

Pikaの最新テキストから高品質な動画を生成するモデル。テキストプロンプトから優れた映像表現と自然な動きを実現します。最大時間: 5秒

Maxtime: 5s
t2v-pika-v2.2

Pixverse Text to Video

v3.5

高品質なテキストから動画生成モデル。多様なスタイルオプションと解像度設定に対応。自然な動きと表現力豊かな映像を実現

Maxtime: 5s
t2v-pixverse

Pixverse Fast Text to Video

v3.5

高速なテキストから動画生成モデル。多様なスタイルオプションと解像度設定に対応。標準版より高速に処理が可能

Maxtime: 5s
t2v-pixverse-fast

Ray-2 Text to Video

v1.0

Lumaの最先端Ray2モデルによる高品質なテキストから動画生成。リアルな映像と自然な動きを実現。テキストや画像入力に対応

Maxtime: 5s
t2v-ray-2

Ray2 Flash

v1.0

Lumaの高速テキストから動画生成モデル。Ray2の高品質を維持しながら高速処理を実現。最大時間: 5秒

Maxtime: 5s
t2v-ray-2-flash

Luma Dream Machine

v1.0

Lumaのクリエイティブテキストから動画生成モデル。芸術的で創造的な表現に最適。最大時間: 5秒

Maxtime: 5s
t2v-luma-dream-machine

Fast SVD Text to Video

v1.0

高速なテキストから動画生成モデル。自然な動きと表現力豊かな映像を実現。カスタマイズ可能なモーションバケットIDとディープキャッシュ設定

Maxtime: 5s
t2v-fast-svd

Fast SVD LCM Text to Video

v1.0

超高速なテキストから動画生成モデル。LCM(Latent Consistency Model)を活用し、少ないステップ数で高品質な動画を生成。自然な動きと表現力豊かな映像を実現

Maxtime: 5s
t2v-fast-svd-lcm

Mochi V1

v1.0

高品質なテキストから動画生成モデル。自然な動きと表現力豊かな映像を実現。プロンプト拡張機能で創造性を向上

Maxtime: 5s
t2v-mochi-v1

CogVideoX-5B

v1.0

次世代テキストから動画生成モデル。高品質で自然な動きと表現力豊かな映像を実現。カスタマイズ可能なビデオサイズとフレームレート

Maxtime: 5s
t2v-cogvideox-5b

T2V Turbo

v1.0

超高速なテキストから動画生成モデル。少ないステップ数で高品質な動画を生成。自然な動きと表現力豊かな映像を実現。最大時間: 5秒

Maxtime: 5s
t2v-turbo

MiniMax Video 01

v1.0

MiniMaxの高品質な動画生成モデル。汎用性の高いビデオコンテンツを生成します。最大時間: 5秒

Maxtime: 5s
t2v-minimax-video-01

LTX Video v0.95

v0.95

高品質テキストから動画生成モデル。自然な動きと表現力豊かな映像を生成。最大時間: 5秒

Maxtime: 5s
t2v-ltx-video-v095

OpenAI Sora 2 Text to Video

v2.0

OpenAIの高速テキスト→動画生成モデル。コンセプト検討やSNS向けクリップに最適で、自然なカメラワークを短時間で確認できます。

Maxtime: 10s
t2v-sora-2

OpenAI Sora 2 Pro Text to Video

v2.0 Pro

OpenAIのプロダクション向けSoraモデル。シネマティックな映像品質と安定した長尺モーションで、広告やマーケティング動画に適しています。

Maxtime: 10s
t2v-sora-2-pro

s2v

VEED Avatars Speech to Video

v1.0

音声からアバター動画を生成するモデル。30種類のアバターから選択可能。音声に合わせてアバターが自然に話す動画を生成。依存音声ファイルの指定とdependency_wait: trueの設定が必須です。

必須パラメータ

  • avatar_id
    必須
    使用するアバターID(必須)YAML設定: parameters.avatar_id例: elena_vertical_primary
    使用可能な値:
    emily_vertical_primary - Emily(縦向き・基本)
    emily_vertical_secondary - Emily(縦向き・セカンダリ)
    marcus_vertical_primary - Marcus(縦向き・基本)
    marcus_vertical_secondary - Marcus(縦向き・セカンダリ)
    mira_vertical_primary - Mira(縦向き・基本)
    mira_vertical_secondary - Mira(縦向き・セカンダリ)
    jasmine_vertical_primary - Jasmine(縦向き・基本)
    jasmine_vertical_secondary - Jasmine(縦向き・セカンダリ)
    jasmine_vertical_walking - Jasmine(縦向き・歩行)
    aisha_vertical_walking - Aisha(縦向き・歩行)
    elena_vertical_primary - Elena(縦向き・基本)
    elena_vertical_secondary - Elena(縦向き・セカンダリ)
    any_male_vertical_primary - 汎用男性(縦向き・基本)
    any_female_vertical_primary - 汎用女性(縦向き・基本)
    any_male_vertical_secondary - 汎用男性(縦向き・セカンダリ)
    any_female_vertical_secondary - 汎用女性(縦向き・セカンダリ)
    any_male_vertical_walking - 汎用男性(縦向き・歩行)
    any_female_vertical_walking - 汎用女性(縦向き・歩行)
    emily_primary - Emily(標準・基本)
    emily_side - Emily(標準・サイド)
    marcus_primary - Marcus(標準・基本)
    marcus_side - Marcus(標準・サイド)
    aisha_walking - Aisha(標準・歩行)
    elena_primary - Elena(標準・基本)
    elena_side - Elena(標準・サイド)
    any_male_primary - 汎用男性(標準・基本)
    any_female_primary - 汎用女性(標準・基本)
    any_male_side - 汎用男性(標準・サイド)
    any_female_side - 汎用女性(標準・サイド)

オプションパラメータ

  • dependency音声ファイルの依存関係を指定。mp3, wav, m4a等の音声ファイルをサポートYAML設定: parameters.dependency
  • dependency_wait依存関係の処理完了を待つかどうか。音声ファイル使用時は必須でtrueに設定YAML設定: parameters.dependency_wait

ヒント

音声ファイルを依存関係として指定し、dependency_wait: trueを設定することで、音声に同期したアバター動画を生成できます。アバターは縦向き(vertical)と横向きのバリエーションがあります。30種類のアバターから選択可能です。

Maxtime: 60s

コード例

src:
  structure.yaml:
    content: |-
      Project: Speech to Avatar Video Project
      - 音声からアバター動画を生成
      - 30種類のアバターから選択可能
      - 自然な口パクとジェスチャー
    agent_selection_reason: Project structure definition
    dependency: []
    agent: claude-3-5-sonnet-20241022
    api: []
  audio:
    sample_speech.mp3:
      content: "こんにちは!私はVEED Avatarsを使用したアバターです。音声に合わせて自然に話すことができます。"
      agent_selection_reason: 音声ファイルの生成
      dependency: []
      agent: t2s-gpt-4o-mini-tts
      api: []
  video:
    avatar_video.mp4:
      content: |-
        音声からアバター動画を生成
        - Emily(縦向き・基本)アバターを使用
        - 音声に合わせた自然な口パクとジェスチャー
      agent_selection_reason: s2v-veed-avatarsは音声からリアルなアバター動画を生成でき、30種類のアバターから選択可能
      dependency:
        - src/audio/sample_speech.mp3
      dependency_wait: true
      agent: s2v-veed-avatars
      parameters:
        avatar_id: emily_vertical_primary
      api: []
s2v-veed-avatars

i2vの使用例

Kling Image to Video v2.1

src:
  structure.yaml:
    content: |-
      Project: Creating Innovative Digital Art Fusing Surrealism and Futurism
      - Fantastical world of crystal islands floating on an ocean of liquid starlight
      - Surreal landscape with clockwork mechanical trees and luminous butterflies
      - Photorealistic yet dreamlike still image generation using t2i-imagen3
      - Magical motion and cosmic energy animation using Kling i2v v2.1
      - Unique visual expression where fantasy meets steampunk
      - Mystical space with gravity-defying upward waterfalls and multiple moons
      - Fantastical ecosystem of bioluminescent plants and cosmic energy flows
    agent_selection_reason: Selected claude-3-5-sonnet-20241022 for its excellence in managing project structure design and multiple media generation requirements. Particularly suited for planning surreal artworks and integrated multimedia production management.
    dependency: []
    agent: claude-3-5-sonnet-20241022
    api: []
  image-generation:
    beautifle_landscape.png:
      content: A surreal dreamscape where floating crystal islands hover above an ocean of liquid starlight. Ancient clockwork trees with gears for leaves stretch toward a sky filled with multiple moons in different phases. Ethereal butterflies made of pure light weave between cascading waterfalls that flow upward, defying gravity. The entire scene is painted in vibrant purples, electric blues, and golden amber hues, creating a mystical atmosphere that blends fantasy with steampunk aesthetics. Intricate details include floating geometric structures, bioluminescent flora, and streams of cosmic energy connecting the floating islands.
      agent_selection_reason: t2i-imagen3, Google's cutting-edge image generation model, excels at simultaneously expressing surreal elements and photorealistic textures. It particularly demonstrates advanced capabilities in convincingly depicting liquid starlight, luminous organisms, complex light interactions, and gravity-defying physical phenomena. It also shows superior ability in integrating the complex aesthetics of fantasy and steampunk fusion into a single work.
      dependency: []
      note: Prompts must be in English only.
      agent: t2i-imagen3
      api: []
  video-generation:
    beautifle_landscape.mp4:
      content: |-
        Transform this surreal dreamscape into a mesmerizing animated masterpiece.
        The crystal islands gently rotate and pulse with inner light while floating gracefully.
        Clockwork trees' gear-leaves turn slowly, creating hypnotic mechanical rhythms.
        Light-butterflies dance in spiraling patterns, leaving trails of stardust.
        The upward-flowing waterfalls shimmer and undulate with magical energy.
        Multiple moons slowly orbit across the cosmic sky, casting shifting shadows.
        Bioluminescent plants pulse in synchronized waves of color.
        Streams of cosmic energy flow between islands like living aurora.
        The liquid starlight ocean below ripples with celestial reflections.
        Camera slowly pans across this fantastical realm with cinematic grandeur.
      dependency:
        - src/image-generation/beautifle_landscape.png
      dependency_wait: true
      agent: i2v-kling-v2.1
      api: []
      parameters:
        duration: 5
        aspect_ratio: "1:1"
        negative_prompt: low quality, blurry, static camera
        cfg_scale: 0.6

Kling Image to Video v2.1 Standard

src:
  structure.yaml:
    content: |-
      Project: Standard Quality Video Generation with Kling v2.1 Standard Edition
      - High-quality image-to-video conversion with standard settings
      - Multiple aspect ratio support (16:9, 9:16, 1:1)
      - Duration options (5 or 10 seconds)
      - Consistent and reliable video generation
    agent_selection_reason: Using i2v-kling-2.1-standard for stable and consistent video generation with standard settings
    agent: t2i-flux-schnell
    dependency: []
  image-generation:
    sample-image.png:
      content: |-
        A serene landscape with a calm lake reflecting mountains
      agent: t2i-flux-schnell
      dependency: []
      api: []
  video-generation:
    landscape-video.mp4:
      content: |-
        Gentle breeze creating ripples on the water surface
        Clouds slowly drifting across the sky
        Subtle light changes as time passes
        Natural and peaceful atmosphere
      dependency:
        - src/image-generation/sample-image.png
      dependency_wait: true
      agent: i2v-kling-2.1-standard
      api: []
      parameters:
        duration: 5
        aspect_ratio: "16:9"
        negative_prompt: low quality, unnatural movement
        cfg_scale: 0.5

Kling Image to Video v2.5 Turbo Pro

src:
  structure.yaml:
    content: |-
      Project: Cinematic Orbit Shot of Futuristic Explorer
      - Single still image converted into a moving shot
      - Camera arcs around subject at sunset
      - Tail frame highlights silhouette against the sun
    agent_selection_reason: Selected i2v-kling-v2.5-turbo-pro for smooth cinematic motion.
    dependency:
      - src/local_image/explorer.png
    dependency_wait: true
    agent: i2v-kling-v2.5-turbo-pro
    api: []
    parameters:
      duration: "10"
      aspect_ratio: "16:9"
      negative_prompt: blur, distort, and low quality
      cfg_scale: 0.5

ByteDance Seedance v1 Lite Reference to Video

src:
  structure.yaml:
    content: |-
      Project: Cinematic Intro with Seedance Lite Reference-to-Video
      - Use multiple reference stills to control motion
      - Focus on neon-lit cyberpunk ambience and flowing garments
      - Track the subject with a gentle forward-moving camera
    agent_selection_reason: Using i2v-bytedance-seedance-v1-lite-reference-to-video for reference-driven motion control.
    agent: t2i-flux-schnell
    dependency: []
  image-generation:
    reference-main.png:
      content: |-
        A cyberpunk hero standing in a neon-lit alley, dramatic lighting on the coat.
      agent: t2i-flux-schnell
      dependency: []
      api: []
    reference-style.png:
      content: |-
        Stylized lighting accents and atmosphere for the same alley scene.
      agent: t2i-flux-schnell
      dependency: []
      api: []
  video-generation:
    hero-intro.mp4:
      content: |-
        Generate a cinematic opener where the protagonist walks through the neon-lit alley, coat flowing in the wind. Maintain a gentle tracking shot from a slightly elevated angle.
      dependency:
        - src/image-generation/reference-main.png
        - src/image-generation/reference-style.png
      dependency_wait: true
      agent: i2v-bytedance-seedance-v1-lite-reference-to-video
      api: []
      parameters:
        aspect_ratio: "16:9"
        resolution: "720p"
        duration: "5"
        camera_fixed: false
        seed: -1

ByteDance Seedance v1 Pro I2V

src:
  structure.yaml:
    content: |-
      Project: Natural Motion Video Generation with ByteDance Seedance v1 Pro
      - High-quality image-to-video conversion
      - Camera motion control options
      - Reproducible generation with seed values
      - Multiple resolution support (720p/1080p)
    agent_selection_reason: Using i2v-bytedance-seedance-v1-pro for high-quality motion generation with camera control
    agent: t2i-flux-schnell
    dependency: []
  image-generation:
    base-image.png:
      content: |-
        A peaceful garden scene with blooming flowers
      agent: t2i-flux-schnell
      dependency: []
      api: []
  video-generation:
    garden-motion.mp4:
      content: |-
        Gentle breeze moving through the flowers, petals swaying naturally
        Butterflies flying between the flowers
        Soft sunlight filtering through leaves
      dependency:
        - src/image-generation/base-image.png
      dependency_wait: true
      agent: i2v-bytedance-seedance-v1-pro
      api: []
      parameters:
        resolution: "1080p"
        camera_fixed: false
        seed: -1

ByteDance OmniHuman v1.5

src:
  structure.yaml:
    content: |-
      Project: Talking Avatar with OmniHuman
      - Combine a portrait still with voice-over audio
      - Generate expressive lip-sync aligned to speech
    agent_selection_reason: Using i2v-bytedance-omnihuman-v1.5 for high-fidelity facial motion and lip-sync.
    agent: claude-3-5-sonnet-20241022
    dependency: []
  image-generation:
    avatar.png:
      content: |-
        A friendly presenter facing the camera with soft studio lighting.
      agent: t2i-flux-schnell
      dependency: []
      api: []
  audio:
    voice-line.mp3:
      content: |-
        "Welcome to our product showcase. Let me guide you through the highlights."
      agent: t2s-gpt-4o-mini-tts
      dependency: []
      api: []
  video-generation:
    talking-avatar.mp4:
      content: |-
        Synchronize the speech with natural facial expressions and subtle head movements.
      dependency:
        - src/image-generation/avatar.png
        - src/audio/voice-line.mp3
      dependency_wait: true
      agent: i2v-bytedance-omnihuman-v1.5
      api: []
      parameters:
        audio_url: src/audio/voice-line.mp3

MiniMax Hailuo-02 Pro I2V

src:
  structure.yaml:
    content: |-
      Project: High-Quality Video Generation with MiniMax Hailuo-02 Pro
      - Advanced image-to-video conversion with prompt optimization
      - Natural and sophisticated video generation
      - Enhanced detail and motion quality
    agent_selection_reason: Using i2v-minimax-hailuo-02-pro for enhanced video quality with prompt optimization
    agent: t2i-flux-schnell
    dependency: []
  image-generation:
    source-image.png:
      content: |-
        A vibrant cityscape at golden hour with bustling street life
      agent: t2i-flux-schnell
      dependency: []
      api: []
  video-generation:
    city-animation.mp4:
      content: |-
        Gentle movement of people walking through the streets
        Soft lighting changes as the golden hour progresses
        Natural urban atmosphere with subtle life and energy
        Camera slowly pans across the vibrant cityscape
      dependency:
        - src/image-generation/source-image.png
      dependency_wait: true
      agent: i2v-minimax-hailuo-02-pro
      api: []
      parameters:
        prompt_optimizer: true

WAN 2.5 Preview Image to Video

src:
  structure.yaml:
    content: |-
      Project: Cinematic WAN 2.5 Preview shot
      - Generate a 10 second tracking shot from a still hero image
      - Maintain character fidelity while adding dynamic camera motion
      - Use 1080p output for presentation footage
    agent_selection_reason: Selecting i2v-wan-25-preview to leverage WAN 2.5 Preview's long clip support and smooth motion quality.
    agent: claude-3-5-sonnet-20241022
    dependency: []
  image-generation:
    hero-frame.png:
      content: |-
        A heroic warrior standing on a cliff at sunset, cape flowing in the wind.
      agent: t2i-flux-pro
      dependency: []
      api: []
  video-generation:
    cinematic-shot.mp4:
      content: |-
        Create a 10-second 1080p clip with subtle camera push-in and atmospheric motion around the character.
      dependency:
        - src/image-generation/hero-frame.png
      dependency_wait: true
      agent: i2v-wan-25-preview
      api: []
      parameters:
        duration: "5"
        resolution: "1080p"
        aspect_ratio: "16:9"

s2vの使用例

VEED Avatars

src:
  structure.yaml:
    content: |-
      Project: Speech to Avatar Video Project
      - 音声からアバター動画を生成
      - 30種類のアバターから選択可能
      - 自然な口パクとジェスチャー
    agent_selection_reason: Project structure definition
    dependency: []
    agent: claude-3-5-sonnet-20241022
    api: []
  audio:
    sample_speech.mp3:
      content: "こんにちは!私はVEED Avatarsを使用したアバターです。音声に合わせて自然に話すことができます。"
      agent_selection_reason: 音声ファイルの生成
      dependency: []
      agent: t2s-gpt-4o-mini-tts
      api: []
  video:
    avatar_video.mp4:
      content: |-
        音声からアバター動画を生成
        - Emily(縦向き・基本)アバターを使用
        - 音声に合わせた自然な口パクとジェスチャー
      agent_selection_reason: s2v-veed-avatarsは音声からリアルなアバター動画を生成でき、30種類のアバターから選択可能
      dependency:
        - src/audio/sample_speech.mp3
      dependency_wait: true
      agent: s2v-veed-avatars
      parameters:
        avatar_id: emily_vertical_primary
      api: []

AI Avatar Multi

src:
  structure.yaml:
    content: KAMUI Anime Avatar 8-Second Conversation Test
    agent_selection_reason: プロジェクト構造定義とKAMUI日本語アバター機能のテスト
    dependency: []
    agent: claude-3-5-sonnet-20241022
    api: []
  audio:
    japanese_greeting.mp3:
      content: みなさん、こんにちは!新しいアニメアバターが登場しました!
      agent_selection_reason: |-
        t2s-minimax-speech-02-turboは日本語の自然な発音と抑揚に対応しており、
        親しみやすい挨拶メッセージの生成に適しています。
      dependency: []
      agent: t2s-minimax-speech-02-turbo
      parameters:
        voice_setting:
          voice_id: Decent_Boy
          speed: 1.4
          emotion: neutral
        language_boost: Japanese
        audio_setting:
          format: mp3
          sample_rate: 44100
      api: []
    japanese_response.mp3:
      content: わあ、すごい!どんなことができるんですか?
      agent_selection_reason: |-
        t2s-minimax-speech-02-turboのDeep_Voice_Manを使用して男性の声で応答を生成。
        対話の自然な流れを作るため、異なる音声IDを使用します。
      dependency: []
      agent: t2s-minimax-speech-02-turbo
      parameters:
        voice_setting:
          voice_id: Lively_Girl
          speed: 1.2
          emotion: neutral
        language_boost: Japanese
        audio_setting:
          format: mp3
          sample_rate: 44100
      api: []
  image:
    conversation_scene.jpg:
      content: Animation Taste, Animation TasteAnimation Taste, Two realistic forest animals having an animated conversation in a beautiful woodland setting. A wise old brown bear sitting upright with expressive eyes and gentle facial expression, appearing to be speaking earnestly to a clever red fox who is sitting attentively with tilted head and bright, intelligent eyes showing curiosity. The bear's mouth is slightly open as if mid-sentence, with natural body language showing engagement. The fox has perked ears and an alert, listening posture. Surrounding them is a lush forest with dappled sunlight filtering through tall trees, creating a warm, magical atmosphere. Moss-covered rocks and wildflowers scattered around. Photorealistic style with incredible detail in fur texture, natural lighting, and authentic woodland environment. The scene captures the essence of two friends sharing stories in nature.

      agent_selection_reason: t2i-flux-proを使用してアニメテイストの男女キャラクターを生成。FLUX
      dependency: []
      agent: t2i-imagen4
      api: []
  video:
    kamui_japanese_avatar_conversation.mp4:
      content: |-
        Two Japanese professionals having a friendly conversation about the new KAMUI grimoire update in a modern office setting. 
        Natural dialogue flow with expressive gestures and eye contact, showcasing the advanced Japanese language avatar capabilities.
      agent_selection_reason: s2v-ai-avatar-multiはデュアル音声対応でWise_WomanとDeep_Voice_Manの2つの声を使った自然な日本語対話動画を生成
      dependency:
        - src/audio/japanese_greeting.mp3
        - src/audio/japanese_response.mp3
        - src/image/conversation_scene.jpg
      dependency_wait: true
      agent: s2v-ai-avatar-multi
      parameters:
        num_frames: 192
        turbo: true
        seed: 12345
      api: []

t2vの使用例

Wan 2.5 Preview Text to Video

src:
  storyboard.yaml:
    content: |-
      Project: Futuristic City Reveal with Cinematic Lighting
      - From text prompt to Wan 2.5 Preview video generation
      - Lean camera move that circles around the hero subject
      - Optional background score supplied via audio_url
      - Use 1080p resolution and 10 second duration for presentation reels
      - Deliver both vertical and landscape cuts for social media
      - Include fallback prompts for negative details (noise, low quality)
    agent_selection_reason: Gemini 2.5 Flash organizes requirements and prepares prompts for multi-agent video generation.
    dependency: []
    agent: gemini-2.5-flash-preview-04-17
    api: []
video-generation:
  wan25_preview_demo.mp4:
    content: |-
      Cinematic reveal of a cyberpunk city skyline at sunset.
      The camera begins with a wide aerial shot, then glides around a lone android hero standing on a balcony.
      Neon reflections ripple across glass towers while drones pass overhead.
      Include atmospheric haze, volumetric light shafts, and dynamic clouds.
      Keep movements smooth and emphasize premium cinematic lighting.
    agent_selection_reason: Wan 2.5 Preview handles 1080p output, long motion, and nuanced lighting in 10 second clips.
    dependency: []
    agent: t2v-wan-25-preview
    api: []
    parameters:
      duration: "5"
      aspect_ratio: "16:9"
      resolution: "1080p"
      enable_prompt_expansion: true
      negative_prompt: "low resolution, muted colors, jitter, artifacts"

Kling 2.1 Text to Video

src:
  video:
    magical_forest.mp4:
      content: |-
        A magical forest at dawn with glowing fireflies dancing between ancient trees. 
        Soft mist rolls through the undergrowth as golden sunlight filters through the canopy. 
        Ethereal and cinematic atmosphere with smooth camera movement.
      dependency: []
      agent: "t2v-kling-2.1"
      parameters:
        duration: 10                               # 5または10秒を指定
        aspect_ratio: "16:9"                       # 16:9, 9:16, 1:1から選択
        style: "cinematic fantasy"                 # スタイル指定(プロンプトに追加)
        negative_prompt: "low quality, blurry, static camera"  # 除外したい要素
        cfg_scale: 0.7                            # プロンプトへの忠実度(0.0-1.0)
        seed: 123456                              # 再現性のためのシード値(オプション)
      api: []
      
    # 最小構成の例
    simple_scene.mp4:
      content: "A serene lake at sunset with rippling water"
      dependency: []
      agent: "t2v-kling-2.1"
      api: []  # parametersを省略するとデフォルト値が使用されます

Kling 2.5 Turbo Pro

src:
  video:
    futuristic_city.mp4:
      content: |-
        A futuristic city skyline at sunset with flying cars weaving between holographic billboards.
        - Neon reflections on glass buildings
        - Dynamic aerial traffic
        - Warm cinematic lighting
      dependency: []
      agent: "t2v-kling-2.5-turbo-pro"
      parameters:
        duration: "5"
        aspect_ratio: "16:9"
        cfg_scale: 0.6
        seed: 12345
      api: []

s2vの使用例

VEED Avatars Speech to Video

src:
  structure.yaml:
    content: |-
      Project: Speech to Avatar Video Project
      - 音声からアバター動画を生成
      - 30種類のアバターから選択可能
      - 自然な口パクとジェスチャー
    agent_selection_reason: Project structure definition
    dependency: []
    agent: claude-3-5-sonnet-20241022
    api: []
  audio:
    sample_speech.mp3:
      content: "こんにちは!私はVEED Avatarsを使用したアバターです。音声に合わせて自然に話すことができます。"
      agent_selection_reason: 音声ファイルの生成
      dependency: []
      agent: t2s-gpt-4o-mini-tts
      api: []
  video:
    avatar_video.mp4:
      content: |-
        音声からアバター動画を生成
        - Emily(縦向き・基本)アバターを使用
        - 音声に合わせた自然な口パクとジェスチャー
      agent_selection_reason: s2v-veed-avatarsは音声からリアルなアバター動画を生成でき、30種類のアバターから選択可能
      dependency:
        - src/audio/sample_speech.mp3
      dependency_wait: true
      agent: s2v-veed-avatars
      parameters:
        avatar_id: emily_vertical_primary
      api: []