AI агенти за генериране на видео

AI агенти, които генерират и редактират висококачествени видеоклипове

i2v

Kling Image to Video

v1.0

Моделът Kling генерира висококачествени видеоклипове от изображения. Запазва характеристиките на оригиналното изображение, добавя естествени движения и позволява посочване на посоката на движение с текстова заявка.

Maxtime: 5s
i2v-kling-v1

Kling Image to Video Pro

v1.0

Моделът Kling Pro генерира висококачествени видеоклипове от изображения. Запазва характеристиките на оригиналното изображение, добавя естествени движения и позволява посочване на посоката на движение с текстова заявка. Позволява изход с по-високо качество от стандартната версия. Поддържа контрол на движението чрез статични и динамични маски.

Maxtime: 5s
i2v-kling-v1-pro

Kling Image to Video v1.5 Pro

v1.5

Модел Kling v1.5 Pro за генериране на видео от изображения. Генерира висококачествени видеоклипове с естествени движения. Поддържа по-усъвършенствано изразяване и по-дълго време за генериране от стандартната версия. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true. Максимално време: 10 секунди

Maxtime: 5s
i2v-kling-v1.5-pro

Kling Image to Video v1.6

v1.6

Модел Kling v1.6 за генериране на видео от изображения. Реализира естествени движения и висококачествено визуално изражение в най-новата версия. Поддържа разнообразни стилове. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true. Максимално време: 5 секунди

Maxtime: 5s
i2v-kling-v1.6

Kling Image to Video v2.0

v1.6

Модел Kling v2.0 за генериране на видео от изображения. Позволява преобразуване на ултра висока резолюция и сложни сцени във видео. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Maxtime: 5s
i2v-kling-v2.0

Kling Image to Video v2.1

v2.1

agents.video.i2v.agents.i2v-kling-v2-1.description

Незадължителни параметри

  • duration動画の長さ(5または10秒)。デフォルト: "5"YAML設定: parameters.duration
  • aspect_ratioアスペクト比("16:9", "9:16", "1:1")。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
  • negative_prompt生成を避ける要素の指定。デフォルト: "blur, distort, and low quality"YAML設定: parameters.negative_prompt
  • cfg_scaleCFG(Classifier Free Guidance)スケール。プロンプトへの忠実度(0.0-1.0)。デフォルト: 0.5YAML設定: parameters.cfg_scale

Съвети

開始画像は依存画像として指定します。durationとaspect_ratioは文字列で指定する必要があります。高品質な動画を生成するために、詳細で具体的なプロンプトを推奨します。

Maxtime: 10s

common.code_example

src:
  structure.yaml:
    content: |-
      Project: Creating Innovative Digital Art Fusing Surrealism and Futurism
      - Fantastical world of crystal islands floating on an ocean of liquid starlight
      - Surreal landscape with clockwork mechanical trees and luminous butterflies
      - Photorealistic yet dreamlike still image generation using t2i-imagen3
      - Magical motion and cosmic energy animation using Kling i2v v2.1
      - Unique visual expression where fantasy meets steampunk
      - Mystical space with gravity-defying upward waterfalls and multiple moons
      - Fantastical ecosystem of bioluminescent plants and cosmic energy flows
    agent_selection_reason: Selected claude-3-5-sonnet-20241022 for its excellence in managing project structure design and multiple media generation requirements. Particularly suited for planning surreal artworks and integrated multimedia production management.
    dependency: []
    agent: claude-3-5-sonnet-20241022
    api: []
  image-generation:
    beautifle_landscape.png:
      content: A surreal dreamscape where floating crystal islands hover above an ocean of liquid starlight. Ancient clockwork trees with gears for leaves stretch toward a sky filled with multiple moons in different phases. Ethereal butterflies made of pure light weave between cascading waterfalls that flow upward, defying gravity. The entire scene is painted in vibrant purples, electric blues, and golden amber hues, creating a mystical atmosphere that blends fantasy with steampunk aesthetics. Intricate details include floating geometric structures, bioluminescent flora, and streams of cosmic energy connecting the floating islands.
      agent_selection_reason: t2i-imagen3, Google's cutting-edge image generation model, excels at simultaneously expressing surreal elements and photorealistic textures. It particularly demonstrates advanced capabilities in convincingly depicting liquid starlight, luminous organisms, complex light interactions, and gravity-defying physical phenomena. It also shows superior ability in integrating the complex aesthetics of fantasy and steampunk fusion into a single work.
      dependency: []
      note: Prompts must be in English only.
      agent: t2i-imagen3
      api: []
  video-generation:
    beautifle_landscape.mp4:
      content: |-
        Transform this surreal dreamscape into a mesmerizing animated masterpiece.
        The crystal islands gently rotate and pulse with inner light while floating gracefully.
        Clockwork trees' gear-leaves turn slowly, creating hypnotic mechanical rhythms.
        Light-butterflies dance in spiraling patterns, leaving trails of stardust.
        The upward-flowing waterfalls shimmer and undulate with magical energy.
        Multiple moons slowly orbit across the cosmic sky, casting shifting shadows.
        Bioluminescent plants pulse in synchronized waves of color.
        Streams of cosmic energy flow between islands like living aurora.
        The liquid starlight ocean below ripples with celestial reflections.
        Camera slowly pans across this fantastical realm with cinematic grandeur.
      dependency:
        - src/image-generation/beautifle_landscape.png
      dependency_wait: true
      agent: i2v-kling-v2.1
      api: []
      parameters:
        duration: 5
        aspect_ratio: "1:1"
        negative_prompt: low quality, blurry, static camera
        cfg_scale: 0.6
i2v-kling-v2.1

Kling Image to Video v2.1 Standard

v2.1

agents.video.i2v.agents.i2v-kling-2-1-standard.description

Незадължителни параметри

  • duration動画の長さ(5または10秒)。デフォルト: "5"YAML設定: parameters.duration
  • aspect_ratioアスペクト比("16:9", "9:16", "1:1")。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
  • negative_prompt生成を避ける要素の指定。デフォルト: "blur, distort, and low quality"YAML設定: parameters.negative_prompt
  • cfg_scaleCFG(Classifier Free Guidance)スケール。プロンプトへの忠実度(0.0-1.0)。デフォルト: 0.5YAML設定: parameters.cfg_scale

Съвети

マスター版と同じAPIパラメータを使用しますが、標準設定による安定した生成が期待できます。開始画像は依存画像として指定します。durationとaspect_ratioは文字列で指定する必要があります。

Maxtime: 10s

common.code_example

src:
  structure.yaml:
    content: |-
      Project: Standard Quality Video Generation with Kling v2.1 Standard Edition
      - High-quality image-to-video conversion with standard settings
      - Multiple aspect ratio support (16:9, 9:16, 1:1)
      - Duration options (5 or 10 seconds)
      - Consistent and reliable video generation
    agent_selection_reason: Using i2v-kling-2.1-standard for stable and consistent video generation with standard settings
    agent: t2i-flux-schnell
    dependency: []
  image-generation:
    sample-image.png:
      content: |-
        A serene landscape with a calm lake reflecting mountains
      agent: t2i-flux-schnell
      dependency: []
      api: []
  video-generation:
    landscape-video.mp4:
      content: |-
        Gentle breeze creating ripples on the water surface
        Clouds slowly drifting across the sky
        Subtle light changes as time passes
        Natural and peaceful atmosphere
      dependency:
        - src/image-generation/sample-image.png
      dependency_wait: true
      agent: i2v-kling-2.1-standard
      api: []
      parameters:
        duration: 5
        aspect_ratio: "16:9"
        negative_prompt: low quality, unnatural movement
        cfg_scale: 0.5
i2v-kling-2.1-standard

Kling Image to Video v2.5 Turbo Pro

v2.5 Turbo Pro

agents.video.i2v.agents.i2v-kling-v2-5-turbo-pro.description

Незадължителни параметри

  • duration動画の長さ(5または10秒)。デフォルト: "5"YAML設定: parameters.duration
  • aspect_ratioアスペクト比("16:9", "9:16", "1:1")。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
  • negative_prompt生成を避ける要素の指定。デフォルト: "blur, distort, and low quality"YAML設定: parameters.negative_prompt
  • cfg_scaleCFG(Classifier Free Guidance)スケール。プロンプトへの忠実度(0.0-1.0)。デフォルト: 0.5YAML設定: parameters.cfg_scale

Съвети

開始画像は依存画像として指定し、durationとaspect_ratioは文字列で指定してください。

Maxtime: 10s

common.code_example

src:
  structure.yaml:
    content: |-
      Project: Cinematic Orbit Shot of Futuristic Explorer
      - Single still image converted into a moving shot
      - Camera arcs around subject at sunset
      - Tail frame highlights silhouette against the sun
    agent_selection_reason: Selected i2v-kling-v2.5-turbo-pro for smooth cinematic motion.
    dependency:
      - src/local_image/explorer.png
    dependency_wait: true
    agent: i2v-kling-v2.5-turbo-pro
    api: []
    parameters:
      duration: "10"
      aspect_ratio: "16:9"
      negative_prompt: blur, distort, and low quality
      cfg_scale: 0.5
i2v-kling-v2.5-turbo-pro

Kling Image to Video v1.6 Pro

v1.6

Модел Kling v1.6 Pro за генериране на висококачествени видеоклипове от изображения. Най-новата Pro версия позволява по-дълго време за генериране на видео и усъвършенствано визуално изражение. Позволява и задаване на плавен преход от начално към крайно изображение (по избор). Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Незадължителни параметри

  • start_image_urlПът към началното изображение (по избор)YAML設定: parameters.start_image_url
  • end_image_urlПът към крайното изображение (по избор). Ако е посочено, ще бъде генерирано видео с плавен преход от началното към крайното изображение.YAML設定: parameters.end_image_url

Съвети

Ако посочвате начално и крайно изображение, са необходими поне две зависими изображения. Ако не са посочени, ще бъде генерирано стандартно видео само от началното изображение.

Maxtime: 5s
i2v-kling-v1.6-pro

ByteDance Seedance v1 Lite Reference to Video

v1.0 Lite

agents.video.i2v.agents.i2v-bytedance-seedance-v1-lite-reference-to-video.description

Незадължителни параметри

  • prompt生成する動画の説明。参照画像にどのような動きを付けるか詳細に記述YAML設定: parameters.prompt
  • reference_image_urls参照画像URLの配列(1〜4件)。依存画像を指定する場合はdependency_wait: trueを推奨YAML設定: parameters.reference_image_urls
  • aspect_ratio動画のアスペクト比(デフォルト: auto。21:9, 16:9, 4:3, 1:1, 3:4, 9:16, auto)YAML設定: parameters.aspect_ratio
  • resolution動画解像度(デフォルト: 720p。480p/720pに対応)YAML設定: parameters.resolution
  • duration動画の長さ(秒)。デフォルト: 5。3〜12秒に対応YAML設定: parameters.duration
  • camera_fixedカメラモーションを固定するか。デフォルト: falseYAML設定: parameters.camera_fixed
  • enable_safety_checkerセーフティチェッカーを有効化するか。デフォルト: trueYAML設定: parameters.enable_safety_checker
  • seedシード値(-1でランダム)。デフォルト: -1YAML設定: parameters.seed

Съвети

参照画像を依存ファイルとして指定する場合は dependency_wait: true を設定し、1〜4枚までの画像を読み込ませてください。

Maxtime: 12s

common.code_example

src:
  structure.yaml:
    content: |-
      Project: Cinematic Intro with Seedance Lite Reference-to-Video
      - Use multiple reference stills to control motion
      - Focus on neon-lit cyberpunk ambience and flowing garments
      - Track the subject with a gentle forward-moving camera
    agent_selection_reason: Using i2v-bytedance-seedance-v1-lite-reference-to-video for reference-driven motion control.
    agent: t2i-flux-schnell
    dependency: []
  image-generation:
    reference-main.png:
      content: |-
        A cyberpunk hero standing in a neon-lit alley, dramatic lighting on the coat.
      agent: t2i-flux-schnell
      dependency: []
      api: []
    reference-style.png:
      content: |-
        Stylized lighting accents and atmosphere for the same alley scene.
      agent: t2i-flux-schnell
      dependency: []
      api: []
  video-generation:
    hero-intro.mp4:
      content: |-
        Generate a cinematic opener where the protagonist walks through the neon-lit alley, coat flowing in the wind. Maintain a gentle tracking shot from a slightly elevated angle.
      dependency:
        - src/image-generation/reference-main.png
        - src/image-generation/reference-style.png
      dependency_wait: true
      agent: i2v-bytedance-seedance-v1-lite-reference-to-video
      api: []
      parameters:
        aspect_ratio: "16:9"
        resolution: "720p"
        duration: "5"
        camera_fixed: false
        seed: -1
i2v-bytedance-seedance-v1-lite-reference-to-video

ByteDance Seedance v1 Pro I2V

v1.0 Pro

agents.video.i2v.agents.i2v-bytedance-seedance-v1-pro.description

Незадължителни параметри

  • prompt生成する動画の説明。画像の内容と動きを詳細に記述YAML設定: parameters.prompt
  • resolution生成する動画の解像度("720p", "1080p")。デフォルト: "1080p"YAML設定: parameters.resolution
  • duration生成する動画の長さ(秒)。デフォルト: "5"(固定値)YAML設定: parameters.duration
  • camera_fixedカメラを固定するかどうか。デフォルト: falseYAML設定: parameters.camera_fixed
  • seedシード値(-1でランダム)。デフォルト: -1YAML設定: parameters.seed

Съвети

カメラモーションを制御したい場合は camera_fixed: true を設定します。同じシード値を使用することで、同じプロンプトから同じ動画を再現できます。

Maxtime: 5s

common.code_example

src:
  structure.yaml:
    content: |-
      Project: Natural Motion Video Generation with ByteDance Seedance v1 Pro
      - High-quality image-to-video conversion
      - Camera motion control options
      - Reproducible generation with seed values
      - Multiple resolution support (720p/1080p)
    agent_selection_reason: Using i2v-bytedance-seedance-v1-pro for high-quality motion generation with camera control
    agent: t2i-flux-schnell
    dependency: []
  image-generation:
    base-image.png:
      content: |-
        A peaceful garden scene with blooming flowers
      agent: t2i-flux-schnell
      dependency: []
      api: []
  video-generation:
    garden-motion.mp4:
      content: |-
        Gentle breeze moving through the flowers, petals swaying naturally
        Butterflies flying between the flowers
        Soft sunlight filtering through leaves
      dependency:
        - src/image-generation/base-image.png
      dependency_wait: true
      agent: i2v-bytedance-seedance-v1-pro
      api: []
      parameters:
        resolution: "1080p"
        camera_fixed: false
        seed: -1
i2v-bytedance-seedance-v1-pro

ByteDance OmniHuman v1.5

v1.5

agents.video.i2v.agents.i2v-bytedance-omnihuman-v1-5.description

Задължителни параметри

  • audio_url
    Задължително
    音声ファイルのURL(必須)。30秒以内の音声を指定YAML設定: parameters.audio_url

Съвети

依存関係として人物画像と音声ファイルを登録し、dependency_wait: true を設定してください。

Maxtime: 30s

common.code_example

src:
  structure.yaml:
    content: |-
      Project: Talking Avatar with OmniHuman
      - Combine a portrait still with voice-over audio
      - Generate expressive lip-sync aligned to speech
    agent_selection_reason: Using i2v-bytedance-omnihuman-v1.5 for high-fidelity facial motion and lip-sync.
    agent: claude-3-5-sonnet-20241022
    dependency: []
  image-generation:
    avatar.png:
      content: |-
        A friendly presenter facing the camera with soft studio lighting.
      agent: t2i-flux-schnell
      dependency: []
      api: []
  audio:
    voice-line.mp3:
      content: |-
        "Welcome to our product showcase. Let me guide you through the highlights."
      agent: t2s-gpt-4o-mini-tts
      dependency: []
      api: []
  video-generation:
    talking-avatar.mp4:
      content: |-
        Synchronize the speech with natural facial expressions and subtle head movements.
      dependency:
        - src/image-generation/avatar.png
        - src/audio/voice-line.mp3
      dependency_wait: true
      agent: i2v-bytedance-omnihuman-v1.5
      api: []
      parameters:
        audio_url: src/audio/voice-line.mp3
i2v-bytedance-omnihuman-v1.5

MiniMax Video-01 I2V

v1.0

Модел за генериране на видео от изображения на MiniMax. Генерира висококачествени видеоклипове с естествени движения. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Maxtime: 5s
i2v-minimax-video-01

MiniMax Video-01 Live I2V

v1.0

Модел за генериране на видео от изображения на MiniMax, оптимизиран за реално време. Постига бърза обработка и естествени движения едновременно. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Maxtime: 5s
i2v-minimax-video-01-live

MiniMax Subject Reference I2V

v1.0

Модел за генериране на видео от изображения на MiniMax, базиран на препратка към обект. Добавя естествени движения, като запазва характеристиките на обекта. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Maxtime: 5s
i2v-minimax-video-01-subject-reference

MiniMax Director I2V

v1.0

Модел за генериране на video от изображения на MiniMax с указания от режисьор. Позволява генериране на video въз основа на подробни режисьорски инструкции. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Maxtime: 5s
i2v-minimax-video-01-director

MiniMax Hailuo-02 Pro I2V

v02-pro

agents.video.i2v.agents.i2v-minimax-hailuo-02-pro.description

Незадължителни параметри

  • prompt_optimizerプロンプト最適化機能の有効/無効。デフォルト: trueYAML設定: parameters.prompt_optimizer

Съвети

プロンプト最適化機能により、自動的により詳細で適切なプロンプトに変換されます。依存画像として指定された開始画像を基に、自然で洗練された動画を生成します。

Maxtime: 5s

common.code_example

src:
  structure.yaml:
    content: |-
      Project: High-Quality Video Generation with MiniMax Hailuo-02 Pro
      - Advanced image-to-video conversion with prompt optimization
      - Natural and sophisticated video generation
      - Enhanced detail and motion quality
    agent_selection_reason: Using i2v-minimax-hailuo-02-pro for enhanced video quality with prompt optimization
    agent: t2i-flux-schnell
    dependency: []
  image-generation:
    source-image.png:
      content: |-
        A vibrant cityscape at golden hour with bustling street life
      agent: t2i-flux-schnell
      dependency: []
      api: []
  video-generation:
    city-animation.mp4:
      content: |-
        Gentle movement of people walking through the streets
        Soft lighting changes as the golden hour progresses
        Natural urban atmosphere with subtle life and energy
        Camera slowly pans across the vibrant cityscape
      dependency:
        - src/image-generation/source-image.png
      dependency_wait: true
      agent: i2v-minimax-hailuo-02-pro
      api: []
      parameters:
        prompt_optimizer: true
i2v-minimax-hailuo-02-pro

WAN Image to Video

v1.0

Модел за генериране на видео от изображения на WAN. Генерира висококачествени видеоклипове с естествени движения. Поддържа разнообразни резолюции и пропорции. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Maxtime: 4s
i2v-wan

WAN 2.5 Preview Image to Video

v2.5 Preview

agents.video.i2v.agents.i2v-wan-25-preview.description

Maxtime: 10s

common.code_example

src:
  structure.yaml:
    content: |-
      Project: Cinematic WAN 2.5 Preview shot
      - Generate a 10 second tracking shot from a still hero image
      - Maintain character fidelity while adding dynamic camera motion
      - Use 1080p output for presentation footage
    agent_selection_reason: Selecting i2v-wan-25-preview to leverage WAN 2.5 Preview's long clip support and smooth motion quality.
    agent: claude-3-5-sonnet-20241022
    dependency: []
  image-generation:
    hero-frame.png:
      content: |-
        A heroic warrior standing on a cliff at sunset, cape flowing in the wind.
      agent: t2i-flux-pro
      dependency: []
      api: []
  video-generation:
    cinematic-shot.mp4:
      content: |-
        Create a 10-second 1080p clip with subtle camera push-in and atmospheric motion around the character.
      dependency:
        - src/image-generation/hero-frame.png
      dependency_wait: true
      agent: i2v-wan-25-preview
      api: []
      parameters:
        duration: "5"
        resolution: "1080p"
        aspect_ratio: "16:9"
i2v-wan-25-preview

WAN Image to Video Pro

v1.0

Висококачествена версия на модела WAN за генериране на видео от изображения. Позволява по-детайлно визуално изражение от стандартната версия. Генерира висококачествени видеоклипове с повече стъпки на инференция. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Maxtime: 4s
i2v-wan-pro

WAN Effects Image to Video

v1.0

Модел WAN за генериране на видео от изображения с прилагане на специални ефекти. Автоматично прилага различни ефекти като зуумване, зуумване навън и т.н. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Maxtime: 4s
i2v-wan-effects

Hunyuan Video I2V

v1.0

Модел за генериране на видео от изображения на Hunyuan. Генерира плавни видеоклипове с висока честота на кадрите и резолюция. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Maxtime: 5s
i2v-hunyuan-video

Hunyuan Video LoRA I2V

v1.0

Модел за генериране на видео от изображения на Hunyuan с приложен LoRA. Генерира видеоклипове с конкретен стил или тема, прилагайки персонализиран LoRA. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Maxtime: 5s
i2v-hunyuan-video-lora

Veo 3.1 Image to Video

v3.1

agents.video.i2v.agents.i2v-veo3-1.description

Незадължителни параметри

  • aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
  • resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
  • generate_audio音声付き動画を生成する場合は true。不要な場合は false。YAML設定: parameters.generate_audio
  • duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration

Съвети

被写体の動きやカメラワーク、スタイルを具体的にプロンプトへ記述すると効果的です。音声が不要な場合は generate_audio を false に設定してください。

Maxtime: 8s
i2v-veo3.1

Veo 3.1 Fast Image to Video

v3.1 Fast

agents.video.i2v.agents.i2v-veo3-1-fast-image-to-video.description

Незадължителни параметри

  • aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
  • resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
  • generate_audio音声付き動画を生成する場合は true。不要な場合は false。false にするとクレジットを節約できます。YAML設定: parameters.generate_audio
  • duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration

Съвети

被写体の動きやカメラワーク、演出イメージを具体的に記述すると滑らかなアニメーションになります。ローカル画像を使用する際は dependency_wait: true を忘れずに。

Maxtime: 8s
i2v-veo3.1-fast-image-to-video

Veo 3.1 Reference to Video

v3.1

agents.video.i2v.agents.i2v-veo3-1-reference-to-video.description

Незадължителни параметри

  • image_urls参照画像URLの配列。依存画像を指定すると自動的にFal.aiストレージURLへ変換されますYAML設定: parameters.image_urls
  • aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
  • resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
  • generate_audio音声付き動画を生成する場合は true。不要な場合は false。YAML設定: parameters.generate_audio
  • duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration

Съвети

参照画像ごとにポーズや角度を変えると滑らかな被写体遷移が得られます。local_imageを依存画像に使う場合は dependency_wait: true を設定してください。

Maxtime: 8s
i2v-veo3.1-reference-to-video

Veo 3.1 First/Last Frame

v3.1

agents.video.i2v.agents.i2v-veo3-1-first-last-frame-to-video.description

Незадължителни параметри

  • first_frame_url開始フレームの画像パス。依存画像から解決される場合は省略可能ですYAML設定: parameters.first_frame_url
  • last_frame_url終了フレームの画像パス。依存画像から解決される場合は省略可能ですYAML設定: parameters.last_frame_url
  • aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
  • resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
  • generate_audio音声付き動画を生成する場合は true。不要な場合は false。YAML設定: parameters.generate_audio
  • duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration

Съвети

開始と終了の2フレームを的確に選び、プロンプトでは動き方・カメラワーク・雰囲気を丁寧に指定すると上質な補間結果が得られます。音声が不要な場合は generate_audio を false に設定してください。

Maxtime: 8s
i2v-veo3.1-first-last-frame-to-video

Veo 3.1 First/Last Frame (Fast)

v3.1 Fast

agents.video.i2v.agents.i2v-veo3-1-fast-first-last-frame-to-video.description

Незадължителни параметри

  • first_frame_url開始フレームの画像パス。依存画像から解決される場合は省略可能ですYAML設定: parameters.first_frame_url
  • last_frame_url終了フレームの画像パス。依存画像から解決される場合は省略可能ですYAML設定: parameters.last_frame_url
  • aspect_ratio生成する動画のアスペクト比。"16:9"または"9:16"が選択可能。デフォルト: "16:9"YAML設定: parameters.aspect_ratio
  • resolution出力解像度。"720p"または"1080p"が選択可能。デフォルト: "720p"YAML設定: parameters.resolution
  • generate_audio音声付き動画を生成する場合は true。不要な場合は false。YAML設定: parameters.generate_audio
  • duration動画の長さ。数値または"8s"形式で指定。デフォルト: "8s"YAML設定: parameters.duration

Съвети

開始フレームと終了フレームの2枚を依存画像として必ず用意してください。動きの説明やカメラワーク、雰囲気をプロンプトで詳細に指定すると表現力が向上します。音声が不要な場合は generate_audio を false に設定してください。

Maxtime: 8s
i2v-veo3.1-fast-first-last-frame-to-video

Ray 2 Image to Video

v1.0

Висококачествен модел на Luma за генериране на видео от изображения. Постига реалистични движения и детайлно изражение. Поддържа разнообразни пропорции и резолюции. Позволява и задаване на плавен преход от начално към крайно изображение (по избор). Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Незадължителни параметри

  • start_image_urlПът към началното изображение (по избор)YAML設定: parameters.start_image_url
  • end_image_urlПът към крайното изображение (по избор). Ако е посочено, ще бъде генерирано видео с плавен преход от началното към крайното изображение.YAML設定: parameters.end_image_url

Съвети

Ако посочвате начално и крайно изображение, са необходими поне две зависими изображения. Ако не са посочени, ще бъде генерирано стандартно видео само от началното изображение.

Maxtime: 5s
i2v-ray-2

Luma Dream Machine I2V

v1.5

Модел на Luma за генериране на видео от изображения. Позволява творческо и артистично визуално изражение във видео. Поддържа разнообразни пропорции и резолюции. Позволява и задаване на плавен преход от начално към крайно изображение (по избор). Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Незадължителни параметри

  • start_image_urlПът към началното изображение (по избор)YAML設定: parameters.start_image_url
  • end_image_urlПът към крайното изображение (по избор). Ако е посочено, ще бъде генерирано видео с плавен преход от началното към крайното изображение.YAML設定: parameters.end_image_url

Съвети

Ако посочвате начално и крайно изображение, са необходими поне две зависими изображения. Ако не са посочени, ще бъде генерирано стандартно видео само от началното изображение.

Maxtime: 5s
i2v-luma-dream-machine

Vidu Image to Video

v1.0

Модел на Vidu за генериране на видео от изображения. Реализира визуално изражение от едно изображение с отлично качество на картината и естествени движения. Позволява регулиране на големината на движението. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Maxtime: 4s
i2v-vidu

Vidu Reference Image to Video

v1.0

Модел на Vidu за генериране на видео, използващ референтни изображения. Генерира видео, което запазва последователно изобразяване на обекта от множество референтни изображения. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Зависимости

Могат да бъдат посочени множество зависими изображения, които се интегрират за генериране на последователно видео.

Maxtime: 4s
i2v-vidu-reference

Vidu Start-End Image to Video

v1.0

Модел на Vidu за генериране на видео, като се посочват начално и крайно изображение. Генерира видео с плавен преход между две изображения. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Задължителни параметри

  • start_image_url
    Задължително
    Път към началното изображениеYAML設定: parameters.start_image_url
  • end_image_url
    Задължително
    Път към крайното изображениеYAML設定: parameters.end_image_url
Maxtime: 4s
i2v-vidu-start-end

Vidu Template Image to Video

v1.0

Модел на Vidu за генериране на видео сцени от множество изображения, базиран на шаблон. Генерира видео въз основа на различни шаблони. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Задължителни параметри

  • template
    Задължително
    Име на шаблонаYAML設定: parameters.template
    Налични стойности:
    dreamy_wedding
    romantic_lift
    sweet_proposal
    couple_arrival
    cupid_arrow
    pet_lovers
    lunar_newyear
    hug
    kiss
    dynasty_dress
    wish_sender
    love_pose
    hair_swap
    youth_rewind
    morphlab
    live_photo
    emotionlab
    live_memory
    interaction
    christmas
    Изисквания според стойност:
    • wish_sender - Изисква 3 зависими изображения
    • dynasty_dress - Препоръчително 2 зависими изображения
    • shop_frame - Препоръчително 2 зависими изображения
    • other - Работи с 1 зависимо изображение

Зависимости

Могат да бъдат посочени множество зависими изображения, като е необходим броят изображения според шаблона.

Maxtime: 4s
i2v-vidu-template

Pika v1.5 Pikaffects

v1.5

agents.video.i2v.agents.i2v-pika-v1-5-pikaffects.description

Maxtime: 5s
i2v-pika-v1.5-pikaffects

Pika v2 Turbo

v2.0

Бърз модел на Pika за генериране на видео от изображения. Обработката е 3 пъти по-бърза от стандартната версия, реализира висококачествено визуално изражение във видео. Поддържа 720p резолюция. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true. Максимално време: 5 секунди

Maxtime: 5s
i2v-pika-v2-turbo

Pika v2.1

v2.1

Висококачествен модел на Pika за генериране на видео от изображения. Постига остри детайли и естествени движения едновременно. Поддържа 1080p резолюция. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Maxtime: 5s
i2v-pika-v2.1

Pika v2.2

v2.2

Най-новият модел на Pika за генериране на видео от изображения. Реализира усъвършенствовани движения и естествено визуално изражение. Може да генерира видеоклипове с максимална продължителност 10 секунди. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true. Максимално време: 10 секунди

Maxtime: 5s
i2v-pika-v2.2

Pika v2.2 Scenes

v2.2

Модел на Pika за генериране на видео сцени от множество изображения. Интегрира множество изображения за генериране на последователно видео. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Maxtime: 5s
i2v-pika-v2.2-pikascenes

Pixverse v3.5 I2V

v3.5

Модел на Pixverse за генериране на видео от изображения. Генерира висококачествени видеоклипове с естествени движения и поддържа разнообразни сцени и стилове. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Maxtime: 5s
i2v-pixverse-v3.5

Pixverse v3.5 Fast I2V

v3.5

Бърза версия на модела Pixverse v3.5 за генериране на видео от изображения. Обработката е по-бърза от стандартната версия, идеална за бързи творчески процеси. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Maxtime: 5s
i2v-pixverse-v3.5-fast

SkyReels I2V

v1.0

Модел на Skyreels за генериране на видео от изображения. Позволява генериране на висококачествени видеоклипове с естествени движения. Поддържа различни сцени и реализира плавни анимационни ефекти. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true. Максимално време: 5 секунди

Maxtime: 5s
i2v-skyreels

CogVideoX-5B I2V

v1.0

Модел CogVideoX-5B за генериране на видео от изображения. Създава детайлни, висококачествени видеоклипове, използвайки модел от 5 милиарда параметри. Отличен в изразяването на сложни сцени и движения. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Maxtime: 5s
i2v-cogvideox-5b

LTX Video v0.95 I2V

v0.95

agents.video.i2v.agents.i2v-ltx-video-v0-95.description

Maxtime: 5s
i2v-ltx-video-v0.95

Stable Video I2V

v1.0

Модел Stable Video за генериране на видео от изображения. Създава видеоклипове с отлична стабилност и последователност, подходящи за широк спектър от приложения. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Maxtime: 5s
i2v-stable-video

Fast SVD LCM I2V

v1.0

Ултрабърз модел за генериране на видео от изображения, използващ Stable Video Diffusion LCM. Реализира ултрабързо време за обработка с Lightning Speed и генерира висококачествено видео. Изисква задължително посочване на зависимо изображение и настройка dependency_wait: true.

Maxtime: 5s
i2v-fast-svd-lcm

v2v

Sync-Lipsync

v1.0

Модел, който генерира липсинхрон (движения на устата) за съществуващи видеоклипове, съобразени с аудиото. Постига естествени движения на устата. Изисква задължително посочване на зависимо видео и зависимо аудио и настройка dependency_wait: true.

Maxtime: 5s
v2v-sync-lipsync

s2v

VEED Avatars

v1.0

agents.video.s2v.agents.s2v-veed-avatars.description

Съвети

音声ファイルは依存音声として指定します。アバターIDはavatar_idパラメータで指定可能。デフォルトはemily_vertical_primaryです。音声の長さに合わせて動画が生成されます。

Maxtime: 60s

common.code_example

src:
  structure.yaml:
    content: |-
      Project: Speech to Avatar Video Project
      - 音声からアバター動画を生成
      - 30種類のアバターから選択可能
      - 自然な口パクとジェスチャー
    agent_selection_reason: Project structure definition
    dependency: []
    agent: claude-3-5-sonnet-20241022
    api: []
  audio:
    sample_speech.mp3:
      content: "こんにちは!私はVEED Avatarsを使用したアバターです。音声に合わせて自然に話すことができます。"
      agent_selection_reason: 音声ファイルの生成
      dependency: []
      agent: t2s-gpt-4o-mini-tts
      api: []
  video:
    avatar_video.mp4:
      content: |-
        音声からアバター動画を生成
        - Emily(縦向き・基本)アバターを使用
        - 音声に合わせた自然な口パクとジェスチャー
      agent_selection_reason: s2v-veed-avatarsは音声からリアルなアバター動画を生成でき、30種類のアバターから選択可能
      dependency:
        - src/audio/sample_speech.mp3
      dependency_wait: true
      agent: s2v-veed-avatars
      parameters:
        avatar_id: emily_vertical_primary
      api: []
s2v-veed-avatars

AI Avatar Multi

v1.0

agents.video.s2v.agents.s2v-ai-avatar-multi.description

Съвети

2つの音声ファイルと1つの画像が必須です。すべてdependency配列で指定し、dependency_wait: trueを設定してください。contentの内容がpromptとして使用されます。parametersにはnum_frames、turbo、seedなどの生成オプションのみ指定します。

Maxtime: 90s

common.code_example

src:
  structure.yaml:
    content: KAMUI Anime Avatar 8-Second Conversation Test
    agent_selection_reason: プロジェクト構造定義とKAMUI日本語アバター機能のテスト
    dependency: []
    agent: claude-3-5-sonnet-20241022
    api: []
  audio:
    japanese_greeting.mp3:
      content: みなさん、こんにちは!新しいアニメアバターが登場しました!
      agent_selection_reason: |-
        t2s-minimax-speech-02-turboは日本語の自然な発音と抑揚に対応しており、
        親しみやすい挨拶メッセージの生成に適しています。
      dependency: []
      agent: t2s-minimax-speech-02-turbo
      parameters:
        voice_setting:
          voice_id: Decent_Boy
          speed: 1.4
          emotion: neutral
        language_boost: Japanese
        audio_setting:
          format: mp3
          sample_rate: 44100
      api: []
    japanese_response.mp3:
      content: わあ、すごい!どんなことができるんですか?
      agent_selection_reason: |-
        t2s-minimax-speech-02-turboのDeep_Voice_Manを使用して男性の声で応答を生成。
        対話の自然な流れを作るため、異なる音声IDを使用します。
      dependency: []
      agent: t2s-minimax-speech-02-turbo
      parameters:
        voice_setting:
          voice_id: Lively_Girl
          speed: 1.2
          emotion: neutral
        language_boost: Japanese
        audio_setting:
          format: mp3
          sample_rate: 44100
      api: []
  image:
    conversation_scene.jpg:
      content: Animation Taste, Animation TasteAnimation Taste, Two realistic forest animals having an animated conversation in a beautiful woodland setting. A wise old brown bear sitting upright with expressive eyes and gentle facial expression, appearing to be speaking earnestly to a clever red fox who is sitting attentively with tilted head and bright, intelligent eyes showing curiosity. The bear's mouth is slightly open as if mid-sentence, with natural body language showing engagement. The fox has perked ears and an alert, listening posture. Surrounding them is a lush forest with dappled sunlight filtering through tall trees, creating a warm, magical atmosphere. Moss-covered rocks and wildflowers scattered around. Photorealistic style with incredible detail in fur texture, natural lighting, and authentic woodland environment. The scene captures the essence of two friends sharing stories in nature.

      agent_selection_reason: t2i-flux-proを使用してアニメテイストの男女キャラクターを生成。FLUX
      dependency: []
      agent: t2i-imagen4
      api: []
  video:
    kamui_japanese_avatar_conversation.mp4:
      content: |-
        Two Japanese professionals having a friendly conversation about the new KAMUI grimoire update in a modern office setting. 
        Natural dialogue flow with expressive gestures and eye contact, showcasing the advanced Japanese language avatar capabilities.
      agent_selection_reason: s2v-ai-avatar-multiはデュアル音声対応でWise_WomanとDeep_Voice_Manの2つの声を使った自然な日本語対話動画を生成
      dependency:
        - src/audio/japanese_greeting.mp3
        - src/audio/japanese_response.mp3
        - src/image/conversation_scene.jpg
      dependency_wait: true
      agent: s2v-ai-avatar-multi
      parameters:
        num_frames: 192
        turbo: true
        seed: 12345
      api: []
s2v-ai-avatar-multi

t2v

Veo2 Text to Video

v2.0

Моделът Veo2 позволява висококачествено генериране на видео от текст. Поддържа естествени движения и изход с висока резолюция

Maxtime: 5s
t2v-veo2

Veo3 Text to Video

v3.0

agents.video.t2v.agents.t2v-veo3.description

Maxtime: 10s
t2v-veo3

Veo 3.1 Text to Video

v3.1

agents.video.t2v.agents.t2v-veo3-1.description

Maxtime: 8s
t2v-veo3.1

Veo 3.1 Fast Text to Video

v3.1 Fast

agents.video.t2v.agents.t2v-veo3-1-fast.description

Maxtime: 8s
t2v-veo3.1-fast

Hunyuan Text to Video

v1.0

Отворен модел за генериране на видео, характеризиращ се с висока визуална качество, разнообразни движения, съответствие между текст и видео и стабилно генериране

Maxtime: 5s
t2v-hunyuan-video

Hunyuan Video LoRA

v1.0

Генериране на видео с Hunyuan, използващо LoRA модел. Позволява генериране на видеоклипове с персонализиран стил. Генерира висококачествено съдържание. Максимално време: 5 секунди

Maxtime: 5s
t2v-hunyuan-video-lora

Wan Text to Video

v1.0

Модел за генериране на висококачествено видео от текст. Постига естествени движения и изразителни визуални ефекти

Maxtime: 5s
t2v-wan

Wan 2.5 Preview Text to Video

v2.5 Preview

agents.video.t2v.agents.t2v-wan-25-preview.description

Maxtime: 10s

common.code_example

src:
  storyboard.yaml:
    content: |-
      Project: Futuristic City Reveal with Cinematic Lighting
      - From text prompt to Wan 2.5 Preview video generation
      - Lean camera move that circles around the hero subject
      - Optional background score supplied via audio_url
      - Use 1080p resolution and 10 second duration for presentation reels
      - Deliver both vertical and landscape cuts for social media
      - Include fallback prompts for negative details (noise, low quality)
    agent_selection_reason: Gemini 2.5 Flash organizes requirements and prepares prompts for multi-agent video generation.
    dependency: []
    agent: gemini-2.5-flash-preview-04-17
    api: []
video-generation:
  wan25_preview_demo.mp4:
    content: |-
      Cinematic reveal of a cyberpunk city skyline at sunset.
      The camera begins with a wide aerial shot, then glides around a lone android hero standing on a balcony.
      Neon reflections ripple across glass towers while drones pass overhead.
      Include atmospheric haze, volumetric light shafts, and dynamic clouds.
      Keep movements smooth and emphasize premium cinematic lighting.
    agent_selection_reason: Wan 2.5 Preview handles 1080p output, long motion, and nuanced lighting in 10 second clips.
    dependency: []
    agent: t2v-wan-25-preview
    api: []
    parameters:
      duration: "5"
      aspect_ratio: "16:9"
      resolution: "1080p"
      enable_prompt_expansion: true
      negative_prompt: "low resolution, muted colors, jitter, artifacts"

t2v-wan-25-preview

Wan 2.1 Pro

v1.0

Висококачествен модел за генериране на видео от текст. Позволява по-висока резолюция и детайлно изражение от стандартната версия. Максимално време: 5 секунди

Maxtime: 4s
t2v-wan-pro

Hailuo T2V-01-Live

v1.0

Превръща 2D илюстрации в живи видеоклипове. Вдъхва живот на героите с плавни движения и ярки изражения. Оптимизиран за стабилност и фини изражения, поддържа широк спектър от артистични стилове. Максимално време: 5 секунди

Maxtime: 5s
t2v-hailuo-t2v-01-live

Hailuo T2V-01-Director

v1.0

Модел за генериране на видео от текст с функция за управление на камерата. Позволява прецизно движение на камерата за кинематографично разказване. Включването на инструкции за камерата като [Push in] или [Pan left] в заявката позволява кинематографично изразяване

Maxtime: 5s
t2v-hailuo-t2v-01-director

Kling 1.0

v1.0

Първият модел на Kling за генериране на видео от текст. Реализира прост и лесен за използване интерфейс и висококачествено генериране на видео. Максимално време: 5 секунди

Maxtime: 5s
t2v-kling-1.0

Kling 1.0 Pro

v1.0

Висококачествена версия на Kling 1.0. Реализира по-усъвършенствано рендериране и фини детайли. Максимално време: 5 секунди

Maxtime: 5s
t2v-kling-1.0-pro

Kling 1.6 (std) Text to Video

v1.6

Модел Kling 1.6 (стандартна версия) позволява висококачествено генериране на видео от текст

Maxtime: 5s
t2v-kling-1.6

Kling 1.6 (pro) Text to Video

v1.6 Pro

Модел Kling 1.6 (професионална версия) позволява висококачествено генериране на видео от текст. Позволява по-усъвършенствано визуално изражение. Максимално време: 5 секунди

Maxtime: 5s
t2v-kling-1.6-pro

Kling 2.0 Text to Video

v2.0

Модел за генериране на висококачествено видео от текст от следващо поколение. Поддържа ултра висока резолюция, сложни сцени, усъвършенствано управление на камерата и обектите. Максимално време: 15 секунди

Maxtime: 8s
t2v-kling-2.0

Kling 2.1 Text to Video

v2.1

agents.video.t2v.agents.t2v-kling-2-1.description

Незадължителни параметри

  • duration動画の長さ(5または10秒)。デフォルト: 5YAML設定: parameters.duration
  • aspect_ratioアスペクト比(16:9, 9:16, 1:1)。デフォルト: 16:9YAML設定: parameters.aspect_ratio
  • style映像スタイル(例: cinematic, fantasy, realistic)。オプションYAML設定: parameters.style
  • seed再現性のための乱数シード(0-2147483647)。オプションYAML設定: parameters.seed
  • negative_prompt生成を避ける要素の指定。デフォルト: 'blur, distort, and low quality'YAML設定: parameters.negative_prompt
  • cfg_scaleプロンプトへの忠実度(0.0-1.0)。デフォルト: 0.5YAML設定: parameters.cfg_scale

Съвети

duration, aspect_ratio, negative_prompt, cfg_scaleはAPIでサポートされているパラメータです。styleパラメータはプロンプトの一部として処理されます。高品質な動画を生成するために、詳細で具体的なプロンプトを推奨します。

Maxtime: 10s

common.code_example

src:
  video:
    magical_forest.mp4:
      content: |-
        A magical forest at dawn with glowing fireflies dancing between ancient trees. 
        Soft mist rolls through the undergrowth as golden sunlight filters through the canopy. 
        Ethereal and cinematic atmosphere with smooth camera movement.
      dependency: []
      agent: "t2v-kling-2.1"
      parameters:
        duration: 10                               # 5または10秒を指定
        aspect_ratio: "16:9"                       # 16:9, 9:16, 1:1から選択
        style: "cinematic fantasy"                 # スタイル指定(プロンプトに追加)
        negative_prompt: "low quality, blurry, static camera"  # 除外したい要素
        cfg_scale: 0.7                            # プロンプトへの忠実度(0.0-1.0)
        seed: 123456                              # 再現性のためのシード値(オプション)
      api: []
      
    # 最小構成の例
    simple_scene.mp4:
      content: "A serene lake at sunset with rippling water"
      dependency: []
      agent: "t2v-kling-2.1"
      api: []  # parametersを省略するとデフォルト値が使用されます
t2v-kling-2.1

Kling 2.5 Turbo Pro

v2.5 Turbo Pro

agents.video.t2v.agents.t2v-kling-2-5-turbo-pro.description

Незадължителни параметри

  • duration動画の長さ(5または10秒)。デフォルト: 5YAML設定: parameters.duration
  • aspect_ratioアスペクト比(16:9, 9:16, 1:1)。デフォルト: 16:9YAML設定: parameters.aspect_ratio
  • negative_prompt生成を避ける要素の指定。デフォルト: 'blur, distort, and low quality'YAML設定: parameters.negative_prompt
  • cfg_scaleプロンプトへの忠実度。デフォルト: 0.5YAML設定: parameters.cfg_scale
  • seed再現性のための乱数シード(0-2147483647)。オプションYAML設定: parameters.seed

Съвети

動きのディテールを細かく記述したプロンプトが高品質な結果につながります。

Maxtime: 10s

common.code_example

src:
  video:
    futuristic_city.mp4:
      content: |-
        A futuristic city skyline at sunset with flying cars weaving between holographic billboards.
        - Neon reflections on glass buildings
        - Dynamic aerial traffic
        - Warm cinematic lighting
      dependency: []
      agent: "t2v-kling-2.5-turbo-pro"
      parameters:
        duration: "5"
        aspect_ratio: "16:9"
        cfg_scale: 0.6
        seed: 12345
      api: []
t2v-kling-2.5-turbo-pro

Vidu Q1 Text to Video

v1.0

agents.video.t2v.agents.t2v-vidu-q1.description

Незадължителни параметри

  • aspect_ratio動画のアスペクト比(16:9, 9:16, 1:1)YAML設定: parameters.aspect_ratio
  • movement_amplitude動きの大きさ(auto, small, medium, large)YAML設定: parameters.movement_amplitude
  • style映像スタイル(general, anime)YAML設定: parameters.style
  • seed再現性のための乱数シードYAML設定: parameters.seed

Съвети

「movement_amplitude」を「auto」に設定すると、AIが自動的に適切な動きの大きさを判断します。「style」パラメータでは映像の全体的なスタイルを指定できます。

Maxtime: 5s
t2v-vidu-q1

Pika v2 Turbo Text to Video

v2.0

Моделът Pika v2 Turbo генерира висококачествени видеоклипове от текстова заявка. Реализира бърза обработка с качествено видео извеждане. Максимално време: 5 секунди

Maxtime: 5s
t2v-pika-v2-turbo

Pika v2.1 Text to Video

v2.1

Моделът Pika v2.1 генерира висококачествени видеоклипове от текстова заявка. Реализира отлично визуално изражение и естествени движения. Максимално време: 5 секунди

Maxtime: 5s
t2v-pika-v2.1

Pika v2.2 Text to Video

v2.2

Най-новият модел на Pika генерира висококачествени видеоклипове от текст. Реализира отлично визуално изражение и естествени движения от текстова заявка. Максимално време: 5 секунди

Maxtime: 5s
t2v-pika-v2.2

Pixverse Text to Video

v3.5

Висококачествен модел за генериране на видео от текст. Поддържа разнообразни стилове и настройки на резолюцията. Постига естествени движения и изразителни визуални ефекти

Maxtime: 5s
t2v-pixverse

Pixverse Fast Text to Video

v3.5

Бърз модел за генериране на видео от текст. Поддържа разнообразни стилове и настройки на резолюцията. Обработката е по-бърза от стандартната версия

Maxtime: 5s
t2v-pixverse-fast

Ray-2 Text to Video

v1.0

Висококачествено генериране на видео от текст от най-съвременния модел Ray2 на Luma. Реализира реалистично видео и естествени движения. Поддържа текстови и графични въвеждания

Maxtime: 5s
t2v-ray-2

Ray2 Flash

v1.0

Бърз модел на Luma за генериране на видео от текст. Реализира бърза обработка, като същевременно запазва високото качество на Ray2. Максимално време: 5 секунди

Maxtime: 5s
t2v-ray-2-flash

Luma Dream Machine

v1.0

Модел на Luma за генериране на креативно видео от текст. Оптимален за артистично и творческо изразяване. Максимално време: 5 секунди

Maxtime: 5s
t2v-luma-dream-machine

Fast SVD Text to Video

v1.0

Бърз модел за генериране на видео от текст. Постига естествени движения и изразителни визуални ефекти. Позволява персонализирани ID на контейнери за движение и настройки на дълбок кеш

Maxtime: 5s
t2v-fast-svd

Fast SVD LCM Text to Video

v1.0

Ултрабърз модел за генериране на видео от текст. Използва LCM (Latent Consistency Model) за генериране на висококачествени видеоклипове с по-малък брой стъпки. Постига естествени движения и изразителни визуални ефекти

Maxtime: 5s
t2v-fast-svd-lcm

Mochi V1

v1.0

Висококачествен модел за генериране на видео от текст. Постига естествени движения и изразителни визуални ефекти. Подобрява творчеството с функция за разширяване на заявките

Maxtime: 5s
t2v-mochi-v1

CogVideoX-5B

v1.0

Модел за генериране на видео от текст от следващо поколение. Реализира високо качество, естествени движения и изразителни визуални ефекти. Позволява персонализирани размери на видеото и честота на кадрите

Maxtime: 5s
t2v-cogvideox-5b

T2V Turbo

v1.0

Ултрабърз модел за генериране на видео от текст. Генерира висококачествени видеоклипове с малък брой стъпки. Постига естествени движения и изразителни визуални ефекти. Максимално време: 5 секунди

Maxtime: 5s
t2v-turbo

MiniMax Video 01

v1.0

Висококачествен модел на MiniMax за генериране на видео. Генерира универсално видео съдържание. Максимално време: 5 секунди

Maxtime: 5s
t2v-minimax-video-01

LTX Video v0.95

v0.95

Висококачествен модел за генериране на видео от текст. Генерира естествени движения и изразителни визуални ефекти. Максимално време: 5 секунди

Maxtime: 5s
t2v-ltx-video-v095

OpenAI Sora 2 Text to Video

v2.0

agents.video.t2v.agents.t2v-sora-2.description

Maxtime: 10s
t2v-sora-2

OpenAI Sora 2 Pro Text to Video

v2.0 Pro

agents.video.t2v.agents.t2v-sora-2-pro.description

Maxtime: 10s
t2v-sora-2-pro

s2v

VEED Avatars Speech to Video

v1.0

agents.video.s2v.agents.s2v-veed-avatars.description

Задължителни параметри

  • avatar_id
    Задължително
    使用するアバターIDYAML設定: parameters.avatar_id例: emily_vertical_primary
    Налични стойности:
    emily_vertical_primary
    emily_vertical_secondary
    marcus_vertical_primary
    marcus_vertical_secondary
    mira_vertical_primary
    mira_vertical_secondary
    jasmine_vertical_primary
    jasmine_vertical_secondary
    jasmine_vertical_walking
    aisha_vertical_walking
    elena_vertical_primary
    elena_vertical_secondary
    any_male_vertical_primary
    any_female_vertical_primary
    any_male_vertical_secondary
    any_female_vertical_secondary
    any_male_vertical_walking
    any_female_vertical_walking
    emily_primary
    emily_side
    marcus_primary
    marcus_side
    aisha_walking
    elena_primary
    elena_side
    any_male_primary
    any_female_primary
    any_male_side
    any_female_side

Незадължителни параметри

  • dependency音声ファイルの依存関係を指定。mp3, wav, m4a等の音声ファイルをサポートYAML設定: parameters.dependency
  • dependency_wait依存関係の処理完了を待つかどうか。音声ファイル使用時は必須でtrueに設定YAML設定: parameters.dependency_wait

Съвети

音声ファイルを依存関係として指定し、dependency_wait: trueを設定することで、音声に同期したアバター動画を生成できます。アバターは縦向き(vertical)と横向きのバリエーションがあります。30種類のアバターから選択可能です。

Maxtime: 60s

common.code_example

src:
  structure.yaml:
    content: |-
      Project: Speech to Avatar Video Project
      - 音声からアバター動画を生成
      - 30種類のアバターから選択可能
      - 自然な口パクとジェスチャー
    agent_selection_reason: Project structure definition
    dependency: []
    agent: claude-3-5-sonnet-20241022
    api: []
  audio:
    sample_speech.mp3:
      content: "こんにちは!私はVEED Avatarsを使用したアバターです。音声に合わせて自然に話すことができます。"
      agent_selection_reason: 音声ファイルの生成
      dependency: []
      agent: t2s-gpt-4o-mini-tts
      api: []
  video:
    avatar_video.mp4:
      content: |-
        音声からアバター動画を生成
        - Emily(縦向き・基本)アバターを使用
        - 音声に合わせた自然な口パクとジェスチャー
      agent_selection_reason: s2v-veed-avatarsは音声からリアルなアバター動画を生成でき、30種類のアバターから選択可能
      dependency:
        - src/audio/sample_speech.mp3
      dependency_wait: true
      agent: s2v-veed-avatars
      parameters:
        avatar_id: emily_vertical_primary
      api: []
s2v-veed-avatars

i2vの使用例

Kling Image to Video v2.1

src:
  structure.yaml:
    content: |-
      Project: Creating Innovative Digital Art Fusing Surrealism and Futurism
      - Fantastical world of crystal islands floating on an ocean of liquid starlight
      - Surreal landscape with clockwork mechanical trees and luminous butterflies
      - Photorealistic yet dreamlike still image generation using t2i-imagen3
      - Magical motion and cosmic energy animation using Kling i2v v2.1
      - Unique visual expression where fantasy meets steampunk
      - Mystical space with gravity-defying upward waterfalls and multiple moons
      - Fantastical ecosystem of bioluminescent plants and cosmic energy flows
    agent_selection_reason: Selected claude-3-5-sonnet-20241022 for its excellence in managing project structure design and multiple media generation requirements. Particularly suited for planning surreal artworks and integrated multimedia production management.
    dependency: []
    agent: claude-3-5-sonnet-20241022
    api: []
  image-generation:
    beautifle_landscape.png:
      content: A surreal dreamscape where floating crystal islands hover above an ocean of liquid starlight. Ancient clockwork trees with gears for leaves stretch toward a sky filled with multiple moons in different phases. Ethereal butterflies made of pure light weave between cascading waterfalls that flow upward, defying gravity. The entire scene is painted in vibrant purples, electric blues, and golden amber hues, creating a mystical atmosphere that blends fantasy with steampunk aesthetics. Intricate details include floating geometric structures, bioluminescent flora, and streams of cosmic energy connecting the floating islands.
      agent_selection_reason: t2i-imagen3, Google's cutting-edge image generation model, excels at simultaneously expressing surreal elements and photorealistic textures. It particularly demonstrates advanced capabilities in convincingly depicting liquid starlight, luminous organisms, complex light interactions, and gravity-defying physical phenomena. It also shows superior ability in integrating the complex aesthetics of fantasy and steampunk fusion into a single work.
      dependency: []
      note: Prompts must be in English only.
      agent: t2i-imagen3
      api: []
  video-generation:
    beautifle_landscape.mp4:
      content: |-
        Transform this surreal dreamscape into a mesmerizing animated masterpiece.
        The crystal islands gently rotate and pulse with inner light while floating gracefully.
        Clockwork trees' gear-leaves turn slowly, creating hypnotic mechanical rhythms.
        Light-butterflies dance in spiraling patterns, leaving trails of stardust.
        The upward-flowing waterfalls shimmer and undulate with magical energy.
        Multiple moons slowly orbit across the cosmic sky, casting shifting shadows.
        Bioluminescent plants pulse in synchronized waves of color.
        Streams of cosmic energy flow between islands like living aurora.
        The liquid starlight ocean below ripples with celestial reflections.
        Camera slowly pans across this fantastical realm with cinematic grandeur.
      dependency:
        - src/image-generation/beautifle_landscape.png
      dependency_wait: true
      agent: i2v-kling-v2.1
      api: []
      parameters:
        duration: 5
        aspect_ratio: "1:1"
        negative_prompt: low quality, blurry, static camera
        cfg_scale: 0.6

Kling Image to Video v2.1 Standard

src:
  structure.yaml:
    content: |-
      Project: Standard Quality Video Generation with Kling v2.1 Standard Edition
      - High-quality image-to-video conversion with standard settings
      - Multiple aspect ratio support (16:9, 9:16, 1:1)
      - Duration options (5 or 10 seconds)
      - Consistent and reliable video generation
    agent_selection_reason: Using i2v-kling-2.1-standard for stable and consistent video generation with standard settings
    agent: t2i-flux-schnell
    dependency: []
  image-generation:
    sample-image.png:
      content: |-
        A serene landscape with a calm lake reflecting mountains
      agent: t2i-flux-schnell
      dependency: []
      api: []
  video-generation:
    landscape-video.mp4:
      content: |-
        Gentle breeze creating ripples on the water surface
        Clouds slowly drifting across the sky
        Subtle light changes as time passes
        Natural and peaceful atmosphere
      dependency:
        - src/image-generation/sample-image.png
      dependency_wait: true
      agent: i2v-kling-2.1-standard
      api: []
      parameters:
        duration: 5
        aspect_ratio: "16:9"
        negative_prompt: low quality, unnatural movement
        cfg_scale: 0.5

Kling Image to Video v2.5 Turbo Pro

src:
  structure.yaml:
    content: |-
      Project: Cinematic Orbit Shot of Futuristic Explorer
      - Single still image converted into a moving shot
      - Camera arcs around subject at sunset
      - Tail frame highlights silhouette against the sun
    agent_selection_reason: Selected i2v-kling-v2.5-turbo-pro for smooth cinematic motion.
    dependency:
      - src/local_image/explorer.png
    dependency_wait: true
    agent: i2v-kling-v2.5-turbo-pro
    api: []
    parameters:
      duration: "10"
      aspect_ratio: "16:9"
      negative_prompt: blur, distort, and low quality
      cfg_scale: 0.5

ByteDance Seedance v1 Lite Reference to Video

src:
  structure.yaml:
    content: |-
      Project: Cinematic Intro with Seedance Lite Reference-to-Video
      - Use multiple reference stills to control motion
      - Focus on neon-lit cyberpunk ambience and flowing garments
      - Track the subject with a gentle forward-moving camera
    agent_selection_reason: Using i2v-bytedance-seedance-v1-lite-reference-to-video for reference-driven motion control.
    agent: t2i-flux-schnell
    dependency: []
  image-generation:
    reference-main.png:
      content: |-
        A cyberpunk hero standing in a neon-lit alley, dramatic lighting on the coat.
      agent: t2i-flux-schnell
      dependency: []
      api: []
    reference-style.png:
      content: |-
        Stylized lighting accents and atmosphere for the same alley scene.
      agent: t2i-flux-schnell
      dependency: []
      api: []
  video-generation:
    hero-intro.mp4:
      content: |-
        Generate a cinematic opener where the protagonist walks through the neon-lit alley, coat flowing in the wind. Maintain a gentle tracking shot from a slightly elevated angle.
      dependency:
        - src/image-generation/reference-main.png
        - src/image-generation/reference-style.png
      dependency_wait: true
      agent: i2v-bytedance-seedance-v1-lite-reference-to-video
      api: []
      parameters:
        aspect_ratio: "16:9"
        resolution: "720p"
        duration: "5"
        camera_fixed: false
        seed: -1

ByteDance Seedance v1 Pro I2V

src:
  structure.yaml:
    content: |-
      Project: Natural Motion Video Generation with ByteDance Seedance v1 Pro
      - High-quality image-to-video conversion
      - Camera motion control options
      - Reproducible generation with seed values
      - Multiple resolution support (720p/1080p)
    agent_selection_reason: Using i2v-bytedance-seedance-v1-pro for high-quality motion generation with camera control
    agent: t2i-flux-schnell
    dependency: []
  image-generation:
    base-image.png:
      content: |-
        A peaceful garden scene with blooming flowers
      agent: t2i-flux-schnell
      dependency: []
      api: []
  video-generation:
    garden-motion.mp4:
      content: |-
        Gentle breeze moving through the flowers, petals swaying naturally
        Butterflies flying between the flowers
        Soft sunlight filtering through leaves
      dependency:
        - src/image-generation/base-image.png
      dependency_wait: true
      agent: i2v-bytedance-seedance-v1-pro
      api: []
      parameters:
        resolution: "1080p"
        camera_fixed: false
        seed: -1

ByteDance OmniHuman v1.5

src:
  structure.yaml:
    content: |-
      Project: Talking Avatar with OmniHuman
      - Combine a portrait still with voice-over audio
      - Generate expressive lip-sync aligned to speech
    agent_selection_reason: Using i2v-bytedance-omnihuman-v1.5 for high-fidelity facial motion and lip-sync.
    agent: claude-3-5-sonnet-20241022
    dependency: []
  image-generation:
    avatar.png:
      content: |-
        A friendly presenter facing the camera with soft studio lighting.
      agent: t2i-flux-schnell
      dependency: []
      api: []
  audio:
    voice-line.mp3:
      content: |-
        "Welcome to our product showcase. Let me guide you through the highlights."
      agent: t2s-gpt-4o-mini-tts
      dependency: []
      api: []
  video-generation:
    talking-avatar.mp4:
      content: |-
        Synchronize the speech with natural facial expressions and subtle head movements.
      dependency:
        - src/image-generation/avatar.png
        - src/audio/voice-line.mp3
      dependency_wait: true
      agent: i2v-bytedance-omnihuman-v1.5
      api: []
      parameters:
        audio_url: src/audio/voice-line.mp3

MiniMax Hailuo-02 Pro I2V

src:
  structure.yaml:
    content: |-
      Project: High-Quality Video Generation with MiniMax Hailuo-02 Pro
      - Advanced image-to-video conversion with prompt optimization
      - Natural and sophisticated video generation
      - Enhanced detail and motion quality
    agent_selection_reason: Using i2v-minimax-hailuo-02-pro for enhanced video quality with prompt optimization
    agent: t2i-flux-schnell
    dependency: []
  image-generation:
    source-image.png:
      content: |-
        A vibrant cityscape at golden hour with bustling street life
      agent: t2i-flux-schnell
      dependency: []
      api: []
  video-generation:
    city-animation.mp4:
      content: |-
        Gentle movement of people walking through the streets
        Soft lighting changes as the golden hour progresses
        Natural urban atmosphere with subtle life and energy
        Camera slowly pans across the vibrant cityscape
      dependency:
        - src/image-generation/source-image.png
      dependency_wait: true
      agent: i2v-minimax-hailuo-02-pro
      api: []
      parameters:
        prompt_optimizer: true

WAN 2.5 Preview Image to Video

src:
  structure.yaml:
    content: |-
      Project: Cinematic WAN 2.5 Preview shot
      - Generate a 10 second tracking shot from a still hero image
      - Maintain character fidelity while adding dynamic camera motion
      - Use 1080p output for presentation footage
    agent_selection_reason: Selecting i2v-wan-25-preview to leverage WAN 2.5 Preview's long clip support and smooth motion quality.
    agent: claude-3-5-sonnet-20241022
    dependency: []
  image-generation:
    hero-frame.png:
      content: |-
        A heroic warrior standing on a cliff at sunset, cape flowing in the wind.
      agent: t2i-flux-pro
      dependency: []
      api: []
  video-generation:
    cinematic-shot.mp4:
      content: |-
        Create a 10-second 1080p clip with subtle camera push-in and atmospheric motion around the character.
      dependency:
        - src/image-generation/hero-frame.png
      dependency_wait: true
      agent: i2v-wan-25-preview
      api: []
      parameters:
        duration: "5"
        resolution: "1080p"
        aspect_ratio: "16:9"

s2vの使用例

VEED Avatars

src:
  structure.yaml:
    content: |-
      Project: Speech to Avatar Video Project
      - 音声からアバター動画を生成
      - 30種類のアバターから選択可能
      - 自然な口パクとジェスチャー
    agent_selection_reason: Project structure definition
    dependency: []
    agent: claude-3-5-sonnet-20241022
    api: []
  audio:
    sample_speech.mp3:
      content: "こんにちは!私はVEED Avatarsを使用したアバターです。音声に合わせて自然に話すことができます。"
      agent_selection_reason: 音声ファイルの生成
      dependency: []
      agent: t2s-gpt-4o-mini-tts
      api: []
  video:
    avatar_video.mp4:
      content: |-
        音声からアバター動画を生成
        - Emily(縦向き・基本)アバターを使用
        - 音声に合わせた自然な口パクとジェスチャー
      agent_selection_reason: s2v-veed-avatarsは音声からリアルなアバター動画を生成でき、30種類のアバターから選択可能
      dependency:
        - src/audio/sample_speech.mp3
      dependency_wait: true
      agent: s2v-veed-avatars
      parameters:
        avatar_id: emily_vertical_primary
      api: []

AI Avatar Multi

src:
  structure.yaml:
    content: KAMUI Anime Avatar 8-Second Conversation Test
    agent_selection_reason: プロジェクト構造定義とKAMUI日本語アバター機能のテスト
    dependency: []
    agent: claude-3-5-sonnet-20241022
    api: []
  audio:
    japanese_greeting.mp3:
      content: みなさん、こんにちは!新しいアニメアバターが登場しました!
      agent_selection_reason: |-
        t2s-minimax-speech-02-turboは日本語の自然な発音と抑揚に対応しており、
        親しみやすい挨拶メッセージの生成に適しています。
      dependency: []
      agent: t2s-minimax-speech-02-turbo
      parameters:
        voice_setting:
          voice_id: Decent_Boy
          speed: 1.4
          emotion: neutral
        language_boost: Japanese
        audio_setting:
          format: mp3
          sample_rate: 44100
      api: []
    japanese_response.mp3:
      content: わあ、すごい!どんなことができるんですか?
      agent_selection_reason: |-
        t2s-minimax-speech-02-turboのDeep_Voice_Manを使用して男性の声で応答を生成。
        対話の自然な流れを作るため、異なる音声IDを使用します。
      dependency: []
      agent: t2s-minimax-speech-02-turbo
      parameters:
        voice_setting:
          voice_id: Lively_Girl
          speed: 1.2
          emotion: neutral
        language_boost: Japanese
        audio_setting:
          format: mp3
          sample_rate: 44100
      api: []
  image:
    conversation_scene.jpg:
      content: Animation Taste, Animation TasteAnimation Taste, Two realistic forest animals having an animated conversation in a beautiful woodland setting. A wise old brown bear sitting upright with expressive eyes and gentle facial expression, appearing to be speaking earnestly to a clever red fox who is sitting attentively with tilted head and bright, intelligent eyes showing curiosity. The bear's mouth is slightly open as if mid-sentence, with natural body language showing engagement. The fox has perked ears and an alert, listening posture. Surrounding them is a lush forest with dappled sunlight filtering through tall trees, creating a warm, magical atmosphere. Moss-covered rocks and wildflowers scattered around. Photorealistic style with incredible detail in fur texture, natural lighting, and authentic woodland environment. The scene captures the essence of two friends sharing stories in nature.

      agent_selection_reason: t2i-flux-proを使用してアニメテイストの男女キャラクターを生成。FLUX
      dependency: []
      agent: t2i-imagen4
      api: []
  video:
    kamui_japanese_avatar_conversation.mp4:
      content: |-
        Two Japanese professionals having a friendly conversation about the new KAMUI grimoire update in a modern office setting. 
        Natural dialogue flow with expressive gestures and eye contact, showcasing the advanced Japanese language avatar capabilities.
      agent_selection_reason: s2v-ai-avatar-multiはデュアル音声対応でWise_WomanとDeep_Voice_Manの2つの声を使った自然な日本語対話動画を生成
      dependency:
        - src/audio/japanese_greeting.mp3
        - src/audio/japanese_response.mp3
        - src/image/conversation_scene.jpg
      dependency_wait: true
      agent: s2v-ai-avatar-multi
      parameters:
        num_frames: 192
        turbo: true
        seed: 12345
      api: []

t2vの使用例

Wan 2.5 Preview Text to Video

src:
  storyboard.yaml:
    content: |-
      Project: Futuristic City Reveal with Cinematic Lighting
      - From text prompt to Wan 2.5 Preview video generation
      - Lean camera move that circles around the hero subject
      - Optional background score supplied via audio_url
      - Use 1080p resolution and 10 second duration for presentation reels
      - Deliver both vertical and landscape cuts for social media
      - Include fallback prompts for negative details (noise, low quality)
    agent_selection_reason: Gemini 2.5 Flash organizes requirements and prepares prompts for multi-agent video generation.
    dependency: []
    agent: gemini-2.5-flash-preview-04-17
    api: []
video-generation:
  wan25_preview_demo.mp4:
    content: |-
      Cinematic reveal of a cyberpunk city skyline at sunset.
      The camera begins with a wide aerial shot, then glides around a lone android hero standing on a balcony.
      Neon reflections ripple across glass towers while drones pass overhead.
      Include atmospheric haze, volumetric light shafts, and dynamic clouds.
      Keep movements smooth and emphasize premium cinematic lighting.
    agent_selection_reason: Wan 2.5 Preview handles 1080p output, long motion, and nuanced lighting in 10 second clips.
    dependency: []
    agent: t2v-wan-25-preview
    api: []
    parameters:
      duration: "5"
      aspect_ratio: "16:9"
      resolution: "1080p"
      enable_prompt_expansion: true
      negative_prompt: "low resolution, muted colors, jitter, artifacts"

Kling 2.1 Text to Video

src:
  video:
    magical_forest.mp4:
      content: |-
        A magical forest at dawn with glowing fireflies dancing between ancient trees. 
        Soft mist rolls through the undergrowth as golden sunlight filters through the canopy. 
        Ethereal and cinematic atmosphere with smooth camera movement.
      dependency: []
      agent: "t2v-kling-2.1"
      parameters:
        duration: 10                               # 5または10秒を指定
        aspect_ratio: "16:9"                       # 16:9, 9:16, 1:1から選択
        style: "cinematic fantasy"                 # スタイル指定(プロンプトに追加)
        negative_prompt: "low quality, blurry, static camera"  # 除外したい要素
        cfg_scale: 0.7                            # プロンプトへの忠実度(0.0-1.0)
        seed: 123456                              # 再現性のためのシード値(オプション)
      api: []
      
    # 最小構成の例
    simple_scene.mp4:
      content: "A serene lake at sunset with rippling water"
      dependency: []
      agent: "t2v-kling-2.1"
      api: []  # parametersを省略するとデフォルト値が使用されます

Kling 2.5 Turbo Pro

src:
  video:
    futuristic_city.mp4:
      content: |-
        A futuristic city skyline at sunset with flying cars weaving between holographic billboards.
        - Neon reflections on glass buildings
        - Dynamic aerial traffic
        - Warm cinematic lighting
      dependency: []
      agent: "t2v-kling-2.5-turbo-pro"
      parameters:
        duration: "5"
        aspect_ratio: "16:9"
        cfg_scale: 0.6
        seed: 12345
      api: []

s2vの使用例

VEED Avatars Speech to Video

src:
  structure.yaml:
    content: |-
      Project: Speech to Avatar Video Project
      - 音声からアバター動画を生成
      - 30種類のアバターから選択可能
      - 自然な口パクとジェスチャー
    agent_selection_reason: Project structure definition
    dependency: []
    agent: claude-3-5-sonnet-20241022
    api: []
  audio:
    sample_speech.mp3:
      content: "こんにちは!私はVEED Avatarsを使用したアバターです。音声に合わせて自然に話すことができます。"
      agent_selection_reason: 音声ファイルの生成
      dependency: []
      agent: t2s-gpt-4o-mini-tts
      api: []
  video:
    avatar_video.mp4:
      content: |-
        音声からアバター動画を生成
        - Emily(縦向き・基本)アバターを使用
        - 音声に合わせた自然な口パクとジェスチャー
      agent_selection_reason: s2v-veed-avatarsは音声からリアルなアバター動画を生成でき、30種類のアバターから選択可能
      dependency:
        - src/audio/sample_speech.mp3
      dependency_wait: true
      agent: s2v-veed-avatars
      parameters:
        avatar_id: emily_vertical_primary
      api: []