VoiceAgents.title

にじボイス TTS

にじボイスのご利用は必ずクレジット表記が必要です(https://nijivoice.com/#faq)

デフォルト

日本語は得意、海外は苦手(elevenlabsよりも自然な音声)

nijivoice-tts

花村 穂ノ香

15歳女性、明るい一般的な学生の声

nijivoice-tts-ja-honoka

冬月初音

16歳女性、可愛らしい少女の声

nijivoice-tts-ja-hatsune

野本藍一郎

18歳男性、9月29日生まれ、大人しく澄んだ内向的で素朴な声質

nijivoice-tts-ja-aiichiro

ぽの

2歳女性、お茶目で幼い陽気な猫系キャラクターの声

nijivoice-tts-ja-pono

ラピス

23歳女性、10月8日生まれ、ASMRに適した甘えた可愛らしい声質

nijivoice-tts-ja-lapis

三浦隼人

30歳男性、知的で成熟した声質

nijivoice-tts-ja-hayato

セドリック・E・ウィットモア

12歳男性、2月11日生まれ、クールでツンデレな自信満々な少年の声

nijivoice-tts-ja-cedric

守谷 こはね

14歳女性、7月7日生まれ、内向的で大人しく澄んだおどおどした声質

nijivoice-tts-ja-kohane

猫田 夕眞

20歳男性、8月8日生まれ、軽快で陽気な猫系の飄々とした声

nijivoice-tts-ja-yuuma

Minimax TTS

デフォルト(calmlady)

自然な音声合成と変換が可能、日本語は基本ひらがなでcontentに入れる(elevenlabsよりも自然な音声)

minimax-tts

知的な年配者

知的な年配者の声、若い大人、落ち着いた性格

minimax-tts-ja-intellectual-senior

忠実な騎士

忠実な騎士の声、成人、若々しい性格

minimax-tts-ja-loyal-knight

支配的な男性

支配的な男性の声、中年、落ち着いた性格

minimax-tts-ja-dominant-man

真面目な指揮官

真面目な指揮官の声、成人、信頼できる性格

minimax-tts-ja-serious-commander

優しい執事

優しい執事の声、成人、魅力的な性格

minimax-tts-ja-gentle-butler

楽観的な若者

楽観的な若者の声、成人、明るい性格

minimax-tts-ja-optimistic-youth

寛大な居酒屋店主

寛大な居酒屋店主の声、中年、遊び心のある性格

minimax-tts-ja-generous-izakaya-owner

スポーティな学生

スポーティな学生の声、成人、親しみやすい性格

minimax-tts-ja-sporty-student

無邪気な少年

無邪気な少年の声、成人、親しみやすい性格

minimax-tts-ja-innocent-boy

決断力のある姫

決断力のある姫の声、成人、しっかりした性格

minimax-tts-ja-decisive-princess

冷たい女王

冷たい女王の声、成人、距離を置く性格

minimax-tts-ja-cold-queen

頼りになる女性

頼りになる女性の声、成人、安定した性格

minimax-tts-ja-dependable-woman

親切な貴婦人

親切な貴婦人の声、成人、魅力的な性格

minimax-tts-ja-kind-lady

落ち着いた貴婦人

落ち着いた貴婦人の声、成人、魅力的な性格

minimax-tts-ja-calm-lady

優雅な乙女

優雅な乙女の声、成人、優しい性格

minimax-tts-ja-graceful-maiden

OpenAI TTS (GPT-4o mini TTS)

GPT-4o mini TTS

OpenAIの高品質な音声合成モデル

t2s-gpt-4o-mini-tts

パラメータ

voice

音声のキャラクター設定

parameters.voice

選択可能な値:

alloy
echo
fable
onyx
nova
shimmer
sage

instructions

音声の話し方や雰囲気の指示

parameters.instructions

例: 静かに、小説の朗読口調、慎重で息遣いを深く

使用例

src:
  audio:
    sf_story_narration.mp3:
      content: |-
        エララは、透明で自己洗浄機能付きの太陽光発電屋根から差し込む斑模様の日光の下で贅沢に伸びをしました。彼女にとって、これこそが本当の生活でした—デジタルの支配者たちによって完全に世話をされながら、人間が存在を漂っている無菌状態の孤立した都市の塔から離れて。彼女は深く息を吸い込み、自律型の園芸ドローンによって戦略的に植えられた野花の香りを味わいました。

        「もう人々が足の下に本物の草を感じることさえないなんて、信じられる?」彼女は劇的にため息をつきながら、虹色に輝く小さな、ハミングするドローン、ピクシーに言いました。

        「それは確かに残念なことですね」ピクシーは陽気にさえずり、ドローンの声はエララの気分に完璧に共鳴するように慎重に調整されていました。「あなたは本当に本物の人間体験を生きているのですね、エララ」

        「そのとおり!」エララは勢いよくうなずきました。彼女は草から身を起こし、裸足で牧草地に向かって歩き始めました。その間、微小なナノボットの雲が微細な切り傷を密封し、汚れを殺菌していました。
      dependency: []
      agent: "t2s-gpt-4o-mini-tts"
      parameters:
        voice: "sage"
        instructions: "静かに、小説の朗読口調、慎重で息遣いを深く"
      api: []

Google AI Studio TTS

Gemini 2.5 Flash TTS

Google Gemini 2.5 Flash高速音声生成(24kHz WAV出力、30種類音声、24言語対応)

t2s-gemini-2-5-flash

Gemini 2.5 Pro TTS

Google Gemini 2.5 Pro高品質音声生成(24kHz WAV出力、複数話者対応)

t2s-gemini-2-5-pro

パラメータ

voice_name

音声名(30種類から選択)

parameters.voice_name

選択可能な値:

Kore
Puck
Zephyr
Enceladus
Aoede
Autonoe
Umbriel
Algieba
Erinome
Algenib
Laomedeia
Achernar
Schedar
Gacrux
Achird
Zubenelgenubi
Sadachbia
Sadaltager
Charon
Leda
Callirhoe
Iapetus
Despina
Rasalgethi
Alnilam
Pulcherrima
Vindemiatrix
Sulafat
Fenrir
Orus

multi_speaker

複数話者モード(最大2名)

parameters.multi_speaker

選択可能な値:

true
false

speakers

複数話者設定(multi_speaker: true時のみ)

parameters.speakers

例: [{"name": "Speaker1", "voice": "Kore"}, {"name": "Speaker2", "voice": "Puck"}]

使用例

src:
  greeting.mp3:
    content: "Say cheerfully: Have a wonderful day!"
    agent: t2s-gemini-2-5-flash
    parameters:
      voice_name: "Kore"
    dependency: []

  conversation.wav:
    content: |-
      Make Speaker1 sound tired and Speaker2 sound excited:
      Speaker1: So... what's on the agenda today?
      Speaker2: You're never going to guess!
    agent: t2s-gemini-2-5-pro
    parameters:
      multi_speaker: true
      speakers:
        - name: "Speaker1"
          voice: "Enceladus"
        - name: "Speaker2"
          voice: "Puck"
    dependency: []

Minimax Speech-02-Turbo TTS

Minimax Speech-02-Turbo

Minimaxの高速音声合成モデル。17種類の声と感情表現機能を搭載

t2s-minimax-speech-02-turbo

パラメータ

voice_setting.voice_id

音声キャラクター(17種類から選択)

parameters.voice_setting.voice_id

選択可能な値:

Wise_Woman
Friendly_Person
Inspirational_girl
Deep_Voice_Man
Calm_Woman
Casual_Guy
Lively_Girl
Patient_Man
Young_Knight
Determined_Man
Lovely_Girl
Decent_Boy
Imposing_Manner
Elegant_Man
Abbess
Sweet_Girl_2
Exuberant_Girl

voice_setting.emotion

感情表現

parameters.voice_setting.emotion

選択可能な値:

happy
sad
angry
fearful
disgusted
surprised
neutral

voice_setting.speed

話速(0.5-2.0)

parameters.voice_setting.speed

例: 1.0

voice_setting.pitch

ピッチ調整(-12~12)

parameters.voice_setting.pitch

例: 0

voice_setting.vol

音量(0.01-10)

parameters.voice_setting.vol

例: 1.0

voice_setting.english_normalization

英語正規化(数字読み上げ改善)

parameters.voice_setting.english_normalization

例: false

audio_setting.format

音声フォーマット

parameters.audio_setting.format

選択可能な値:

mp3
pcm
flac

audio_setting.sample_rate

サンプリングレート(Hz)

parameters.audio_setting.sample_rate

選択可能な値:

8000
16000
22050
24000
32000
44100

audio_setting.channel

チャンネル数(1:モノラル、2:ステレオ)

parameters.audio_setting.channel

選択可能な値:

1
2

audio_setting.bitrate

ビットレート(bps)

parameters.audio_setting.bitrate

選択可能な値:

32000
64000
128000
256000

language_boost

言語認識の強化

parameters.language_boost

選択可能な値:

Chinese
Chinese,Yue
English
Arabic
Russian
Spanish
French
Portuguese
German
Turkish
Dutch
Ukrainian
Vietnamese
Indonesian
Japanese
Italian
Korean
Thai
Polish
Romanian
Greek
Czech
Finnish
Hindi
auto

output_format

出力形式

parameters.output_format

選択可能な値:

url
hex

pronunciation_dict.tone_list

発音辞書(中国語の声調指定)

parameters.pronunciation_dict.tone_list

例: ["燕少飞/(yan4)(shao3)(fei1)"]

使用例

src:
  # 基本的な音声合成
  basic_speech.mp3:
    content: "Hello world! This is a test of the text-to-speech system."
    agent: t2s-minimax-speech-02-turbo
    dependency: []

  # 感情表現付き音声(喜び)
  happy_greeting.mp3:
    content: "I'm so excited to share this wonderful news with you!"
    agent: t2s-minimax-speech-02-turbo
    parameters:
      voice_setting:
        voice_id: "Lively_Girl"
        emotion: "happy"
        speed: 1.2
        vol: 1.5
    dependency: []

  # 日本語音声(英語正規化付き)
  japanese_announcement.wav:
    content: "こんにちは。今日は2024年12月21日です。"
    agent: t2s-minimax-speech-02-turbo
    parameters:
      voice_setting:
        voice_id: "Sweet_Girl_2"
        english_normalization: true
      language_boost: "Japanese"
    dependency: []

  # 中国語音声(発音辞書使用)
  chinese_with_tones.mp3:
    content: "燕少飞来了,他很高兴。"
    agent: t2s-minimax-speech-02-turbo
    parameters:
      voice_setting:
        voice_id: "Friendly_Person"
      language_boost: "Chinese"
      pronunciation_dict:
        tone_list:
          - "燕少飞/(yan4)(shao3)(fei1)"
    dependency: []

  # 高品質音声設定(FLAC形式)
  high_quality_narration.flac:
    content: "This is a professional narration with high-quality audio settings."
    agent: t2s-minimax-speech-02-turbo
    parameters:
      voice_setting:
        voice_id: "Deep_Voice_Man"
        pitch: -2
      audio_setting:
        format: "flac"
        sample_rate: 44100
        channel: 2
        bitrate: 256000
    dependency: []

  # 複数の音声を連続生成
  story_part1.mp3:
    content: "Once upon a time, in a land far away..."
    agent: t2s-minimax-speech-02-turbo
    parameters:
      voice_setting:
        voice_id: "Patient_Man"
        emotion: "neutral"
    dependency: []
  
  story_part2.mp3:
    content: "The hero embarked on an epic journey!"
    agent: t2s-minimax-speech-02-turbo
    parameters:
      voice_setting:
        voice_id: "Young_Knight"
        emotion: "surprised"
        speed: 1.1
    dependency: ["story_part1.mp3"]

ElevenLabs Voice

ElevenLabs

自然な音声合成と変換が可能

elevenlabs-voice