VoiceAgents.title
にじボイス TTS
にじボイスのご利用は必ずクレジット表記が必要です(https://nijivoice.com/#faq)
デフォルト
日本語は得意、海外は苦手(elevenlabsよりも自然な音声)
花村 穂ノ香
15歳女性、明るい一般的な学生の声
冬月初音
16歳女性、可愛らしい少女の声
野本藍一郎
18歳男性、9月29日生まれ、大人しく澄んだ内向的で素朴な声質
ぽの
2歳女性、お茶目で幼い陽気な猫系キャラクターの声
ラピス
23歳女性、10月8日生まれ、ASMRに適した甘えた可愛らしい声質
三浦隼人
30歳男性、知的で成熟した声質
セドリック・E・ウィットモア
12歳男性、2月11日生まれ、クールでツンデレな自信満々な少年の声
守谷 こはね
14歳女性、7月7日生まれ、内向的で大人しく澄んだおどおどした声質
猫田 夕眞
20歳男性、8月8日生まれ、軽快で陽気な猫系の飄々とした声
Minimax TTS
デフォルト(calmlady)
自然な音声合成と変換が可能、日本語は基本ひらがなでcontentに入れる(elevenlabsよりも自然な音声)
知的な年配者
知的な年配者の声、若い大人、落ち着いた性格
忠実な騎士
忠実な騎士の声、成人、若々しい性格
支配的な男性
支配的な男性の声、中年、落ち着いた性格
真面目な指揮官
真面目な指揮官の声、成人、信頼できる性格
優しい執事
優しい執事の声、成人、魅力的な性格
楽観的な若者
楽観的な若者の声、成人、明るい性格
寛大な居酒屋店主
寛大な居酒屋店主の声、中年、遊び心のある性格
スポーティな学生
スポーティな学生の声、成人、親しみやすい性格
無邪気な少年
無邪気な少年の声、成人、親しみやすい性格
決断力のある姫
決断力のある姫の声、成人、しっかりした性格
冷たい女王
冷たい女王の声、成人、距離を置く性格
頼りになる女性
頼りになる女性の声、成人、安定した性格
親切な貴婦人
親切な貴婦人の声、成人、魅力的な性格
落ち着いた貴婦人
落ち着いた貴婦人の声、成人、魅力的な性格
優雅な乙女
優雅な乙女の声、成人、優しい性格
OpenAI TTS (GPT-4o mini TTS)
GPT-4o mini TTS
OpenAIの高品質な音声合成モデル
パラメータ
voice
音声のキャラクター設定
parameters.voice
選択可能な値:
instructions
音声の話し方や雰囲気の指示
parameters.instructions
例: 静かに、小説の朗読口調、慎重で息遣いを深く
使用例
src:
audio:
sf_story_narration.mp3:
content: |-
エララは、透明で自己洗浄機能付きの太陽光発電屋根から差し込む斑模様の日光の下で贅沢に伸びをしました。彼女にとって、これこそが本当の生活でした—デジタルの支配者たちによって完全に世話をされながら、人間が存在を漂っている無菌状態の孤立した都市の塔から離れて。彼女は深く息を吸い込み、自律型の園芸ドローンによって戦略的に植えられた野花の香りを味わいました。
「もう人々が足の下に本物の草を感じることさえないなんて、信じられる?」彼女は劇的にため息をつきながら、虹色に輝く小さな、ハミングするドローン、ピクシーに言いました。
「それは確かに残念なことですね」ピクシーは陽気にさえずり、ドローンの声はエララの気分に完璧に共鳴するように慎重に調整されていました。「あなたは本当に本物の人間体験を生きているのですね、エララ」
「そのとおり!」エララは勢いよくうなずきました。彼女は草から身を起こし、裸足で牧草地に向かって歩き始めました。その間、微小なナノボットの雲が微細な切り傷を密封し、汚れを殺菌していました。
dependency: []
agent: "t2s-gpt-4o-mini-tts"
parameters:
voice: "sage"
instructions: "静かに、小説の朗読口調、慎重で息遣いを深く"
api: []Google AI Studio TTS
Gemini 2.5 Flash TTS
Google Gemini 2.5 Flash高速音声生成(24kHz WAV出力、30種類音声、24言語対応)
Gemini 2.5 Pro TTS
Google Gemini 2.5 Pro高品質音声生成(24kHz WAV出力、複数話者対応)
パラメータ
voice_name
音声名(30種類から選択)
parameters.voice_name
選択可能な値:
multi_speaker
複数話者モード(最大2名)
parameters.multi_speaker
選択可能な値:
speakers
複数話者設定(multi_speaker: true時のみ)
parameters.speakers
例: [{"name": "Speaker1", "voice": "Kore"}, {"name": "Speaker2", "voice": "Puck"}]
使用例
src:
greeting.mp3:
content: "Say cheerfully: Have a wonderful day!"
agent: t2s-gemini-2-5-flash
parameters:
voice_name: "Kore"
dependency: []
conversation.wav:
content: |-
Make Speaker1 sound tired and Speaker2 sound excited:
Speaker1: So... what's on the agenda today?
Speaker2: You're never going to guess!
agent: t2s-gemini-2-5-pro
parameters:
multi_speaker: true
speakers:
- name: "Speaker1"
voice: "Enceladus"
- name: "Speaker2"
voice: "Puck"
dependency: []Minimax Speech-02-Turbo TTS
Minimax Speech-02-Turbo
Minimaxの高速音声合成モデル。17種類の声と感情表現機能を搭載
パラメータ
voice_setting.voice_id
音声キャラクター(17種類から選択)
parameters.voice_setting.voice_id
選択可能な値:
voice_setting.emotion
感情表現
parameters.voice_setting.emotion
選択可能な値:
voice_setting.speed
話速(0.5-2.0)
parameters.voice_setting.speed
例: 1.0
voice_setting.pitch
ピッチ調整(-12~12)
parameters.voice_setting.pitch
例: 0
voice_setting.vol
音量(0.01-10)
parameters.voice_setting.vol
例: 1.0
voice_setting.english_normalization
英語正規化(数字読み上げ改善)
parameters.voice_setting.english_normalization
例: false
audio_setting.format
音声フォーマット
parameters.audio_setting.format
選択可能な値:
audio_setting.sample_rate
サンプリングレート(Hz)
parameters.audio_setting.sample_rate
選択可能な値:
audio_setting.channel
チャンネル数(1:モノラル、2:ステレオ)
parameters.audio_setting.channel
選択可能な値:
audio_setting.bitrate
ビットレート(bps)
parameters.audio_setting.bitrate
選択可能な値:
language_boost
言語認識の強化
parameters.language_boost
選択可能な値:
output_format
出力形式
parameters.output_format
選択可能な値:
pronunciation_dict.tone_list
発音辞書(中国語の声調指定)
parameters.pronunciation_dict.tone_list
例: ["燕少飞/(yan4)(shao3)(fei1)"]
使用例
src:
# 基本的な音声合成
basic_speech.mp3:
content: "Hello world! This is a test of the text-to-speech system."
agent: t2s-minimax-speech-02-turbo
dependency: []
# 感情表現付き音声(喜び)
happy_greeting.mp3:
content: "I'm so excited to share this wonderful news with you!"
agent: t2s-minimax-speech-02-turbo
parameters:
voice_setting:
voice_id: "Lively_Girl"
emotion: "happy"
speed: 1.2
vol: 1.5
dependency: []
# 日本語音声(英語正規化付き)
japanese_announcement.wav:
content: "こんにちは。今日は2024年12月21日です。"
agent: t2s-minimax-speech-02-turbo
parameters:
voice_setting:
voice_id: "Sweet_Girl_2"
english_normalization: true
language_boost: "Japanese"
dependency: []
# 中国語音声(発音辞書使用)
chinese_with_tones.mp3:
content: "燕少飞来了,他很高兴。"
agent: t2s-minimax-speech-02-turbo
parameters:
voice_setting:
voice_id: "Friendly_Person"
language_boost: "Chinese"
pronunciation_dict:
tone_list:
- "燕少飞/(yan4)(shao3)(fei1)"
dependency: []
# 高品質音声設定(FLAC形式)
high_quality_narration.flac:
content: "This is a professional narration with high-quality audio settings."
agent: t2s-minimax-speech-02-turbo
parameters:
voice_setting:
voice_id: "Deep_Voice_Man"
pitch: -2
audio_setting:
format: "flac"
sample_rate: 44100
channel: 2
bitrate: 256000
dependency: []
# 複数の音声を連続生成
story_part1.mp3:
content: "Once upon a time, in a land far away..."
agent: t2s-minimax-speech-02-turbo
parameters:
voice_setting:
voice_id: "Patient_Man"
emotion: "neutral"
dependency: []
story_part2.mp3:
content: "The hero embarked on an epic journey!"
agent: t2s-minimax-speech-02-turbo
parameters:
voice_setting:
voice_id: "Young_Knight"
emotion: "surprised"
speed: 1.1
dependency: ["story_part1.mp3"]ElevenLabs Voice
ElevenLabs
自然な音声合成と変換が可能