6 件のツール
Microsoft VALL-E ニューラル音声合成。
オープンソース 高品質 TTS。
Meta オープンソース MusicGen。
Meta テキスト→環境音モデル。
Meta 多機能音声モデル Voicebox。
OpenAI Whisper 音声認識モデル。