ChatTTSは、GitHubの2noise/chatttsにある音声生成モデルのことです。Chat TTSは、会話シナリオに特に設計されており、大規模言語モデルのアシスタント向けのダイアログタスクや、会話型オーディオ・ビデオのイントロダクションに向いています。モデルは、中国語と英語の両方をサポートしており、高品質かつ自然なスピーチ合成を実現しています。このようなパフォーマンスは、中国語と英語のデータ約100,000時間のトレーニングによって実現しています。また、プロジェクトチームは、40,000時間のデータでトレーニングされた基本モデルをオープンソース化する予定で、学術コミュニティや開発者コミュニティがさらなる研究開発を行うのを支援します。
オールインワンのオーディオ AI プラットフォーム。音声文字起こし、Speech-To-Text、オーディオペン、Text-to-Speech、ビデオダビング、ライブストリームキャプションのための究極のソリューション