ChatTTS: 채팅용 텍스트 음성 변환 개요
ChatTTS는 대화 시나리오용으로 설계된 음성 생성 모델로, GitHub에서 2noise/chattts로 사용할 수 있습니다. 이는 대형 언어 모델 어시스턴트 및 대화형 오디오 및 비디오 소개를 위한 대화 작업을 지원하며 영어와 중국어를 모두 지원합니다. 약 100,000시간의 데이터로 훈련된 ChatTTS는 고품질 및 자연스러운 음성 합성을 제공합니다. 프로젝트 팀은 40,000시간의 데이터로 훈련된 기본 모델을 오픈 소스로 공개하여 추가 연구 및 개발을 지원할 계획입니다.
ChatTTS의 주요 기능 중 하나는 영어와 중국어를 포함한 다국어 지원으로, 언어 장벽을 극복합니다. 약 10백만 시간의 데이터로 철저히 훈련된 ChatTTS는 일류 음성 합성을 제공합니다. 대화 작업에 이상적인 ChatTTS는 응용 프로그램 및 서비스에서 상호 작용 경험을 향상시킵니다.