KONAN TECHNOLOGY

Vision AI Konan Voice

Konan Voice를
사용해야 하는 이유

텍스트만 입력하면, 고품질 AI 음성과 3D 캐릭터 제작 완료!
성우와 캐릭터를 선택해 나만의 3D 캐릭터를 만들 수 있습니다.
코난보이스를 활용해 다양한 동영상 콘텐츠를 제작해보세요!

Konan Voice는 단일 신경망 기술을
사용하여 입력된 텍스트로부터 해당
음성파형을
실시간 자동으로 합성하는
고품질 고속 end-to-end 음성합성
솔루션
입니다.


Video - 인공지능 성우, 코난보이스 3D 캐릭터 (Konan Voice)

BENEFITS

Benefit 01.

차별화된 음성합성 솔루션 제시

한국어 텍스트가 음성으로 변환되며 한국어 외에도 영어, 숫자, 기호 등의 텍스트 및 다양한 표본화와 오디오 인코딩 포맷의 음성 파형도 지원됩니다.


Benefit 02.

혁신적 음성합성 서비스 실현

남녀 합성음 선택 기능을 제공하고, 낭독체 및 대화체 합성도 지원됩니다.
또한 평서문, 의문문, 감탄문, 띄어읽기 합성 및 다양한 음색과 억양의
남녀 음성 페르소나도 지원돼 선택군이 다양합니다.


Benefit 03.

발성 속도 조절

보통 발성 속도 대비 빠르거나 느린 합성음을 지원하며,
발성 속도 또한 점진적으로 조절할 수 있습니다.

FEATURE

Konan Voice는 고품질 단일화자 음성합성 엔진은 '현직 아나운서', '성우' 등 음성 발성 전문가로부터 녹음된
고품질의 대용량 단일화자 음성데이터를 학습에 사용하고, 음성 지속시간 모델과 비순환 신경망 기반
고속 end-to-end 음성합성 기술을 적용하여 인간이 발성한 음성 수준의 고품질 합성음을 CPU 상에서
실시간으로 제공
합니다.

또한 다화자 다음색 음성합성 엔진은 고품질 고속 end-to-end 음성합성 기술과 화자 임베딩 기술을 결합하여
재학습 없이 화자 정보만으로 개별 화자 고유의 음색과 발음 스타일 등이 생생하게 표현된 고품질 페르소나 음성을
실시간으로 합성
할 수 있습니다.

고품질 End-to- end 음성합성

  • 학습 데이터로부터 음성합성 규칙을 자체적으로 학습하여 음성을 합성하는 단일 신경망 모듈 기반의 최신 end-to-end 음성합성 기술 적용
  • 음성 운율 모델링 기술 적용으로 보다 자연스러운 음질 확보
  • 인간 발성 음성 수준의 고품질 합성음 제공

고완성도 음성합성

  • 음성 지속시간 모델링 기술 적용으로 end-to-end 음성합성 기술의 불안정한 합성오류 문제 해결
  • 완벽한 상용 서비스를 위한 고완성도 음성합성
    기능

CPU 기반 고속 음성합성

  • 전체 신경망 모듈을 비순환, 비재귀 방식의 고속 트랜스포머 알고리즘으로 설계
  • GPU 없이 CPU 상에서도 실시간 합성음 제공

다양한 음색 및 음성스타일

  • 현직 아나운서 등 남녀 음성 발성 전문가들로부터 수집한 고품질 대용량 음성데이터로 신경망 학습
  • 낭독체 및 대화체 합성음 지원
  • 수백 명 수준의 다화자 다음색 합성음 선택을 통한 음성 페르소나 지원

Video - 코난보이스 3D 캐릭터 튜토리얼

TECHNOLOGY

개념도 - Konan Voice

개념도 - Konan Voice