1158개 언어 지원, 나만의 목소리로 오디오북 제작

by DD
5개월 전
조회수 7

다양한 전자책 형식 지원: .epub, .mobi 등 다양한 형식의 전자책을 오디오북으로 변환

고품질 TTS 엔진 통합: XTTSv2, Piper-TTS 등 다양한 TTS 엔진을 활용하여 자연스러운 음성 생성

음성 복제 기능: 사용자의 목소리를 복제하여 오디오북 제작 가능

1158개 언어 지원: 광범위한 언어 지원으로 다양한 독자층에게 어필

GUI 및 CLI 인터페이스 제공: 사용 편의성을 높이고, 다양한 사용 환경 지원

다양한 TTS 엔진 통합 및 음성 복제

Ebook2audiobook은 XTTSv2, Piper-TTS, VITS, Fairseq, Tacotron2, YourTTS 등 다양한 TTS(Text-to-Speech) 엔진을 지원하여 사용자가 원하는 음성 스타일을 선택할 수 있도록 한다. 특히, 음성 복제(Voice Cloning) 기능을 통해 사용자의 목소리를 기반으로 오디오북을 제작할 수 있다. 이는 개인화된 오디오 경험(Personalized Audio Experience)을 제공하며, 1158개 언어를 지원하여 광범위한 사용자에게 접근성을 높인다.

다양한 입력 형식 지원

이 도구는 .epub, .mobi, .azw3, .fb2, .lrf, .rb, .snb, .tcr, .pdf, .txt, .rtf, .doc, .docx, .html, .odt, .azw, .tiff, .tif, .png, .jpg, .jpeg, .bmp 등 다양한 전자책 형식(E-book Format)을 지원한다. OCR 스캔(OCR Scanning) 기능을 통해 이미지 기반의 전자책도 처리할 수 있다. 이러한 유연성은 사용자가 다양한 소스에서 전자책을 가져와 오디오북으로 변환할 수 있도록 한다.

GUI 및 CLI 인터페이스 제공

Ebook2audiobook은 Gradio 기반의 웹 GUI(Web GUI)를 제공하여 사용자가 직관적으로 오디오북 변환 작업을 수행할 수 있도록 돕는다. 또한, CLI(Command Line Interface)를 지원하여 자동화된 작업이나 서버 환경에서의 사용을 가능하게 한다. Docker 지원(Docker Support)을 통해 다양한 환경에서 쉽게 배포하고 실행할 수 있으며, --headless 옵션을 통해 백그라운드에서 작업을 수행할 수 있다.

Docker를 활용한 배포 및 실행

README에 따르면, Ebook2audiobook은 Docker 컨테이너(Docker Container)를 통해 쉽게 배포하고 실행할 수 있도록 지원한다. 사용자는 CPU, CUDA, ROCm, XPU, JETSON 등 다양한 환경에 맞는 이미지를 선택하여 사용할 수 있다. Docker Compose를 사용하면 복잡한 설정을 간소화하고, 볼륨 마운트(Volume Mount)를 통해 전자책 및 출력 파일을 관리할 수 있다. 이는 환경 의존성 문제를 해결(Environment Dependency Issues)하고, 사용 편의성을 높인다.

DrewThomasson / ebook2audiobook