# 🎤 자연스러운 더빙을 위해 어떤 영상이 적합할까요?

![Image](https://upload.cafenono.com/image/slashpagePost/20250416/190250_ZOqZtHbhzAASXx9mpk?q=80&s=1280x180&t=outside&f=webp)

더빙 기능의 품질을 보장하기 위해 아래와 같은 조건을 충족하는 것이 중요합니다.

### **1️⃣ AI 더빙을 위해 필요한 음성 분량은 어느 정도일까요?**

각 화자의 음성이 최소 20 초 이상 포함되어야 합니다.

발화 시간이 너무 짧을 경우, 번역 및 음성 생성의 정확도가 낮아질 수 있습니다.

### **2️⃣ 최적의 화자 수는 몇 명 정도가 좋을까요?**

현재 최대 2명의 화자까지 매끄럽게 더빙을 지원하고 있습니다.

다수의 화자가 있는 영상에서도 음성은 지원되며, 보이스 클론 및 화자 분리 기능은 일정 부분 차이가 있을 수 있습니다.

### 3️⃣** 배경음과 효과음 처리**

배경음 속에 사람이 내는 효과음(예: 웃음소리)이 포함된 경우, 현재 별도로 필터링되지 않습니다.

따라서 효과음도 일반 음성으로 인식되어 번역될 수 있습니다.

### 4️⃣** 소음 환경 및 빠른 발화 영상 처리**

소음이 심한 환경(기차 소리, 매미 소리, 배경 음악 등)에서는 음성 인식 및 번역의 정확도가 낮아질 수 있습니다.

빠른 말하기(빨리 감기된 영상 포함)가 포함된 경우, 정상적으로 동작하지 않을 가능성이 있습니다.

이러한 조건을 충족하면 더 안정적인 음성 번역 품질을 경험할 수 있습니다. 😊

For the site tree, see the [root Markdown](https://community.perso.ai/.md).