Add local GPU preset voices with dropdown selection.

Generate ChatTTS sample_random_speaker presets without cloud APIs; choose clone or preset in synthesize UI. Co-authored-by: Cursor <cursoragent@cursor.com>
2026-06-12 17:28:17 +08:00
parent 8be34a2fd5
commit eb71e28427
7 changed files with 304 additions and 15 deletions
@@ -106,11 +106,25 @@ python app.py

 ## 使用流程

-### 首次使用：锁定音色
+### 配音音色（全部本地 GPU，无需 API）
+
+| 方式 | 说明 |
+|------|------|
+| **我的锁定音色** | 「音色锁定」上传你的人声 → 声音克隆（`speaker_emb.pt`） |
+| **预设男/女声** | ChatTTS 内置说话人，合成页下拉选择（类似微软音色列表） |
+
+首次使用预设音色（服务器执行一次）：
+
+```bash
+bash scripts/generate_voice_presets.sh
+pm2 restart trading_studio
+```
+
+### 首次使用：锁定音色（可选，用于克隆自己的声音）

 1. 进入 **「音色锁定」** 标签页
 2. 上传 10-30 秒干净人声参考（你的碎碎念盲录样本）
-3. （可选）填写参考音频的精确转写，提升 zero-shot 还原度
+3. 填写参考音频的精确转写（强烈建议）
 4. 点击 **锁定音色** → 生成 `speaker_emb.pt`

 ### 日常生产