Add local GPU preset voices with dropdown selection.

Generate ChatTTS sample_random_speaker presets without cloud APIs; choose clone or preset in synthesize UI.

Co-authored-by: Cursor <cursoragent@cursor.com>
This commit is contained in:
dekun
2026-06-12 17:28:17 +08:00
parent 8be34a2fd5
commit eb71e28427
7 changed files with 304 additions and 15 deletions
+16 -2
View File
@@ -106,11 +106,25 @@ python app.py
## 使用流程
### 首次使用:锁定音色
### 配音音色(全部本地 GPU,无需 API)
| 方式 | 说明 |
|------|------|
| **我的锁定音色** | 「音色锁定」上传你的人声 → 声音克隆(`speaker_emb.pt` |
| **预设男/女声** | ChatTTS 内置说话人,合成页下拉选择(类似微软音色列表) |
首次使用预设音色(服务器执行一次):
```bash
bash scripts/generate_voice_presets.sh
pm2 restart trading_studio
```
### 首次使用:锁定音色(可选,用于克隆自己的声音)
1. 进入 **「音色锁定」** 标签页
2. 上传 10-30 秒干净人声参考(你的碎碎念盲录样本)
3. (可选)填写参考音频的精确转写,提升 zero-shot 还原度
3. 填写参考音频的精确转写(强烈建议)
4. 点击 **锁定音色** → 生成 `speaker_emb.pt`
### 日常生产