Qwen3-TTS / Qwen3-ASR

鸽伦比娅·希珀塞莱尼亚

参考音频和参考文本从项目目录中的配置文件读取。页面支持直接输入目标文本，也支持先把提示词发给 LM Studio，等待回复后自动送入流式合成。现在也支持麦克风流式输入，识别结果会实时回填到目标文本。

TTS 运行时量化GPU 流式合成

Talker-

Predictor-

Decoder-

Provider-

ASR 运行时ONNX 增量识别

Variant-

Provider-

Quantization-

Sample Rate-

语音流式输入麦克风 -> ONNX ASR

待机 Session -

点击开始录音后，浏览器会按小段 WAV 持续上传，识别文本实时写入目标文本。安卓 Chrome 走局域网访问时通常需要 HTTPS；拿不到实时麦克风权限时，可用下面的录音文件上传兜底。

录音文件上传

还没有识别结果。

LM Studio本地推理

LM 提示词

LM Studio Ready 自动检测模型

留空则直接使用目标文本；填写后会先等待 LM Studio 回复。

还没有聊天历史。填写 LM 提示词后，用户输入和 LM 回复会自动累计在这里。

合成参数

目标文本较长时会自动分段

目标文本

语言 Temperature

Sub Temperature Seed

Sub Seed Auto Steps Margin

调试模式

自动规划提交后会由服务端再次校准

自动步数256

预计时长0.0s

总分段数-

模式Auto

Idle

等待开始。