Qwen3-TTS / Qwen3-ASR

鸽伦比娅·希珀塞莱尼亚

参考音频和参考文本从项目目录中的配置文件读取。页面支持直接输入目标文本,也支持先把提示词发给 LM Studio,等待回复后自动送入流式合成。现在也支持麦克风流式输入,识别结果会实时回填到目标文本。

TTS 运行时量化GPU 流式合成
Talker-
Predictor-
Decoder-
Provider-
ASR 运行时ONNX 增量识别
Variant-
Provider-
Quantization-
Sample Rate-
语音流式输入麦克风 -> ONNX ASR
待机 Session -

点击开始录音后,浏览器会按小段 WAV 持续上传,识别文本实时写入目标文本。安卓 Chrome 走局域网访问时通常需要 HTTPS;拿不到实时麦克风权限时,可用下面的录音文件上传兜底。

还没有识别结果。
LM Studio本地推理
LM Studio Ready 自动检测模型

留空则直接使用目标文本;填写后会先等待 LM Studio 回复。

聊天历史 0 / 30000
还没有聊天历史。填写 LM 提示词后,用户输入和 LM 回复会自动累计在这里。

合成参数

目标文本较长时会自动分段

自动规划提交后会由服务端再次校准
自动步数256
预计时长0.0s
总分段数-
模式Auto

流式状态

Idle
等待开始。