Qwen3-TTS / Qwen3-ASR
鸽伦比娅·希珀塞莱尼亚
参考音频和参考文本从项目目录中的配置文件读取。页面支持直接输入目标文本,也支持先把提示词发给 LM Studio,等待回复后自动送入流式合成。现在也支持麦克风流式输入,识别结果会实时回填到目标文本。
TTS 运行时量化GPU 流式合成
Talker-
Predictor-
Decoder-
Provider-
ASR 运行时ONNX 增量识别
Variant-
Provider-
Quantization-
Sample Rate-
语音流式输入麦克风 -> ONNX ASR
待机
Session -
点击开始录音后,浏览器会按小段 WAV 持续上传,识别文本实时写入目标文本。安卓 Chrome 走局域网访问时通常需要 HTTPS;拿不到实时麦克风权限时,可用下面的录音文件上传兜底。
还没有识别结果。
LM Studio本地推理
还没有聊天历史。填写 LM 提示词后,用户输入和 LM 回复会自动累计在这里。
合成参数
目标文本较长时会自动分段
流式状态
Idle等待开始。