功能概述
免费在线文字转语音工具在浏览器中把文字合成为自然语音。中英日三种主语言调用开源 Kokoro-82M 神经网络模型(首次约下载 86MB,之后缓存在本地),韩语、西班牙语、法语、德语等走浏览器内置 Web Speech API 作为补充。所有推理过程 100% 在你的设备上完成,文字内容不会离开浏览器。解决的痛点
市面上的 TTS 服务要么需要注册账号和付费订阅,要么会把输入文本上传到云端处理——个人博客配音、内部培训旁白、游戏剧情朗读等场景往往不方便把稿件交给第三方。此工具让你在本地浏览器里直接生成可下载的音频,不用填信用卡、不用担心文字泄露。核心功能
- 基于 Kokoro-82M 开源模型:中文、英文、日文输出自然、富有情感
- 多音色选择:中/英/日共 22+ 种音色,男女、少年、老年、播报风格均可选
- 浏览器 TTS 回退:韩语、西班牙语、法语、德语等通过设备内置语音引擎合成
- 单次最长 5000 字:适合大多数短视频旁白、播客开场、教学片段
- 一键下载 WAV:生成的音频可直接用于视频剪辑、播客、PPT、游戏
- 100% 本地处理:文字从不上传服务器,首次下载模型后可离线使用
功能亮点
Kokoro-82M 是一个仅 82M 参数的开源 TTS 模型,在端侧跑也能产出接近云端大模型的自然度。搭配浏览器 Web Speech API 的多语言兜底,一个页面覆盖主流配音需求。无账号、无次数限制、无水印。适用场景
- 内容创作:短视频/公众号配音、博客 audio 版本,不再被云端 TTS 月费卡住
- 无障碍阅读:为长文、文档、邮件生成朗读版本,通勤时边走边听
- 语言学习:把生词、例句、文章转成标准发音反复播放
- 播客与课程旁白:录制前先用 AI 生成临时旁白做时长测试,定稿后再人工录音
- 游戏与互动原型:快速生成 NPC 对白占位音频,缩短开发迭代周期
使用建议
- 首次使用会下载 Kokoro 模型(~86MB),建议在 Wi-Fi 下完成,之后切断网络也能使用
- 超过 5000 字的长文请分段生成,避免浏览器内存吃紧
- Kokoro 支持的中/英/日音色质量最高,其他语言走浏览器回退,质量因操作系统而异
- 需要为生成的音频做后期(降噪、均衡、节奏调整),可搭配 BibiGPT 的免费音频降噪工具和静音移除工具使用
相关功能:免费在线文字转语音 — 立即试用 升级 Pro:解锁无限使用 → 查看定价
