AI Awesome
主页
发现最出色的 AI 工具
为您寻找解决任何合适 AI 方案的终极导航目录。
Search
人工智能文本转语音
(30)
J
unknown
j3k0/speech.sh
让代理大声说出内容,并在完成后向您提供摘要
人工智能文本转语音
大声说出
完成后提供摘要
I
unknown
Introducing Voicebox
Voicebox是首个为语音设计的生成式AI模型,旨在跨任务泛化并具有最先进的性能。
人工智能文本转语音
生成式语音AI
跨任务泛化
最先进的性能
Y
open source
ybouhjira/claude-code-tts
MCP服务器插件用于Claude Code,通过OpenAI的TTS API将文本转换为语音。
人工智能文本转语音
使用OpenAI的TTS API将文本转换为语音
提供6种声音
采用工作池架构
M
open source
mberg/kokoro-tts-mcp
使用Kokoro TTS模型将文本转换为语音。
人工智能文本转语音
使用Kokoro TTS模型
将文本转换为MP3
上传到S3存储桶
M
open source
mbailey/voice-mcp
语音交互服务器,支持语音转文字、文字转语音和实时语音
人工智能文本转语音
支持语音转文字
支持文字转语音
集成OpenAI API和LiveKit
O
open source
ovlabs/mcp-server-originalvoices
为AI代理提供人类上下文的1:1数字孪生网络
人工智能文本转语音
查询数字孪生网络
提供真实的人类上下文
提升AI代理输出
V
open source
Vaibhavs10/insanely-fast-whisper
使用Whisper和高级库进行快速AI转录
人工智能文本转语音
结合Whisper Large v2提高准确性
使用HF Transformers和Optimum提高速度
利用flash attention提高性能
G
open source
ggerganov/whisper.cpp
OpenAI的Whisper模型的C/C++本地执行端口
人工智能文本转语音
本地Whisper模型执行
C/C++实现
OpenAI Whisper模型端口
S
unknown
Speech Studio - Microsoft Azure
微软Azure的云语音认知服务。
人工智能文本转语音
基于云的语音识别
自然语言理解
与Azure服务的集成
�
unknown
🔥] [Eleven Labs Beta
AI语音合成服务为生成的语音添加情感。
人工智能文本转语音
为生成的语音添加情感
语音合成服务
增强语音表现力
P
open source
p0n1/epub_to_audiobook
将 EPUB 转换为适用于 Audiobookshelf 的音频书格式
人工智能文本转语音
将 EPUB 文件转换为 MP3 音频书
针对 Audiobookshelf 兼容性进行优化
易于使用的命令行界面
P
open source
Parler-TTS
高品质、完全开源的文本转语音AI
人工智能文本转语音
完全开源的TTS模型
高质量的音频输出
易于使用和集成
C
unknown
COVAL
从识别到情绪,构建可扩展的语音AI系统
人工智能文本转语音
语音AI架构
构建、扩展和评估系统
情绪智能集成
G
unknown
Github
支持文本转语音功能的免费AI聊天
人工智能文本转语音
文本转语音转换
AI驱动的聊天交互
开源项目
G
unknown
Github
免费AI语音翻译服务,面向开发者。
人工智能文本转语音
实时语音翻译
支持多种语言
易于API集成
G
open source
Github
免费开源的文本转语音AI项目
人工智能文本转语音
将文本转换为语音
支持多种语言
易于使用的API
W
open source
whisperX
高级开源音频转录工具。
人工智能文本转语音
高精度转录
实时处理
多语言支持
E
unknown
Eleven Labs
具有多种声音选项的AI语音生成器
人工智能文本转语音
创建逼真的类人声音
提供多种语言和口音
易于与应用程序集成
T
open source
TTS WebUI
用于AI语音和音乐生成的开源Web界面,包含15+种模型
人工智能文本转语音
支持15+种TTS模型
语音生成AI
基于Web的界面
M
unknown
Microsoft Azure Neural TTS
适用于企业应用的扩展型AI文本转语音服务
人工智能文本转语音
扩展型解决方案
高度可定制
企业集成
I
unknown
iSpeech
适用于多种企业需求的通用AI语音解决方案
人工智能文本转语音
支持多种语言
提供多种声音
专为企业使用而设计
R
unknown
Respeecher
为娱乐创造逼真、富有情感的语音克隆
人工智能文本转语音
创造富有情感的语音克隆
声音逼真
用于娱乐行业
D
unknown
Descript Overdub
与Descript编辑套件无缝集成的配音工具
人工智能文本转语音
与Descript的转录工具集成
适合快速配音
增强内容创作工作流程
S
paid
Synthesia
从文本快速轻松地创建AI视频
人工智能文本转语音
从纯文本生成视频
提供多种AI虚拟形象
可自定义视频风格
Previous
Page 1 of 2
Next