AI Awesome
主页
发现最出色的 AI 工具
为您寻找解决任何合适 AI 方案的终极导航目录。
Search
语音生成与转换
(49)
U
unknown
URL
微软的AI语音库用于语音识别和合成
人工智能语音合成
访问各种语音模型
自定义语音创建
与微软服务集成
W
open source
whisperX
高级开源音频转录工具。
人工智能文本转语音
高精度转录
实时处理
多语言支持
V
unknown
VocalReplica
AI可从音轨中分离人声和乐器。
人工智能语音发生器
AI人声分离
AI乐器分离
适用于喜爱的音轨
P
unknown
podcast.ai
由Play.ht文本转语音技术驱动的AI生成播客
人工智能播客
完全AI生成的播客
由Play.ht驱动
文本转语音AI技术
E
unknown
Eleven Labs
具有多种声音选项的AI语音生成器
人工智能文本转语音
创建逼真的类人声音
提供多种语言和口音
易于与应用程序集成
A
unknown
AI Voice Agents
AI语音代理使用DialLink自动处理业务电话和任务
人工智能语音助手
自动处理业务电话
处理日常任务
由DialLink提供支持
T
open source
TTS WebUI
用于AI语音和音乐生成的开源Web界面,包含15+种模型
人工智能文本转语音
支持15+种TTS模型
语音生成AI
基于Web的界面
M
unknown
Microsoft Azure Neural TTS
适用于企业应用的扩展型AI文本转语音服务
人工智能文本转语音
扩展型解决方案
高度可定制
企业集成
V
unknown
Veritone Voice
可定制的语音克隆,用于媒体中的品牌一致性。
人工智能语音发生器
高度可定制的语音克隆
应用于媒体和娱乐
保持品牌一致性
I
unknown
iSpeech
适用于多种企业需求的通用AI语音解决方案
人工智能文本转语音
支持多种语言
提供多种声音
专为企业使用而设计
R
unknown
Respeecher
为娱乐创造逼真、富有情感的语音克隆
人工智能文本转语音
创造富有情感的语音克隆
声音逼真
用于娱乐行业
D
unknown
Descript Overdub
与Descript编辑套件无缝集成的配音工具
人工智能文本转语音
与Descript的转录工具集成
适合快速配音
增强内容创作工作流程
S
paid
Synthesia
从文本快速轻松地创建AI视频
人工智能文本转语音
从纯文本生成视频
提供多种AI虚拟形象
可自定义视频风格
S
unknown
Speech and Language Processing - Dan Jurafsky and James H. Martin
斯坦福大学语音和语言处理课程的全面材料
人工智能语音合成
斯坦福专家制定的课程大纲
免费访问课程内容
详细的学术资源
V
unknown
Voice_Agent
Voice_Agent 是一个AI语音代理测试应用。
人工智能语音发生器
语音交互功能
AI驱动响应
项目测试环境
S
unknown
Speechllm
通过GitHub训练、推理和评估SpeechLLM模型
人工智能语音合成
SpeechLLM模型的训练代码
SpeechLLM模型的推理代码
SpeechLLM模型的评估代码
S
unknown
Speech-Trident
强大的语音/音频大语言模型和编解码器模型
人工智能语音合成
很棒的语音/音频大语言模型
表征学习
编解码器模型
V
unknown
Voice datasets
全面的开放源代码语音和声音数据集集合。
人工智能文本转语音
列出95+数据集
用于语音和声音计算
公开可用
T
open source
tortoise-tts
高品质多音色文本转语音系统
人工智能文本转语音
多音色TTS
注重质量
开源
V
unknown
Vonage
为企业住宅提供全面的电话服务。
人工智能文本转语音
本地、免费长途和国际号码
虚拟前台
呼叫管理功能
O
unknown
OpenAI TTS
使用OpenAI TTS API将文本转换为自然语音音频。
人工智能文本转语音
高质量的音频转换
支持多种语言
可定制的语音选项
G
unknown
Google STT
来自 Google Cloud 的高质量语音识别 API
人工智能语音转文本
利用 Google 的 ASR 技术
易于使用的 API
全面的语音转文字服务
E
paid
ElevenLabs
基于人工智能的语音合成,用于可访问内容创作。
人工智能文本转语音
自然音效生成
支持多种语言
内容可访问性工具
A
unknown
Azure Speech Service
Azure语音服务提供140多种语言的神经声音。
人工智能语音合成
支持超过400种神经声音
适用于140多种语言和地区
包含多语言声音
Previous
Page 2 of 3
Next