AI Awesome
主页
发现最出色的 AI 工具
为您寻找解决任何合适 AI 方案的终极导航目录。
Search
语音生成与转换
(49)
J
unknown
j3k0/speech.sh
让代理大声说出内容,并在完成后向您提供摘要
人工智能文本转语音
大声说出
完成后提供摘要
L
unknown
Leximo-AI/leximo-ai-call-assistant-mcp-server
一款AI驱动的电话助手,可自动拨打电话以完成预订和安排预约等任务。
人工智能语音助手
进行AI驱动的电话呼叫
预订
安排预约
+1
I
unknown
Introducing Voicebox
Voicebox是首个为语音设计的生成式AI模型,旨在跨任务泛化并具有最先进的性能。
人工智能文本转语音
生成式语音AI
跨任务泛化
最先进的性能
V
open source
voicetest
一个支持 Retell、VAPI、Bland 和 LiveKit 的开源语音代理测试框架。
人工智能语音发生器
运行自主模拟
使用 LLM 评委进行评估
�
open source
🎙️ OpenSource Voice Dictation Agent (like Wispr Flow
开源语音识别AI助手用于转录
人工智能语音识别
语音识别
实时转录
开源模型
Y
open source
ybouhjira/claude-code-tts
MCP服务器插件用于Claude Code,通过OpenAI的TTS API将文本转换为语音。
人工智能文本转语音
使用OpenAI的TTS API将文本转换为语音
提供6种声音
采用工作池架构
T
open source
transcribe-app/mcp-transcribe
快速可靠的音频/视频转写服务,用于LLM交互。
人工智能转录
快速可靠的转写
使用文本内容进行LLM交互
支持音频/视频文件和语音备忘录
M
open source
mberg/kokoro-tts-mcp
使用Kokoro TTS模型将文本转换为语音。
人工智能文本转语音
使用Kokoro TTS模型
将文本转换为MP3
上传到S3存储桶
M
open source
mbailey/voice-mcp
语音交互服务器,支持语音转文字、文字转语音和实时语音
人工智能文本转语音
支持语音转文字
支持文字转语音
集成OpenAI API和LiveKit
O
open source
ovlabs/mcp-server-originalvoices
为AI代理提供人类上下文的1:1数字孪生网络
人工智能文本转语音
查询数字孪生网络
提供真实的人类上下文
提升AI代理输出
V
open source
Vaibhavs10/insanely-fast-whisper
使用Whisper和高级库进行快速AI转录
人工智能文本转语音
结合Whisper Large v2提高准确性
使用HF Transformers和Optimum提高速度
利用flash attention提高性能
S
open source
shashikg/WhisperS2T
为Whisper的语音转文字转换优化了管道。
人工智能语音转文本
提升Whisper模型性能
简化音频处理
提高转录准确性
G
open source
ggerganov/whisper.cpp
OpenAI的Whisper模型的C/C++本地执行端口
人工智能文本转语音
本地Whisper模型执行
C/C++实现
OpenAI Whisper模型端口
I
unknown
Introducing Universal-1
Universal-1 是一种前沿的多语言语音转文本AI模型。
人工智能语音识别
支持多种语言
高精度转录
实时处理
S
unknown
Speech Studio - Microsoft Azure
微软Azure的云语音认知服务。
人工智能文本转语音
基于云的语音识别
自然语言理解
与Azure服务的集成
�
unknown
🔥] [Eleven Labs Beta
AI语音合成服务为生成的语音添加情感。
人工智能文本转语音
为生成的语音添加情感
语音合成服务
增强语音表现力
A
unknown
AI Voice Generator
从文本轻松在线创建自然AI旁白
人工智能语音发生器
免费在线文本转语音
自然、逼真的声音
简单的文本输入界面
V
unknown
Voice-Swap
一款AI工具,可将人声转换为匹配各种歌手风格的音色。
人工智能变声器
可将人声转换为匹配歌手风格的音色
调整人声特征
易于使用的界面
P
open source
p0n1/epub_to_audiobook
将 EPUB 转换为适用于 Audiobookshelf 的音频书格式
人工智能文本转语音
将 EPUB 文件转换为 MP3 音频书
针对 Audiobookshelf 兼容性进行优化
易于使用的命令行界面
P
open source
Parler-TTS
高品质、完全开源的文本转语音AI
人工智能文本转语音
完全开源的TTS模型
高质量的音频输出
易于使用和集成
C
unknown
COVAL
从识别到情绪,构建可扩展的语音AI系统
人工智能文本转语音
语音AI架构
构建、扩展和评估系统
情绪智能集成
G
unknown
Github
支持文本转语音功能的免费AI聊天
人工智能文本转语音
文本转语音转换
AI驱动的聊天交互
开源项目
G
unknown
Github
免费AI语音翻译服务,面向开发者。
人工智能文本转语音
实时语音翻译
支持多种语言
易于API集成
G
open source
Github
免费开源的文本转语音AI项目
人工智能文本转语音
将文本转换为语音
支持多种语言
易于使用的API
Previous
Page 1 of 3
Next