发现最出色的 AI 工具

为您寻找解决任何合适 AI 方案的终极导航目录。

语音生成与转换(52)

Spix-HQ/spix-mcp

Spix-MCP 为 AI 代理提供真实电话号码和语音功能，用于外呼和来电、电子邮件以及联系人管理。

人工智能语音发生器

为 AI 代理提供真实电话号码处理外呼和来电电子邮件管理+2

fasuizu-br/brainiall-mcp-server

AI驱动的语音工具用于发音评估、语音转文本和文本转语音

人工智能文本转语音

发音评估带语言检测的语音转文本带多种声音的文本转语音

samson-art/transcriptor-mcp

Transcriptor MCP是一款用于从音频内容中生成文本和元数据的AI工具

人工智能转录员

音频转录元数据生成AI驱动分析

让代理大声说出内容，并在完成后向您提供摘要

人工智能文本转语音

大声说出完成后提供摘要

Leximo-AI/leximo-ai-call-assistant-mcp-server

一款AI驱动的电话助手，可自动拨打电话以完成预订和安排预约等任务。

人工智能语音助手

进行AI驱动的电话呼叫预订安排预约+1

Introducing Voicebox

Voicebox是首个为语音设计的生成式AI模型，旨在跨任务泛化并具有最先进的性能。

人工智能文本转语音

生成式语音AI跨任务泛化最先进的性能

一个支持 Retell、VAPI、Bland 和 LiveKit 的开源语音代理测试框架。

人工智能语音发生器

运行自主模拟使用 LLM 评委进行评估

🎙️ OpenSource Voice Dictation Agent (like Wispr Flow

开源语音识别AI助手用于转录

人工智能语音识别

语音识别实时转录开源模型

ybouhjira/claude-code-tts

MCP服务器插件用于Claude Code，通过OpenAI的TTS API将文本转换为语音。

人工智能文本转语音

使用OpenAI的TTS API将文本转换为语音提供6种声音采用工作池架构

transcribe-app/mcp-transcribe

快速可靠的音频/视频转写服务，用于LLM交互。

人工智能转录

快速可靠的转写使用文本内容进行LLM交互支持音频/视频文件和语音备忘录

mberg/kokoro-tts-mcp

使用Kokoro TTS模型将文本转换为语音。

人工智能文本转语音

使用Kokoro TTS模型将文本转换为MP3上传到S3存储桶

mbailey/voice-mcp

语音交互服务器，支持语音转文字、文字转语音和实时语音

人工智能文本转语音

支持语音转文字支持文字转语音集成OpenAI API和LiveKit

ovlabs/mcp-server-originalvoices

为AI代理提供人类上下文的1:1数字孪生网络

人工智能文本转语音

查询数字孪生网络提供真实的人类上下文提升AI代理输出

Vaibhavs10/insanely-fast-whisper

使用Whisper和高级库进行快速AI转录

人工智能文本转语音

结合Whisper Large v2提高准确性使用HF Transformers和Optimum提高速度利用flash attention提高性能

shashikg/WhisperS2T

为Whisper的语音转文字转换优化了管道。

人工智能语音转文本

提升Whisper模型性能简化音频处理提高转录准确性

ggerganov/whisper.cpp

OpenAI的Whisper模型的C/C++本地执行端口

人工智能文本转语音

本地Whisper模型执行C/C++实现OpenAI Whisper模型端口

Introducing Universal-1

Universal-1 是一种前沿的多语言语音转文本AI模型。

人工智能语音识别

支持多种语言高精度转录实时处理

Speech Studio - Microsoft Azure

微软Azure的云语音认知服务。

人工智能文本转语音

基于云的语音识别自然语言理解与Azure服务的集成

🔥] [Eleven Labs Beta

AI语音合成服务为生成的语音添加情感。

人工智能文本转语音

为生成的语音添加情感语音合成服务增强语音表现力

AI Voice Generator

从文本轻松在线创建自然AI旁白

人工智能语音发生器

免费在线文本转语音自然、逼真的声音简单的文本输入界面

一款AI工具，可将人声转换为匹配各种歌手风格的音色。

人工智能变声器

可将人声转换为匹配歌手风格的音色调整人声特征易于使用的界面

p0n1/epub_to_audiobook

将 EPUB 转换为适用于 Audiobookshelf 的音频书格式

人工智能文本转语音

将 EPUB 文件转换为 MP3 音频书针对 Audiobookshelf 兼容性进行优化易于使用的命令行界面

高品质、完全开源的文本转语音AI

人工智能文本转语音

完全开源的TTS模型高质量的音频输出易于使用和集成

从识别到情绪，构建可扩展的语音AI系统

人工智能文本转语音

语音AI架构构建、扩展和评估系统情绪智能集成

Page 1 of 3