AI Awesome
ホーム
最高のAIツールを見つけ出しましょう
あらゆるタスクのための人工知
Search
音声生成と変換
(49)
J
unknown
j3k0/speech.sh
エージェントに音声で話してもらい、完了したら要約を通知する
AI テキスト読み上げ
音声で話す
完了後に要約を提供する
L
unknown
Leximo-AI/leximo-ai-call-assistant-mcp-server
AIで動作するコールアシスタントで、予約の予約やアポイントメントのスケジュールなど、電話を自動化します。
AI音声アシスタント
AIで動作する電話の発信
予約の予約
アポイントメントのスケジュール
+1
I
unknown
Introducing Voicebox
Voiceboxは、音声生成AIモデルであり、最先端の性能でタスクを一般化することができる初のモデルです。
AI テキスト読み上げ
音声生成AI
タスクを一般化する
最先端の性能
V
open source
voicetest
オープンソースのテストハーネスで、Retell、VAPI、Bland、およびLiveKitをサポートする音声エージェント用です。
AI音声ジェネレーター
自律的なシミュレーションを実行する
LLMジャッジで評価する
�
open source
🎙️ OpenSource Voice Dictation Agent (like Wispr Flow
オープンソースの音声認識AIエージェントで、テキスト変換
AI音声認識
音声認識
リアルタイム変換
オープンソースモデル
Y
open source
ybouhjira/claude-code-tts
MCPサーバープラグインのClaude Codeは、OpenAIのTTS APIを使用してテキストを音声に変換します。
AI テキスト読み上げ
OpenAIのTTS APIを使用してテキストを音声に変換
6つの声をサポート
ワーカープールアーキテクチャ
T
open source
transcribe-app/mcp-transcribe
高速で信頼性の高い音声/動画のテキスト変換サービスで、LLMとのインタラクションに対応。
AI文字起こし
高速で信頼性の高いテキスト変換
テキストコンテンツを使用したLLMのインタラクション
音声/動画ファイルと音声メモのサポート
M
open source
mberg/kokoro-tts-mcp
Kokoro TTSモデルを使用してテキストを音声に変換します。
AI テキスト読み上げ
Kokoro TTSモデルを使用
テキストをMP3に変換
S3バケットにアップロード
M
open source
mbailey/voice-mcp
音声インタラクションサーバーで、音声からテキストへの変換、テキストから音声への変換、リアルタイム音声をサポート
AI テキスト読み上げ
音声からテキストへの変換をサポート
テキストから音声への変換をサポート
OpenAI APIとLiveKitと統合
O
open source
ovlabs/mcp-server-originalvoices
AIエージェントが人間の文脈を得るための1:1デジタルツインネットワーク。
AI テキスト読み上げ
デジタルツインネットワークをクエリ
本物の人間の文脈を提供
AIエージェントの出力を改善
V
open source
Vaibhavs10/insanely-fast-whisper
Fast AI transcription using Whisper and advanced libraries.
AI テキスト読み上げ
Whisper Large v2で精度を高める
HF TransformersとOptimumで高速化
flash attentionでパフォーマンスを活用
S
open source
shashikg/WhisperS2T
Whisperの音声からテキストへの変換のためのパイプラインを最適化しました。
AI 音声テキスト変換
Whisperモデルのパフォーマンスを向上させる
音声処理を簡素化する
翻訳の精度を向上させる
G
open source
ggerganov/whisper.cpp
ローカル実行のためのOpenAIのWhisperモデルのC/C++ポート
AI テキスト読み上げ
ローカルWhisperモデル実行
C/C++実装
OpenAI Whisperモデルポート
I
unknown
Introducing Universal-1
Universal-1は、最先端の多言語音声認識AIモデルです。
AI音声認識
複数の言語をサポート
高い精度の音声認識
リアルタイム処理
S
unknown
Speech Studio - Microsoft Azure
Microsoft Azureのクラウド音声認識サービス。
AI テキスト読み上げ
クラウドベースの音声認識
自然言語理解
Azureサービスとの統合
�
unknown
🔥] [Eleven Labs Beta
AI TTSサービスは生成された声に感情を加えます。
AI テキスト読み上げ
生成された声に感情を加えます
TTSサービス
声の表現を高めます
A
unknown
AI Voice Generator
テキストから自然なAI音声をオンラインで簡単に作成します。
AI音声ジェネレーター
無料オンラインテキスト読み上げ
自然でリアルな音声
シンプルなテキスト入力インターフェース
V
unknown
Voice-Swap
AIツールでボーカルを変換して、さまざまな歌手のスタイルに合わせます。
AI Voice Changer
歌手のスタイルに合わせてボーカルを変換します
ボーカルの特徴を調整します
使いやすいインターフェース
P
open source
p0n1/epub_to_audiobook
EPUBをAudiobookshelfに最適化されたオーディオブック形式に変換します。
AI テキスト読み上げ
EPUBファイルをMP3オーディオブックに変換します
Audiobookshelfとの互換性に最適化されています
簡単なコマンドラインインターフェース
P
open source
Parler-TTS
高品質で完全にオープンソースのテキスト読み上げAI
AI テキスト読み上げ
完全にオープンソースのTTSモデル
高品質なオーディオ出力
使いやすく統合しやすい
C
unknown
COVAL
認識から感情まで、スケーラブルな音声AIシステムを構築します。
AI テキスト読み上げ
音声AIアーキテクチャ
システムを構築、スケールアップ、評価
感情知性統合
G
unknown
Github
テキスト読み上げ機能付き無料AIチャット
AI テキスト読み上げ
テキスト読み上げ変換
AIによるチャットインタラクション
オープンソースプロジェクト
G
unknown
Github
無料のAI音声翻訳サービス(開発者向け)。
AI テキスト読み上げ
リアルタイム音声翻訳
複数の言語をサポート
簡単なAPI統合
G
open source
Github
無料のオープンソーステキスト読み上げAIプロジェクト。
AI テキスト読み上げ
テキストを音声に変換
複数の言語をサポート
簡単なAPIを使用
Previous
Page 1 of 3
Next