AI Awesome
ホーム
最高のAIツールを見つけ出しましょう
あらゆるタスクのための人工知
Search
AI テキスト読み上げ
(30)
J
unknown
j3k0/speech.sh
エージェントに音声で話してもらい、完了したら要約を通知する
AI テキスト読み上げ
音声で話す
完了後に要約を提供する
I
unknown
Introducing Voicebox
Voiceboxは、音声生成AIモデルであり、最先端の性能でタスクを一般化することができる初のモデルです。
AI テキスト読み上げ
音声生成AI
タスクを一般化する
最先端の性能
Y
open source
ybouhjira/claude-code-tts
MCPサーバープラグインのClaude Codeは、OpenAIのTTS APIを使用してテキストを音声に変換します。
AI テキスト読み上げ
OpenAIのTTS APIを使用してテキストを音声に変換
6つの声をサポート
ワーカープールアーキテクチャ
M
open source
mberg/kokoro-tts-mcp
Kokoro TTSモデルを使用してテキストを音声に変換します。
AI テキスト読み上げ
Kokoro TTSモデルを使用
テキストをMP3に変換
S3バケットにアップロード
M
open source
mbailey/voice-mcp
音声インタラクションサーバーで、音声からテキストへの変換、テキストから音声への変換、リアルタイム音声をサポート
AI テキスト読み上げ
音声からテキストへの変換をサポート
テキストから音声への変換をサポート
OpenAI APIとLiveKitと統合
O
open source
ovlabs/mcp-server-originalvoices
AIエージェントが人間の文脈を得るための1:1デジタルツインネットワーク。
AI テキスト読み上げ
デジタルツインネットワークをクエリ
本物の人間の文脈を提供
AIエージェントの出力を改善
V
open source
Vaibhavs10/insanely-fast-whisper
Fast AI transcription using Whisper and advanced libraries.
AI テキスト読み上げ
Whisper Large v2で精度を高める
HF TransformersとOptimumで高速化
flash attentionでパフォーマンスを活用
G
open source
ggerganov/whisper.cpp
ローカル実行のためのOpenAIのWhisperモデルのC/C++ポート
AI テキスト読み上げ
ローカルWhisperモデル実行
C/C++実装
OpenAI Whisperモデルポート
S
unknown
Speech Studio - Microsoft Azure
Microsoft Azureのクラウド音声認識サービス。
AI テキスト読み上げ
クラウドベースの音声認識
自然言語理解
Azureサービスとの統合
�
unknown
🔥] [Eleven Labs Beta
AI TTSサービスは生成された声に感情を加えます。
AI テキスト読み上げ
生成された声に感情を加えます
TTSサービス
声の表現を高めます
P
open source
p0n1/epub_to_audiobook
EPUBをAudiobookshelfに最適化されたオーディオブック形式に変換します。
AI テキスト読み上げ
EPUBファイルをMP3オーディオブックに変換します
Audiobookshelfとの互換性に最適化されています
簡単なコマンドラインインターフェース
P
open source
Parler-TTS
高品質で完全にオープンソースのテキスト読み上げAI
AI テキスト読み上げ
完全にオープンソースのTTSモデル
高品質なオーディオ出力
使いやすく統合しやすい
C
unknown
COVAL
認識から感情まで、スケーラブルな音声AIシステムを構築します。
AI テキスト読み上げ
音声AIアーキテクチャ
システムを構築、スケールアップ、評価
感情知性統合
G
unknown
Github
テキスト読み上げ機能付き無料AIチャット
AI テキスト読み上げ
テキスト読み上げ変換
AIによるチャットインタラクション
オープンソースプロジェクト
G
unknown
Github
無料のAI音声翻訳サービス(開発者向け)。
AI テキスト読み上げ
リアルタイム音声翻訳
複数の言語をサポート
簡単なAPI統合
G
open source
Github
無料のオープンソーステキスト読み上げAIプロジェクト。
AI テキスト読み上げ
テキストを音声に変換
複数の言語をサポート
簡単なAPIを使用
W
open source
whisperX
高度なオープンソース音声認識ツール。
AI テキスト読み上げ
高い精度の音声認識
リアルタイム処理
複数言語サポート
E
unknown
Eleven Labs
AI音声生成器で、多様な音声オプション付き。
AI テキスト読み上げ
リアルな人間のような音声を作成します
さまざまな言語とアクセントを提供します
アプリケーションと簡単に統合できます
T
open source
TTS WebUI
オープンソースのWeb UIでAI音声と音楽生成、15モデル以上。
AI テキスト読み上げ
15モデル以上のTTSモデルをサポート
音声生成AI
Webベースのインターフェース
M
unknown
Microsoft Azure Neural TTS
エンタープライズアプリ向けのスケーラブルなAIテキスト読み上げサービス。
AI テキスト読み上げ
スケーラブルなソリューション
非常にカスタマイズ可能
エンタープライズ統合
I
unknown
iSpeech
多目的なAI音声ソリューション、多様な企業ニーズに対応。
AI テキスト読み上げ
複数の言語をサポート
幅広い声の種類
企業利用に最適化
R
unknown
Respeecher
リアルな感情豊かな声のクローンを作成し、娯楽用に利用します。
AI テキスト読み上げ
感情豊かな声のクローンを作成します
リアルな音声
娯楽業界で使用されています
D
unknown
Descript Overdub
シームレスな音声オーバーレイツールで、Descriptの編集スイートと統合されています。
AI テキスト読み上げ
Descriptの音声認識ツールと統合されます
迅速な音声オーバーレイに最適です
コンテンツ作成ワークフローを強化します
S
paid
Synthesia
テキストからAI動画を素早く簡単に作成します。
AI テキスト読み上げ
プレイテキストから動画を生成
複数のAIアバターが利用可能
動画スタイルをカスタマイズ可能
Previous
Page 1 of 2
Next