AI Awesome
ホーム
最高のAIツールを見つけ出しましょう
あらゆるタスクのための人工知
Search
音声生成と変換
(49)
U
unknown
URL
マイクロソフトのAI音声ギャラリーは、音声認識と合成のためのものです。
AI Speech Synthesis
さまざまな音声モデルへのアクセス
カスタム音声の作成
マイクロソフトサービスとの統合
W
open source
whisperX
高度なオープンソース音声認識ツール。
AI テキスト読み上げ
高い精度の音声認識
リアルタイム処理
複数言語サポート
V
unknown
VocalReplica
AIがトラックからボーカルと楽器を分離します。
AI音声ジェネレーター
AIによるボーカル分離
AIによる楽器分離
お気に入りのトラックで動作します
P
unknown
podcast.ai
AIで生成されたポッドキャスト、Play.htテキスト読み上げで動作。
AI ポッドキャスト
完全にAIで生成されたポッドキャスト
Play.htで動作
テキスト読み上げAI技術
E
unknown
Eleven Labs
AI音声生成器で、多様な音声オプション付き。
AI テキスト読み上げ
リアルな人間のような音声を作成します
さまざまな言語とアクセントを提供します
アプリケーションと簡単に統合できます
A
unknown
AI Voice Agents
AI Voice AgentsはDialLinkでビジネスコールとタスクを自動化します。
AI音声アシスタント
ビジネスコールを自動化
ルーティンワークを処理
DialLinkで動作
T
open source
TTS WebUI
オープンソースのWeb UIでAI音声と音楽生成、15モデル以上。
AI テキスト読み上げ
15モデル以上のTTSモデルをサポート
音声生成AI
Webベースのインターフェース
M
unknown
Microsoft Azure Neural TTS
エンタープライズアプリ向けのスケーラブルなAIテキスト読み上げサービス。
AI テキスト読み上げ
スケーラブルなソリューション
非常にカスタマイズ可能
エンタープライズ統合
V
unknown
Veritone Voice
カスタマイズ可能な声のクローニングで、メディアにおけるブランドの統一性を保つ。
AI音声ジェネレーター
非常にカスタマイズ可能な声のクローニング
メディアおよびエンターテイメントで使用
ブランドの統一性を維持
I
unknown
iSpeech
多目的なAI音声ソリューション、多様な企業ニーズに対応。
AI テキスト読み上げ
複数の言語をサポート
幅広い声の種類
企業利用に最適化
R
unknown
Respeecher
リアルな感情豊かな声のクローンを作成し、娯楽用に利用します。
AI テキスト読み上げ
感情豊かな声のクローンを作成します
リアルな音声
娯楽業界で使用されています
D
unknown
Descript Overdub
シームレスな音声オーバーレイツールで、Descriptの編集スイートと統合されています。
AI テキスト読み上げ
Descriptの音声認識ツールと統合されます
迅速な音声オーバーレイに最適です
コンテンツ作成ワークフローを強化します
S
paid
Synthesia
テキストからAI動画を素早く簡単に作成します。
AI テキスト読み上げ
プレイテキストから動画を生成
複数のAIアバターが利用可能
動画スタイルをカスタマイズ可能
S
unknown
Speech and Language Processing - Dan Jurafsky and James H. Martin
包括的なスタンフォード大学の音声および言語処理コース教材。
AI Speech Synthesis
スタンフォード大学専門家によるカリキュラム
コースコンテンツへの無料アクセス
詳細な学術リソース
V
unknown
Voice_Agent
Voice_AgentはAI音声エージェントのテストアプリです。
AI音声ジェネレーター
音声インタラクション機能
AIによる応答
プロジェクトテスト環境
S
unknown
Speechllm
GitHubを通じてSpeechLLMモデルをトレーニング、推論、評価します。
AI Speech Synthesis
SpeechLLMモデルのトレーニングコード
SpeechLLMモデルの推論コード
SpeechLLMモデルの評価コード
S
unknown
Speech-Trident
パワフルなスピーチ/オーディオLLMとコーデックモデル。
AI Speech Synthesis
すごいスピーチ/オーディオLLM
表現学習
コーデックモデル
V
unknown
Voice datasets
包括的なオープンソースの音声およびサウンドデータセットコレクション。
AI テキスト読み上げ
95以上のデータセットがリストされています
音声およびサウンドコンピューティング向け
公開されています
T
open source
tortoise-tts
高品質な多音声テキスト読み上げシステム。
AI テキスト読み上げ
多音声TTS
品質重視
オープンソース
V
unknown
Vonage
ビジネスおよび住居向けの包括的な電話サービス。
AI テキスト読み上げ
ローカル、無料通話可能、および国際番号
バーチャルアシスタント
通話管理機能
O
unknown
OpenAI TTS
OpenAI TTS APIでテキストを自然な音声に変換します。
AI テキスト読み上げ
高品質な音声変換
複数の言語サポート
カスタマイズ可能な声のオプション
G
unknown
Google STT
Google Cloudからの高品質な音声認識APIです。
AI 音声テキスト変換
GoogleのASR技術を活用
使いやすいAPI
包括的な音声からテキストへのサービス
E
paid
ElevenLabs
AIで動作する音声合成によるアクセシブルコンテンツ作成
AI テキスト読み上げ
自然な音声生成
複数の言語をサポート
コンテンツアクセシビリティツール
A
unknown
Azure Speech Service
Azure Speech Serviceは140以上の言語にわたるニューラルボイスを提供しています。
AI Speech Synthesis
400以上のニューラルボイスをサポート
140以上の言語とロケールで利用可能
多言語ボイスを含む
Previous
Page 2 of 3
Next