AI Awesome
ホーム
最高のAIツールを見つけ出しましょう
あらゆるタスクのための人工知
Search
AI検出と反検出
(42)
F
unknown
For-Sunny/hebbian-mind-enterprise
AI生成アート検出ツール
AIアートディテクタ
ヘブバン学習
ニューロングラフメモリ
協調活性化
T
unknown
thoughtproof/thoughtproof-mcp
取引実行前にAIエージェントのための敵対的多モデル推論検証
AIアートディテクタ
Claude、Grok、およびDeepSeekが各決定に挑戦
JWKS署名の attestation で ALLOW または HOLD を返す
Base (USDC) で x402-gated
P
unknown
Prompt Injection Sentinel
プロンプトインジェクションとジャイルブレイクを検出するために微調整されたモデルで、低い偽陽性率です。
AI コンテンツ検出器
微調整されたBERT-largeモデル
低い偽陽性率
プロンプトインジェクション分類
D
unknown
DeBERTa Prompt Injection Detector v2
DeBERTa Prompt Injection Detector v2 は、大規模言語モデルにおけるプロンプトインジェクション攻撃を検出するために微調整されたAIモデルです。
AI コンテンツ検出器
fine-tuned DeBERTa-v3-base
LLM guardrail pipelinesで使用
悪意のあるプロンプトを特定するのに効果的
L
unknown
Llama-Prompt-Guard-2-86M
Llama-Prompt-Guard-2-86Mは、LLMパイプラインでプロンプトインジェクションとジャイルブレイクの試みを検出する軽量モデルです
AI コンテンツ検出器
プロンプトインジェクションを検出
ジャイルブレイクの試みを防止
86Mパラメータモデル
L
unknown
Llama-Guard-4-12B
Llama-Guard-4-12Bは、LLMの入力と出力における有害コンテンツを検出する多モーダルセーフティ分類器です
AI コンテンツ検出器
テキストおよび画像モダリティにおける有害コンテンツの検出
Metaによって開発
多モーダルセーフティ分類の最新技術
S
open source
spikee
プロンプトインジェクション脆弱性を評価および利用するためのツール
AIアートディテクタ
プロンプトインジェクションを検知
セキュリティを評価
脆弱性を利用
A
open source
ai-scanner
NVIDIA garakに基づくオープンソースのWebアプリケーションで、AIモデルのセキュリティ評価に使用されます
AIアートディテクタ
179のプローブ
マルチターゲットスキャン
スケジュールされたスキャン
+2
T
unknown
The Arcanum Prompt Injection Taxonomy
プロンプトインジェクション攻撃のための包括的な分類システム
AI検出器
攻撃意図を分類
技術と回避策をカバー
入力ベクトルを分類
G
open source
GUCCI-atlasv/skillssafe-mcp
無料のAIエージェントスキルセキュリティスキャナーで、SKILL.md、MCP設定、システムプロンプトをセキュリティ脆弱性に分析します。
AI コンテンツ検出器
資格情報の盗難、プロンプトインジェクション、ゼロ幅文字攻撃、ClawHavoc指標のスキャン
OpenClaw、Claude Code、Cursor、Codexをサポート
サインアップ不要
G
open source
gpartin/CryptoGuardClient
AI取引エージェントのための決定的な暗号検証器で、取引を検証し、rug pullを検出します。
AIアートディテクタ
取引ごとの決定的な暗号検証器
取引を検証(PROCEED/CAUTION/BLOCK)
トークンをスキャン
+2
Z
open source
Ziran
オープンソースのセキュリティテストフレームワークで、AIエージェントのための危険なツールチェーン構成を発見し、実行レベルの副作用を検出します。
AIアートディテクタ
危険なツールチェーン構成のためのグラフ分析
実行レベルの副作用の検出
多段階の信頼悪用キャンペーン
S
open source
ShellWard
ShellWardは、プロンプトインジェクション、データ漏洩、および危険なコマンドに対して8層の防御を持つAIエージェントセキュリティミドルウェアです
AIアートディテクタ
8層の防御システム
プロンプトインジェクション対策
データ漏洩防止
+2
J
open source
joergmichno/clawguard-mcp
AIエージェント用のセキュリティスキャナーで、42以上の正規表現パターンを使用してプロンプトインジェクションを検出します
AI コンテンツ検出器
プロンプトインジェクションを検出
42以上の正規表現パターンを使用
AIエージェント用のセキュリティスキャナー
A
paid
alberthild/shieldapi-mcp
Shieldapi-mcpは、パスワード侵害チェック、評価スキャン、プロンプトインジェクション検知を含むAIエージェントのセキュリティインテリジェンスを提供します。
AIアートディテクタ
password breach checks
email/domain/IP/URL reputation
prompt injection detection
J
unknown
jacobsd32-cpu/djd-agent-score-mcp
Base上のAIエージェントウォレットの評価スコアリングのための様々なツールを使用。
AIアートディテクタ
信頼スコア
詐欺報告
ブラックリストチェック
+3
K
unknown
knowledgepa3/gia-mcp-server
29のツールで意思決定分類、法的監査のトレイル、コンプライアンスマッピングに対応するエンタープライズAIガバナンスレイヤー。
AIアートディテクタ
MAI意思決定分類(必須/推奨/情報)
ハッシュチェーン式の法的監査のトレイル
人間介入ゲート
+3
C
unknown
Chimera-Protocol/csl-core
Z3形式検証を使用した、MCPを通じてAIエージェントのための機械検証可能な制約を書き込み、検証し、強制するための確定的なAI安全政策エンジン
AIアートディテクタ
確定的なAI安全政策エンジン
Z3形式検証
機械検証可能な制約の強制
C
open source
context-rot-detection
トークン利用状況、コンテキスト品質の劣化、セッション疲労を監視することで、AIエージェントにその認知状態に関する自己意識を与えます。
AIアートディテクタ
トークン利用状況を監視
コンテキスト品質の劣化を評価
セッション疲労を検知
+2
T
unknown
The Emerging Attacks on Large Language Models (LLMs)
この記事では、脅威行為者が大規模言語モデル(LLM)を侵害したり操作したりするために悪用できる主要な攻撃ベクトルについて議論しています。
AIアートディテクタ
LLMの脆弱性の悪用
LLMの脅威ベクトル
AIにおけるセキュリティリスク
P
unknown
pipelock
AIエージェントのためのセキュリティハーネスで、DLPスキャン、SSRF保護、MCPレスポンススキャン、ワークスペースの整合性監視を提供するエグレッションプロキシを備えています。
AIアートディテクタ
DLPスキャン
SSRF保護
MCPレスポンススキャン
+1
G
unknown
GPT-2 Output Detector
テキストが本物かGPT-2によって生成されたかを検出します。
AI検出器
テキストの本物かどうかを推定します
GPT-2によって生成されたコンテンツを特定します
可能性スコアを提供します
B
unknown
briland/LLM-security-and-privacy
LLMのセキュリティとプライバシー対策を強化します。
AIアートディテクタ
LLMのセキュリティを改善します。
ユーザーのプライバシーを保護します。
プライバシーツールを提供します。
O
open source
Opacus
Opacusを使用してPyTorchモデルを差分プライバシーでトレーニングします。
AIアートディテクタ
PyTorchモデルに差分プライバシーを有効にします
プライバシーを保護するトレーニングツールを提供します
PyTorchエコシステムと統合します
Previous
Page 1 of 2
Next