最高のAIツールを見つけ出しましょう

あらゆるタスクのための人工知

AI検出と反検出(42)

For-Sunny/hebbian-mind-enterprise

AI生成アート検出ツール

AIアートディテクタ

ヘブバン学習ニューロングラフメモリ協調活性化

thoughtproof/thoughtproof-mcp

取引実行前にAIエージェントのための敵対的多モデル推論検証

AIアートディテクタ

Claude、Grok、およびDeepSeekが各決定に挑戦JWKS署名の attestation で ALLOW または HOLD を返すBase (USDC) で x402-gated

Prompt Injection Sentinel

プロンプトインジェクションとジャイルブレイクを検出するために微調整されたモデルで、低い偽陽性率です。

AI コンテンツ検出器

微調整されたBERT-largeモデル低い偽陽性率プロンプトインジェクション分類

DeBERTa Prompt Injection Detector v2

DeBERTa Prompt Injection Detector v2 は、大規模言語モデルにおけるプロンプトインジェクション攻撃を検出するために微調整されたAIモデルです。

AI コンテンツ検出器

fine-tuned DeBERTa-v3-baseLLM guardrail pipelinesで使用悪意のあるプロンプトを特定するのに効果的

Llama-Prompt-Guard-2-86M

Llama-Prompt-Guard-2-86Mは、LLMパイプラインでプロンプトインジェクションとジャイルブレイクの試みを検出する軽量モデルです

AI コンテンツ検出器

プロンプトインジェクションを検出ジャイルブレイクの試みを防止86Mパラメータモデル

Llama-Guard-4-12B

Llama-Guard-4-12Bは、LLMの入力と出力における有害コンテンツを検出する多モーダルセーフティ分類器です

AI コンテンツ検出器

テキストおよび画像モダリティにおける有害コンテンツの検出Metaによって開発多モーダルセーフティ分類の最新技術

プロンプトインジェクション脆弱性を評価および利用するためのツール

AIアートディテクタ

プロンプトインジェクションを検知セキュリティを評価脆弱性を利用

NVIDIA garakに基づくオープンソースのWebアプリケーションで、AIモデルのセキュリティ評価に使用されます

AIアートディテクタ

179のプローブマルチターゲットスキャンスケジュールされたスキャン+2

The Arcanum Prompt Injection Taxonomy

プロンプトインジェクション攻撃のための包括的な分類システム

攻撃意図を分類技術と回避策をカバー入力ベクトルを分類

GUCCI-atlasv/skillssafe-mcp

無料のAIエージェントスキルセキュリティスキャナーで、SKILL.md、MCP設定、システムプロンプトをセキュリティ脆弱性に分析します。

AI コンテンツ検出器

資格情報の盗難、プロンプトインジェクション、ゼロ幅文字攻撃、ClawHavoc指標のスキャンOpenClaw、Claude Code、Cursor、Codexをサポートサインアップ不要

gpartin/CryptoGuardClient

AI取引エージェントのための決定的な暗号検証器で、取引を検証し、rug pullを検出します。

AIアートディテクタ

取引ごとの決定的な暗号検証器取引を検証（PROCEED/CAUTION/BLOCK）トークンをスキャン+2

オープンソースのセキュリティテストフレームワークで、AIエージェントのための危険なツールチェーン構成を発見し、実行レベルの副作用を検出します。

AIアートディテクタ

危険なツールチェーン構成のためのグラフ分析実行レベルの副作用の検出多段階の信頼悪用キャンペーン

ShellWardは、プロンプトインジェクション、データ漏洩、および危険なコマンドに対して8層の防御を持つAIエージェントセキュリティミドルウェアです

AIアートディテクタ

8層の防御システムプロンプトインジェクション対策データ漏洩防止+2

joergmichno/clawguard-mcp

AIエージェント用のセキュリティスキャナーで、42以上の正規表現パターンを使用してプロンプトインジェクションを検出します

AI コンテンツ検出器

プロンプトインジェクションを検出42以上の正規表現パターンを使用AIエージェント用のセキュリティスキャナー

alberthild/shieldapi-mcp

Shieldapi-mcpは、パスワード侵害チェック、評価スキャン、プロンプトインジェクション検知を含むAIエージェントのセキュリティインテリジェンスを提供します。

AIアートディテクタ

password breach checksemail/domain/IP/URL reputationprompt injection detection

jacobsd32-cpu/djd-agent-score-mcp

Base上のAIエージェントウォレットの評価スコアリングのための様々なツールを使用。

AIアートディテクタ

信頼スコア詐欺報告ブラックリストチェック+3

knowledgepa3/gia-mcp-server

29のツールで意思決定分類、法的監査のトレイル、コンプライアンスマッピングに対応するエンタープライズAIガバナンスレイヤー。

AIアートディテクタ

MAI意思決定分類（必須/推奨/情報）ハッシュチェーン式の法的監査のトレイル人間介入ゲート+3

Chimera-Protocol/csl-core

Z3形式検証を使用した、MCPを通じてAIエージェントのための機械検証可能な制約を書き込み、検証し、強制するための確定的なAI安全政策エンジン

AIアートディテクタ

確定的なAI安全政策エンジンZ3形式検証機械検証可能な制約の強制

context-rot-detection

トークン利用状況、コンテキスト品質の劣化、セッション疲労を監視することで、AIエージェントにその認知状態に関する自己意識を与えます。

AIアートディテクタ

トークン利用状況を監視コンテキスト品質の劣化を評価セッション疲労を検知+2

The Emerging Attacks on Large Language Models (LLMs)

この記事では、脅威行為者が大規模言語モデル（LLM）を侵害したり操作したりするために悪用できる主要な攻撃ベクトルについて議論しています。

AIアートディテクタ

LLMの脆弱性の悪用LLMの脅威ベクトルAIにおけるセキュリティリスク

AIエージェントのためのセキュリティハーネスで、DLPスキャン、SSRF保護、MCPレスポンススキャン、ワークスペースの整合性監視を提供するエグレッションプロキシを備えています。

AIアートディテクタ

DLPスキャンSSRF保護MCPレスポンススキャン+1

GPT-2 Output Detector

テキストが本物かGPT-2によって生成されたかを検出します。

テキストの本物かどうかを推定しますGPT-2によって生成されたコンテンツを特定します可能性スコアを提供します

briland/LLM-security-and-privacy

LLMのセキュリティとプライバシー対策を強化します。

AIアートディテクタ

LLMのセキュリティを改善します。ユーザーのプライバシーを保護します。プライバシーツールを提供します。

Opacusを使用してPyTorchモデルを差分プライバシーでトレーニングします。

AIアートディテクタ

PyTorchモデルに差分プライバシーを有効にしますプライバシーを保護するトレーニングツールを提供しますPyTorchエコシステムと統合します

Page 1 of 2