发现最出色的 AI 工具

为您寻找解决任何合适 AI 方案的终极导航目录。

AI 检测与反检测(42)

For-Sunny/hebbian-mind-enterprise

一个用于检测人工智能生成艺术的工具

AI艺术探测器

赫布学习神经图记忆协同激活

thoughtproof/thoughtproof-mcp

交易执行前对AI代理进行对抗性多模型推理验证。

AI艺术探测器

Claude、Grok和DeepSeek对每个决策进行挑战返回经JWKS签名的允许或持有证明在Base（USDC）上使用x402门控

Prompt Injection Sentinel

一个用于检测提示注入和越狱的微调模型，具有低误报率。

AI内容检测器

微调BERT-large模型低误报率提示注入分类

DeBERTa Prompt Injection Detector v2

DeBERTa Prompt Injection Detector v2 是一个针对大型语言模型中的提示注入攻击进行检测而微调的 AI 模型。

AI内容检测器

微调的 DeBERTa-v3-base用于 LLM 护栏流程在识别恶意提示方面非常有效

Llama-Prompt-Guard-2-86M

Llama-Prompt-Guard-2-86M 是一个用于检测 LLM 管道中提示注入和越狱尝试的轻量级模型。

AI内容检测器

检测提示注入防止越狱尝试86M 参数模型

Llama-Guard-4-12B

Llama-Guard-4-12B 是一种多模态安全分类器，用于检测 LLM 输入和输出中的有害内容

AI内容检测器

检测文本和图像模态中的有害内容由 Meta 开发多模态安全分类的最新技术

一个用于评估和利用提示注入漏洞的工具

AI艺术探测器

检测提示注入评估安全性利用漏洞

基于NVIDIA garak构建的开源Web应用程序，用于AI模型安全评估

AI艺术探测器

179个探测多目标扫描计划扫描+2

The Arcanum Prompt Injection Taxonomy

针对提示注入攻击的综合分类系统

人工智能探测器

分类攻击意图涵盖技术和规避方法分类输入向量

GUCCI-atlasv/skillssafe-mcp

一个免费的AI代理技能安全扫描器，分析SKILL.md、MCP配置文件和系统提示中的安全漏洞。

AI内容检测器

扫描凭证盗窃、提示注入、零宽度字符攻击和ClawHavoc指标支持OpenClaw、Claude Code、Cursor和Codex无需注册

gpartin/CryptoGuardClient

一个用于 AI 交易代理的确定性加密验证器，用于验证交易和检测跑路行为。

AI艺术探测器

每笔交易的确定性加密验证器验证交易（继续/谨慎/阻止）扫描代币+2

用于 AI 代理的开源安全测试框架，可发现危险工具链组合并检测执行级别的副作用

AI艺术探测器

对危险工具链组合进行图分析检测执行级别的副作用多阶段信任利用活动

ShellWard 是一款具有 8 层防御的 AI 代理安全中间件，可防御提示注入、数据窃取和危险命令。

AI艺术探测器

8 层防御系统防御提示注入防止数据窃取+2

joergmichno/clawguard-mcp

一个用于AI代理的安全扫描器，使用42+正则表达式模式检测提示注入

AI内容检测器

检测提示注入使用42+正则表达式模式AI代理安全扫描器

alberthild/shieldapi-mcp

Shieldapi-mcp 为 AI 代理提供安全智能，包括密码泄露检查、声誉扫描和提示注入检测。

AI艺术探测器

密码泄露检查电子邮件/域名/IP/URL 声誉提示注入检测

jacobsd32-cpu/djd-agent-score-mcp

在Base上使用各种工具为AI代理钱包进行声誉评分。

AI艺术探测器

信任评分欺诈报告黑名单检查+3

knowledgepa3/gia-mcp-server

一个包含29种工具的企业级AI治理层，用于决策分类、取证审计追踪和合规映射。

AI艺术探测器

MAI decision classification (Mandatory/Advisory/Informational)hash-chained forensic audit trailshuman-in-the-loop gates+1

Chimera-Protocol/csl-core

一个具有 Z3 形式验证的确定性 AI 安全策略引擎，用于通过 MCP 编写、验证和执行 AI 代理的机器可验证约束

AI艺术探测器

确定性 AI 安全策略引擎Z3 形式验证机器可验证约束执行

context-rot-detection

通过监控令牌使用情况、上下文质量下降和会话疲劳，为 AI 代理提供对其认知状态的自知。

AI艺术探测器

监控令牌使用情况评估上下文质量下降检测会话疲劳+2

The Emerging Attacks on Large Language Models (LLMs)

本文讨论了威胁行为者可以利用的关键攻击向量，以破坏或操纵大型语言模型（LLM）。

AI艺术探测器

detects key attack vectorscompromises LLMsmanipulates LLMs

一个为 AI 代理提供出口代理、数据丢失防护扫描、SSRF 保护、MCP 响应扫描和工作区完整性监控的安全束缚装置。

AI艺术探测器

数据丢失防护扫描SSRF 保护MCP 响应扫描+1

GPT-2 Output Detector

检测文本是否真实或由GPT-2生成。

人工智能探测器

估计文本真实性识别GPT-2生成的内容提供可能性分数

briland/LLM-security-and-privacy

增强 LLM 安全和隐私措施。

AI艺术探测器

提升 LLM 安全保护用户隐私提供隐私工具

使用Opacus对PyTorch模型进行差分隐私训练

AI艺术探测器

为PyTorch模型启用差分隐私提供隐私保护训练工具与PyTorch生态系统集成

Page 1 of 2