AI Awesome
主页
发现最出色的 AI 工具
为您寻找解决任何合适 AI 方案的终极导航目录。
Search
AI 检测与反检测
(42)
F
unknown
For-Sunny/hebbian-mind-enterprise
一个用于检测人工智能生成艺术的工具
AI艺术探测器
赫布学习
神经图记忆
协同激活
T
unknown
thoughtproof/thoughtproof-mcp
交易执行前对AI代理进行对抗性多模型推理验证。
AI艺术探测器
Claude、Grok和DeepSeek对每个决策进行挑战
返回经JWKS签名的允许或持有证明
在Base(USDC)上使用x402门控
P
unknown
Prompt Injection Sentinel
一个用于检测提示注入和越狱的微调模型,具有低误报率。
AI内容检测器
微调BERT-large模型
低误报率
提示注入分类
D
unknown
DeBERTa Prompt Injection Detector v2
DeBERTa Prompt Injection Detector v2 是一个针对大型语言模型中的提示注入攻击进行检测而微调的 AI 模型。
AI内容检测器
微调的 DeBERTa-v3-base
用于 LLM 护栏流程
在识别恶意提示方面非常有效
L
unknown
Llama-Prompt-Guard-2-86M
Llama-Prompt-Guard-2-86M 是一个用于检测 LLM 管道中提示注入和越狱尝试的轻量级模型。
AI内容检测器
检测提示注入
防止越狱尝试
86M 参数模型
L
unknown
Llama-Guard-4-12B
Llama-Guard-4-12B 是一种多模态安全分类器,用于检测 LLM 输入和输出中的有害内容
AI内容检测器
检测文本和图像模态中的有害内容
由 Meta 开发
多模态安全分类的最新技术
S
open source
spikee
一个用于评估和利用提示注入漏洞的工具
AI艺术探测器
检测提示注入
评估安全性
利用漏洞
A
open source
ai-scanner
基于NVIDIA garak构建的开源Web应用程序,用于AI模型安全评估
AI艺术探测器
179个探测
多目标扫描
计划扫描
+2
T
unknown
The Arcanum Prompt Injection Taxonomy
针对提示注入攻击的综合分类系统
人工智能探测器
分类攻击意图
涵盖技术和规避方法
分类输入向量
G
open source
GUCCI-atlasv/skillssafe-mcp
一个免费的AI代理技能安全扫描器,分析SKILL.md、MCP配置文件和系统提示中的安全漏洞。
AI内容检测器
扫描凭证盗窃、提示注入、零宽度字符攻击和ClawHavoc指标
支持OpenClaw、Claude Code、Cursor和Codex
无需注册
G
open source
gpartin/CryptoGuardClient
一个用于 AI 交易代理的确定性加密验证器,用于验证交易和检测跑路行为。
AI艺术探测器
每笔交易的确定性加密验证器
验证交易(继续/谨慎/阻止)
扫描代币
+2
Z
open source
Ziran
用于 AI 代理的开源安全测试框架,可发现危险工具链组合并检测执行级别的副作用
AI艺术探测器
对危险工具链组合进行图分析
检测执行级别的副作用
多阶段信任利用活动
S
open source
ShellWard
ShellWard 是一款具有 8 层防御的 AI 代理安全中间件,可防御提示注入、数据窃取和危险命令。
AI艺术探测器
8 层防御系统
防御提示注入
防止数据窃取
+2
J
open source
joergmichno/clawguard-mcp
一个用于AI代理的安全扫描器,使用42+正则表达式模式检测提示注入
AI内容检测器
检测提示注入
使用42+正则表达式模式
AI代理安全扫描器
A
paid
alberthild/shieldapi-mcp
Shieldapi-mcp 为 AI 代理提供安全智能,包括密码泄露检查、声誉扫描和提示注入检测。
AI艺术探测器
密码泄露检查
电子邮件/域名/IP/URL 声誉
提示注入检测
J
unknown
jacobsd32-cpu/djd-agent-score-mcp
在Base上使用各种工具为AI代理钱包进行声誉评分。
AI艺术探测器
信任评分
欺诈报告
黑名单检查
+3
K
unknown
knowledgepa3/gia-mcp-server
一个包含29种工具的企业级AI治理层,用于决策分类、取证审计追踪和合规映射。
AI艺术探测器
MAI decision classification (Mandatory/Advisory/Informational)
hash-chained forensic audit trails
human-in-the-loop gates
+1
C
unknown
Chimera-Protocol/csl-core
一个具有 Z3 形式验证的确定性 AI 安全策略引擎,用于通过 MCP 编写、验证和执行 AI 代理的机器可验证约束
AI艺术探测器
确定性 AI 安全策略引擎
Z3 形式验证
机器可验证约束执行
C
open source
context-rot-detection
通过监控令牌使用情况、上下文质量下降和会话疲劳,为 AI 代理提供对其认知状态的自知。
AI艺术探测器
监控令牌使用情况
评估上下文质量下降
检测会话疲劳
+2
T
unknown
The Emerging Attacks on Large Language Models (LLMs)
本文讨论了威胁行为者可以利用的关键攻击向量,以破坏或操纵大型语言模型(LLM)。
AI艺术探测器
detects key attack vectors
compromises LLMs
manipulates LLMs
P
unknown
pipelock
一个为 AI 代理提供出口代理、数据丢失防护扫描、SSRF 保护、MCP 响应扫描和工作区完整性监控的安全束缚装置。
AI艺术探测器
数据丢失防护扫描
SSRF 保护
MCP 响应扫描
+1
G
unknown
GPT-2 Output Detector
检测文本是否真实或由GPT-2生成。
人工智能探测器
估计文本真实性
识别GPT-2生成的内容
提供可能性分数
B
unknown
briland/LLM-security-and-privacy
增强 LLM 安全和隐私措施。
AI艺术探测器
提升 LLM 安全
保护用户隐私
提供隐私工具
O
open source
Opacus
使用Opacus对PyTorch模型进行差分隐私训练
AI艺术探测器
为PyTorch模型启用差分隐私
提供隐私保护训练工具
与PyTorch生态系统集成
Previous
Page 1 of 2
Next