Strix:一个会真动手打漏洞的 AI 渗透测试工具,把 PoC 验证做进了自动化流水线

Strix:一个会真动手打漏洞的 AI 渗透测试工具,把 PoC 验证做进了自动化流水线
Strix 做的事情跟传统漏洞扫描器有一个本质区别它不是跑完规则给你一份告警清单就走了而是让 AI 代理像真实攻击者一样动态运行你的代码、找到漏洞、然后写出可运行的概念验证代码来证明漏洞真的存在。项目目前处于 1.0 正式版阶段2026 年 5 月 27 日发布的到现在 513 次提交迭代节奏很密集。核心团队把侦察、漏洞利用、后渗透拆成了三个不同角色的 AI 代理平行推进各自的攻击面。它的架构本质上是一个多代理编排系统每个代理配了一套真实的渗透测试工具——HTTP 拦截用的是 Caido浏览器自动化靠 Playwright漏洞扫描引擎跑 NucleiLLM 调用层统一走 LiteLLM 抽象。有意思的地方在于它选的 LLM 策略。不是只用一家——推荐列表里列了 GPT-5.4、Claude Sonnet 4.6、Gemini 3 Pro Preview 三种也支持 Bedrock、Azure 和本地的 Ollama、LMStudio。这意味着你可以根据成本和安全合规需求切换模型不需要被绑在某个供应商上。费用控制方面CLI 里藏了一个 --max-budget-usd 参数可以给每次扫描设硬上限。安装方式——一句 curl 管道 bash 搞定。前提是你有 Docker 和一个 LLM API 密钥。首次运行会自动拉取沙箱镜像扫描结果存到 strix_runs 目录。命令行是这样的curl -sSL https://strix.ai/install | bash export STRIX_LLMopenai/gpt-5.4 export LLM_API_KEYyour-api-key strix --target ./app-directory它支持三种目标模式本地代码库路径、GitHub 仓库 URL、线上应用 URL。可以同时测多个目标也可以把源码和部署地址一起丢给它做白盒加黑盒的交叉验证。CI/CD 集成方面README 里给了一段 GitHub Actions 的 YAML 配置示例跑 quick 模式加 diff scope只扫 PR 变更的部分适合放进代码审查流程里。但有几个坑需要提前知道第一个是 Docker——不是可选的是必须的。Strix 的代理在 Docker 沙箱里执行漏洞利用代码没装 Docker 就跑不起来。第二个是 API 费用——AI 代理多次调用模型做攻击决策单次扫描的 Token 消耗不低。README 诚实地说预算可能会有轻微超支因为正在执行的调用无法立即中断只能尽力估算。第三个坑在 7 月 3 日刚修复——SARIF 格式输出的兼容性问题对于没有代码行号映射的发现结果现在改用合成位置标记而不是静默丢弃。还有一条 README 用加粗警告字体写的只测你拥有的或者有授权测试的应用。这不是免责声明——这个工具确实会执行真实的漏洞利用误用有法律后果。从功能覆盖面来看Strix 能检测的漏洞类型相当全面。OWASP Top 10 全部覆盖还延伸到了业务逻辑缺陷和云基础设施配置错误。访问控制方面测 IDOR 和权限提升注入类覆盖 SQL、NoSQL、OS 命令注入和 SSTI客户端侧覆盖三种 XSS、原型污染和 CSRF业务逻辑层测竞态条件、支付操纵和工作流绕过。对于 API它专门检测了批量赋值和速率限制绕过——这两个在传统扫描器里经常被忽略。同类工具的对比需要分两层来看。传统漏扫像 Nuclei模板驱动漏洞扫描引擎项目地址见文末和 OWASP ZAP开源 Web 代理加被动扫描器它们跑规则的速度快、成本低但误报率高而且只告诉你有风险不验证风险是否真的可利用。商业产品如 Burp Suite Pro 有更丰富的攻击面分析能力但它是闭源商业软件没有 AI 代理自主决策的架构。两种产品的 Star 数暂未从公开渠道获取到实时数据。AI 安全这个品类里能像 Strix 这样把 SAST、DAST 和 PoC 验证全部串联成一个自动化流程的工具暂未从公开渠道找到同等完成度的开源替代品。但这不是说它没有短板——Strix 的扫描速度取决于 LLM 响应时间一次完整评估可能需要数十分钟到数小时跟秒级出结果的模板扫描器完全不是一个量级。什么人适合用如果你是小团队没有专职安全工程师但又需要在发布前做一轮真实的安全测试Strix 的 CI/CD 集成模式可能是最直接的切入点——配好 GitHub Actions每次 PR 自动跑 quick 扫描。如果你在做漏洞赏金可以把它当成一个自动化的侦察助手帮你快速扫出可能的高价值入口点然后你手动深入。什么情况不适合如果你需要一个毫秒级响应的 WAF 或在生产环境做实时拦截这不是 Strix 的设计目标。如果你的应用非常小众——用了冷门框架、自研协议或非标准认证体系——AI 代理可能无法正确理解你的技术栈扫描效果会打折扣。另外如果你对把代码交给第三方 LLM 分析有合规顾虑需要自己搭本地模型但 README 里没有给出本地模型的具体配置调优指南这部分可能需要自己摸索。Strix 最值得关注的地方不是它扫了多少类漏洞而是它把验证环节自动化了。传统安全工具说你可能有 SQL 注入Strix 说你看这是拖出来的数据库前 10 行。这种从可能有到确实有的跨越是 AI 渗透测试和传统扫描之间最本质的分界线。项目地址https://github.com/usestrix/strix 同类工具 - Nucleihttps://github.com/projectdiscovery/nuclei模板驱动漏洞扫描引擎 - OWASP ZAPhttps://github.com/zaproxy/zaproxy开源 Web 应用安全扫描器