Hermes Agent 一周暴涨五万 Star，但我劝你别急着追

📅 2026/6/24 4:07:39 👁️ 次浏览

一周五万 Star发生了什么上周打开 GitHub Trending 周榜我盯着第二名的数字看了三遍NousResearch/hermes-agent — 一周 53,110 Star总 Star 91.1K。两个月不到从建仓到九万星。这个增长速度意味着什么做个对比LangChain 花了差不多一年才到这个量级AutoGen 用了半年多。Hermes 用了不到八周。社区炸了。Reddit 上 I switched from OpenClaw to Hermes 隔几天就冒一条HN 搜 hermes agent 出来 50 多条讨论国内技术群里也开始传下一个必学框架。如果你跟我一样看到这种数据会本能地点进去、读文档、开始考虑要不要把现有项目迁过去——这篇文章就是写给你的。但我想先说别急。Hermes Agent 到底是什么先讲清楚它到底在做什么再聊要不要追。Hermes Agent 是 Nous Research 开源的一个通用 AI Agent 框架MIT 协议。核心卖点特性说明你可能关心的自我改进循环执行任务后自动总结经验编码成可复用 Skill听起来很酷但有坑后面说跨会话记忆不像多数框架一次对话一世界对长期项目有吸引力15 平台网关Telegram、Slack、Discord、Web 开箱即用集成成本确实低模型无关Claude、GPT、Gemini、本地模型都能接不绑死供应商版本狂飙42 天内发了 9 个版本最新 v0.9.0迭代快接口也在快速变动客观说这些特性确实踩中了当前 Agent 开发的几个痛点。跨会话记忆和自我改进循环是很多开发者手动实现过的东西有人帮你框架化了当然有吸引力。但我要泼两盆冷水。冷水一增长数字背后的疑点Hermes Agent 背后是 Nous Research——一家从 Web3 起步的公司。CEO 来自以太坊 MEV 项目Series A 用的是token 估值不是传统股权融资Paradigm 领投 6500 万美元。我对 Web3 没偏见但这个背景叠加上爆炸式增长社区已经开始质疑了Star 的水分问题。Reddit 多条高赞帖指出新注册账号集中发模板化推广帖措辞高度雷同。有人直接用了likely using bots这个词。我没有证据说 Star 一定是刷的但当一个项目两个月到九万星保持合理怀疑不是坏事。自我改进的根本缺陷。这是我觉得最值得警惕的Hermes 的 Agent 会在完成任务后自动评估结果、把经验编码成 Skill。问题是——Agent 几乎总是认为自己做对了。即使实际输出有错它也会把错误的经验固化下来。Power user 管这叫噩梦你手动改好了一个 bug下次 Agent 又按旧 Skill 把错误改回去。Token 开销问题。有人测过Hermes 每次 API 调用大约73% 是固定开销约 13.9K tokens 用于加载上下文和 Skill 库真正干活的只占小头。对于个人开发者来说这个 token 税不便宜。我不是说 Hermes Agent 一定有问题。它的技术方向——持久记忆、自我改进——确实是 Agent 框架需要解决的真命题。但当增长速度远超技术成熟度的时候至少该观望一下。冷水二你追得完吗打开 GitHub 的ai-agentTopic 页面9,900 个仓库。随便列几个 2026 年上半年你应该关注的 Agent 框架LangGraph、CrewAI、AutoGen、LlamaIndex Agents、Mastra、Haystack、FastAgency、Semantic Kernel、Phidata、Composio、Multica…… 有人做过统计至少25 个以上进入过 Trending 或者被正经技术媒体推荐过。每一个框架发布时的话术都长这样We fundamentally rethought agent architecture.10x faster than XX, 3x cheaper than YY.The only agent framework youll ever need.然后一个月后另一个框架冲上 Trending上个月的唯一框架已经没人提了。Reddit 上甚至开始出现反趋势的帖子I Stopped Using Frameworks — AI Agents Do It All Now.这不叫技术进步。这叫框架疲劳Framework Fatigue。现象数据GitHub ai-agent 仓库数9,9002026 上半年主流 Agent 框架25常见生产事故重复调用 API、幻觉策略、死循环、覆盖用户编辑反趋势信号停止使用框架类帖子开始高赞说句实在话我自己就是过来人。2025 年底到 2026 年初LangChain → AutoGen → CrewAI → OpenClaw一个不落。每换一个框架之前写的适配代码、踩过的配置坑、积累的调试经验就全废了。转头一看半年过去了我的实际产出并没有因为用了更好的框架而变多。真正的问题不是用什么框架METR一个专注 AI 能力评估的研究机构今年做了一项实验结论给我当头一棒有经验的开发者使用 AI 工具后实际完成任务反而慢了 19%。但他们自己觉得快了 20%。这是什么概念AI 工具包括 Agent 框架制造了一种效率幻觉——你觉得自己在飞速产出但算上学框架的时间、调试 Agent 行为的时间、修 Agent 幻觉的时间总成本反而更高了。不止是 Agent 框架。整个 Vibe Coding 运动的反噬数据也触目惊心指标变化代码 churn改了又改的比率41%代码重复度×4健康重构占比从 25% 暴跌到 10%安全公司测试 15 个 vibe coding 应用69 个漏洞6 个 Critical 级Apple 动作已封禁多款 vibe coding 生成的应用Addy Osmani——Chrome 团队工程负责人在开发者社区影响力很大——分享了他的 AI 编程工作流。里面没有一条是关于选对框架的全是工程纪律先写spec.md做人工规划想清楚再让 AI 动手拆小任务每个任务的边界清晰到 AI 不会发挥喂充分上下文别让 AI 猜你要什么人类始终在监督位不要让 AI 无人值守跑 30 分钟超频 commit每个小步骤都提交出问题能回滚Stack Overflow 也在今年发布了agents.md规范指南核心结论跟 Osmani 一样AI 放大的是你已有的工程纪律不是替代它。你花在搞清楚 Hermes Agent 怎么配置自我改进循环上的三天大概率不如花在让 AI 更好地理解你已有的代码上。与其追工具不如建体系这不是鸡汤。我掉进过这个坑现在爬出来了分享一下我现在怎么想这件事。我维护了 10 年的 C 技术栈26 个核心模块10 万行代码。网络层、协议解析、配置管理、渲染引擎——这些模块不管外面 Agent 框架怎么更新换代它们的工程价值不会归零。框架会过时但你的代码资产不会。真正值得投入的事情只有三件1. 搞清楚你有什么你的技术栈里有哪些成熟模块哪些可以让 AI 直接复用哪些有技术债需要先清理如果这些问题你答不上来换再多框架都是瞎折腾。我之前做了一个工具叫 repo-scan就是干这个的——用 AI 交叉审计你的代码库帮你理清家底。让 Claude 和 GPT 分别扫描交叉比对找出你自己都忘了的宝贝模块和隐藏的技术债。2. 从八十分开始别从零开始上一篇文章《受够了 Vibe Coding 的失控换个起点让 AI 事半功倍》我详细聊过这个方法论与其让 AI 从零写 2000 行代码3 处幻觉 API改了一下午不如用你的成熟模块搭好 80% 骨架AI 只补最后 20% 的胶水代码零幻觉30 分钟合并。我正在做的 GufaForge 就是这个思路的产品化——扫描你的成熟模块库根据新项目需求自动装配骨架生成 AI 可直接执行的装配清单。工具还在完善中完成后会开源感兴趣的可以先关注公众号「海滨code」第一时间通知。3. 建立框架无关的工程纪律不管你最终选 Hermes、OpenClaw 还是裸写 Claude Code这些纪律不因框架而变规划和执行分离——人做规划AI 做执行。别把两件事混在一起让 AI 自己发挥控制任务粒度——每轮让 AI 做一件具体的事别让它无人值守跑半小时超频 commit——每完成一小步就提交出问题能秒回滚写 spec 不写 prompt——与其花时间优化 prompt不如花时间写清楚 spec.md这套流程你用什么框架都适用。框架挂了流程还在。所以Hermes Agent 该不该学该关注但没必要急着 all-in。Star 它Watch 它等 3-6 个月看社区沉淀。一个月后还有人认真写使用心得的框架才值得花时间学。一个月后没人提的现在学了也白学。先把自己的家底理清楚。你的代码资产、技术栈能力矩阵、AI 能直接复用的模块清单——这些搞不清楚用什么框架都事倍功半。建立框架无关的工作流。spec.md → 拆任务 → 喂上下文 → 监督 → commit。这套流程不依赖任何框架也不会因为哪个框架凉了而作废。如果确实想试 Hermes用一个小项目试。别拿你的生产项目当实验场。GitHub 上有 9,900 个 ai-agent 仓库。最终活下来不会超过 5 个。而你的精力应该花在那些不随框架消亡的东西上。

相关新闻