智能体设计范式:Reflection
📅 2026/7/2 3:47:14
👁️ 次浏览
智能体设计范式Reflection1 核心思想Reflection反思让模型在生成初步答案后对自己的回答进行自我评价和修正通过多轮“生成—反思—改进”的循环提升答案的准确性、完整性和逻辑性。2 工作原理初始回答模型根据问题直接生成一个答案。反思阶段将问题、初始回答以及反思提示如“请指出上述答案中的错误、不足或遗漏”发给模型让它输出批评意见和建议。改进阶段将反思内容连同初始答案一起要求模型生成一个改进后的答案。可以迭代多轮反思直到满意或达到次数上限。3 使用场景答案质量要求极高的场合如法律分析、医学建议、复杂逻辑推理。需要自我纠错的开放式任务写作、代码审查。模型容易产生幻觉的领域通过反思降低错误。4 优缺点优点能显著减少事实错误和逻辑漏洞。模拟人类“打草稿—检查—誊写”的过程输出更可靠。可应用于任何基础的 LLM 调用之上即插即用。缺点多次调用 LLM成本翻倍。模型可能固执己见反思不能真正纠正错误。反思缺乏外部知识校验仍可能自我强化错误。5 Python 实现importrequestsfromtypingimportOptionalclassAliYunLLM:...# 定义与前文相同# ---------- Reflection Agent ----------classReflectionAgent:def__init__(self,llm:AliYunLLM,max_reflections:int2):self.llmllm self.max_reflectionsmax_reflectionsdef_generate_initial_answer(self,question:str)-str:system_prompt你是一个乐于助人的助手请认真回答用户的问题。answerself.llm.generate(question,system_promptsystem_prompt)print(f初始答案\n{answer})returnanswerdef_reflect(self,question:str,answer:str)-str:system_prompt(你是一位严厉的评审专家。请仔细审阅以下问题和答案找出其中可能存在的错误、遗漏、逻辑矛盾或表述不清的地方并给出具体的改进建议。直接输出批评和建议不要输出其他内容。)promptf问题{question}\n\n答案{answer}\n\n请进行反思和批评reflectionself.llm.generate(prompt,system_promptsystem_prompt)print(f反思内容\n{reflection})returnreflectiondef_improve_answer(self,question:str,original_answer:str,reflection:str)-str:system_prompt(你是一位追求完美的助手。请根据评审专家的反思意见对原始答案进行改进生成一个更准确、完整、清晰的最终答案。只输出改进后的答案。)prompt(f问题{question}\n\nf原始答案{original_answer}\n\nf评审意见{reflection}\n\n请输出改进后的答案)improvedself.llm.generate(prompt,system_promptsystem_prompt)print(f改进后答案\n{improved})returnimproveddefrun(self,question:str)-str:# 1. 初始答案answerself._generate_initial_answer(question)# 2. 迭代反思与改进foriinrange(self.max_reflections):reflectionself._reflect(question,answer)# 使用改进后的答案作为下一轮的基础answerself._improve_answer(question,answer,reflection)returnanswer# ---------- 示例运行 ----------if__name____main__:llmAliYunLLM(api_keyyour-api-key,base_urlhttps://dashscope.aliyuncs.com/api/v1,modelqwen-plus)agentReflectionAgent(llm,max_reflections2)question请解释量子纠缠的基本概念及其应用。final_answeragent.run(question)print(f\n最终答案\n{final_answer})
先唠唠我踩过的智慧园区选型坑我做智慧园区落地快5年了,见过太多甲方选型踩坑的,我自己2023年帮天津一个制造产业园做升级的时候也栽过。当初贪便宜找了个只做SaaS平台的小厂商,结果园区原有12种不同品牌的门禁、摄像头、能耗设备,…
📅 2026/7/2 3:45:14
1. 项目背景与核心需求在嵌入式系统开发中,如何用最精简的硬件资源实现多功能控制一直是个经典课题。这次我们要用一片74HC32或门芯片配合STM32F765ZI单片机,搭建一个2x2矩阵键盘系统,实现多个功能的灵活管理。这种方案特别适合需要同时控制多…
📅 2026/7/2 3:45:14
文章目录前言一、RAG当年有多火?火到连食堂大妈都在问二、RAG的"中年危机":天生自带的bug终于藏不住了三、Agent登场:从"查资料的图书管理员"到"能办事的私人助理"3.1 Skill:把"查文档"变…
📅 2026/7/2 3:45:14
Cat-Catch资源嗅探工具:浏览器媒体下载的终极解决方案 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch
你是否曾经在网上看到一个精彩的…
📅 2026/7/2 14:43:30
1. 项目概述:PCF8591与PIC18F4680的信号转换系统在嵌入式系统开发中,模拟信号与数字信号的相互转换是基础且关键的技术环节。PCF8591作为一款经典的ADC/DAC转换芯片,配合PIC18F4680这款中高端8位微控制器,可以构建一个灵活、低成本…
📅 2026/7/2 14:43:30
D2DX终极指南:如何让暗黑破坏神2在现代电脑上焕发新生 【免费下载链接】d2dx D2DX is a complete solution to make Diablo II run well on modern PCs, with high fps and better resolutions. 项目地址: https://gitcode.com/gh_mirrors/d2/d2dx
还在为《暗…
📅 2026/7/2 14:43:30
1. 项目背景与核心需求 在嵌入式系统开发中,用户设置和偏好的持久化存储是一个基础但关键的需求。传统方案如直接写入Flash存在擦写次数限制(通常10万次左右),而使用外部EEPROM芯片则能提供更可靠的数据保存能力。DS28EC20作为Max…
📅 2026/7/2 14:43:30
1. OpenClaw 进阶玩法全景解析第一次接触OpenClaw时,我就被它灵活的多Agent架构吸引了。这个看似简单的工具链,在实际业务场景中能玩出各种花样——从自动化客服到智能数据分析,从风险预警到流程优化。但真正想用好它,光会调用API…
📅 2026/7/2 14:43:30
1. 项目背景与核心需求在嵌入式系统开发中,键盘输入是最基础的人机交互方式之一。传统方案中,一个4键键盘(2x2矩阵)通常需要占用微控制器的4个GPIO引脚——这在小规模系统中或许可行,但当系统功能复杂、外设众多时&…
📅 2026/7/2 14:41:30
1. 项目概述:从“能用”到“精通”的必经之路如果你正在学习或从事网络安全测试,尤其是Web应用安全评估,那么BurpSuite的Intruder模块绝对是你绕不开的核心工具。而Intruder模块里,功能最强大、也最让人又爱又恨的,莫过…
📅 2026/7/2 0:00:33
1. 项目概述:从“找东西”到“精准操控” 做自动化测试,尤其是Web UI自动化,最核心也最让人头疼的一步是什么?不是写复杂的业务逻辑,也不是处理异步加载,而是最基础的—— 让程序找到页面上那个你想操作的…
📅 2026/7/2 0:00:33
1. 项目概述:为什么是Maestro? 如果你正在寻找一个能让你快速上手、告别繁琐配置、并且对移动端UI自动化测试真正友好的框架,那么Maestro很可能就是你一直在等的那个答案。我接触过Appium、Espresso、XCUITest,也折腾过各种基于图…
📅 2026/7/2 0:00:33
6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…
📅 2026/6/30 10:04:37
引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…
📅 2026/7/1 15:35:39
目录
第一步:选对模板,省心一半
第二步:打开扫码点餐功能
开启功能按钮
桌台管理与桌码生成
第三步:个性化设计,打造品牌感
调整点餐页面
设置点餐规则 你还在让顾客站着排队点餐吗?2025年ÿ…
📅 2026/7/2 1:17:03
在业务中快速构建一个能理解私有文档、准确回答专业问题的智能助手,是很多开发团队面临的共同挑战。传统方案往往需要从零开始搭建复杂的 RAG(检索增强生成)系统,涉及文档解析、向量化、检索、大模型调用等多个环节,整…
📅 2026/7/2 9:49:12
FAE放射组学分析工具:医学影像特征探索的完整解决方案 【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE
你是否曾经面对海量医学影像数据感到无从下手?想要从CT、MRI等影像中提取有价值的定量特征&#…
📅 2026/7/2 1:36:45