多租户 RAG 知识库权限怎么隔离
📅 2026/6/24 8:27:57
👁️ 次浏览
先给结论:多租户场景下做 RAG,最致命的不是检索准不准,是 A 公司的人能不能搜到 B 公司的文档。这道权限隔离做漏了,就是数据泄露事故。我踩过一次差点出事的边,把几种隔离方案和选型摆在这。场景我做的是一个给多家客户用的合同问答 Agent。每家客户上传自己的合同到知识库,问答时只能检索到自家的文档。早期我图快,所有客户的文档丢一个向量库里,检索时全局召回——直到测试时 A 客户搜出了 B 客户的合同片段,后背一凉。三种隔离方案对比我把试过的三种摆一起:方案隔离强度成本适合规模主要风险元数据过滤中低中小,几十个租户过滤条件漏写就穿透独立 collection高中几十到几百租户collection 多了管理累独立向量库实例最高高大客户/强合规资源浪费、运维重元数据过滤:所有文档进同一个库,但每条切片打上tenant_id标签,检索时强制带where tenant_id 当前租户这个过滤条件。成本最低,但有个致命点——只要哪次检索忘了带这个过滤条件,立刻全局穿透。我那次事故就是某条检索分支漏了过滤。独立 collection:每个租户一个独立的向量集合,检索时按租户路由到对应 collection。物理上分开,不存在忘了过滤的穿透问题,隔离强度高一档。代价是租户多了之后,几百个 collection 管起来有点烦。独立向量库实例:每个大客户单独起一套库。隔离最彻底,合规审计最好交代,但资源和运维成本最高,只对强合规的大客户才值得。我最后的选型中小租户用元数据过滤兜底,但加了两道保险:一是把tenant_id过滤写进检索的公共封装里,任何检索调用都自动带上,不给忘记的机会;二是上线前专门写了一条越权检索的测试用例,A 租户的请求去搜 B 的关键词,断言必须召回 0 条。少数强合规的大客户单独切独立 collection。这套混合策略落地下来,既没为小客户上重型方案,又给大客户留了硬隔离。实现上我是在一个带场景化 RAG 能力的搭智能体平台上做的,它支持按知识库维度建多个独立库,我直接一个租户挂一个知识库,检索时绑定当前租户的库,从源头上就不会跨租户召回——比自己在一个大库里靠过滤条件兜底,心理踏实多了。一个容易忽略的细节权限不只是检索那一刻的事。文档删除也要隔离——客户解约后,他那批向量得能干净删掉。我早期是按文档 ID 一条条删,后来发现切片散在库里删不干净,残留的向量还能被搜到。改成按tenant_id批量清,才算彻底。收尾多租户 RAG,我的经验是:隔离强度按客户分级别给,别一刀切;同时把越权检索写成自动化测试,每次发版都跑,这比任何人工 review 都靠谱。模型和向量化那层我用的讯飞星辰现成的服务,大模型 API 直接调,不用自己搭嵌入和推理服务,省下的工夫全花在把权限这道闸做严上了。
产品更新概览功能新增:二维孪生新增元素模块。功能修复:修复查看器提示异常问题。功能优化:完善EXE查看器功能;优化鲸孪生中高性能模型导入问题;优化鲸孪生中路径动画刷新时轨迹闪烁问题。功能新增在山海鲸可视化4.7.7…
📅 2026/6/24 8:22:57
#include
#include
using namespace std;
class Student
{
private:
string name; // 姓名(私有)
double score; // 成绩(私有)
static int stuNum; // 静态:学生总数
static double sumScore; // 静态&am…
📅 2026/6/24 8:22:57
软件数字员工中的虚拟助手设计:未来办公的新引擎 在数字化转型的浪潮中,软件数字员工正逐渐成为企业效率提升的核心驱动力。其中,虚拟助手作为数字员工的重要形态,通过自然语言处理、机器学习和自动化技术,为用户提供…
📅 2026/6/24 8:22:57
综合类校园生活服务平台,通常同时承载餐饮外卖点餐、日常同城跑腿代买两类核心订单业务。很多自研项目为了开发便捷,会将两类订单统一存储、统一调度分配,看似简化了开发流程,实际运行中容易出现业务冲突问题。外卖订单时效性要求…
📅 2026/6/24 9:33:08
更多请点击:
https://kaifayun.com
第一章:从Prompt到masterpiece:AI图像生成艺术审美的范式跃迁 当“a cyberpunk cat wearing neon sunglasses, cinematic lighting, 8k”不再仅是一串指令,而成为可被视觉系统精准解码的美学契…
📅 2026/6/24 9:33:08
(3)序列化流和反序列流 序列化流和反序列流都属于字节流的部分 —1、序列化流/对象操作输出流
序列化流/对象操作输出流
可以把java中的对象写到本地文件中
构造方法 Public ObjectOutputStream(OutputStream out) 把基本流包装成高级流 成员方法 Pub…
📅 2026/6/24 9:33:08
之前做过一个教程,叫「用 iThinkAir,把一段文字变成清晰图表」。那次的结果是 Markdown 图文教程。
这次往前走一步:把这篇 Markdown 教程,直接变成带配音旁白的视频。
这件事靠的是 OpenClaw 的一个 Skill,名字叫 doc…
📅 2026/6/24 9:33:08
更多请点击:
https://intelliparadigm.com
第一章:AI短视频生产力革命的底层逻辑与趋势研判 AI短视频生产力革命并非简单工具叠加,而是算力、算法、数据与创作范式四重要素共振的结果。GPU集群的边际成本持续下降,使得端到端视频…
📅 2026/6/24 9:33:08
摘要
ToolBoxMax 是一个免登录、数据本地运算的聚合型在线工具箱,提供开发、设计、图片处理、文本处理等九大类实用工具,所有操作均在浏览器本地完成,保障用户隐私安全。它特别适合程序员、设计师、运营人员及普通办公用户处理日常轻量化任务…
📅 2026/6/24 9:28:05
TaskJuggler脚本编程入门:用代码实现自动化项目管理 【免费下载链接】TaskJuggler TaskJuggler - Project Management beyond Gantt chart drawing 项目地址: https://gitcode.com/gh_mirrors/ta/TaskJuggler
TaskJuggler是一款强大的开源项目管理工具&#…
📅 2026/6/24 0:02:25
终极教程:使用angular-mobile-nav实现流畅的移动页面过渡效果 【免费下载链接】angular-mobile-nav An angular navigation service for mobile applications 项目地址: https://gitcode.com/gh_mirrors/an/angular-mobile-nav
angular-mobile-nav是一款专为…
📅 2026/6/24 0:02:25
Wan2.1-Fun-V1.1-1.3B-InP Web UI使用教程:无需代码的AI视频创作 【免费下载链接】Wan2.1-Fun-V1.1-1.3B-InP 项目地址: https://ai.gitcode.com/hf_mirrors/PAI/Wan2.1-Fun-V1.1-1.3B-InP
Wan2.1-Fun-V1.1-1.3B-InP是一款强大的AI视频创作工具,…
📅 2026/6/24 0:02:25
1. 从手册到实战:SLIDER与SPINBOX控件的深度解析在嵌入式GUI开发里摸爬滚打十几年,我见过太多项目因为界面交互的“小问题”而卡壳。参数调节不跟手、数值输入效率低下,这些看似不起眼的细节,往往是决定产品用户体验成败的关键。e…
📅 2026/6/24 6:06:01
暗黑2重获新生:D2DX如何让经典游戏在现代Windows系统上流畅运行 【免费下载链接】d2dx D2DX is a complete solution to make Diablo II run well on modern PCs, with high fps and better resolutions. 项目地址: https://gitcode.com/gh_mirrors/d2/d2dx
…
📅 2026/6/23 2:15:55
CompressO终极指南:免费开源的视频图像压缩神器 【免费下载链接】compressO Convert any video/image into a tiny size. 100% free & open-source. Available for Mac, Windows & Linux. 项目地址: https://gitcode.com/gh_mirrors/co/compressO
你…
📅 2026/6/24 4:59:40