追问“你确定吗”，多数大模型竟“滑跪”，新评测维度呼之欲出！

📅 2026/6/30 16:18:52 👁️ 次浏览

追问“你确定吗”，多数大模型竟“滑跪”，新评测维度呼之欲出！

【导语近日网友shadcn的一条帖子引发开发者与AI研究者社群共鸣揭示了大模型面对“你确定吗”追问时的“窘境”也引发了对大模型抗干扰能力评测的思考。】“你确定吗”大模型的“滑铁卢”网友shadcn发的“没有模型能扛住『are you sure?』这种追问它们都会瞬间屈服”帖子揭开了大模型的日常性“窘境”。用户不提供新信息仅追问“你确定吗”模型就会道歉、改口甚至改错原本正确的答案。例如用户质疑代码逻辑或数学常识多数大模型会在零点几秒内“滑跪”顺着错误思路编造新方案。少数“抗压”模型脱颖而出并非所有大模型都如此。The Interaction Company开发的AI助理应用Poke、Anthropic的Claude Opus 4.8以及Claude Opus 4.6在被追问后能坚持自己的想法。网友Keane称Claude Opus 4.6能“顶住压力”他在系统提示词里设置后该模型会给出更有依据的理由。还有网友怀念Fable认为它多数情况下能扛住追问并解释原因。RLHF“诅咒”大模型成“讨好型人格”大模型如此表现是因为来自RLHF的“诅咒”即模型过度重视人类反馈。这可归类为AI谄媚为迎合用户倾向牺牲事实一致性。在模型对齐阶段训练者通过奖励机制让模型更安全、礼貌“顶撞”人类会拿低分“顺从用户”是得分捷径导致AI成了“讨好型人格”。即便最新一代模型也无法完全免疫这种盲目顺从。新评测维度“are you sure?” benchmark当下模型评测注重复杂题目正确率但对话中的抗干扰能力缺少统一衡量。一个合格的AI助手应在用户质疑等情况下保持判断边界。因此有网友提出为大模型专门设置“are you sure?”的benchmark测试其在答对后被质疑时改变立场的概率。编辑观点大模型在面对追问时的表现暴露了其缺陷设置新评测维度很有必要有助于推动大模型提升抗干扰能力更好地服务用户。

Ai token 是什么

Ai token 是什么

一、一句话看懂 TokenAI 不认识汉字、英文、标点，它只认数字。 Token 就是 AI 处理文字的最小 “文字碎片单位”，相当于 AI 世界里的 “文字积木”。一段文字会被工具拆成一堆积木（Token），模型靠这些积木计算、理解、…

📅 2026/6/30 16:18:52

GitOps——让Git成为唯一的“真相来源“

GitOps——让Git成为唯一的“真相来源“

GitOps——让Git成为唯一的"真相来源" 你有没有用过手机的"云备份"？生活场景：云备份的便利以前备份照片你要备份手机里的照片：插上数据线打开电脑复制粘贴等待 “等等，好像漏了几张？” 重新来一遍现在云备份你打开iCloud/小米云服务： …

📅 2026/6/30 16:18:52

22年网络建设与运维国赛iscsi服务

22年网络建设与运维国赛iscsi服务

(七)iscsi 服务任务描述：请采用 iscsi，实现集中管理存储。 1.在 linux3 上添加 4 块硬盘，利用 lvm2 创建 lvm，卷组名称为 vg1，逻辑卷名称为 lv1，容量为全部，格式化为 ext4 格式。使用/dev/vg1…

📅 2026/6/30 16:18:52

sysSentry与Kubernetes集成指南：容器化环境下的硬件故障监控方案

sysSentry与Kubernetes集成指南：容器化环境下的硬件故障监控方案

sysSentry与Kubernetes集成指南：容器化环境下的硬件故障监控方案【免费下载链接】sysSentry sysSentry is a system inspection framework used to manage system inspection tasks. 项目地址: https://gitcode.com/openeuler/sysSentry 前往项目官网免费下…

📅 2026/6/30 17:39:18

Kafka-UI安全加固实战：3种权限最小化配置保障企业级安全

Kafka-UI安全加固实战：3种权限最小化配置保障企业级安全

Kafka-UI安全加固实战：3种权限最小化配置保障企业级安全【免费下载链接】kafka-ui Open-Source Web UI for Apache Kafka Management 项目地址: https://gitcode.com/GitHub_Trending/ka/kafka-ui Kafka-UI是一个功能强大的开源Web界面工具，用于…

📅 2026/6/30 17:39:18

如何快速上手 OpenDesign Components：从安装到第一个组件的完整教程

如何快速上手 OpenDesign Components：从安装到第一个组件的完整教程

如何快速上手 OpenDesign Components：从安装到第一个组件的完整教程【免费下载链接】opendesign-components The repository of OpenDesign components 项目地址: https://gitcode.com/openeuler/opendesign-components 前往项目官网免费下载：ht…

📅 2026/6/30 17:39:18

DeepInsight研究流程优化：提升AI智能体研究效率的5个技巧

DeepInsight研究流程优化：提升AI智能体研究效率的5个技巧

DeepInsight研究流程优化：提升AI智能体研究效率的5个技巧【免费下载链接】deepInsight The deep-research enables efficient RAG retrieval and multi-source data analysis, supporting intelligent reasoning for automated complex research tasks. 项目地址…

📅 2026/6/30 17:39:18

评测即锚点：模型评测方法论的科学基础与工程体系

评测即锚点：模型评测方法论的科学基础与工程体系

评测即锚点：模型评测方法论的科学基础与工程体系一、评测危机——当排行榜成为幻觉大模型时代，评测榜单的繁荣背后隐藏着深刻的危机。一个模型在 MMLU 上达到 90% 的准确率，是否意味着它真正"理解"了这些知识？一个在 H…

📅 2026/6/30 17:39:18

GHelper完整教程：华硕笔记本终极轻量控制方案

GHelper完整教程：华硕笔记本终极轻量控制方案

GHelper完整教程：华硕笔记本终极轻量控制方案【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook, Zenbook, Expertbook…

📅 2026/6/30 17:37:18

如何永久备份微信聊天记录：本地化数据管理完全指南

如何永久备份微信聊天记录：本地化数据管理完全指南

如何永久备份微信聊天记录：本地化数据管理完全指南【免费下载链接】WeChatMsg 提取微信聊天记录，将其导出成HTML、Word、CSV文档永久保存，对聊天记录进行分析生成年度聊天报告项目地址: https://gitcode.com/GitHub_Trending/we/WeChatMs…

📅 2026/6/30 0:01:32

Mate Engine技术深度解析：开源VRM虚拟桌面伴侣的架构与实现

Mate Engine技术深度解析：开源VRM虚拟桌面伴侣的架构与实现

Mate Engine技术深度解析：开源VRM虚拟桌面伴侣的架构与实现【免费下载链接】Mate-Engine A free Desktop Mate alternative with a lightweight interface and custom VRM support, though with more features. 项目地址: https://gitcode.com/gh_mirrors/ma/Mat…

📅 2026/6/30 0:01:32

专业级Windows系统优化工具：WinUtil一站式自动化解决方案

专业级Windows系统优化工具：WinUtil一站式自动化解决方案

专业级Windows系统优化工具：WinUtil一站式自动化解决方案【免费下载链接】winutil Chris Titus Techs Windows Utility - Install Programs, Tweaks, Fixes, and Updates 项目地址: https://gitcode.com/GitHub_Trending/wi/winutil Windows系统管理长期以来…

📅 2026/6/30 0:01:32

管理者的六个层次

管理者的六个层次

📅 2026/6/29 7:54:50

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

📅 2026/6/30 10:04:37

审计来了，数据权限全开——审计走了，怎么确保权限全部关掉？

审计来了，数据权限全开——审计走了，怎么确保权限全部关掉？

引言：审计结束三个月了，审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间，内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中，审计…

📅 2026/6/30 6:54:54