字节二面追问:你们做了那么多 SFT,数据质量到底怎么判断?

字节二面追问:你们做了那么多 SFT,数据质量到底怎么判断?
文章目录前言一、从"事后判断"到"事前事中":SFT 数据工程的认知跃迁二、训练前的质量评估:四种方法叠加印证三、困惑度过滤:找到"最近发展区"四、奖励模型打分与 LLM-as-Judge五、交叉一致性检验:让问题在训练前暴露六、训练中的数据问题诊断:四个信号七、贯穿全程的数据清洗策略:五步法八、从架构师视角看 SFT 数据工程的几个取舍九、面试话术:考官想听的是什么总结前言前阵子群里有人去字节二面,回来吐槽了一段经历。面试快结束的时候,他想着反问一下显得自己有思考,就问面试官:“SFT 训练数据的质量,你们内部怎么把控?”面试官来了兴致,说这问题问到点子上了,接着一口气讲了五六分钟——困惑度、奖励模型、LLM 充当裁判、交叉一致性校验,方法名报了一串。但朋友事后回忆,说对方讲了很多方法名词,“但东一句西一句的,没听出来这些方法之间是什么关系,也不知道他想表达的核心是什么。”我问他:“那你有没有追问,比如这些方法怎么组合?训练过程中怎么判断问题出在数据上?”他摇摇头说没有,当时没反应过来。这件事让我琢磨了很久。数据质量评估这件事,多数人能说出几个方法名词,但要把它们串成一套有逻辑的判断框架,不管是面试者还是面试官,往往都说不清楚。今天就把这个体系梳理清楚。读完你能搞明白:SFT 数据质量评估不是一个点,是三个阶段:训练前筛选、训练中诊断、全程清洗困惑度过滤、奖励模型打分、LLM-as-Judge、交叉一致性检验——四种方法各有什么盲区,怎么组合使用训练开始后,哪四个信号说明问题出在数据上格式清洗、去重、异常值检测、安全过滤、分布审计——五步清洗法怎么做架