清风笔记

AI 面试专题:从基础到项目表达

AI 面试越来越少停留在“你知道某个名词吗”,更多会追问你是否理解模型能力边界、RAG 链路、Agent 工程、数据安全、成本延迟和业务指标。这个专题帮你把知识点组织成可以复习、可以表达、可以落地的结构。

LLM Interview Core
RAG检索增强生成
Agent工具调用与编排
VectorEmbedding / Rerank
Ops评估 / 成本 / 安全
01 / Knowledge Map

AI 面试知识地图

建议按“基础概念、核心方案、工程落地、项目表达”四层准备。每层都要能讲清原理、限制、取舍和你在项目里的具体做法。

Foundation

大模型基础

Token、上下文窗口、Temperature、Top-p、Embedding、Prompt、Function Calling、幻觉与对齐。

Architecture

应用架构

RAG、Agent、模型路由、缓存、队列、限流、降级、异步任务和人审流程。

Engineering

工程指标

准确率、召回率、命中率、延迟、吞吐、成本、稳定性、日志、追踪和灰度发布。

Business

业务价值

效率提升、人工节省、转化率、满意度、风险降低,以及这些指标如何被真实验证。

02 / Question Bank

高频问题与回答方向

RAG 为什么会答错?怎么优化?

从文档切分、召回质量、Embedding 模型、Query 改写、重排、上下文拼接、提示词约束和答案校验几层回答。最好补充你的评估指标。

向量检索和关键词检索怎么结合?

关键词适合精确匹配,向量适合语义召回。生产中常用混合检索,再用 Rerank 排序,并对低置信结果触发兜底。

Agent 和普通工作流有什么区别?

Agent 更强调模型参与规划、工具选择和迭代执行;普通工作流通常路径固定。回答时要强调权限、超时、重试、审计和失败回滚。

如何降低大模型调用成本?

模型分层、缓存、Prompt 精简、批处理、流式响应、结果复用、限流、异步任务、只在关键环节调用强模型。

如何判断一个 AI 功能是否上线?

看离线评测、灰度效果、人工审核、异常兜底、日志监控、权限控制、数据合规和业务指标,而不是 demo 看起来能跑。

怎么处理模型幻觉?

通过引用来源、检索约束、结构化输出、拒答策略、置信度判断、规则校验和人工复核降低风险,不能承诺完全消除。

03 / Project Story

项目表达模板:别只说“我接了大模型”

面试官真正想听的是你如何把 AI 能力放进业务系统,并在效果、成本和风险之间做取舍。

背景业务痛点、用户是谁、原流程成本有多高。
方案模型、RAG、Agent、数据流、权限和系统边界。
难点召回不准、回答不稳、延迟过高、数据脏、权限复杂。
指标命中率、准确率、处理时长、人工节省、用户反馈。
取舍为什么这样切分文档,为什么选这个模型,为什么保留人工审核。
复盘上线后出现了什么问题,你怎么监控、迭代和降级。
04 / 14-Day Plan

14 天冲刺复习计划

Day 1-3

补基础

整理 LLM 基础概念,准备每个概念的一句话解释、适用场景和常见误区。

Day 4-6

拆 RAG

画出完整链路:数据清洗、切分、Embedding、索引、检索、重排、生成、评估。

Day 7-9

练系统设计

准备知识库问答、智能客服、代码助手、运营文案生成四类场景。

Day 10-12

复盘项目

把自己的项目按“背景、方案、难点、指标、取舍、复盘”写成 3 分钟版本。

Day 13-14

模拟追问

让 AI 扮演面试官连续追问,重点训练边界、失败案例、成本和安全问题。