大模型基础
Token、上下文窗口、Temperature、Top-p、Embedding、Prompt、Function Calling、幻觉与对齐。
AI 面试越来越少停留在“你知道某个名词吗”,更多会追问你是否理解模型能力边界、RAG 链路、Agent 工程、数据安全、成本延迟和业务指标。这个专题帮你把知识点组织成可以复习、可以表达、可以落地的结构。
建议按“基础概念、核心方案、工程落地、项目表达”四层准备。每层都要能讲清原理、限制、取舍和你在项目里的具体做法。
Token、上下文窗口、Temperature、Top-p、Embedding、Prompt、Function Calling、幻觉与对齐。
RAG、Agent、模型路由、缓存、队列、限流、降级、异步任务和人审流程。
准确率、召回率、命中率、延迟、吞吐、成本、稳定性、日志、追踪和灰度发布。
效率提升、人工节省、转化率、满意度、风险降低,以及这些指标如何被真实验证。
从文档切分、召回质量、Embedding 模型、Query 改写、重排、上下文拼接、提示词约束和答案校验几层回答。最好补充你的评估指标。
关键词适合精确匹配,向量适合语义召回。生产中常用混合检索,再用 Rerank 排序,并对低置信结果触发兜底。
Agent 更强调模型参与规划、工具选择和迭代执行;普通工作流通常路径固定。回答时要强调权限、超时、重试、审计和失败回滚。
模型分层、缓存、Prompt 精简、批处理、流式响应、结果复用、限流、异步任务、只在关键环节调用强模型。
看离线评测、灰度效果、人工审核、异常兜底、日志监控、权限控制、数据合规和业务指标,而不是 demo 看起来能跑。
通过引用来源、检索约束、结构化输出、拒答策略、置信度判断、规则校验和人工复核降低风险,不能承诺完全消除。
面试官真正想听的是你如何把 AI 能力放进业务系统,并在效果、成本和风险之间做取舍。
整理 LLM 基础概念,准备每个概念的一句话解释、适用场景和常见误区。
画出完整链路:数据清洗、切分、Embedding、索引、检索、重排、生成、评估。
准备知识库问答、智能客服、代码助手、运营文案生成四类场景。
把自己的项目按“背景、方案、难点、指标、取舍、复盘”写成 3 分钟版本。
让 AI 扮演面试官连续追问,重点训练边界、失败案例、成本和安全问题。