Agent、RAG、LLM工具调用相关面试总结
Agent、RAG、LLM工具调用相关面试总结
Agent 相关面试总结
1. 什么是Agent?与大模型有什么本质不同?
2. Agent 的基本架构由哪些核心组件构成?
3. Workflow,Agent,Tools 这三个的概念和区别介绍一下?
4. 了解哪些其他的 Agent 设计范式? Agent 和 Workflow 的区别是什么?
5. Agent 推理模式有哪些? ReAct 是啥?具体是怎么实现的?
6. ReAct、Plan-and-Execute、Reflection 三种范式有什么核心区别?实际项目中该如何选型?
7. 复杂任务怎么做的任务拆分?为什么要拆分?效果如何提升?
8. 请你介绍一下 Agent 的记忆机制,并说明在实际开发中应该如何设计记忆模块?
9. Agent 的长短期记忆系统怎么做的?记忆是怎么存的?粒度是多少?怎么用的?
10. 什么是Multi-Agent?
11. 说说 Single-Agent 和 Multi-Agent 的设计方案?
12. Agent 记忆压缩通常有哪些方法?
13. 在工程实践中,为什么有时候选择「手搓」Age ...
A2A协议详解:多智能体通信与协作机制
A2A(Agent-to-Agent)协议是多智能体系统中实现智能体之间高效通信与协作的关键机制。本文将深入解析A2A协议的核心概念、通信流程以及在实际应用中的设计原则,帮助你在面试中全面展示对多智能体系统通信机制的理解和实践能力。
MCP(Model Context Protocol)从入门到工程实践:工具发现、选择与学习全解析
MCP(Model Context Protocol)作为大模型交互的关键协议,定义了模型与工具之间的通信规范。本文将从MCP的基本概念入手,深入解析其核心组件、通信流程以及在实际工程中的应用场景,帮助你在面试中全面展示对MCP的理解和实践能力。
从HTTP到SSE再到WebSocket:大模型流式输出与实时交互的工程演进
在大模型应用中,流式输出和实时交互是提升用户体验的关键。本文将从HTTP协议的基本请求响应模式,演进到SSE(Server-Sent Events)的单向流式输出,再到WebSocket的双向实时通信,详细解析每种技术的原理、优缺点以及适用场景,帮助你在面试中清晰阐述大模型交互的工程实现。
大模型工程三板斧:Prompt Engineering、Context Engineering 与 Harness Engineering
本文系统总结了大模型工程的三大核心能力:Prompt Engineering、Context Engineering 与 Harness Engineering,详细解析了它们的定义、技术细节、优缺点以及在实际系统设计中的应用,帮助读者全面理解和掌握大模型工程的核心技能。
JWT和Session权限校验机制
JWT 和 Session 做权限校验机制详解(面试高频)
在 Web 系统中,权限校验通常围绕“用户是谁、能做什么”展开。主流方案有两种:Session 认证与 JWT 认证。二者本质不同,但目标一致:完成身份认证与权限控制。
目录
Session 认证机制(有状态方案)
JWT 认证机制(无状态方案)
Session vs JWT 对比总结
权限校验的本质(面试关键点)
工程实践中的选择建议
面试高频总结
一、Session 认证机制(有状态方案)
1.1 基本工作流程
Session 模式的核心特点是:服务端保存登录状态
典型流程如下:
用户提交账号密码登录
服务端验证成功
服务端生成 Session,并存储用户信息
返回 sessionId 给客户端(通常通过 Cookie)
后续请求携带 sessionId
服务端根据 sessionId 查询 Session 获取用户信息
1.2 请求校验流程
每一次请求的验证过程如下:
1request → sessionId → 服务端 → Session存储(Redis/内存)→ 用户信息 → 权限判断
1.3 权限校验方式 ...
Java基础面试题(基础篇)
基于资料中的基础篇思路整理,汇总Java基础高频面试问题与标准化回答模板,覆盖面向对象、集合、异常、泛型、反射、并发基础等核心知识点。
RAG检索优化四层框架:索引层、查询层、召回层、重排序层
本文将RAG检索优化拆解为四个层次:索引层决定知识怎么存,查询层决定问题怎么转换,召回层决定从哪些路径去找,重排序层决定哪些内容最终进入Prompt。围绕这四层给出方法论、参数建议、评估指标与线上排障路径,并结合Spring AI + Milvus提供可落地实践。
RAG Embedding详解:模型选型、维度权衡与评估调优
本文聚焦RAG中的Embedding环节,系统讲解语义向量化的核心原理、相似度度量方法、主流模型选型思路、向量维度与性能成本权衡,并结合Spring AI给出可落地实现与评估方法,帮助你在面试和工程实践中把“检索质量”讲清、做稳、持续优化。
RAG文档切割(Chunking)策略详解:从固定切分到语义切分
本文聚焦RAG系统中的关键环节——文档切割(Chunking)。从切割目标、常见策略、参数设计到评估与排障,系统讲清“为什么切、怎么切、如何验证切得好”,并以Spring AI为主给出可落地实现思路,帮助你在面试与工程实践中都能稳住这一高频考点。