
背景:
🌟学历:211本科
🌟专业:光信息科学与技术专业
🌟性别:男
🌟年龄:32岁
🌟职业情况:8年中小厂产品经理工作经验
🌓求职过程及最终结果:
所以导致自己投简历,拿到了4个面试都挂在了一面,我就意识到:这样肯定不行!继续面试没有意义。
改完简历之后,严格意义上说我没有海投,全部是精投,投递的都是自己想去的公司,因为在面试之前导师就对我进行了三次模拟面试,海投的意义就不大了。
一共投递了19家的30多个招聘JD,拿到10个面试,最终拿到3个满意offer(Kimi、智普、快手),年包涨薪幅度在30%-51%之间,非常满意了。

很荣幸收到老薛邀请撰写面经,因为薛老板要求每一场面试都要录音,方便导师指导复盘,我看了一下有200多个问题(实在太多了),下面给大家分享几个我认为比较有价值的问题,然后把自己的答案也贴在下面,希望对大家有帮助。
业务面试:
1、你在上家公司主导了代码生成场景的Agent能力评估Benchmark构建,能否具体说说你是如何设计评估指标和Rubrics的?这些经验对Kimi的Agent评估有什么借鉴意义?
参考答案:面试官您好,我当时设计的核心思路是场景分层+能力拆解+多维度评估。
首先将代码生成场景分为基础语法实现、复杂逻辑构建、性能优化、可维护性4个层级;
然后针对每个层级拆解评估指标,比如基础语法实现考察编译通过率、代码正确性;复杂逻辑构建考察算法复杂度、边界处理能力;
最后制定Rubrics评分标准,对每个指标设置1-5分的评分规则,同时引入人工复核环节确保评估准确性。
至于迁移到Kimi的Agent评估,我认为可以借鉴场景化评估和动态迭代的思路: Kimi的Agent覆盖多场景,需要针对不同场景设计专属的评估体系,比如对话场景关注上下文一致性、意图理解准确率,工具调用场景关注工具选择合理性、任务完成率;同时评估体系需要动态迭代,随着Agent能力的提升和新场景的拓展,不断优化指标和Rubrics。
2、面试官:在你过往的Agent的项目评估中,你如何区分Agent能力不足和输入模糊导致的任务失败?在Kimi的多场景评估中,如何用同样的思路提升评估的准确性?
参考答案:在我们公司,我会对失败样本进行人工标注,区分Agent问题和输入问题。比如,用户输入"写一个排序算法"属于模糊输入也就是输入问题,而Agent生成的代码存在语法错误则属于Agent问题。
在Kimi的多场景评估中,我会建立样本标注机制:对每个评估样本标注输入质量和Agent表现两个维度,输入质量分为清晰、模糊、无效;Agent表现分为优秀、合格、不合格;同时设计输入修正模块,对模糊输入进行标准化处理
3、Kimi的Agent需要覆盖多场景(对话,工具调用,代码生成等),你会如何设计统一且可扩展的评估Benchmark?核心难点是什么?
参考答案:我会采用核心能力+场景适配的分层架构:
核心能力:定义所有Agent共通的核心能力指标,如意图理解准确率、上下文一致性、任务完成率;
场景适配:针对每个场景设计专属的评估指标,如代码生成场景的编译通过率,工具调用场景的工具选择准确率;
扩展接口:预留扩展接口,支持新场景的快速接入。
核心难点是场景多样性与评估统一性的平衡,以及动态场景下的评估体系迭代。
解决方案:
1)建立场景标签体系:为每个场景打上标签,比如"代码生成""多模态交互"等,通过标签关联对应的评估指标和Rubrics;
2)构建动态迭代机制:定期收集用户反馈和Agent表现数据,优化评估指标和评分标准,比如当Agent在某场景的能力达到瓶颈时,调整评估难度;
3)引入自动化评估工具:用代码实现部分指标的自动化评估,比如编译通过率,API调用成功率等,从而提升评估效率,同时保留人工复核环节确保准确性。
4、如果评估结果显示Agent在某场景的表现波动较大,你会如何分析原因并优化评估体系?
参考答案:我会从样本、模型、评估规则三个维度分析:
1)样本维度:检查样本是否存在质量问题,比如标注错误、场景覆盖不全等,是否需要补充或替换样本;
2)模型维度:排查模型是否存在版本迭代,参数调整等情况,导致能力波动;
3)评估规则维度:检查评估指标和Rubrics是否合理,是否需要优化评分标准。
优化方案:
1)样本迭代:补充场景覆盖不全的样本,修正标注错误的样本,确保样本的代表性和准确性;
2)评估规则优化:调整指标权重或评分标准,比如当Agent在某指标上的表现稳定后,降低该指标的权重,增加新能力指标的权重;
3)动态监控机制:建立Agent表现的动态监控体系,实时预警波动情况,及时分析原因并优化。
5、通过竞品分析,你认为目前Al Agent的高价值应用场景有哪些? Kimi可以在哪些细分方向上形成差异化优势?
参考答案:根据我的经验,目前AlAgent的高价值场景主要集中在专业领域辅助、复杂任务拆解、多工具协同三个方向,比如:
1)专业领域辅助:如代码生成,法律文书撰写,医疗问诊辅助;
2)复杂任务拆解:如项目规划,旅行安排,活动策划;
3)多工具协同:如数据分析,内容创作等。
Kimi的差异化优势在于长文本理解能力和多模态融合能力,可以在以下细分方向形成优势:
1)长文档处理场景:如论文精读,合同审核,书籍总结,利用Kimi的长文本理解能力,打造能处理百万级字符的Agent;
2)多模态专业辅助:如设计稿生成,可以结合文本描述和图片参考;视频脚本创作,结合文本和视频素材;利用多模态融合能力提升Agent的专业度;
3)垂直行业定制:针对金融,法律等垂直行业,打造具备专业知识和合规能力的 Agent,结合Kimi的技术优势提供精准服务。
6、你认为这些场景的商业变现模式是什么?如何平衡用户价值与商业目标?
参考答案:针对我上面提到的几种场景,商业变现模式包括按次付费、订阅制、行业定制服务:
1)按次付费:针对单次复杂任务进行收费,比如论文精读,合同审核场景;
2)订阅制:提供Agent的高级功能的订阅服务,比如多工具协同,长文档处理等场景;
3)行业定制:为企业客户提供定制化的Agent解决方案,收取服务费。
平衡用户价值与商业目标的核心是基础功能免费+进阶功能付费:
首先保障基础对话,简单工具调用等核心功能的免费开放,满足用户的基础需求;
然后针对高价值场景和进阶功能设计付费模式,比如长文档处理,垂直行业定制等;
同时变现场景要融入自然,比如在Agent提供服务后,推荐对应的付费升级选项,避免生硬推销。
7、除了自然语言对话,Agent还有哪些核心能力?Kimi的Agent在技术架构上有哪些可以优化的地方?
参考答案:Agent的核心能力包括意图理解、任务规划、工具调用、记忆管理、反思迭代等。
Kimi的Agent可以在以下方面优化:
1)记忆管理优化:引入长期记忆和短期记忆的分层管理,提升长程对话的上下文一致性;
2)工具调用增强:优化工具选择的准确性和多工具协同的效率,比如通过强化学习让Agent学习更优的工具调用策略;
3)反思迭代机制:增加Agent的自我反思能力,当任务失败时,自动分析原因并调整策略,提升任务完成率。
8、大模型中的CoT(Chain of Thought)在Agent中起到什么作用?你会如何设计CoT来提升Agent的复杂任务处理能力?
参考答案:CoT在Agent中起到逻辑拆解禾推理引导的作用,通过让Agent生成中间推理步骤,提升复杂任务的处理能力。
我会设计场景化CoT模板:
针对代码生成场景,设计需求分析算法选择代码实现测试验证的CoT模板;
针对项目规划场景,设计目标拆解任务分配时间规划风险评估的CoT模板;
同时允许Agent根据具体任务动态调整CoT步骤,提升灵活性和适应性。
如果大家最近在求职找AI产品经理工作,不清楚如何制定自己的求职策略,欢迎加我微信(xuelaoban678)找我聊聊。
