大数跨境
0
0

面试美团大模型算法工程师,有点难!!!

面试美团大模型算法工程师,有点难!!! 运筹Offer
2025-05-10
1
导读:关于小编:小编是过年某985研二,过完年打算找大厂实习 offer,本文章主要记录了本小菜研找实习的坎坷历程

关于小编:小编是过年某985研二,过完年打算找大厂实习 offer,本文章主要记录了本小菜研找实习的坎坷历程,欢迎大佬们给建议!!!

面试题汇总

应聘岗位:美团-算法工程师

面试轮数:

整体面试感觉:

1. 自我介绍

在自我介绍环节,我清晰地阐述了个人基本信息、教育背景、工作经历和技能特长,展示了自信和沟通能力。

2. 面试问题

2.1 简历项目

  1. RAG 相关
    1. 介绍一下 RAG 思路?
    2. 如何构建 QA 数据?
    3. PDF 文件如何解析?
    4. RAG 幻觉问题怎么解决?
    5. 如何过滤掉检索过程中的噪声文档?
  2. KBQA 相关
    1. 介绍一下意图识别思路?
    2. 介绍一下常见的命名实体识别模型?

2.2 八股文

2.2.1 介绍一下决策树中熵?
  • 定义:信息量度量的是一个具体事件发生了所带来的信息,而熵则是在结果出来之前对可能产生信息量的期望;考虑该随机变量的所有可能取值,即所有可能发生事件所带来的信息量的期望
  • 公式:

2.2.2 介绍一下条件熵?
  • 定义:给定X条件下,Y的条件概率分布的熵: H(Y|X=x),结合以上两条,条件熵:(给定为X条件下,Y的条件概率分布的熵)对X的数学期望

2.2.3 介绍一下决策树有哪几种分裂点方式?
  • 分类问题采用基尼系数来选择最优特征和分裂点;
  • 回归问题采用平方误差的总值(总方差)来选择最优特征和分裂点。
2.2.4 有那些方法可以评价模型的好坏?
  • 分类问题
  1. 混淆矩阵:混淆矩阵是监督学习中的一种可视化工具,主要用于比较分类结果和实例的真实信息。矩阵中的每一行代表实例的预测类别,每一列代表实例的真实类别。

  2. 准确率(Accuracy):准确率是最常用的分类性能指标。

即正确预测的正反例数 /总数

  1. 精确率(Precision):精确率容易和准确率被混为一谈。其实,精确率只是针对预测正确的正样本而不是所有预测正确的样本。表现为预测出是正的里面有多少真正是正的。可理解为查准率。

即正确预测的正例数 /预测正例总数

  1. 召回率(Recall):召回率表现出在实际正样本中,分类器能预测出多少。与真正率相等,可理解为查全率。

即正确预测的正例数 /实际正例总数

  1. ROC曲线

F值是精确率和召回率的调和值,更接近于两个数较小的那个,所以精确率和召回率接近时,F值最大。很多推荐系统的评测指标就是用F值的。

  • 回归问题
  1. 平均绝对误差(MAE):平均绝对误差MAE(Mean Absolute Error)又被称为l1范数损失(l1-norm loss)

  1. 平均平方误差(MSE):平均平方误差MSE(Mean Squared Error)又被称为l2范数损失(l2-norm loss)

  1. 均方根误差(RMSE): RMSE虽然广为使用,但是其存在一些缺点,因为它是使用平均误差,而平均值对异常点(outliers)较敏感,如果回归器对某个点的回归值很不理性,那么它的误差则较大,从而会对RMSE的值有较大影响,即平均值是非鲁棒的。

3. Leetcode 题

具体题意记不清了,但是类似 【64. 最小路径和】

  • 题目内容
给定一个包含非负整数的 m x n 网格 grid ,请找出一条从左上角到右下角的路径,使得路径上的数字总和为最小。

说明:每次只能向下或者向右移动一步。

示例 1:
输入:grid = [[1,3,1],[1,5,1],[4,2,1]]
输出:7
解释:因为路径 1→3→1→1→1 的总和最小。

示例 2:
输入:grid = [[1,2,3],[4,5,6]]
输出:12

提示:

m == grid.length
n == grid[i].length
1 <= m, n <= 200
0 <= grid[i][j] <= 200
  • 代码实现
class Solution:
def minPathSum(self, grid: [[int]]) -> int:
for i in range(len(grid)):
for j in range(len(grid[0])):
if i == j == 0: continue
elif i == 0: grid[i][j] = grid[i][j - 1] + grid[i][j]
elif j == 0: grid[i][j] = grid[i - 1][j] + grid[i][j]
else: grid[i][j] = min(grid[i - 1][j], grid[i][j - 1]) + grid[i][j]
return grid[-1][-1]

面试题汇总

致谢

  • LLMs 千面郎君更新版 https://mp.weixin.qq.com/s/C6NdO_Ebj3DQx2AVAAgQRQ
  • LLMs九层妖塔 https://mp.weixin.qq.com/s/Eh0tY1zx2FqXQqIGa2dIBA
  • NLP 面无不过 https://github.com/km1994/NLP-Interview-Notes

【声明】内容源于网络
0
0
运筹Offer
运筹OR帷幄社区旗下的求职和留学资讯平台,聚焦运筹学、大数据、AI等领域,内容涵盖企业招聘、实习内推、职场经历分享以及运筹学海外硕博申请咨询
内容 1337
粉丝 0
运筹Offer 运筹OR帷幄社区旗下的求职和留学资讯平台,聚焦运筹学、大数据、AI等领域,内容涵盖企业招聘、实习内推、职场经历分享以及运筹学海外硕博申请咨询
总阅读307
粉丝0
内容1.3k