
链接:
https://zhuanlan.zhihu.com/p/475465220
2022.3.3 一面
时长:1h 30min
1. 自我介绍
主要介绍了数据挖掘(异常检测)和运筹算法(整数规划)的两个项目经历,还有实习经历。
2. 说两个项目 然后追着项目不停地深究
智能运维异常检测项目
1)时间窗口规整的预处理如何做的?
我在项目中是这么做的,假设取一个故障时间t的前后两分钟内[t-2*60*1000, t+2*60*1000)的elapsedTime进行研究
A. 对于一条时间序列,我们从t-2*60*1000时刻开始进行规整
B. 对于每一个规整的点k,我们取一个固定的时间窗口如前后一秒[k-1000, k+1000)
B.1 假设时间窗口内的elapsedTime为空,则取最近的时间点的elapsedTime
B.2 假设时间窗口内的elapsedTime非空,则取时间窗口所有elapsedTime的平均值
2)训练的过程如何选择训练集和测试集?
五折交叉验证
3)如何选择训练特征?
当时说了一堆基本的最大值,最小值,平均值等等。差点忘了,幸好机智的拿出了大创项目结项文档给面试官分享,然后给出了 开始变化时间,变化梯度,False coefficients。
4)KL散度的定义?(项目中提到了是用KL散度和JS散度去做根因定位的)
没有一句废话,用分布Q拟合分布P的额外信息。
5)和其他模型对比的结果怎么样?
挺好的,说了一下准确率,召回率,F1-score。
6)除了准确率,召回率,F1-score还有什么方法判断?
其实不太记得,在面试官的提醒下说了 ROC曲线和AUC。
然后还给自己挖了坑,提到了多分类,结果多分类还是说了准确率。。。
线性规划-分配400个员工去50个项目的最大利润
1)目标函数和约束是什么?
讲了项目要求人数、等级、差旅费用等等
2)最后公司采用了你的方案吗?
我说我给了公司两个方案,具体有没有采用不知道,还讲了一个训练员工,给员工升级的方案,说公司对这个方案比较满意。
3. 实习经历
1)面试官提到了我在腾讯的实习经历,问文本爬取之后如何聚类?最后聚了多少类?
我说到了K-means,DBSCAN,K-means的K是用手肘法选择的。不太记得,好像聚了100多类。
面试官当时笑着评价部门居然让实习生做这么重要的事情,胆子真的很大。
2)了解NLP吗?会不会做分词?
只了解最基本的,会用jieba,word2vec。。。
4. 基本技能
面试官先问了我会什么编程语言,我说主要会python,结果下面三道题都没答出来,太尴尬了。。
1)Python 的 is 和 == 有什么区别?
没答上来,后来面试官说 is 是判断地址的。
2)函数中的参数和外部变量同名,外部变量会改变吗?
不会。。。
但是我说 值变量 不可以变,列表和字典可以,可能是可以迭代的就可以变吧。
面试官让我去了解 可变变量和不可变变量。
3) 函数中*和**有什么作用?
我说python不知道,C语言是指针和指针的指针。
当时心都凉了,觉得三道python全都不会,真要命。。。
4)sql中left join和right join的区别
5)sql中having一般和什么搭配使用?和where有什么区别?
说了半天才说到group by,基本技能这一块估计扣光分了。
6)如果给你一组数据,特征比样本多,怎么去筛选特征?
我说可以用PCA降维度,面试官说是一个方法,还有吗?我说之前项目中随机森林决策树也可以筛选。然后面试官提到了一些XGBoost什么的,我说不太会。面试官就让我想除了树还有什么方法?然后我又继续想,后来面试官提示说可以判断相关性,我就恍然大悟,想起了多元统计的内容,然后说了很多,如果两个变量相关就乘起来,还可以用Forward, Backward等等,还说了Lasso回归和岭回归可以压缩系数到0,把不相关的去掉。
7)拉格朗日乘子了解吗?
我说了解,对偶问题就是这么来的,然后举了个例子。
8)KKT条件是什么?
满足原问题constraint,对偶问题constraint,松弛互补。
9)有A,B两组投放量和转换量,第二天转换率都提高了,但是AB总和转换率下降了是怎么回事?
辛普森悖论,因为A、B两组数据悬殊太大。
10)对于分段函数,
,
怎么变成连续函数?
用logsitics回归的函数,类似于sigmoid函数。
5. 实战
到这里已经过了一个多小时,刚开始的时候说面试时间40-60min,现在已经超时了,我还在想说居然没有代码题,最后还是给了一道动态规划的代码题。考试的时候慢慢做做出来了,后来搜了一下发现原题是leetcode 120。
6. 反问
1)部门的业务是什么?
抖音电商。
2)用什么求解器?
不太了解,面试官主要是做数据挖掘这块,运筹只是了解。
3)接下来还有几轮面试?(其实在暗暗问自己有没有通过hhhh)
要等HR安排。
2022.3.4 二面凉经
时长:2h
1. 自我介绍
2. 深挖项目经历
3. 单纯形方法的几何解释?
4. 列生成算法
5. 启发式算法了解吗?遗传编码怎么编?
6. 随机过程的马尔科夫链,时间均衡的马尔科夫链的转移矩阵?
7. 排队论了解吗?
8. 随机优化怎么做?
9. 鲁棒优化怎么做?
10. 对于分段函数,
,
如何用线性规划约束表示?
11. 写代码,动态规划 leetcode 122
12. 反问
如何发布招聘?
如果你也想发布公司招聘岗位,请扫描以下二维码或者添加微信号:or_offer 联系我们的工作人员,添加请修改备注为:公司+姓名+招聘!
微信公众号后台回复
实习:获取实习岗位投递方式
校招:获取校招岗位投递方式
社招:获取社招岗位投递方式
学界招聘:获取学界岗位投递方式
职场会客厅:获取直播链接和往期直播视频完整版
加群:获取加入求职群方式

