大数跨境
0
0

字节运筹算法面经

字节运筹算法面经 运筹Offer
2023-04-09
2
↑↑↑↑↑点击上方蓝色字关注我们!





本文仅作为学术分享,如有侵权作删文处理




作者:冰冻生菜

链接:

https://zhuanlan.zhihu.com/p/475465220



2022.3.3 一面


时长:1h 30min


1. 自我介绍


主要介绍了数据挖掘(异常检测)和运筹算法(整数规划)的两个项目经历,还有实习经历。



2. 说两个项目 然后追着项目不停地深究


智能运维异常检测项目


1)时间窗口规整的预处理如何做的?


我在项目中是这么做的,假设取一个故障时间t的前后两分钟内[t-2*60*1000, t+2*60*1000)的elapsedTime进行研究


A. 对于一条时间序列,我们从t-2*60*1000时刻开始进行规整


B. 对于每一个规整的点k,我们取一个固定的时间窗口如前后一秒[k-1000, k+1000)


B.1 假设时间窗口内的elapsedTime为空,则取最近的时间点的elapsedTime


B.2 假设时间窗口内的elapsedTime非空,则取时间窗口所有elapsedTime的平均值


2)训练的过程如何选择训练集和测试集?


五折交叉验证


3)如何选择训练特征?


当时说了一堆基本的最大值,最小值,平均值等等。差点忘了,幸好机智的拿出了大创项目结项文档给面试官分享,然后给出了 开始变化时间,变化梯度,False coefficients。


4)KL散度的定义?(项目中提到了是用KL散度和JS散度去做根因定位的)


没有一句废话,用分布Q拟合分布P的额外信息。


5)和其他模型对比的结果怎么样?


挺好的,说了一下准确率,召回率,F1-score。


6)除了准确率,召回率,F1-score还有什么方法判断?


其实不太记得,在面试官的提醒下说了 ROC曲线和AUC。


然后还给自己挖了坑,提到了多分类,结果多分类还是说了准确率。。。



线性规划-分配400个员工去50个项目的最大利润


1)目标函数和约束是什么?


讲了项目要求人数、等级、差旅费用等等


2)最后公司采用了你的方案吗?


我说我给了公司两个方案,具体有没有采用不知道,还讲了一个训练员工,给员工升级的方案,说公司对这个方案比较满意。



3. 实习经历


1)面试官提到了我在腾讯的实习经历,问文本爬取之后如何聚类?最后聚了多少类?


我说到了K-means,DBSCAN,K-means的K是用手肘法选择的。不太记得,好像聚了100多类。


面试官当时笑着评价部门居然让实习生做这么重要的事情,胆子真的很大。


2)了解NLP吗?会不会做分词?


只了解最基本的,会用jieba,word2vec。。。



4. 基本技能


面试官先问了我会什么编程语言,我说主要会python,结果下面三道题都没答出来,太尴尬了。。


1)Python 的 is 和 == 有什么区别?


没答上来,后来面试官说 is 是判断地址的。


2)函数中的参数和外部变量同名,外部变量会改变吗?


不会。。。


但是我说 值变量 不可以变,列表和字典可以,可能是可以迭代的就可以变吧。


面试官让我去了解 可变变量和不可变变量。


3) 函数中*和**有什么作用?


我说python不知道,C语言是指针和指针的指针。


当时心都凉了,觉得三道python全都不会,真要命。。。


4)sql中left join和right join的区别


5)sql中having一般和什么搭配使用?和where有什么区别?


说了半天才说到group by,基本技能这一块估计扣光分了。


6)如果给你一组数据,特征比样本多,怎么去筛选特征?


我说可以用PCA降维度,面试官说是一个方法,还有吗?我说之前项目中随机森林决策树也可以筛选。然后面试官提到了一些XGBoost什么的,我说不太会。面试官就让我想除了树还有什么方法?然后我又继续想,后来面试官提示说可以判断相关性,我就恍然大悟,想起了多元统计的内容,然后说了很多,如果两个变量相关就乘起来,还可以用Forward, Backward等等,还说了Lasso回归和岭回归可以压缩系数到0,把不相关的去掉。


7)拉格朗日乘子了解吗?


我说了解,对偶问题就是这么来的,然后举了个例子。


8)KKT条件是什么?


满足原问题constraint,对偶问题constraint,松弛互补。


9)有A,B两组投放量和转换量,第二天转换率都提高了,但是AB总和转换率下降了是怎么回事?


辛普森悖论,因为A、B两组数据悬殊太大。


10)对于分段函数, 

 ,

怎么变成连续函数?


用logsitics回归的函数,类似于sigmoid函数。



5. 实战


到这里已经过了一个多小时,刚开始的时候说面试时间40-60min,现在已经超时了,我还在想说居然没有代码题,最后还是给了一道动态规划的代码题。考试的时候慢慢做做出来了,后来搜了一下发现原题是leetcode 120。



6. 反问


1)部门的业务是什么?


抖音电商。


2)用什么求解器?


不太了解,面试官主要是做数据挖掘这块,运筹只是了解。


3)接下来还有几轮面试?(其实在暗暗问自己有没有通过hhhh)


要等HR安排。




2022.3.4 二面凉经


时长:2h


1. 自我介绍

2. 深挖项目经历

3. 单纯形方法的几何解释?

4. 列生成算法

5. 启发式算法了解吗?遗传编码怎么编?

6. 随机过程的马尔科夫链,时间均衡的马尔科夫链的转移矩阵?

7. 排队论了解吗?

8. 随机优化怎么做?

9. 鲁棒优化怎么做?

10. 对于分段函数, 

如何用线性规划约束表示?


11. 写代码,动态规划 leetcode 122

12. 反问

如何发布招聘?


如果你也想发布公司招聘岗位,请扫描以下二维码或者添加微信号:or_offer 联系我们的工作人员添加请修改备注为:公司+姓名+招聘!





微信公众号后台回复

实习:获取实习岗位投递方式

校招:获取校招岗位投递方式

社招:获取社招岗位投递方式

学界招聘:获取学界岗位投递方式

职场会客厅:获取直播链接和往期直播视频完整版

加群:获取加入求职群方式



【声明】内容源于网络
0
0
运筹Offer
运筹OR帷幄社区旗下的求职和留学资讯平台,聚焦运筹学、大数据、AI等领域,内容涵盖企业招聘、实习内推、职场经历分享以及运筹学海外硕博申请咨询
内容 1337
粉丝 0
运筹Offer 运筹OR帷幄社区旗下的求职和留学资讯平台,聚焦运筹学、大数据、AI等领域,内容涵盖企业招聘、实习内推、职场经历分享以及运筹学海外硕博申请咨询
总阅读19
粉丝0
内容1.3k