
链接:
https://www.nowcoder.com/feed/main/detail/57136a97816a469eae37689a2f682d19?sourceSSR=users
📍面试公司:顺丰
🕐面试时间:9.29
💻面试岗位:大模型 一面
❓面试问题:
1.自我介绍
2.实习-微调上下文长度是多少?
3.实习-微调数据集多少?
4.实习-用的什么卡训练?什么框架,训练多长时间?
5.实习-显存优化框架是什么?
6.实习-deepseed zero用的什么?zero 1 2 3 有什么区别,介绍一下
7.如果使用zero2,全参微调8B模型,精度BF16,占用多少显存?模型占用多少,梯度占用多少,优化器占用多少(这一块答得挺差的)
8.实习-PPO训练使用几张卡
9.实习-PPO有多个模型,如何加载的,SFT占用了几张卡?(这一块答得更差)
10.实习-PPO训练框架?
11.实习-为什么不使用RAG?使用Agent的框架吗?
12.讲一下vllm的prefix cache
13.vllm 并发量很高的时候,什么机制去解决?(就是一次解决不完,不会)
14.讲一下vllm和SGlang的结构化输出(不会)
反问:
1.业务:问答机器人,把很多很多的机器人整合为一个,涉及到多路查询、query重写、实例抽取,微调和langchain。还有一些多模型搜索的业务等
2.技术栈:模型微调+agent
🙌面试感想:训练问的好多,我不会
如何发布招聘?
如果你也想发布公司招聘岗位,博士/博士后岗位,请扫描以下二维码或者添加微信号:or_offer 联系我们的工作人员,添加请修改备注为:公司/学校+姓名+招聘!
微信公众号后台回复
实习:获取实习岗位投递方式
校招:获取校招岗位投递方式
社招:获取社招岗位投递方式
职场会客厅:获取职场相关直播链接和往期直播视频完整版
留学会客厅:获取留学直播链接和往期直播视频完整版
海外硕博申请:获取客服联系方式
求职群:获取加入【IT算法求职内推群】方式
留学群:获取加入【运筹学海外硕博申请群】方式

