大数跨境
0
0

Google、Amazon、Apple等互联网大厂面试必考题+解题思路+参考答案大解析

Google、Amazon、Apple等互联网大厂面试必考题+解题思路+参考答案大解析 CareerTu职图
2020-06-02
0
导读:Technical, Quantitative和Product类型问题怎么回答?

 云咖啡讲座 

时间: 6/4 周四 9 PM EDT


哪些专业适合转型Business Intelligence?

行业中BI工具演变、求职重点技能

大型科技公司BI岗位分类&适合人群


扫码回复【BI 0】报名

特殊时间,一杯咖啡钱,

足不出户,和大厂导师“Coffee Chat”



不知不觉就已经五月份啦!感觉被疫情悄悄夺去了半年时光呢……马上入夏,也就意味着毕业季马上到了。但是今年的毕业典礼全都改成线上进行了。


前几天,奥巴马在毕业典礼演讲中狠狠Diss了一把Trump,给吃瓜群众乐坏了。



奥巴马对毕业生说:在这个充满不确定性的时间点,你们踏上了人生的下一个征程……但是这次疫情也掀开了很多“遮羞布”,包括一些领导人……有些“领导人”甚至装都不装一下……

 

但是有句话说到我心里了:越是挑战的时代,越是充满机遇。不过,机会是给有准备的人的!Are you ready?

Research的第一步永远从JD开始


怎么打造自己的CV?怎么讲好自己的故事?毫无头绪?招聘帖中的Job Description是最好的切入点。

 

现在HR筛简历都是直接用软件抓关键词。如果JD中要求的基本技能都没有出现在你的简历中,写的再长再花哨都没用!

 

那么问题来了:哪些才是重点“关键词”呢?

 

随便从LinkedIn上搜一下Data Scientist,最热门的包括Apple 的这个岗位:


打眼一扫,看到不少“硬技术”的要求:SQL, R, Python, SAS 等等。“软实力”也相当重要:Communicate;Present……

 

要是觉得光看一个 JD,可能代表性不够?那我们看 500+ 个如何?


毕竟搞数据的,就要用科学一点的手段解决问题。我用Python抓取了Monster.com上所有Data Scientist 的招聘信息,来看看这些 JD 中出现的高频词汇有哪些吧。

 

(鼓励大家也可以根据自己的兴趣,尝试这样Side Project。既回答了想知道的问题,又对建立自己的 Professional Portfolio 有好处)

 


词云当中最醒目的除了Data,就是Team。这不意外,毕竟数据分析更多的是为决策者提供底层支持的,需要和多个利益相关方、跨团队合作。


再看看其他高频词, 简历中“哪些关键词”重要,答案也初现端倪。


“Analytic”, “Solution”, “Develop”, “Machine-learning”...


Data Scientist 很重要的一点就是通过建模、机器学习等方式,对大数据进行分析、形成洞察,并将其转化为解决方案。


什么意思?用普通话讲就是:一大堆数据给你,你怎么快速提取有用信息?光是些漂亮图标可不OK。你得说出这个数据说明了什么问题,怎么解决?

 

再来看看哪些数据科学技术是反复出现的。



毫无疑问,Python和SQL是最必要的技能,R在第三。所以还在纠结Python和R应该选哪个的初学者们,很显然Python 更好。SQL作为查询语言也很必要,不会提数,分析个啥。Tableau和SAS属于第二梯队。这两个没有这么热门是因为毕竟不是开源软件,要收费。所以使用的公司可能不如Python和R多。


Excel在比较后面。这也不稀奇,毕竟Excel能处理的只是结构化的,有限的数据。很多时候都需要先用SQL, Python, SAS等手段,对数据进行聚合后才能在Excel中分析。而且Excel的可视化选择非常有限。


这也告诉我们:面试的时候别光说自己会Excel 透视表了……这么基本,面试官不会被Impressed的。

 

了解了这些关键词,除了知道自己的简历应该往哪个方向打造,也不难想到 Data Science 的面试肯定会着重考察这些。


这里需要强调一点,根据职图JP Mogrgan的导师反馈,现在DS面试都会涉及最近很火的Machine Learning,比如面试官会问你SVM内的解释,Lagrange Multiplier,Duality Problem,调参和Overfitting For SVM等问题。同时XG Boost的残差学习,Overfitting for XG Boost,Bagging,Stacking和Ensembling on models这些DS最基本的问题也是必考内容。

Machine Leaning的部分其实非常难,如果有工作经验丰富的DS大牛分析如何学习和理解就会事半功倍。

6月4日,我们邀请了Google的BI分析师
告诉你哪些工具是数据岗求职核心技能
不论你是相关专业还是想转行的同学
都可以扫码报名讲座


三大常见面试题大解析


今天给大家梳理一下三大类常见的面试题型:Technical, Quantitative和 Product。


01

Technical


这类问题就是想考察你会不会使用工作日常当中需要的一些技术。最简单直接的就是会给你一个数据表,问你想要知道XXX,要怎么提取、处理、计算数据来回答这个问题。
 
出题形式一般就是告诉你数据表里面有什么变量,要求你现场写出SQL或 R/Python 语句来进行解答,如果没有共享屏幕的那就直接说出大概解题思路。
 
就比如求职论坛上分享的这种面经,算是比较典型的。两个数据表,要先理解表之间的逻辑,再进行关联。


其实如果你熟悉 SQL 语句的话,这类题型的难点更多在于你怎么理解背后的商业逻辑。

就比如这道题里面,你能不能很快Get到一次Session(访问)可能会有多条记录(因为Action不同),你计算时需要去重。还有些题逻辑比较复杂的,我建议可以建立中间表。这样逻辑清晰,自己也不会慌。

02

Quantitative


说白了就是数学,概率、统计是最常出现的,也是你以后工作中最常用的。这部分复习复习大学数学就好了,因此也是最好准备的。
 
一道典型的题:


还有就是科技公司非常喜欢考察关于Distribution的问题。比如:
  • What's the distribution of the comments per post?

  • What's the distribution of comment length?

  • What's the distribution of page shares per person?

  • If we take all people that share 2 pages on day1, what would be thedistribution of page share on day2?


如果你面试的岗位还要求机器学习的话,你还需要能够解释一些常用的Learning Method,能够解释它们之间的区别和适用的场景等等。比如:
  • SVM、DT一般应用在什么场景上?——网易、腾讯(建议所有的分类模型如LR,DT, RF, SVM, KNN 等都要了解 )

  • 介绍一下 XGB 和 GBDT以及他们区别?——腾讯

  • Bagging和boosting的区别?——淘宝

  • 为什么说朴素贝叶斯是”朴素“的?——腾讯


03

Product


这个也是数据科学岗位与单纯的Engineering或者Quant 的最大区别之处。考察的是产品思维,简言之,就是你怎么站在用户的角度去思考产品的优化。
 
这部分也是回答好了最容易出彩的地方。因为跟Technical和Quantitative 相比,这类问题没有标准答案,可以大胆发挥。如果你能说出面试官都没想到的点,一定会非常Impress他。
 
题目大概会长成这个样子:


参考答案:“我觉得我们可以小范围先做个试验(Pilot test),然后再做AB test。随机对部分用户开放Share功能,部分维持原样(解释 AB test 怎么操作)。然后我们观察用户行为的变化。我估计平台上的视频库存会增加,但我们要进一步看看是因为单个用户观看视频时长增加,还是因为用户留存率提高了。我们还需要保证新内容没有与原有内容形成竞争关系。所以尽管视频曝光量(Impression)增加,我们可以看看每曝光观看量 (View per Impression) 是否出现大幅下跌(解释Metric,以及Metric 变化的方向)。我们有资源的话,可以对用户进行问卷调查,了解他们是否喜欢观看分享的内容。"
 
Product很注重Metric 的选择。因为经常会涉及到A/B Test或者某个局部的改变,要怎么去衡量这个改变是否有效,就要看你选择的Metric 的质量。
 
比如这道题:


你的Metric不仅体现了你对Business Objective的理解,也体现了你对该产品Success的理解。
 
除了这些基本的产品概念。我建议还应该了解一些Common Sense的数量要有个大致的概念。也就是咨询常说Guesstimates。

04

Bonus:Guesstimates


这类问题根源在于很多时候我们当下很难或者几乎不可能取得真实的数据,因此就需要有个大致的估算。
 
Guesstimates问题起源于物理学里的“费米问题”。1945 年,世界上第一颗原子弹在美国墨西哥州爆炸。当时尖端的仪器设备要花数星期分析计算才能给出原子弹的爆炸当量。费米觉得大可不必。他将一张小纸片举过头顶,在爆炸的同时松开。他观察小纸片落地的位置,一波心算后,宣布原子弹能量相当于10000吨TNT当量。后来,仪器给出的结果证明他是正确的。
 
在业界里面,最常用到的就是就市场大小的估计 (Market Sizing)。估算时,需要对一些市场数据有个大致的数量级概念才能给出比较准确的估计。

题目大概长这样:


一般的解题思路就是拆解,方向可以是Top-Down 或者Bottom-Up。比如这样:


但到这里只回答了一半。其中很多节点(比如网页数量、每页广告数、访客数与、CPC 等等)都需要你有个大致的数量及概念,才能完整地把这道题解开。
 
Commonsense 数据包括:Instagram的日活有多少?北京有多少上班族?Facebook 的 ARPU(活跃用户的平均付费)大概多少?等等。

个人面试经历分享

上面为大家逐一分析了三大类题型。实际上,面试都会是给一个大的Business Case,然后面试官一边跟你逐渐深入讨论,一边就把三项都考察了。顺便也会观察你这个人,人品、性格、整体素养等等。
 
我记得在面试滴滴数据岗的时候,面试官问我的题目就是:有一天,你突然发现拼车率下降了 15%,你会怎么去解决?
 
记住,拿到问题后,千万不要想到什么说什么。先跟面试官明确问题,礼貌询问能否花一些时间简单想一想,然后在草稿纸上梳理思路。不要担心短暂的沉默,慌张地回答更尴尬。
 
我努力回忆了一下我当时的回答。当然我的答案绝对不是标准,供大家参考罢了。

我想分为外部和内部两方面来看:

先从宏观的角度去看:是否是市场整体因为某些原因导致?是局部地区现象,还是全国大范围?

竞争者是否也出现这样的情况,还是只是我们的问题?竞争者是否有什么动作导致我们的客源流失到竞争者平台?

排除了外部原因后,再看内部。我想内部可以继续拆解为供给和需求。

需求方面:
  • 是不是我们的系统出现 bug?加载慢?导致乘客无法顺利下单?

  • 其他业务线出现这个问题了么?是不是有内部侵蚀的问题(cannibalization)?

  • 如果是拼车率而非下单率的问题,要再看从用户打开 App→ 下单→ 拼车成功→ 上车,每个环节逐一调查。


供给方面:
  • 是否是司机数量不足?

  • 是否是司机调度出现问题?

  • …………


我回答的时候,面试官不是等我说完所有点,而是在我说的过程中会说:“要这条你要怎么验证呢?”,“如果我们排除了这个原因,还可能是什么原因呢?”,“嗯这个不错,但我们手头没有现成数据,你会怎么办呢?”
 
大家不用慌,面试官愿意跟你交流,愿意Challenge 你,说明他有Follow你的思路,或者他愿意给你更多的机会展示自己的想法。而且面试官也不会要求你面面俱到,一下给出一个完美答案。所以轻松应对,就假装自己在和教授或者同学讨论问题就好。

想了解更多科技大厂数据岗面试经验?
6月4日,和Google的商业分析师
线上喝“云咖啡”,来一场Coffee Chat吧!


扫码联系职图学姐回复【BI 0】
立即报名讲座

如果你现在还没有拿到满意的Offer,也请你不要轻易失去信心!只要保持不断学习技能,总有一天,机遇会降临到你头上。最可怕的不是没有机会,而是当机会来临时,你却没有做好充足的准备。


目前,职图飞跃计划正在针对Digital MarketingUX/UIData ScienceBusiness Intelligence四大方向的同学招生,参与到这次远程在线实习项目中来,你将成为本次联名商业项目的主心骨,与不同职能的同学协作一起协作推广职图 X Petite Studio推出联名T-shirt!还有资深行业导师带队一起实战,一边学习技能和工具,一边进行实践,学+练的模式让同学们能够熟练掌握,岗位必备的技能,体验和大厂同款流程。



扫码回复【DS 0】

咨询项目详情

More Information


在2019年-2020年期间,

职图已经向160+名企输送了

来自世界各地的专业人才



最后,学姐还为求职互联网科技数据岗位的你
准备了求职大礼包


【职图求职日历


每日求职福利直接送,帮你规划下半年每天可以做的事情,打卡学习,每天完成1小步,求职进步一大步。



【2020北美留学生抱团求职群】


已有纽约、波士顿、美西、美国中部等等多所名校500+学长学姐集合!北美留学生们报团取暖,分享自身的求职经验,和最新的求职资讯!群内无广告运营,每天播放最新的行业资讯和专业知识,更有众多求职福利不定期更新~




【职图最新课程】


有真实实操的远程实习-飞跃计划/帮助海归打破求职壁垒&水土不服-海归VIP冲刺项目/ 每天打卡学习专业知识,加深自身专业实力或跨专业学习-集训营年卡,强势加速你的Offer!



扫码添加学姐

回复【福利0+你的学校名称】立即领取


【声明】内容源于网络
0
0
CareerTu职图
CareerTu (www.careertu.com) 是互联网新职业在线技能学习平台,专注于数字营销 数据分析 商业分析 产品设计。Unlock Your Potential 激发潜能,迭代自我 突破技能界限,实现职场飞跃
内容 6729
粉丝 0
CareerTu职图 CareerTu (www.careertu.com) 是互联网新职业在线技能学习平台,专注于数字营销 数据分析 商业分析 产品设计。Unlock Your Potential 激发潜能,迭代自我 突破技能界限,实现职场飞跃
总阅读4.9k
粉丝0
内容6.7k