数据科学面试终极指南_第1页
数据科学面试终极指南_第2页
数据科学面试终极指南_第3页
数据科学面试终极指南_第4页
数据科学面试终极指南_第5页
已阅读5页,还剩92页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3育培训有限公司目育培训有限公司译序 1前言 2 二、数据科学岗位 1三、科学数据岗位划分 2如何看待数据科学 34.1开发数据产品的创业公司(200人及以下规模) 34.2分析自有数据的创业公司(200人及以下规模) 4.3分析自有数据的财富500强大中型公司 54.4自有成熟数据团队的大型科技公司 6五、聘用数据科学家的行业 75.1获得数据科学面试机会 75.2.通往数据科学面试的九条途径 7 获得面试机会的主动途径 8.与第三方招聘公司合作 12.如何提出求职申请 12简历VS领英 12求职信VS电子邮件 13请人推荐,让人脉为你服务 13六、准备面试 156.1.面试内容 15电话面试 15家庭作业 15招聘经理电话面试 15招聘经理电话面试 17招聘经理现场面试 17技术挑战 17总监面试 176.2.数据科学岗位技能矩阵 186.3.数据科学岗位纵览 184育培训有限公司七、数据科学面试题 207.1.行为试题 20项目? 20?反感什么? 20请说明,当必须说服别人认同你的观点时,你是怎么做的,效果如何? 217.2.数学试题 21如何使用线性回归算法求解最优系数?(C3能源的数据科学家面试时曾问过这个问题) 21学试题 21I型错误与II型错误的区别是什么?(Niraj,我们的校友就遇到了这个问题) 21 试题 25SQL交易表(Transaction_ID,Item_ID,Quantity,DPrice 算法问题—从0开始,编写K近邻算法 28 7.5.场景试题 30假如你是一家鞋品电子商务公司的数据科学家,如何搭建一个鞋品访客推荐系统?(Verizon公司面试数据科学家时问过这个问题) 30 体育、政治、经济等类别,怎样为新文章分类? 31网页设计替代方案的实验。假设没有其它实验结果支持,也没有采集用户行为知识。这一结论可能导致的潜在问题,以及如何避免这些问题。 327.6.面试提示 337.7.结论 33八、招聘经理的想法 338.1WillKurt(QuickSprout公司)访谈 33些方面? 33有什么好建议? 34你想考核的是什么? 34 8.2MattFornito(OpsVisionSolutions公司)访谈 34是什么? 35有什么建议? 355育培训有限公司 8.3AndrewMaguire(PMC/谷歌/Accenture)访谈 36什么? 36有什么建议? 36?你想考察的是什么? 36谷歌招聘数据科学家和业界其它公司有什么不同? 378.4HirstoGyoshev(MasterClass公司)访谈 37么? 37人有什么建议? 38?你想考察的是什么? 38 8九、求职者的成功经验 399.1SaraWeinstein 39什么建议? 39让你觉得意外或很难的是什么? 399.2NirajSheth 39什么建议? 39什么建议?最难的问题是什么? 40 0定因素是什么? 409.3结论 40十、面试后要做的7件事 4210.1面试后,寄出感谢信,保持跟进 4210.2列出对面试问题的想法,寄给他们 42聘公司 4210.4保持联系,正确的方式 4310.5利用人脉 4310.6招聘被拒,更要表现出专业性 4310.7不要放弃希望 43ffer 11.1Offer流程 44Offer 4企业文化 446育培训有限公司团队 45上班地点 45薪资谈判 45 11.2上班前的准备 4611.3结论 46十二、资料和数据 4712.1名人名言 4712.2核对清单 4712.3模板 48争取信息化约谈 48找人推荐工作 48面试后的跟进 4812.4术语库 4912.5资源 491育培训有限公司?DJPatil十年来,这一名词一直饱受争议,实干家与学院派对于数据科学涵义的论辩屡见不鲜,更可怕的是,他们的理念和数据分析公司常用的理念也不一样。只要一讨论大数据与机器学习数据解决方案,就会发现新词让人应接不暇。每个公司对数据科学的涵义都有自己的理解,招聘经理的理解也各不相同,大家都喜欢根据自己的理解来面试。数据科学定义随着公司和岗位变来变去,定义不清使得数据科学面试困难重重。2育培训有限公司分简单的数据科学项目说明数据科学的岗位。某数据科学团队想效仿Yelp团队利用深度学习技术识别图片。Yelp到适合显示的图片。有时上传的都是同类照片,食物,要么是饭店外景,但是想全面评价一家饭店需要不同类别的图片。要实现这个目的需要帮助计算机利用训别哪些照片是饭店外景,哪些照片只是食物。数据科学家负责搭建模型,让机器创建不同图片类别,要从用户标注过的照片和照片标题的关键字里提取所有相关的数据类型。这是个高端岗位,通常要全方位管理数据产品,搞定从算法选择到工程设计等方面据科学问题。数据工程师负责搭建系统,获取并存储所有图片数据,实现数据科学家选定的算法。这个岗位需要很强的力,但是不需要深入理解算法理论。数据分析师负责查询数据、展示业务变化带来的影响。用户满不满意?最近的改版为Yelp带来了多少流量?这些都是数据分析师要提出和解答的问题,此外,数据分析师还要和其它岗位的同事沟通数据分析结是个入门级的岗位,数据科学新人或有一定技术能力的业务人员就可以胜任。后文还会提到更多数据科学岗位。现在只要知道这三个数据科学岗的面试不一样就可以了,其实,大部分,各个数据科学岗位的面试都不一样。3育培训有限公司不但数据科学各岗位的面试要求不一样,各类公司对数据科学面试的要求也不一样。可以把公司大致划分4.1开发数据产品的创业公司(200人及以下规模)欢迎来到硅谷的心脏,创业公司是技术人员的浪漫国度,很多创业公司短期内就能取得惊人的成绩。加入创业公司,要做好一人多职的心理准备,很多时候一个人要兼任三个数据科学岗位的工作,而且可能永远到想要的资源,加班加点,累死累活更是家常便饭。这类公司都希望求职者具有很高的水平,他们对数据处理技能的要求远高于那些只处理内部数据的公司。这类公司的创始人大多都是数据科学精英,或者曾经当过大型数据科学团队的领导。他们招聘的都是顶级人才,要有丰富的从业经验、突出的发展潜力和强大的自我推动力。加入这样的公司可能是这辈子最好的,不过,也要做好面对数据科学顶尖挑战的心理准备。odeAnalyticsRJMetrics岗位实例:数据分析师(Looker),高级分析师(ModeAnalytics)。OMode作效率更高、效果更的目标是为各行各业的分析师提供教育与激励服务。,协制定更科学的决策。第二,为希望实现数据驱动转型的公司或分析师提供开源资料和分析服务。1岗位职责:1我们心目中的人选:O管道经验者优先;公司规模:143名员工使用领英(11-50人的公司规模)岗位解读:本岗位的重点是沟通能力、数据库查询能力、利用编程语言实现数据可视化的能力,说明这是岗,与相关团队沟通数据分析结果是必备能力。4育培训有限公司4.2分析自有数据的创业公司(200人及以下规模)这类创业公司只分析自有数据,不向其它公司销售数据产品。因此,招聘门槛比前一类公司略低。不过分数据对创业公司一样至关重要,因此这类公司的招聘门槛往往也会很高。IT术天才很多,不过能为业务与技术搭桥的人才也不可或缺,要是公司里各部门对理解和使用数据各执己见,这样的人才就更重要了。在数据驱动型公司工作,要做好吃苦耐劳的心理准备,还要拓展思路,为公司各部门采集数据、使用数据推荐新工具,制定新流程。在处理自有数据的公司工作,非常考验数据分析师的水平,要在公司里持续推广、强化数据驱动型的企业文化。赶紧提高自己的领导能力与沟通技巧吧!BCBB量一般不大,但特别在意数据细节BC户量极大,数据问题主要是数据规模庞大,过度关注消费者个体会分散其对消费者群体的注就不错了。求职者一定要深入了解面试的公司及其数据问题,做足功课,确认能在该公司满怀激情地工作,具备的专好也要和该公司的岗位职责相匹配。terclassSprig岗位实例:Branch公司首席数据科学家,Rocksbox公司数据(研究)科学家,Masterclass公司数据等。O数据科学家(决策科学家)MasterclassMasterclass致力于让来自世界各地的朋友都能获得最好的在线教育。演员为什么感情这么丰富?运动员怎么能抵抗地心引力?畅销书作者又是如何炼成的?我们的课程将对这些问题为您一一解密。作为我们的学员,您可以随时随地学习在线课程。至于那些天才宝宝,您可有福了,可以享受每节课一次免费试听的优惠待遇。我们是风投提供资金支持旧金山,现已聘请各行各业的专家录制了大量始搭建自己的数据团队,现在就申请加入我们吧!1我们心目中的人选:O务分析,这些分析领域都要有所涉猎。我们希望你能热爱数据项目涉及的各种分析工作;O实用主义。成果导向、积极主动、动作迅速、无惧荆棘、高屋建瓴、主次分明。必要时可以在短时间内提供足够好的解决方案;O科学思维。能深入钻研问题,提炼出可用于商务实战的假设推理;O善于交往。具有丰富的沟通技巧,能够描述各类业务伙伴提出的模型、逻辑和含义;5育培训有限公司O乐于学习。快速上手新工具与新技能,能打破瓶颈,推动项目开展;O具有敏锐的商业洞察力、产品意识及系统思维。公司规模:37名员工使用领英(11-50人的公司规模)岗位解读:寻找乐于钻研问题的通才,能对各种数据分析结果进行沟通。说明这是个多面手型的数据科学作态度,还要有创业精神。4.3分析自有数据的财富500强大中型公司世界级的大公司深知使用自有数据的重要性。不少公司已经组建了强大的数据科学团队,并提供充足的资金支持,使其安心开展数据科学工作。这些数据团队有点像大公司内部的创业公司,帮助公司将数据转化为商务洞察结果。还有很多公司意识到数据对保持竞争力的重要性,为此不惜招募整个数据科学团队。利自身优势,说不定就能轻松通过这些知名大公司的数据科学面试。虽然这些公司的企业文化已经成形,甚至还有官僚作风,多多少少会给创新带来更多困难,但拥有百万客户数据可以为数据科学带来无限可能。以沃尔玛的采购数据为例,这可是百万量级的数据,分析结果会影响千万人的生活。虽然这类公司一般不会研发尖端数据科学解决方案,但处理他们的数据集依然是一种挑和他们的精英员工一同工作,也能让你受益匪浅。清楚问题。给定一个特征向量,找出该向量到所有其它已知向量的欧式距离并且找出最接近的KJP可乐、第一资本家与建模师,第一资本数据工程师数据工程师职位ID:R5046发布日期:2016年6月16日工作所在地:弗吉尼亚州,麦克林市多年以来,我们一直努力为客户提供独创、精简和人性的银行服务,我们以帮助客户取得成功为使命,客成功就是我们的成功,客户的满意就是我们的标准。在共同价值观的指导下,我们视合作与开放为核心价值,相信快人一步的创新、同心协力的团队,只要互相扶持,以做正确的事情为准则,必能创造卓越的成就。我们的合伙人为客户服务尽心尽力,全力协助客成目标、实现梦想,共同为把银行业变得更好而努力。O我们心目中的人选:想用数据引爆软件的能量吗?开发过引以为豪的应用吗?喜欢优雅的数据解决方案吗?第一资本正在寻求一位资深数据工程师,能够开发语言优雅、扩展性强的数据解决方案,通过内外部客户触点,改变业界游,提交用户体验分析成果。作为引领下一波新浪潮的银行客户团队成员,您将领导整个团队不断完善第一资本的生态系统,最终创建CassandraMongoAPI式处理等。000+人的公司规模)明这是个非常专业的岗位,需要掌控第一资本庞大的数据资源。6育培训有限公司4.4自有成熟数据团队的大型科技公司大型科技公司也在不断孵化成长,他们对数据的痴迷源于当年创业公司的初心,只不过他们的数据规模已经达到甚至超过了百万量级。优步、Airbnb、Facebook和谷歌等世界级大公司有着业界顶尖精英领技术团队,这类公司的数据科学人才专业性极高,可以用最狂野的革新思想应对最前沿的数据问题。如果你渴望挑战、向往处理大规模数据,一定要加入这些顶级公司。虽然在这里你的优势不如在创业公司明显,但是这些公司福利好、薪资高、团队成员极其优秀—就算将来想换工作,这里的工作履历也简历高人一等。cebookAirbnb岗位示例:Oculus数据分析师,Airbnb机器学习数据分析师O数据与分析数据科学家、数据分析师(Oculus)Facebook产品改变了整个世界的供了无限的可能。Facebook对促进世界沟通与共享做出了巨大的贡献,过去的十年里,,十几亿人使用我ebookOculus在寻觅既热衷于虚拟现实,还能驱动数据化业务决策的数据产品科学家。可以操控世界上最复杂的数据集、使用最前沿的技术,在日常工作中,您的洞察结果将会变数据驱动出成功的产品。公司规模:16,715名员工使用领英(10,000+人的公司规模)岗位解读:本岗位指出求职者应该是敢于创新的全面型人才,属于开放式数据科学岗,招聘方希望求职者7育培训有限公司学家的行业各行业对数据科学的要求不一样。每个行业都有专业知识,数据类型也因此不同,比如学校与银行关注的不一样。假如求职者恰巧对要面试的行业充满热情,记得一定要在简历或领英里多多列出该行业的关键字。说明对业很感兴趣,对这个行业的知识了解得非常深刻,会让你在众多求职者中脱颖而出。O'Reilly公司的调研表明,软件、咨询及银行金融是对数据科学人才需求最大的三个行业,也是愿意为数据科学家开出最高工资的行业。不同行业对数据科学岗位的需求不同。软件、医药以及电信业的公司是数向于招聘数据分析师。求职者可以根据潜在雇主的行业,推断他们的数据科学需求。求职者还要了解不同行业、公司及岗位的数据科学面试过程。从事数据科学这一行,必须具备获取和处理大规模数据集的能力。一般来说,求职者应该具备编程能力、数学知识及技术沟通技巧,还要掌握各种数技能,能够胜任公司里各类数据科学岗位工作。的一点,求职者要有通过数据改变世界的决心和能力,不能轻易被困难击倒。数据科学面试就是为了测试这些技能以及求职者的适应能力,准备迎接来自各个维度的挑战吧!科学面试机会科学面试的第一步不是应对面试,而是争取面试机会,仅这点可能就需要几个月的努力。作为本书研究的一部分,我们咨询了20个人,想了解他们认为数据科学面试里哪个环节最难,本来我们认为他们会说技术问题最难,但调查结果并非如此。只有68%的人认为技术问题最难,名列第二;多达%的人认为得到数据科学面试的机会最难。怎样才能得到面试机会,特别是转行做数据科学的人怎样才能获得面试机会呢?介绍这方面内容的文献很少。我们想在此基础上更进一步,研究数据科学面试的真人真事,给大家呈现与众不同的内容,帮助求职到面试机会。5.2.通往数据科学面试的九条途径在数据科学领域,我们发现传统途径还有些作用,不过对于创业公司,新兴的、主动出击式的策略会让求更多机会。O获得面试机会的传统途径:虽然,我们认为新兴的策略对获得面试机会更有效,不过,本着物尽其用的精神,了解下传统途径也没有8育培训有限公司1)官网招聘版块与标准求职求职者通过公司官网的招聘版块提交简历与求职信,然后就等着吧。不是说别用这种方法,不过它真不靠谱。谱可以到Indeed和Careerbuilder上查找数据科学的帖子,也可以去专业网站的数据科学招聘版块找找机会,比如Kaggle的招聘版块。2)第三方招聘公司联系第三方招聘公司,请他们帮忙联系适合的公司。他们在数据科学与技术领域中非常专业,经常能收到未公开发布的招聘信息。在领英上查找数据科学招聘,联系身边的第三方招聘公司,或许能帮你找到合适。3)参加招聘会数据科学类招聘会很少,虽然哈佛大学与斯坦福大学举办的计算机科学招聘会为在校生提供了不少数据科但是就算参加当地数据科学社区主办的聚会也比参加招聘会强得多。O获得面试机会的主动途径上述传统途径是求职的默认项。现在,要想拿到Offer,还要有主动出击的拼搏精神与勇气。创业公司提供了大量数据科学岗位,他们的企业文化与招聘策略大多源于那些十年前也是创业公司的大型公司,创业公司的决策者在创建公司时靠的就是拼搏和勇气,他们的招聘理念也如是,所以,求职者必须同样也要有搏精神和勇气,主动出击和他们取得联系。4)组织或参加数据科学活动大型会议与小型社区聚会。p会议Strata大会:Strata大会是在世界各地巡回举办的大型数据科学会议,演讲者来自各大学院与业内企业。大会的主题关注于数据科学发展最前沿的趋势。在这里,可以学习数据科学背后的技术。Strata大会还经常组织网上活动。KDD大会:KDD,全称数据科学知识探索大会,也是大型数据科学会议,还是引领数据科学理论研讨与组织。参加这样的大会,成为其中的会员是为数据科学发展做出贡献的超凡途径。9育培训有限公司NIPS大会:NIPS,全称神经信息处理系统大会,是大型学院派数据科学会议,侧重于评估数据科学的前。参加该大会可以一览数据科学的未来发展。我们列出了不少数据科学大会,但还有更多服务于本地数据科学社区的小型聚会。美国大多数城市都有数据科学社区聚会,但是旧金山海湾地区的数据聚会最多。可以通过M查询附近的数据科学聚会,有些大型数据科学聚会的成员超过4000多名,比如,旧金山数据发掘聚会、华湾区R用户群。当年就是靠做过数据科学社区联络人找到的工作。他主持过一次亚特兰大数据科学聚会,当时邀请了不少轻轻松松地就应聘成功了。5)打造自己的作品集SundeepPattem是多门数据科学教程的导师。作为数据科创建了一整套提取数据价值的解决方案,还在个人网站上列出了多个方向的数据科学项目。通过解决可持续性的能源问题,他的数据科学技能突飞猛进,很快就成为了知名学术大会的出版作家,不还找到了数据科学家的工作。不知道分析什么数据?我们提供了19个免费开源数据集供你探索。找到感兴趣的数据问题,提出解决方案,记下每步操作,打造自己的作品集,讲述解决问题的经历,展示科学的追求。6)参与开源项目或开放数据项目世界上最酷的数据项目早就不再是大公司秘密数据库里的专利了,Github的开源库才是项目宝地,比如,这里有把人类语言当作数据源的NLTK自然语言工具箱,还有各种Python数据科学与机器学习库。另外,CTO源项目的经历可以证明求职者能和团队一起合作开发高水平的作品。开源项目就像透明的玻璃瓶一样,让势一览无余。7)参加数据科学竞赛喜欢的开源项目也没关系,还有更广阔的天地可以让你发挥创造力,比如参加数据科学竞赛。数据科学竞赛平台有Kaggle,Datakind和Datadriven,这些平台提供了解决现实世界里企业与社会问育培训有限公司题的机会。好好表现数据科学技能,告诉大家你是多么的与众不同,积累最强大的面试资本:热爱实战。8)喝杯咖啡,信息化约谈广泛的人脉能为你带来大量的工作机会。想知道公司要解决什么样的数据问题?哪些问题你能解决?想知,就得多认识些这个圈子的人。对付这种人有一套,能邀请他们和你一起喝咖啡。你可以给他们待解决的问题提出新想法,找到解决问题和数据科学家约谈时,可以听取他们的建议,了解最新的业内动态,还可以扩大数据科学人脉圈,了解业9)数据骇客松顺应实战潮流,数据骇客松提供了独一无二的,与精英团队共同锤炼数据科学本领的机会。几天内解决一的数据问题,这可不简单。DataWeek可行的解决方案,一下子就把你和其他求职者区别开来了。很多公司都关注骇客松,还会提供奖项赞助,以期能在这里找到下一位科学家。育培训有限公司育培训有限公司5.3.与第三方招聘公司合作k与AnnaMeyer合作,她就职于RobertWalters,这是一家专注于数据科学领域的第三方招聘公司,她公司的招聘主管。5.4.如何提出求职申请O简历VS领英哪种提交求职申请的方式更好?现在还有不少人倾向于传统思路,不过他们忽略了一个大问题:传统思路。学院派与实干家的基本区别就是怎么介绍自己。在校学生,还有招聘经理都交流过,他们普遍认为领英已经是招聘的黄金标准。允许第三方招聘公司浏览优化过的简历,他们能帮你找到合适的工作机会。在领英上给自己造势,你就已经输给这么干的人了。虽然现在面试还要求提供简历,但简历已经不是面试成功的重点了。提交简历之后,招聘人员会快速浏览的简历,然后就完了,而伟大的领英可以不断地给你提供求职机会。和学院派不同,写几篇令人印象深刻的论文,再有几年高校工作经验,这是学院派找工作的关键。到业界的公司求职,简历写的越简单越好,列出以前为公司做过什么贡献就可以了。记住,招聘人员对简历就是历的重要建议历的人愿意深入了解你之前,首先要找到对你的兴趣点。亮或加粗显示。招聘人员或招聘经理会先看你是否具有岗位所需的技能。关就可以。4)使用数字说明影响力!不要只写做过什么工作,要写清楚做过的工作产生了多大影响。比如说,写“开发了自益”。英的重要建议。前的工作岗位相匹配。技术能力以及与企业文化的匹配度。说明你独特的世界观,能增添不少个人价值,脱颖而出。育培训有限公司楚这一点。要想求职成功,编写个人档案时要非常慎重。如果不想只得到入门级的Offer,就别说自据科学新人。要是你专注于处理某些特定类型的问题,要说清楚这类问题涉及的行业。搞清楚应聘岗位和行业以及相关技能的关键字。对金融类数据科学岗位感兴趣?别客气,尽量在简历与领英里多提提这些行业的术语。如果你的技能正好与求职岗位相关,一定要说清楚!最好研究一下要应聘公使用的技术。YelpAirbnb位要求使用Python或R,就得在简历和领英里说清楚你会不会这些技术。要是有人能在领英帮你做背书,也是非常有利的事情,所意思,邀请同事证明你的技术实力吧。很多第三方招聘人员和招聘经理不怎么看简历,更喜欢看领英。招聘人员看简历的时间一般也就30秒,然后就把简历扔到一边去了。用强有力的语言描述你为公司带来的影响,如果想让简历或领英引人注目,得一定要使用正确的关键字。都排队等着入职呢。你得干得更漂亮才能找到满意的工作。不管怎么说,优化求职的每一步,包括简历和,这两样都是你的新老板肯定会看的东西。O求职信VS电子邮件求职信以前是学术进步的标准。现在这个年代,招聘人员很少会看求职信。要是想表现得与其他人不同,或领英里附上吧。要表现的更积极主动,就把工作经历好好提炼一下,整理成简明的文字,发个电子邮件给招聘经理,方便他向公司里其他人介绍你。这封邮件一定要简单明了,最好别超过一段,内容也不要超过三点,就说最重事情,能说明你给公司带来的影响就可以了。O请人推荐,让人脉为你服务大多数人都没意识到人脉圈子的重要性,好的人脉圈子可以让你顺顺利利地迈进数据科学面试的大门。很多公司都极其重视人才推荐,特别是内部推荐。要是公司里能有人大力推荐你,最起码能保证有人去看你跳过面试的很多环节。率获得面试机会;仅通求职成功的可能性大幅提高。我们的校友还说,不一定非得是朋友才能做人才推荐,也可以找公司里的员工帮你推荐,起码能电话面试的机会。长远来看,你得结交不同类型的人,不管是曾向你学习的人,还是喜欢给你介绍朋友认识的人,他们都会你推荐工作的人。育培训有限公司假如人脉圈子帮不上忙,又着急找人推荐,那你可以利用信息化约谈这招。接触在这行工作的人,了解他能证明你对他们的事业感兴趣,而且还帮得上忙。去处,领英、Angellist和FounderDating这样的网络平台也可以。只要表现的真心诚意,再展示出你对他们就职的公司和数据科学的兴趣,就可以试着约他们出来喝杯咖啡,聊聊他司,看看能不能为他们手头上的难题提点解决方案。下面是个邮件样稿(你也可以在领英上添加朋友,还可以在FounderDating或Angellist上直接给人发信提出些有创意的想法,帮你们强化信任。希望能有幸请您一起喝杯咖啡,了解下Airbnb面对的问题,说不定我能帮上忙,不知道您下周是否有时间能一起坐坐?前项目的链接。如果人脉圈子够大,通过朋友介绍,就有可能约谈任何公司的人。看下领英里的二度好友,看看别人是怎么和你关联上的,同样,你也可以轻易地关注任何一家公司的领英页面。这里是Airbnb在领英的页面,看。约好以后,一定要好好了解约谈的人及其就职的公司,相关信息在公司网站就能找到,也可以看看能否通源了解。总之,最好了解清楚该公司的日常问题。信息化约谈提供了绝佳的机会,可以让你了解应聘公司到底是什么样,他们的优先级是什么的,这些在面试时有很大帮助。如果准备充足,把自己定位成为帮助公司解决问题的人,这个和你喝咖啡的人就会变成部举荐你的强大助力,帮你跳过一些招聘环节,助你进入第一轮面试。育培训有限公司试希望为争取数据科学面试机会所做的一切都有回报,收到代表开启面试流程的邮件,或者有公司打电话叫试。以下就是即将发生的事情,要准备好哦。6.1.面试内容需要通过许多技术挑战;另一些公司则会考虑企业文化匹配。如果有人推荐,你有可能会直接进入最后一试。最严谨的面试可能是这个样子:O电话面试一般来说,为了节约招聘经理的时间,人力资源的员工会通过电话面试初步筛选求职者。有时会询问些基本的技术问题,筛掉完全不合格的人。大多数情况下,从电话面试开始,公司就已经在考察求职者是否和的企业文化相匹配了,求职者要有较好的沟通技巧,才能面试成功。本次通话可以让你初步了解数据团队的问题及其组织架构。准备好一些有深度的问题,展示你对业务和数的理解,快结束时也可以提些关于公司的问题。O家庭作业电话面试后,有的公司会给求职者布置任务,要求限时完成。这个环节能有效地筛掉技术差、不愿下人。大部分公司不会这么干,但也有不少公司喜欢用家庭作业这种测试方法节约招聘经理的时间。好的家庭作业设计也是了解公司的好机会,可以了解到这份工作要解决什么问题。家庭作业可能会让你深度分析给定的数据集,从数据中推导出洞察结果,并进行说明;也有可能是让你清理有明显错误的数还有可能让你处理某些业务问题,比如基于职位描述中的数据为求职者开发职位推荐系统。花点时间完成家庭作业,了解这家公司有什么样的数据问题。通过家庭作业,可以知道公司侧重于测试哪种技能,以及他们如何看待这个岗位,搞清楚这些问题,能让你更好地利用时间应对面试。做好这项可以充分体现实力,让你与众不同。O招聘经理电话面试育培训有限公司这可能是现场面试前的最后一轮评测。一般为三部分,有时可能一个电话搞定,通话时间会比较长;通常三次电话面试,每次三十分钟。p数学与统计学学与统计学核心概念知识,面试的公司和岗位不同,具体的面试内容也不同。网络公司侧重于评测ABP计显著性均值的概念。能源公司则侧重于测试对回归概念和线数的理解。不管面对哪种的面试,都要能描绘解决问题的整体思路。BAB要像对待数学验证与统计推理一样,不要担心过度关注细节,要能条理清晰地回答问题。p编程本次面试和其它技术面试非常相似。主要是评测技术能力,一般会要求用伪代码解决编程问题,复杂一些面试官可能会用HackerRank或Collabedit这样的工具在线评测。使用这些工具,招聘经理可以实时查看能会用HackerRank或Collabedit这样的工具在线评测。使用这些工具,招聘经理可以实时查看求职者输决方案,准备好应对这种形式的测试,有可能的话去这类网站做些专项训练。破解编程面试这样的书或InterviewCake这样的网站为求职者提供了很多应对编程面试的资源,利用好这对求职者有很大帮助。要想顺利通关编程面试,就得勤做练习,熟,才能生巧。写代码时最好能找个舒适、安静的环境。不过大育培训有限公司多数情况是接到电话后,手忙脚乱地在纸上写下代码,然后匆匆忙忙地在电话里解释;有的时候,面试官会要求使用在线测试工具进行编程测试,这时可别说自己不会用。总之,要对各种可能发生的情况做好准。这种面试经常会问到数据结构,要好好学习哈希映射、决策树、堆栈、队列这些概念。像软件工程师应对试一样,你就能成功。O招聘经理电话面试终于轮到招聘经理了,他会面试求职者的沟通能力,考核求职者能否与公司的团队融洽相处。这次面试通个性、求职动机、团队匹配度及思维天赋。绝大多数招聘经理心里都会有目标人选的预期,越接近招聘经预期,就越可能获得现场面试的机会。标,可以针对该岗位定制沟通内容,尽量表现得自信,再能表述清晰的话,顺利通关的可能性就会很大。还要处理好“航行测试”这样的情景问题,试想一下,和招聘经理一起坐几个小时的飞机,怎么能让他觉得你不是个无聊的人。这项测试非常重竟今后要天天和团队同事一起工作至少八小时,这时最好能表现出和领导融洽相处的本事。O招聘经理现场面试恭喜你通过了电话面试,终于可以和招聘经理面谈啦。招聘经理会从技术和非技术角度两方面进行确认求职者适不适合应聘的岗位,甚至会设定不同场景让求职者使用白板现场讲说,测试求职者的长。O技术挑战如果现场面试没有考核技术能力,就会在本环节进行各种技术测试,特别是数据工程师这个岗位。这个环工程师面试非常相似,通常会要求在白板上写出应用的算法,解决特定的问题。O说就不难。O总监面试级总监面试。创业公司一般会由联合创始人或CEO亲自面试。育培训有限公司恭喜你!终于到了这一关了。一般来说,通过了技术考核的求职者才有可能到这一关。虽然,到了这关基本上就说明公司会给你发Offer,不过也别得意忘形。现阶段只需着重说明怎么推动业务工作进展,怎么司的问题就可以了,不用再证明自己什么,反倒要注意别犯低级错误。6.2.数据科学岗位技能矩阵/统计学库工程[1]领域专长产品科学家[2]中中中高高中工程师低中低高高低科学家高中高低低高专家中高中低低高分析师低高低低低高op不同的数据科学岗位对技能组合要求不一样。数据工程师不用具备太强的业务演示能力,但要能解决各种用好SQL就行了,不过却要是个优秀的演说家。本表从高至低列出了业界对数据科学岗位的需求与标准。以最热门产品数据科学家为例说明了各岗位的专度水平。搞清楚要应聘哪个岗位,了解应聘公司需要哪个岗位的人员,招聘岗位适不适合自己,有助于预估数据科程。6.3.数据科学岗位纵览数据产品科学家:具备数据产品开发能力的全能型数据科学家。数据产品科学家带领团队开发数据产品,法,精通用数据服务终端客户,具备开发能力,能规划各种数据产品。数据科学家:技术、业务与数学的独角兽能力混合体。数据科学家懂得怎样创建与优化数据算法,能够解释说明数据发掘到的内容。相对数据工程师而言,数据科学家不需要太懂编程,但是要能完美解析各种规数据。商务智能专家:关注从数据中提取商务洞察结果,精通统计学,与数据分析师的不同之处在于,能够掌握种机器学习算法,编制各类数据仪表盘,进行各种数据分析,帮助公司各团队制定更好的决策。工程师:不必过多了解统计学或数学,但要能处理各类技术难题,针对大规模数据实现各种算法。育培训有限公司试题7.1.行为试题与其它岗位的面试类似,数据科学面试也包括大量行为试题,面试官会考核求职者的软技能,了解求适应公司的企业文化。O请说明你以前做过的数据科学项目?了解求职者对相关知识的理解程度,曾做过什么样的贡献。测试描述工作内容的能力,以及能否把数据科历与对公司产生的影响联系起来。应答思路:与工程经验的数据项目,例如,提供数据分析并将分析结果产品化的数据项目。举例来说,通过主题提取技术识别文本数据集中的核心主题,说明主题识别的数据产品对促进公司业务增长什么效果。目标角度,详细描述对这个数据项目的贡献和产出结果。面试官希望在了解该项目总体目标的同O对以前的岗位,你喜欢什么?反感什么?合面试的岗位,了解你离职的原因。应答思路:1.差:我就受不了数据科学家总是矮工程师一头,公司高管对企业发展方向一点头绪都没有!2.好:我想在数据科学是企业战略核心、企业发展方向清晰的公司工作。的职责、团队成员、发展历史及核心业务目标等诸多信息。4.注意在讨论反感的事情时,要对事不要对人,表现出专业的素养。在讨论喜欢的事情时,仔细反思、论证哪些事情让你充满激情。比如,可以说喜欢的事情是从数据中分析出重要结果,汇报给管理层后能优化流程、促进业务。也可以说在公司里推行数据科学时可以学到新技术,同时又能让工作的效果更好。可以表示对公司没把数据科学作为战略核心的不满,也可以说公司高层的内耗,团队方向不清晰,但是一定要极地、有指向性的角度来说,千万不要带上个人色彩。育培训有限公司O请说明,当必须说服别人认同你的观点时,你是怎么做的,效果如何?人的能力。应答思路:举例说明你曾经成功地改变现状,量化这些改变带来的影响。如果可以的话,举出数据科学类出沟通技巧与领导能力非常重要。7.2.数学试题科学家岗位的数学问题,不仅需要求职者能执行算法,还要能根据特定目的调整算法。O如何使用线性回归算法求解最优系数?(C3能源的数据科学家面试时曾问过这个问题)原理:了解求职者对线性回归理论的理解程度,线性回归理论对很多数据科学岗位都十分重要,数据科学家不能把算法视为黑箱,不仅要能执行算法,还要能理解算法。这类问题(各种算法)测试求职者对算法的理解。应答思路:一步思路,列出方程式。描述思路的同时,还要详细说明解决方案。答案:在最高水平上,系数是最小化残差平方和的函数。下一步,列出方程,说明什么是残差。想要更进一步的话,可以考虑如下内容:1.用给定的线性回归模型,列出残差平方和的最小化目标,最好用线性代数(矩阵)表示法。2.残差平方和是可求微分的凸函数,将微分设为0,求解该方程,可导出系数,解出最小化方程式。较复杂;还有一种常见的案,通过观测可以发现该方程式是凸性的,因此用梯度下降这样的数值算法求解效率会更高。7.3统计学试题统计学知识对解决数据科学问题至关重要。统计推理能力和统计学理论测试十分常见。一定要牢记常用的III概念。OI型错误与II型错误的区别是什么?(Niraj,我们的校友就遇到了这个问题)原理:统计学基本概念的掌握程度、统计学基础水平,评测怎么使用统计学专业术语沟通各方人员的能力。应答思路:有据,准确说明问题里的名词定义。答案:育培训有限公司欺诈监测业务对假阳性的容忍度特别高,客户不会因为收到提醒小心受骗的邮件发火;可要是真被骗了,却没监测到,这种假阴性就麻烦大了。O这是一家大型保险公司的数据科学面试题。将总体分为两组:,a)他是暴脾气司机的概率是多少?b)他是好脾气司机的概率是多少?原理:很多公司通过贝叶斯推理测试求职者的统计思维能力。说明贝叶斯概率与统计学的频率解释的区别,展示种贝叶斯问题的能力,可以让面试官快速了解你对统计概念的掌握水平和心算能力。应答思路:率的理解水平,要逻辑清晰、条理分明地说明所有假设与计算过程。答案:首先,列出已知项:或0.6需要理解贝叶斯方程式中先验条件与后验条件的概念。先验条件是在问题出现前给定的数据。某人在总体中属于暴脾气司机的概率就是给定的先验假设,不能改变。后验条件是根据贝叶斯定理的假设(P(A/B))得第一个问题是“如果张三一年内发生了3起事故,他是暴脾气司机的可能性是多少?”?#先验条件aggDriver=0.4AggDriver育培训有限公司reeAccAggDriverreeAccNonAggDriver#某人一年内发生3起事故,他是暴脾气司机的概率是多少?#暴脾气司机占总体的比例乘以一年内发生3起事故的暴脾气司机的概率AaggDriverthreeAccAggDriver)"""分子"""分子(即A)加好脾气司机占总体的比例乘以一年内发生3起事故的好脾气司机的概率。"""rthreeAccAggDrivernonAggDriverthreeAccNonAggDriver"""用一年内发生3起事故的暴脾气司机的概率除以一年内发生3起事故的好脾气与坏脾气司机的概率之和,得出后验概率"""#把小数转换为百分数printfformatposterior*100))66=0.3333,即33%。O什么是概率分布类型(说明概率分布函数的推导)?用随机变量描述。a.T分钟内,某餐馆进来K个客人的概率b.一群人中,身高至少为X英寸的概率c.两个六面骰子,点数和为Y的概率dN次硬币,人像朝上为K次的概率原理:概率分布的知识及使用什么模型分析给定的数据。应答思路:说明数据假设,详细说明某模型是如何适用于某个概率分布的。对概率分布进行可视化,向面试官说明为用该模型对某个概率分布进行可视化。答案:a.泊松分布。假设每个客人的到店行为都是完全独立的,与其他人没有关系。育培训有限公司b.正态分布。注意,在连续分布中,精确到X英寸的可能性为零。c.根据公式XY与连续概率分布函数之间的关系。d.二项分布。P(k是抛N次硬币头像朝上的次数):tlibinlinetmatplotlibasplotipylinspaceinompmfxpylablabplotxpmf育培训有限公司7.4编程试题面试数据科学岗位,尤其是数据工程师岗位,算法编程是必考项。这个环节可以参考软件工程师的面试,用开发工具和编程综合理论是常考的内容。OSQL问题—给定交易表(Transaction_ID,Item_ID,Quantity,Purchase_Date(MM/DD/YY))和售价表(Item_ID,Price),请提供以下信息:总收入2)工作日(星期一至星期五)交易的总量、平均值与标准差,按购买量降序排列mID交易样表(表名为transactions):ansactionIDmID11516223163251642116在SQLFiddle中创建transactions表intItemIDintQuantityintPurchaseDatedatetime;tionsDQuantityPurchaseDate6-06-2800:00:00'),6-06-2700:00:00'),6-06-2700:00:00'),6-06-2600:00:00');价格样表(表名为prices):mID1223育培训有限公司在SQLFiddle中创建prices表ntPricevarchar;srice;原理:大型创业公司和成熟公司普遍使用SQL查询数据库。如果面试的是数据分析师,技术面试主要以SQL问。懂得如何正确提取数据,对面试成功很重要。应答思路:面试时,会让求职者在纸上写出代码,或使用HackerEarth等协同编码工具,这样面试官就可以在解释器了。尽量在最短时间内,最有效的完成任务,并且尽量少犯错误。可以用SQLFiddle等工答案:1)总收入LECTsumaquantitybpricectionsASaJOINpricesASbONa.item_ID=b.item_ID这段代码用于关联价格表与交易表,将每个产品的数量与价格相乘,进行汇总。计算得出总收入为37美育培训有限公司2)工作日交易的总量、平均值与标准差tityntityEDAYOFWEEKpurchasedateBETWEENAND3)LeftJoinVSGroupBya.LeftJoin方法countdistinctAitemid(LECTEDAYOFWEEKpurchasedateBETWEENAND育培训有限公司))ASBtemIDBItemIDHEREISNULLBpurchasedateb.Groupby方法[1]T(IDEDAYOFWEEKPurchaseDateBETWEENANDmID)ASB能计算出工作日未交易过的产品数量。SQL答题技巧:O整个问题分解成特定的中表,先为中间表写好查询语句;O算法问题—从0开始,编写K近邻算法原理:在规定时间内,写出算法背后的思想,并进行有效布署,这是评估数据开发能力的关键。这类问题一般会用来考核数据科学家的算法与技术实现能力,也会用来考核数据工程师的技术能力,通常会要求在给定条算法,但大多数情况下以K近邻算法为主,因为这种算法比较实现。应答思路:清楚问题。给定一个特征向量,找出该向量到所有其它已知向量的欧式距离,并找出最接近的K个向量中的大多数向量属于哪一类。这个问题测试对矩阵计算的理解,还测试处理向量和矩阵的方法。回答这个问题,要从核对输入输出样本集开始,动手推导答案。另外,还要注意时空复杂度。下面的方案中,每个预测都是关于O(2N+NlogN)O(2N+NlogN)O(2N+NlogN)的时间复杂度,其中,N是训练的行数。给出解决方案。写清楚语法很重要,还有要注意避免各种让代码不能正常编译的错误,但最重要的是说清的逻辑,要证明你能将算法应用到计算机科学层面。ollections育培训有限公司umpyasnpNearNeighborobjectfinteffitXyNXtestmatrixarrayXtestself.X.shape[0])#将X_test复制为N行istancevectornpsqrtnpsumabsXtestmatrixselfXaxis#此行是为了获取每个训练向量的距离#注意这里是使用**2和np.sum获取距离Sortindexnpargsort[Distance_vector]Close_k_Classes=y[Sort_index][0:k]#提取一组K个最邻近的向量ncollectionsCounterClosestkClassmostcommon#返回出现最多的类解决方案:大数据相关,比如,应聘岗位需要分析超大规模数据集,就会问到MapReduce。包括,如何利用大规模数据集,查找事件流中的最频繁事件。O如何在Hadoop上使用MapReduce实现字数统计?原理:有使用Hadoop或大数据工具的相关经验,或应聘的公司有处理大规模数据集的需求,创业公司,会考核求职者MapReduce实战经验。要学习MapReduce,可以到Horton网站查找相关资源。应答思路:HadoopMapReduceJavaadoop答案:育培训有限公司xt和IntWritables,这样做是因为序列化字节数组比Strings和Ints这样的原始类型更加高效。接着,将Mapper的输出采集到Executor里,执行Combiner任务。Combiner是本地聚合器,能减少MappercerMapper才会进入混洗阶段。如果发现Reducer运行到33%时卡住了,就说明混洗阶段正在等待Mapper完成任务。在混洗阶段,当所有的键都发送到Reducer后,Reducer才开始进入排序常见的后续问题是估算这种算法的时间复杂性,还要注意系统在机器之间写入与通信的数据量。别忽略冗Hadoop常会在机器出现故障时生成多个数据副本。7.5.场景试题O假如你是一家鞋品电子商务公司的数据科学家,如何搭建一个鞋品访客推荐系统? (Verizon公司面试数据科学家时问过这个问题)原理:这个问题旨在测试求职者提交整体产品的思路。情景问题不测试各领域的知识细节,但是需要求职者描述设计产品的全面知识,还要测试求职者的团队管理能力与协同能力。面试官经常会问数据科学家这个问题,数据工程师或数据分析师只要回答这种情景问题的部分内容就可以了。一般情况下,会问数据工程师如何实现相关算法,而不用考虑算法本身;还会问数据分析师查询哪些以确定用户对鞋品的历史偏好。应答思路:坦诚地说明自己哪些方面比较拿手,哪些方面不太熟悉,但重点要说明有经验的内容,如果有不熟悉的内容,也别不好意思,该问就问。尽量把技术知识与业务成果联系起来,说明做出选择的思路和假设。如果好地解决方案,别犹豫,多提问,一定要把问题理解透彻。答案:这个问题分解为数据科学与数据开发两部分。先探讨数据科学部分,对于没有多少用户历史数据的新公司,可以用近似项目法解决。如果其它项目和鞋用矩阵分解技术降维处理。假设有鞋品评级等用户偏好历史数据,可以用协同过滤类型法。特别要说明生成矩阵的行和列。然后,再哪种相似性指标,比如,欧式距离,相似度或余弦距离。能实时生成推荐信息。例如,将用户数据以数据流的形式传输到S3存储桶。设计该系统要基于所有个体进行矩阵分析,预计算整个数据集的推荐信息,将结果存储在Redis这样的内存数育培训有限公司RESTAPI个给定的用户标识进行响应式推荐。OC在Facebook上每分享一次请愿书有多少货币价值?原理:本题旨在了解求职者对业务的理解,以及将复杂问题分解为基础概念,再根据有效数据将这些概念转换为应答思路:仔细研究应聘公司,特别是其盈利模式。了解该公司使用哪些重点指标跟踪绩效,搞明白该公司如何实现盈收。问清楚要解决的问题,提出假设。回答问题时,别紧张、要自信,像给平时给领导汇报工作一样就答案:回答这个问题要对C的业务有一定了解。分享一次请愿书可以通过两种方式产生收入:非注册用户点击广告,比如,签署付费请愿书2)2)注册用户在其生命周期内点击广告第一步先找出求解这两种方式产出价值的方法。诀窍是把一个大问题拆分成多个小问题,简化价值计算方程:1)分享一次的价值=点击一次广告的预期收益+新注册用户分享每次活动的平均数量*新注册用户的期价值2)点击一次广告的预期收益=点击广告的几率*平均每次点击向发布者收取的费用3)点击一次广告的几率根据历史数据在时间窗口(一年或一个月)内的平均转化率得出,类似值通过每次的平均成本得出。,要得出整个生命周期内用户产生的总收益,通常使用队列分析或保留分析等方法。按指定月份对注册用户进行分组,查看注册后十二个月内用户点击广告的次数。根据十二个不同队列月份,得出用户生命周期的平均收益。至此,可以将分析时限设置为任意时段,其因果关系可忽略不计,即由于初次分享且注册用户不管怎样都会在该时间窗口之外注册,因此,不能认为是分享行为带来的。将求出的生命周期价值代入原始公式,就能得出分享一次请愿书的价值。还可以考虑更多元素,例如新注册用户分享自己的内容带来其他用户加入而产生的收益。要在答案里加入更多元素的话,注意不要冲淡核。专注回答最初的问题,就算有不同的想法,留着最后再说。O给定一组分好类的新闻,如体育、政治、经济等类别,怎样为新文章分类?原理:的在于测试求职者对数据科学方法论的理解,了解求职者处理非结构化文本数据的经验,这是了解求职没有能力与信心处理复杂数据的重要测试。育培训有限公司应答思路:么组织文本,以及如何看待分类系统。基本思路:探索数据,理解关键元素a.绘制训练集里的新闻分布,确定是否存在标签失衡。b.查看文本,识别异常,如非英文文本,重度缩写及拼写错误。地体现关联性。2)通过清理文本得出训练集。删除标点符号、缩写和Unicode字符这种信息量少的元素。还可以通过转字母、词形还原与词干提取进一步清理数据。TFIDFTFIDFAUCF指标的性能。还可以使用栅格实现自动交叉验证。PythonPickledJavaPOJO。这个模型还可的流程进行清理即可。O设计评估网页设计替代方案的实验。假设没有其它实验结果支持,也没有采集用户行为知识。讨论这一结论可能导致的潜在问题,以及如何避免这些问题。原理:网络公司大多会测试这个问题,因为优化网站争取更好的业绩是他们的生存之本。比如,Facebook就经常优化主页,刺激用户发布更多帖子。数据科学家的职责是帮助产品经理设计实验,解释实验结果。这个题的认知水平。解决方案:率与Facebook的平均分享次数。接下来确定达到统计显著性(例如95%)的必要样本和访问次数。可以使用卡方检验(使用是否点击这样的二项式随机变量)或Z检验(使用正态分布随机变量)。然后,评估P值,确定B检验的指标与基准A检验的指标是否在统计上有显著不同,如果存在显著不同,且新版指标优于基准指标,则新版网站是最好。回答问题时,要考虑的问题:本无法测试出改版的本质。)对两个访客随机样本进行A/A测试,检查选择的分布和指标是否未具备统计显著差异。这是为了保证性。值,这样的话,平均值就不宜作为评估指标,此时,分布也可能会出现高度偏差。虽然根据中心极限定理可以假设平均值作为比较指标,但有时这种假设也可能不成立。因此,要核查育培训有限公司指标,确保在对比不同方案时,转换率或用户分享次数的平均值是理想的指标。如果某个用户的分享次数使用每个用户的分享率就不是最佳的性能指标了。到这种问题时,尽量充分展示分析各类问题的能力。7.6.面试提示行面试,最好穿西装,打领带。要是不确定穿什么就提前问一下人力资源的人。2)面试前,了解一下面试官和公司,想清楚要问的问题。3)精神饱满。吃饱喝足,锻炼身体,尽量提前做好准备。4)回答问题要详细,思路要清晰。5)微笑,信心。用各种方式减缓压力,做做瑜伽、伸伸懒腰、读点闲书—尽可能保持巅峰状态。7.7.结论数据科学面试是个多面兽,求职者会面对各种挑战,现场编程、设计算法、统计知识、数学问题、领导能技巧、说服力和影响力,真是不胜其烦。数据科学面试很难,好在我们总结了求职成功者和招聘经理的想法与理念,将之整理成系统、可行的思路大家参考。招聘经理的想法8.1WillKurt(QuickSprout公司)访谈个人简介:WillKurt是QuickSprout的数据科学家。他的兴趣是概率论、写作和Haskell。他的博客地witterO招聘新人的时候,你关注哪些方面?对我来说,把创造力和好奇心这两种心态结合起来最重要。在创业公司里,每天不同职能领域都会出现各育培训有限公司又有可能帮营销团队重组测试设置。最理想的求职者要对公司里所有与数据相关的问题都感兴趣,能不断种类型的数据解决方案。O你对参加数据科学面试的人有什么好建议?根据我的经验,所有值得效力的小公司和创业公司都对数据科学家的加入感到开心。他们希望新人的数据科学技能和经验能解决一直以来让人头疼的问题。搞清楚面试问题,和他们一起解决问题,调动他们的兴奋点。抓住机会询问他们在解决什么问题,让他们和你一起头脑风暴,找出解决问题的方法,证明你有能力让他们的日子更好过。要知道,技术高超的求职者很多,但是关心应聘公司的问题,对之感兴趣的人很让面试你的每个人都喜欢和你一起工作,他们就得求着你入职了。O面试时,你喜欢问什么样的问题?你想考核的是什么?单,构建一个分类器就可以了,我和求职者说了这一点,不过,我还告诉他们,我还想通过这个测试看看他们能不能搞点标新立异的东西出来。这个任务的答案不一定很长,或很复杂。我想要的是,求职者要进流,表现出好奇心,找出有价值的东西。这些求职者都会编程,对线性代数、微积分和概率论也很了解,具有学习相关知识的基础,技术从来都不题,但是教他们创造性思维,让他们积极主动地解决问题就非常困难了。OKissmetrics和QuickSprout招聘数据科学家时有什么不同?人应该知道许多创业公司或小公司一直都在招数据科学家,只是因为招聘过程太浪费精力,所以暂时没有开始正式的招聘工作而已。我在Kissmetrics遇到过一个人,他是我见过的最赞的求职者,有一天,他跑到公司门口,跟我们说:“我想来你们这里工作!”。学术界或大公司的人可能不知道创业公司和小公司的招聘有多灵活。如果你认为一家公司的业务很酷,就他们联系。对于一帮热爱自己事业的人来说,告诉他们你喜欢他们干的事,真心想加入他们的团队,没有什么比这个更让人印象深刻的了。就算这家公司暂时不打算招人,等他们开始招聘的时候,你肯定会是第选。8.2MattFornito(OpsVisionSolutions公司)访谈育培训有限公司MattFornito数据分析和管理领域有十多年的经进步。这篇访谈根据和Matt的电话记录整理。O招聘新人时,你关注的重点是什么?我喜欢招聘有量化知识背景的人,他们可以学习编程,但是不用再学这些专业知识了。对我来说,硕士或博士学位非常重要,本科生达不到我的要求,考个本科对大多数人来说都不是什么难事。我喜欢招聘能编程、会沟通的人,能明白技术问题是制定、执行方案和沟通想法的关键。我认为,数据科学家和数据分析主要差别就在于,数据科学家能深刻理解数据问题,还知道怎么解决这些问题。我还喜欢招聘数学、统计学、化学,物理学、生物信息学和工程学专业的硕士或博士。只有少数MBA专业的人和能我配合好。其实我本人是组织心理学专业的博士,所以,尽管我喜欢有STEM(科学、技术、工程、数学英文首字母缩写)背景的人,但也不一定非得局限于这些专业。O你对参加数据科学面试的人有什么建议?招聘人员在意的是教育程度、简历上列出的最后两份工作,还有行业背景。人力资源的人看简历非常快,秒钟内吸引住他们的眼球。条件允许的话,我建议最好去Facebook这样的一流大作,或者去创业公司当个高管,这种行业背景能让人轻松地脱颖而出,找到高端数据科学工作。对于“给我讲讲你做过的项目”这样的问题,招聘经理经常会问求职者曾经做过什么—处理过什么样的数据,使用过什么样的工具,产出了什么样的成果,说清楚这些问题十分重要。成功的求职者对做过的工握的很准,能清晰地讲述项目经历,还能说清楚他们对业务产生的影响。O你会考察哪些内容?面试时,我一般会围绕一个项目测试求职者解决问题的能力和沟通技巧。我还会评估求职者对我们公司和坚持学习的动力、热衷于解决问题是我考察的关键。在技术方面,我对能用HadoopSpark的求职者感兴趣。他们能不能像数据科学家一样思题?做没做过数据科学工作?这些都是我希望通过面试了解的主要问题。我还会问些数学问题,比如,梯度下降、统计技巧,还有随机森林。我还会设计情景问题,提出客户情景HackerRank踪解决方案的方式;我宁愿测试求职者对从未用过的编程语言的接受程度,育培训有限公司。我招聘的人必须能学习新技能,这是我考察的重点。8.3AndrewMaguire(PMC/谷歌/Accenture)访谈Penske用业务分析工作。此前,他曾在谷歌(市场分析、数据质量)、埃森哲创新分析中心(顾问),还有怡安创新分析中心(产品开发团队)工作。O招聘新人时,你关注的重点什么?很重要,如果求职者能把自己的优缺点都说清楚,我觉得这样就很好,我不喜欢太能吹的人,谦虚才是美常重要。O你对参加数据科学面试的人有什么建议?对于技术问题,要多花点心思,写清楚解答思路,还有就是一定要把面试问题搞清楚。另外,有问题问,别害怕告诉面试官没接触过某些领域,或者不熟悉某些算法,他们不会因为这个就筛掉你。作为数据科学认自己知识有限非常重要,坚持学习才是最重要的能力。准备两到三个数据科学项目的“故事”,和面试官聊聊问题规划、数据清洗、数据分析、数据可视化,以这些“故事”可以是以前公司里干过的工作,上大学时的作业,甚至还可以是业余做过的项目。要学会从我发现了解求职者最好的办法是让他们详细介绍以前做过的项目,所以,一定要想办法让面试官对你在简历上提目感兴趣,愿意主动了解你做过的事情。O面试时,你喜欢问什么样的问题?你想考察的是什么?处理过最大、最复杂的数据集是什么样的?处理数据时遇到过什么问题?我一般会探讨这些问题,了解求据清洗技能与经验。举例说明,如何分析数据集?如何与业务方沟通分析结果?数据分析时遇到过哪些问题?产出了什么成育培训有限公司业务产生了什么影响?要说明提取业务洞察和与相关方沟通等方面。我的问题主要和简历相关,要是问以前工作中做过的项目,我会问解决过什么问题,使用过哪些数据,怎么使用数据,分析结果是什么,怎么把分析结果扩展到其它业务领域。所以,一定要谨慎选择在简历上写容。如果觉得内容太多,两页纸写不完的话,就得考虑针对不同类型的岗位定制不同的简历。最后,我会让求职者讲个失败的例子,说说什么地方做错了,以后遇见类似事情怎么改进。这个问题是我从《人力资源百问百答》里看到的,不过我也喜欢看求职者如何回答这个问题:)O谷歌招聘数据科学家和业界其它公司有什么不同?我觉得都差不多,总的来说还是看具体岗位。要是非常专业的岗位,比如研发岗或研究员,问的技术问题就会更细,对专业领域问题也会钻得更深。对于通用岗或业务岗,主要关注技术水平、业务理解力、团队及沟通能力的合理搭配。的不同就是面试次数多,面试官的人数也多,至少有6个人参与面试,从各个方面考察求职者。这些人会从不同角度评判求职者的优缺点,而且必须综合考量求职者的能力和水平,给出是否同意招聘的结论。表现出良好的综合能力,比偏科要好的多。这时候,求职者的态度和亲和力非常重要,某些方面有短板,只要面试官欣赏你,觉得你能在几个月内快速跟进,工作就有戏了。8.4HirstoGyoshev(MasterClass公司)访谈的创业公司,致力于普及天才教育、重塑在线教育。他曾在消费型网站(雅虎)和企业级SaaS公司从事公司战略、商务运营及产品战略等工作。MasterClass长期招聘数据科学家和相关岗位,详情可登录查看。O招聘新人时,你重点关注什么?计与商务智能分析都要能够胜任。他们还要乐于学习,遇到瓶颈时,能积极推动项目的进展。要说教育背景与工作经验,我们希望求职者首先要有足够的统计学知识,能判断统计推断是否有效,能识别并且避免偏差;第二点是,要有满世界采集数据的能力,采集回来的数据基本上都有一大堆问题,他们意愿、有能力处理这些数据,并分析出可行的洞察结果。育培训有限公司市场/用户研究的经验(学术或工作经验都可以),进行商务分析和撰写数据报告的经验也是必须的,我心要具备这些条件。O你对参加数据科学面试的人有什么建议?尽量理解面试问题,搞清楚问题背后更高层面的背景知识。面试时,对数据分析、构建模型的考核,一般都源于公司希望求职者能帮我们解决特定的问题。有时你会发现你解决不了这些问题,有时你恰巧能提出更好地建议。如果一开始就能清楚地理解我们这些“客户”到底要分析什么,你给出的分析、模型或产品更切题。一旦应聘成功,面试时问到的这些问题很可能就是日常要做的工作。O面试时,你喜欢问什么样的问题?你想考察的是什么?我们想了解求职者以前都干过哪些类型的工作,看看这些工作经历和我们招聘的岗位是否相关。我们还会了解求职者以前做过的项目,让他们讲讲解决问题的方法、思路、用过的工具、遇到过什么难题,还有就是怎么解决这些问题。我们还会让求职者做些小项目,看他们怎么处理特定的问题,当然,这也是为了考们的工作质量。OMasterClass招聘数据科学家和别的公司有什么不同?和其它公司相比,我们很少用到机器学习和算法,数据清洗的工作也不多,主要是围绕公司的产品、业务和运营部门,为他们提供各种分析决策支持。工作内容主要包括导入、处理、分析来自不同系统的数据,构建各种预测模型;设计、实施、分析各种调研与测验;协助业务部门定义、设计数据报告与指标;为业他们能熟练掌握数据分析的各方面知识,能处理各种数据分析工作。还有,我们希望求职者具有学习新工、新方法的意愿和能力。9.5结论招聘经理希望求职者能够展示:1)对该公司的兴趣和对数据科学的热爱;2)合群,这点甚至能弥补技术能力不足的弱项;3)强烈的学习意愿,快速学习的能力;4)以往项目的成功经验,对项目的影响力;强大的分析能力。育培训有限公司的成功经验9.1SaraWeinsteinO你对通关数据科学面试有什么建议?首先说一下面试准备,我觉得当初应该多了解一下分析策略。当时,我在统计学、概率论、机器学习、Python/R这些技术方面下了很大功夫,结果却被一个处理指定数据集的问题搞得束手无策,这个问题其但我没有发挥出正常水平。我太在意“硬”技能了,没重视更高层面的方法论和策略。O让你觉得意外或很难的是什么?面试过程太长了。当时我已经猜到会有多次面试,实际上整个流程下来一共面试了三次,每次面试间隔一个礼拜,再加上背景调查,从开始接触到拿到Offer一共用了一个月。搞得我压力山大,整整一个月都要积极应对、保持自信、做好各种面试准备,这可是个不小的挑战。要是早知道耗这么长时间,我就能轻松点了。我给参加漫长、多重面试的朋友的建议是,冥想是个好东西。冥想能让你晚上睡个好觉,还可以让前保持冷静和自信。9.2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论