算法工程师转正答辩_第1页
算法工程师转正答辩_第2页
算法工程师转正答辩_第3页
算法工程师转正答辩_第4页
算法工程师转正答辩_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、算法工程师转正辩论不同企业转正辩论题目如下:.网易邮件事业部数据挖掘工程师整数翻转,如何处理越界问题;C+多态,静态联编和动态联编,虚函数 表;GMM原理,增大数据量是否会更好;模型融合如何做;股票买卖问题,一 次买卖和两次买卖;提升树的思想,随机森林和提升树的区别;EM算法数学原 理;SVM推导,对偶性的作用,核函数有哪些,有什么区别;分布式计算框架 了解哪些。.百度商业平台部数据挖掘工程师python两个每行都是数字的文件合并,去重;shell编程,编辑文件;进程 与线程的区别;卷积神经网络介绍;SVM的推导;大文件求交集,如何解决哈 希之后小文件还是放不进内存;堆排序代码;连续和最大问题

2、,如何证明;3sum 问题,时间复杂度;最短路问题,第K条最短路。. vivo人工智能工程师bp算法介绍,梯度弥散问题;svm介绍,优缺点是什么,卜介绍,区别是 什么;卜与线性回归的区别;如果要预测房价,用什么模型;如果要预测房价, 并且知道一个房间的房型信息,如何构建模型;sigmoid函数的应用有哪些, 为什么,列举十种常用的神经网络模型;语音识别模型有哪些;如何识别一个人 在喝酒,需要几个模型。.苏宁算法工程师卷积神经网络中卷积如何实现,激活函数的意义,损失函数有哪些,初始化 参数如何选择;用过哪些深度学习框架,TensorFlow中的session是什么, 需求,看一下有没有不合理的点

3、,比方之前这个要闻位置是在筛选项下面展示成 两个tab,但是发现tab里面的内容是一样的,所以把它做成筛选性是一样的效 果,前端实现起来也更容易一些,就去跟产品沟通,然后也沟通了一下其他不太 清楚的点,对清楚需求之后就开始制定开发方案,因为CMS里面有一些交互开 发样例,可以直接使用,然后就开始搭建页面,看哪些没有覆盖到,列出清单, 再想方法解决,比方两个典型一些的就是想在一列里面展示标签和标题,使用多 个变量,在react里面就可以直接使用record获取值,使用antd的组件写个 tag和a标签,那使用cms用json语句怎么写呢,不能直接使用antd ,写js 语句也不方便,当时讨论了很

4、多种方法,但实现的效果都不是很理想,最后用 container+map找到了最正确方案,并把这些处理思路都总结了出来。然后就是 操作记录需要展示时间轴,但是cms里面还没有支持时间轴,就找了组内CMS 相关同学沟通了时间轴的需求,最后也得到了很好的实现,还有权限控制之类的。 前端页面开发完了之后,服务端那边还没有开发完,又因为这次是cms搭建, 对返回数据格式有一定的要求,所以我就又负责写了 api层的代码,之前没有开 发过api层的代码,写第一个接口的时候遇到了一些问题,向同事寻求了一些帮 助,整个流程就很清晰了,后面的接口就开发的很快了,api层代码开发完服务 端同学也写完了,接着就是联调

5、,我们自己先进行了充分的测试,然后提测上线, 这里有点小插曲,就是我和服务端同学都是新人,我对api层部署还有CMS部 署这些也是刚接触,所以提测上线这个流程不是特别顺利,再一个就是上线顺序 的问题要沟通好,安排好时间节奏。这里是具体的一些细节,涉及到的交互就是,查询,下架,修改时间,操作 记录这些。修改时间的逻辑处理范围限制以及输入不合法的日期要提示用户,下10 架操作加权限控制,操作记录时间轴的实现,列表初始化时就展示某个字段排序 的结果基本就是在api层处理的,前端主要就是用json搭建页面,尽量不要处 理任何的逻辑。那么在这一阶段呢,我跟了一个完整的模块,并且用了之前也没接触过的用 j

6、son搭建页面,也写了 api层的代码,接触的东西都是新的,具有一些挑战性, 相应的也收获了特别多,在做这个模块的过程中,熟悉了 amis文档,体会到了 cms搭建页面的方便之处,对于一些页面展示上的改动只需要在cms自定义页 面那修改点击发布就行了,不用经过编译等一系列的步骤,节省了特别多的时间, 大大提升了开发效率,当然在收获便利的同时,由于刚接触对一些渲染器的不熟 悉跟之前一些开发方法不一样,在一些问题的处理上也花费了很多时间,所以之 后的开发工作中,需要多多总结业务中常用的这些场景团队内提供,熟悉之后业 务需求开发周期就会大大缩短。最后呢,对这三个月的工作做一个总结,这段时间,从没有学

7、过react到输 出了组件10+ ,参与业务迭代需求,再到最后自己独立负责一个模块,学会了 很多技术上的技能,以及公司平台的使用,还有一些软技能,都得益于团队的支 持与帮助。在这个过程中,我也感受到了自己的一些缺乏,比方开发组件时,考虑问题 不太全面,还有自己在做业务时遇到问题或者是学习到新知识时,总结输出文档 这方面做得还不是很好,再一个就是写完代码之后可能自己还没有养成多思考优 化方案的习惯。所以在之后的时间里呢,需要做的就是更加深入的去学习用到的 技术栈,并养成输出技术文档的好习惯,尝试独立开发不同类型的需求,同时充 实组件库。也要多去关注一下行业动态多在团队进行技术提供,有时间再多刷一

8、11 刷算法题进一步提升逻辑思维能力。最后,感谢这个平台,让我有机会在这里和优秀的人做有挑战的事,也希望 能继续和大家一起见证公司的成长与进步。谢谢大家。12 session和interactivesession的区别;如何实现卷积层权值共享;如何保存模 型,读取已有的模型;用过哪些深度学习模型,区别是什么;了解哪些寻优算法; soft max损失函数是什么;C+的const, static作用;new , delete原理; 强制类型转换cast之间的区别。.腾讯IEG应用研究svm推导,核函数的表达,常用的核函数有哪些;alexnet介绍;过拟合的 原因,有哪些防止过拟合的trick ;

9、1G的文本统计词频,输出频率最高的1000 个词;手写topk的代码,快排。代码还能如何优化,如果要上线的话还需要做 哪些处理如果分类样本的标签只有一定的概率可信,如何处理过拟合的原因, 有哪些防止过拟合的方法;mysql查询一段时间中某个用户的数据。.三星电子中国研究院机器学习研发工程师笔试:水管工之类的算法题,求最大深度;模型评价如何做,其中存在哪些 问题;决策树算法有哪些,随机森林和GBDT的区别;降维方法,PCA原理; 哈夫曼树在机器学习中的应用;文本挖掘算法了解哪些;人流量预测系统如何设 计。profession笔试:最优的进程调度算法(至少用多少个cpu );英语自我介绍。.联想研

10、究院模式识别研究员EM算法数学推导,如何证明算法收敛性;异常值的影响,如何消除;所有 了解的机器学习算法有哪些,框架性讲述;梯度下降算法了解哪些,优劣势是什 么;二叉树中序遍历,递归和非递归;linux操作指令了解哪些,文本处理指令 有哪些;一亿个数的文件,如何分成两个文件a,b,使得a文件的数都小于b ,同时文件大小要差不多。.拼多多算法工程师均匀分布如何生成正态分布;SVM原理,支撑向量越多越好还是越少越好; 二叉树深度遍历,时间复杂度和空间复杂度;二维排序矩阵搜索;工程中的长时 间推广问题,如何考虑样本之间非独立的影响;编程题,矩阵中的最短路,有门 有钥匙。动态规划加状态向量;贝叶斯公式

11、,实际如何计算,如何解决精度问题。.五八集团算法工程师字符串转数字;svm核函数有哪些,如何选取,手写表达式;降维方法介 绍;c的虚函数,虚函数指针和虚函数表存在哪;Linux文件权限修改,参数介 绍;模型的比拟如何做;随机森林和提升树;卷积神经网络原理;如何防止网络 的过拟合;如何网络调优。.猎聘算法工程师Python的数据结构有哪些;tuple和set的区别,set的底层实现;hash表的算法有哪些;svm推导,一直到序列最小化求解。核函数如何体 现,有哪些类型;构建分类器的整个流程是什么;数据清洗方法,缺失值处理方 法,降维方法;pea原理推导;决策树算法的介绍;二维排序数组搜索;如何构

12、 建欺诈交易识别的模型;不均衡的数据如何分类。.新浪移动数据挖掘工程师归并排序,二维排序数组搜索,中序遍历重构二叉树;svm推导,为什么 要用拉格朗日乘数法,对偶问题是什么;KKT条件都有什么,如何求解svm的 最优化问题;数据不均衡如何解决抽样得到的分类准确率如何转换为原准确率; 逻辑回归原理,推导求解方法;为什么选用对数极大似然函数作为优化目标,用 平方损失有什么问题;逻辑回归对特征有什么要求,是否需要做离散化,离散化 的好处与坏处逻辑回归的参数是否可以分布式求解,如何做分布式;有三辆车, 到达时间随机,a车五分钟一趟,b车十分钟一趟,c车十五分钟一趟,求平均 等待时间。辩论内容如下:各位

13、领导,大家下午好,非常感谢大家能够抽出珍贵的时间来参加我的转正 辩论会。今天我的辩论内容主要分为三个局部,第一局部就是我的一个个人简介,第 二局部是实习这三个月以来的一个工作总结,第三局部就是实习以来的感受和对 之后工作的展望。那么,我就先简单地介绍一下自己的履历。我本科是就读于吉林大学,通信 工程专业,当时的年级排名是前20% ,每学年都获得了学业奖学金,大三的时 候获得了院优秀学生,大学期间积极参与社团活动,担任吉林大学南湖校区校学 生会宣传部的部长,负责组织各大校园活动的宣传工作。除了社团工作,也积极 参与各项竞赛,比方参加了全国大学生数学建模大赛获得了吉林赛区省一等奖, 吉林大学电子设

14、计大赛校二等奖,还参加了校园创新工程跟同学组队做了一个基 于4G的车载防盗系统。研究生就读于北京邮电大学信息与通信工程学院将于2021年6月份毕业, 研究生期间积极参与实验室工程,现有一篇论文一篇专利在投。年前的时候有过一段短暂的实习经历,是在爱奇艺的商业智能部,实习了一 个月的时间,参与是一个资源位分析的一个工程,主要是写了几个数字卡展示类 的组件,修改了一些bug。之后四月份的时候经过春招实习面试,五月份幸运的入职了字节跳动的产品研发和工程架构部,感谢洪堂把我招进来提供给我一个 学习和展示自我的机会,感谢我的导师行云和郭洋以及组内很多同事的帮助和指 导,三个多月的时间在TOP工程组学到了很

15、多,也收获了很多。接下来我对这 段时间的工作做一个总结。自入职以来,一直在做TOP ( Toutiao Operation Platform )工程相关的 工作,TOP是一个给整个头条所有业务线(UGC、PGC、西瓜等等)提供一个 统一的运营CRM后台的工程,通过这个统一的CRM后台来沉淀好的运营方法 论,实现快速支持多业务的通用运营需求,提升运营工作效率。TOP工程分为 很多个功能模块,我主要参与过的是大盘分析,内容运营和作者运营模块,参与 了这些模块的功能迭代,那么在业务中就会有一些通用的场景我们可以抽离成组 件,所以团队就开发了一套适合Top业务使用的组件库top-rc ,使用时只需要

16、引入这个包,进行简单的属性赋值就可以实现功能,大大的提升了开发效率,为 了在开发中省去编译耗费的时间,团队开发了 CMS建站工具,引入了一些渲染 器,把top-rc中的组件迁移至CMS ,通过写JSON渲染页面,直接在CMS开 发自定义页面,简单的需求或者改动节省了很多时间,缩短迭代周期。我用CMS 独立开发了流量工具要闻后台这个模块之后也深有感触。我想把我的工作分为三个阶段来讲,第一阶段就是top-rc组件库的建设, 第二阶段就是参与TOP工程的一些功能迭代和细节优化,第三阶段是独立开发 了 TOP流量工具-要闻后台模块。top-rc组件库我共输出了 10多个组件,其中有展示类组件,Info

17、Card ,展 示员工信息在设计这个组件的时候最开始是跟doc里面显示的信息卡对齐的, 当时做完感觉很逼真,但后来考虑到如果我们想展示更多的信息呢?如果获取不 到用户头像呢?如果网络不好信息卡不能立即展示出来呢?在考虑到这些边界 性情形之后就进一步去完善组件,可以配置头像信息,下面的详细信息可以通过 传入一个数组进行循环渲染,label对应于Team、Manager, value对应于后 面的值,在没有头像时就是纯信息展示,信息卡在未完全加载时显示骨架屏。这 个InfoCard组件在后面的previewEmployee的组件里面使用,传入一个Uid 就可以实现类似于doc里面预览员工信息的功能

18、。MetaCard是一个三元信息 展示,avatar, title , desc配置实现一个简单地信息展示,可用在select筛选 框里,分为有无头像,有无描述信息等几种情况;Video和PreviewVideo通过 传入gid属性就可以预览视频信息,还可以配置宽度和高度以及是否自动播放等 信息。然后就是一些表单类组件,SelcetCity组件主要是迁移的antd里面的 cascader组件,主要遇到的问题就是城市数据的获取与处理,编写程序把统计 局网站上面拿到的数据,城市编号和城市名称处理成label , value , children 的格式,把最后生成的json文件传到tos ,前端通

19、过api获取并加缓存。Uploadimage上传图片组件,需要从用户角度考虑上传图片支持可裁剪,配置 可裁剪时可配置默认裁剪比例也可以拖动实现自定义裁剪大小,不配置可裁剪时 直接上传,上传完有预览和删除功能,支持uri和url ,一次上传多张图片等。 还有一些简单地交互类的业务中常见的场景,做成了组件,比方ArticleTitle , 表格里面经常见到,标题长度太长截断展示点点点,鼠标hover展示全部,之 前需要自己用Tooltip写,现在传入一个gid属性就可以实现,还有TextCopy 和OuterAuthor通过简单地属性传入就可以实现文本复制和跳转站外的功能, 所以开发这些组件我的一

20、个感受就是我们要站在用户的角度去设计,确定出需要 抽象出来的属性,再一个就是属性透传问题,以及一些边界情形的考虑。最后输出了一个页面级的组件,layout,也是经过简单的配置搭建出一个页 面,左侧菜单通过sideNavSettings来配置,最开始是用三元表达式判断做到 了支持三级菜单可通过Json配置渲染展示,作为优化点,如果想支持n级呢, 后来用递归的方法做了优化,可支持n级菜单的渲染,头部导航可以通过 headNavSettings 配置,支持配置搜索框,tooltip , link , popover,以及右 侧的个人中心,为提升交互体验,搜索框未点击时是一个icon,点击icon ,

21、搜 索框过渡展开,失焦后过渡收缩,可通过onsearch属性配置搜索内容。这里有 点难的点是处理url与selected Key和openKey的双向性,根据url确定要展 开的项和要选中的项,以及反过来选中某一项时将路由追加到url o第一个阶段主要就是学习react框架,Typescript,以及antd ,学习过程 中输出了十多个常用的业务组件,之前这些都没有学过,git的使用也不熟练, 踩了一些坑,后来就周末花时间去整理了一下git相关的内容,学习了一下局部 原理,比方git是怎么进行存储的,以及git的三个分区和变更历史的形成,几 组常见的git操作命令的比照,输出了文档并在周二的技

22、术提供周会上并给团队 做了一个提供。第二阶段做了一些具体的业务方面的工作,主要就是对于现有TOP工程中 一些可优化的点进行改进,然后参与了几个页面的功能迭代。关于TOP工程中的一些细节优化,解决的主要有三个问题,第一个就是大 盘看板之前是iframe方式嵌入的/frame方式嵌入还有个弊端是背景颜色不可 以改变,我们的背景主题色是白色,而iframe颜色是灰色的,页面不一致,所 以统一改为SDK的方式嵌入,可以修改背景颜色,又可以控制标题是否展示。 由于不同的看板宽高不同,前端获取不到其高度,只能在前端写死一个高度,在 iframe框内滚动展示,就导致可视空间太小,用户体验不好,为了和其他页面

23、 保持一致性,跟产品沟通之后最终解决方案是把页面footer去掉,与其他页面 视觉上保持一致,同时增加了全屏查看按钮,使每一个看板都可以全屏展示。解 决的第二个问题就是,负责维护大盘看板模块时,发现大局部的需求都是往里面 增加看板,其实需求很简单,配置appid , dashboardld注意好要展示的业务 线就可以了,但是这种简单地需求也需要经过提mr,编译部署到boe ,再编译 部署到线上这一系列耗时的操作,所以就对菜单进行优化,在TCC动态配置中 心配置菜单项,前端通过接口引入,再有增加或者调整看板的需求时,很快就搞 定了。那次,正在做别的需求,产品经理wenxia在大盘看板迭代群里面艾

24、特我 增加看板,插空五分钟就给搞定了,产品很惊讶,以至于后来团建的时候见到我 第一句话就说需求支持很快。解决的第三个问题是像一些链接的跳转啊,日期快 捷筛选这些,很多个页面要用到的,之前是每一处都是单独写的,后面我改成了 统一变量管理,之后就可以一键修改。除了一些细节优化,我还参与了几次内容列表与作者列表的功能迭代,比方 针对于之前内容列表里面的排序是内容总VV值,不同筛选条件时,列表的搜索 结果变化不大,导致运营者没方法看到指定内容在目标用户群体的VV值,或者 按照目标用户群的VV进行排序,当任意一个目标用户筛选条件有值时,都要必 须填入VV占比,否那么不能查询。另外为了更明确当前选择的产品,需要在特定 的字段后面加上括号,括号里面显示产品名称。作者分类之

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论