




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
AI黑科技揭秘AI+HR创新应用顶尖科学家团队力作献给走在数字化浪潮前沿的HR们,数字经济时代已全面开启,大数据、人工智能、云计算等新科技推动经济、社会、企业发生翻天覆地的变化,也将赋予人力资本巨大的变革力量。企业纷纷在寻求智慧变革,人力资源部门是推动企业变革的重要动力之一,HR也要时刻随着时代和科技的变化而变化,找到并驾驭合适、高效的智能化工具。在这场浪潮中,思变的企业和HR们已经开始寻求变革新路径。作为人力资本数字化平台和数字化人才战略的先行者,e成科技将始终与您同在,携手开启人力资本数字化新时代!”本专栏内容由HR图灵学院出品,HR图灵学院是e成科技打造的HR领域第一AI专栏,希望以此为窗口,向HR传达专业的AI知识与信息,赋予人力资本领域变革力量,以AI为钥,携手HR开启数字化变革之门!在这里,HR们可以得到前沿技术思考、行业技术干货、全球AI好物、HR+AI创新应用等。02-0910-1702-0910-1718-2318-2324-2924-2930-3637-4230-3637-4243-5143-5152-6061-6852-6061-6869-75第七部分智能职业发展规划76-8476-8485-9485-94让AI技术提升人岗匹配效果,我们做了这些探索解锁这项AI黑科技,马上实现人岗匹配自由AI黑科技:Embedding、知识图谱(KG)方法、自然语言处理(NLP)、非线性树模型、deep模型、BERT、Word2Vec模型等让AI技术提升人岗匹配效果,我们做了这些探索本期和大家讨论下“人岗匹配排序的探索与实践”。从人力资源管理的发展来看,人岗匹配大致经历了三个阶段,“三历对照法”、“冰山挖掘法”、“全人匹配法”,而AI技术的引用将为企业迎来第四个——“数据解剖法”。AI技术实现人岗匹配,离不开数据的处理和模型的选择与训练,看似高深、复杂的人岗匹配算创新应用。“人岗匹配”是企业人力资源管理的核心问题,更是所有HR追求的目标。毫不夸张地说,“人岗匹配”是人力资源的起点,也是人力资源的核心目标之一。本质上,企业和个人是利益共同体,只有使得组织利益和个体价值得才能使人才发挥最大价值,同时激活组织。那么,HR如何做好人岗匹配呢?以前,在千百万份简历中筛选人才,是HR工作中“解不开的劫”,每天花费大量的时间和精力对优秀简历和职位信息人工做匹配,不仅消耗着HR的积极性,往往结果也不尽如人意,筛不到合适的人才,难以满足业务部门的需求。现在,数字经济时代的新技术给HR带来了更多可能,AI技术将助力HR实现智能人岗匹配、大大提升人岗匹配效率与准确率,将HR从机械、琐碎的招聘工作中解放出来。那么,实现AI人岗匹配背后的依据和逻辑又是什么呢?e成科技基于前沿的自然语言处理技术和深度学习模型,并结合大量数据和知识图谱,通过不断探索和反复实践,形成一套高效的人岗匹配推荐算法系统,下面院长将详细为大家介绍这套系统及其背后的逻辑。根据发布职位来推荐简历,该场景中需要优化推荐的准确率、召回率,提升HR更高的工作效率,提升岗位和简历的匹配度来减少招聘人才的成本。在经典的机器学习排序模型中通常分为两种:复杂的人工特征工程+简单的模型,简单的人工特征+复杂的模型。本着该原则我们对以文本为主的职位和简历对进行了匹配排序实践。特征为王以JD和CV对为背景,该场景为经典的机器学习排序问题,目标在于预测JD和CV是否匹配,数据集的采集则是来自我司产品ATS平台,HR从系统根据JD推荐的CV来进行选择,符合要求将要走面试程序的则标为1,否则标为0。2.1特征介绍常见的JD如下图1所示,其中包含格式化离散数据和整段文本数据,从整段文本数据获取招聘意图是提取JD特征的重点难点。为了更好的解决该问题,我们分别引入知识图谱(KG)方法和自然语言处理(NLP)方法,其中KG负责去充分提取文本中实体的关系和联系,NLP则更好的获取JD本文和CV文本相似性信息。因涉及个人隐私此处不展示CV信息。在以JD和CV对是否匹配的背景下,我们将特征主要分为以下几类:JD特征:包含地点,学历硬性要求和利用知识图谱中提取的实体特征如(职能,公司,技能,专业,行业)等;CV特征:包含性别,年龄,学历等基础信息和从工作经历描述文本中提取的实体信息,以及文本类特征等。2.2特征处理>在获取JD和CV的基础特征之后我们主要将特征主要分为四种类型:ID离散特征:比如UID,职能ID,公司ID,行业ID,技能ID,专业ID等。硬性离散类特征:除了性别,年龄,工作地点等基础类型特征,还包含有知识图谱提取的实体之间的关系特征比如学校是否匹配,职能(工作职位对应能力)是否匹配等,此处成为match特征。连续性特征:除薪资等,还包含有知识图谱提取的实体之间的graphembedding的vector相似性值,此处成为IDsim特征。Emdedding特征:包括了ID离散特征的vector,该vector有知识图谱的graphembedding方法产生(如DeepWalk,LINE等)。文本embedding特征,该特征以JD和CV对的方式输入DSSM模型产生vector。在此基础上我们还加入了相应统计特征,统计特征主要有强特征的共现特征以及强特征之间的能力不同。模型演变在模型方面主要可以分为两个总方向,分别是非线性树和deep模型的探索,在探索上主要是根据不同模型的性质进行特征工程。3.1非线性树模型>我们主要以gbdt为主的树模型展开特征工程的探索,gbdt的实现以xgboost和lgb为主。gbdt模型结构如图2所示,gbdt为一个boosting模型,通过叠加多个弱模型来提升拟合能力,根据xgboost模型的优缺点我们可以充分挖掘可用特征。我们再次整理上一节可用特征,主要有ID类特征(职能、行业、公司、技能、专业等基本信息匹配特征(年龄,工作经验,学校等)该特征为二分类特征,以JD和CV的ID类特征是否匹配来构建二分类特征(如职能是否匹配等称为match特征将这两类统称为硬性离散类特征;JD和CV类的graphembedding产生vector对计算余弦值作为连续特征(称为IDsim特征),加上文本相似性特征(称为textsim特征)和薪资组成连续特征。值得注意的是文本特征主要根据JD和CV的格式分为title和description两个部分来挖掘xgboost处理连续值的缺点我们将连续值进行分桶,桶数可由某维特征的分布来确定。将ID类特征也一同加入到树模型中,这是考虑到组合特征的业务意义。分析特征重要性之后,我们根据特征现象去做统计特征,比如出现频率统计,特征共现统计,多维特征多样性统计等操作。相对应的title和description文本特征也可通过简单的加权命中率来构成特征加入到树模型中。总之实验证明ID类特征,二分类特征,连续特征离散化,统计类特征,以及的vector的交叉特征都会给模型带来正向收益。embedding产生3.2深度模型的探索>的弊端就是模型的可解释性变差,根据结果反向特征工程变得困难起来。我们在JD和CV匹配场景下分别使用了DNN,Wide&Deep,DeepFM,等模型尝试。同时并借鉴了PNN、DCN、DLRM和DKN网络原理正在适配适合现有数据类型的模型。本节主要简要介绍DNN和Wide&Deep,DeepFM的使用,再阐述对现有数据的思考。以YouTube的经典NN为开端(如图3,引用自相应论文),现有的数据下如何去使用DNN达到收益正是我们所考虑的。在现有的特征中除了上文提到的二分类特征,embedding相似性等特征之外我们包含知识图谱抽取的实体embedding和文本embedding。文本embedding主要有DSSM模型产生,双塔模型的输入分别为JD的title、description,CV工作经验的title、description,双塔输出为JD和CV是否匹配。我们以双塔的每坐塔的最后输出vector作为JD和CV的表征。本着论文中提到的原理我们去除了树模型中ID类特征,换成了ID对应的vector,保留原有的二分类和连续特征,另外在加入了文本embedding特征,最后的结果不是很乐观。因此分析原因可能是某些特征缺失ID(比如CV职能等)初始化为0导致,还存在的原因可能是由于IDvector的知识结构和文本embedding知识结构不同导致,此处知识结构可以理解为不同训练任务下的embedding空间结构。经历了DNN尝试没带来正向收益我们偏向于以线性和深度非线性结合的Wide&Deep结构(如图4)进行适配,此时我们考虑到DNN的实验产生的问题。embedding的结果,我们采用ID类特征进行随机初始化的embedding在连接match,IDsim和textsim等特征作为deep的输入,将match,IDsim,textsim连接作为wide的输入。以输入ID类特征,match类特征,IDsim特征,textsim的xgboost模型作为wide&deep的比较模型,实验证明wide&deep模型略优于xgboost模型,但是如果对此基础上xgboost做统计特征则可超过wide&deep模型。以上可得deep模型非线性表征能力还是略微的比xgboost能力强。deepFM模型,deepFM模型结构图如图5所示(引用自deepFM相应论文),deepFM将wide&deep的wide部分替换成了FM机制提升了模型对特征的交叉组合能力。根据此模型特征我们将UID,图谱产生的ID类特征等稀疏特征输入FM部分,match特征、IDsim特征以及textsim特征为dense特征输入。结果很是令人欢喜,达到了以上实验的最优值,可能这就是深度学习带来的魅力吧。在喜悦的同时,我们想现有的ID初始化embedding都能产生如此大的魅力,利用graphembedding岂不更加喜人。在DeepFM模型输入基础上我们将ID的graphembedding也加入到模型的densefeature部分,然而实验证明并没有想当然的好,甚至产生了负作用。但至少证明了特征交叉能带来收益,至于graphembedding的加入为啥效果不好却是值得思考和探索的问题。经过上面的探索我们获取了一些经验,例如交叉特征有用,用embedding产生的向量两两相似性计算对树模型有用,因此我们本着上面积累的经验进行了人工构建交叉特征作为xgboost模型的输入。在此基础上加入统计特征,这波操作再次给我们带来了0.5%的收益。最后总结下模型方面的探索结果,以上实验说明我们还没有充分利用graphembedding和由DSSM产出的文本embedding,也证明了embedding内涵的巨大作用,后期我们将加大力度去挖掘该部分的内容。03现阶段成果和未来展望4.1现阶段成果>经过上文特征和模型的探索在此我们分方案来展示我们的实验结果,分别包含以下方案:方案1:ID类特征+match特征+IDsim特征+textsim特征+gbdt方案2:IDvector特征+match特征+IDsim特征+textvector特征+dnn方案3:ID类特征(随机初始化embedding)+match特征+IDsim特征+textsim特征+deepFM方案4:ID类特征+match特征+IDsim特征+IDvectorinner(交叉)特征+textsim特征+统计特征+gbdt主要以这四种有效的递进关系来展示,其中多种的组合尝试就不一一列举了。效果如表格1中,我们的评价指标主要为正例的准确率,召回率,F1值和总的AUC值作为评价指标。以上结果都为数据清洗特征工程后结果,本次数据量JD和CV对大致为86万,其中负例和正例比大致为7:1,我们将其随机分成8:1:1其中8成训练集、1成训练集和1成测试集。4.2未来展望>据质量和量的保证下我们相信深度学习带来的魅力是巨大的。最近由Facebook出品的DLRM处理异构embedding的能力使我们跃跃欲试。另外由微软出品的DKN网络也证明了graphembedding所隐藏的信息量对推荐效果有很大帮助。文献5中结合知识图谱在电商环境下的推荐也使得我们相信充分挖掘embedding信息可以带来不错的收益。作为以技术为驱动的企业,e成科技在AI技术的基础上,创新性地提出基于人才画像和岗位画像的匹配,为人岗匹配带来革命性变革。e成科技作为HR+AI赛道的领跑者,一直专注于AI技术在人力资本领域创新应用,开创性地将AI技术与人力资本场景深度结合。基于6年的AI能力和行业经验积累,e成科技打造了AI开放平台,将AI能力和产品整合至AI开放平台,并通过开放平台将AI能力开放给所有企业和友商。e成科技AI开放平台是HR赛道首个企业自主研发的聚焦人力资本场景的一站式AI能力服务平台,覆盖简历解析、人岗匹配、HR机器人等诸多场景,通过OpenAPI及需求定制等形式,面向所有自研系统大型企业、垂直招聘平台、传统HR行业厂商等企业用户提供智能化服务。未来,我们将一直保持高效的创新与研发能力,将前沿的AI技术深度融合至人力资本场景,为所有企业赋能。文献引用:[1]ChenT,GuestrinC.XGBoost:AScalableTreeBoostingSystem[J].2016.[2]CovingtonP,AdamsJ,SarginE,etal.DeepNeuralNetworksforYouTubeRecommendations[C].-conferenceonrecommendersystems,2016:191-198.[3]ChengH,KocL,HarmsenJ,etal.Wide&DeepLearningforRecommenderSystems[C].conferenceonrecommendersystems,2016:7-10.[4]GuoH,TangR,YeY,etal.DeepFM:AFactorization-MachinebasedNeuralNetworkforCTRPre-diction[J].arXiv:InformationRetrieval,2017.[5]WangJ,HuangP,ZhaoH,etal.Billion-scaleCommodityEmbeddingforE-commerceRecommen-dationinAlibaba[C].knowledgediscoveryanddatamining,2018:839-848.作者:e成科技人岗匹配团队汪序明(扫描二维码查看文章)一切皆可Embedding一切皆可Embedding解锁这项AI黑科技,马上实现人岗匹配自由人岗匹配,是企业人力资源管理的核心之一,更是HR招聘工作的精髓。传统工作方式下,简历搜索和人岗匹配往往消耗HR大量时间和精力,结果却往往不精准,随着人工智能和NLP技术的发展,一些招聘网站纷纷推出自动化推荐功能,但却同质化严重,准确率不高。现在“graphembedding”在人力资本领域落地且取得不俗效果,助力人岗匹配更加高效,这样的AI技术,作为HR的你值得拥有!在NLP(自然语言处理)中,自然语言无法直接应用到数学模型的建立中,需要将其映射到欧式空间。Embedding就是解决如何将自然语言表示为向量的,Google推出了Word2Vec模型,可以将语义相近的词映射到向量空间中相近的位置,之后Google又提出了BERT,BERT可以析等多个语言任务的表现。同时,Embedding也可以作为深度学习模型的隐藏层,可以极大提高模型的表现。自从word2vec横空出世,似乎各行各业的一切东西都在被Embedding,Embedding在数学上表示一个映射F:X->Y,也就是一个函数,其中该函数是一一对应的而且保持空间同构性(即在X空间是近邻的,则被映射到Y空间也是近邻的)。Embedding技术被应用在了多种业务场1)在Airbnb中实现实时个性化搜索,利用用户近几周或者近几个月点击过的房源行为数据实时对用户的搜索目标房源进行相似度比较和排序,这样既极大的提高了效率而且也保证的搜索房源的准确性提高了用户体验。2)在电子商务领域,根据用户的浏览和购买行为数据,通过深度学习模型可以将用户和物品同时嵌入(embedding)到相同的低维空间,然后利用Embedding计算用户和物品之间的相似度(匹配度)直接给用户推荐感兴趣的物品。在人力资本领域,求职者、公司、职位、专业、技能等不同的实体间存在着多种类型的关系,构成了一个知识图谱(KnowledgeGraph)。这里,我们主要关注的是GraphEmbedding(其实也可以称为NetworkEmbedding)。我们利用GraphEmbedding技术,把这些实体嵌入到低维的向量空间,可以直接比较他们的相似性,并能大大的提高简历和岗位的匹配效果。对于具有较多类型节点且各类型节点的数量巨大来说这是比较好的尝试,而且取得了一些效果。生成GraphEmbedding常用方法及其原理由于graphembedding的广泛应用,同时衍生出了很多计算embedding的方法,下面我们介绍几种商业上比较常用的几种方法:1)DeepWalkDeepWalk[3]是KDD2014的一篇文章,我们常用的word2vec是根据词的共现关系利用skipgram和COBW将词映射到低维向量。DeepWalk算法思路其实是利用了word2vec生成embedding的一种方法skipgram,对于已经建立的Graph来说每个节点可以是不同的实体且实体时间可以有不同的关系,从图上的一个节点开始随机游走(randomwalk如果节点之间有weight可以根据weight的不同进行walk来生成类似文本的序列数据,实体id作为一个个词使用skipgram训练得到词向量。算法的大体思路就是:根据图中节点随机游走->生成一定长度的序列->利用skip-gram进行训练。2)LINELINE(Large-scaleInformationNetworkEmbedding)是2015年文章[4]中微软亚洲研究院提出来的一种算法,LINE定义了两种度量节点相似度的方法:一阶相似度(First-orderproximity)和二阶相似度(Second-orderproximity)。一阶相似度节点之间无连接,则一阶相似度为0;对每个无向边,定义顶点和的联合概率分布为:是顶点的低维向量表示,我们的目的就是使得经验分布和概率分布尽可能的接近,于是我们定义以下一阶相似度的目标函数:其中为两种分布之间的距离,为空间上的一个分布,=是它的经验分布,其中W为两点间边权重总和。我们选择KL散度来计算(2)式子。分布q,比较两个概率分布的相似性:将,带入KL散度的公式我们得到︰KL散度的计算公式其实是熵计算公式的简单变形,在原有概率分布分布q,比较两个概率分布的相似性:将,带入KL散度的公式我们得到︰其中C为一个常数,需要注意的是,一阶相似度仅适用于无向图,而不适用于有向图。二阶相似度越高则它们的相似性就越高。二阶相似性假定与其他顶点共享邻居顶点的两个点彼此相似(无向有向均可),一个向量和分别表示顶点本身和其他顶点的特定“上下文”,意为二阶相似。对于每个有向边,我们首先定义由顶点生成“上下文”的概率:式子(5)是一个条件分布,对于顶点,我们的目的就是要拟合与其经验分布。为边的权重,为相邻边的权重的和,因此最小化以下目标函数:d(,)上文已经说明,来表示顶点的度数。这里我们令利用KL散度同一阶相似性的推导类似我们可以得到二阶相似性的计算公式(去掉常数项)为:3)Node2vecNode2vec[5]3)Node2vecNode2vec[5]算法是在DeepWalk基础上进行了改进,主要的创新点在于改进了随机游走的策略,DeepWalk中根据边的权重进行随机游走,而Node2vec加了一个权重调整参数,同时考虑到局部和宏观的信息,并且具有很高的适应性。除了以上提到的常用的生成embedding方法,学术界和工业界还提出了很多方法,像SDNE[6]、Struc2vec、Starspace[7](Facebook用的技术)、EGES(阿里巴巴推荐使用的技术之一)GraphEmbedding为人岗匹配带来新突破在人力资本行业最主要的两大核心要素就是简历CV和工作岗位JD,如何让CV和JD匹配是人力资本行业一直非常重视的问题也是一个难题。我们在人力资本行业领域对embedding的尝试和应用,并且取得了一定的效果。有效的graph1)原始文本处理想要有效的进行人岗匹配(即CV和JD的合理匹配),需要综合考虑包括职能、行业、技能、专业等维度在内的多维度匹配。首先应该提取CV、JD中的文本特征,可以利用深度学习模型提取出CV、JD的文本特征,我们这里称为实体。抽取出实体之后,我们就可以进行CV和JD的匹配,对于自由文本来说除了CV和JD的实体完全匹配上,可以算他们的相似度,词的语义相似度无法完全的诠释。举个例子:CV的特征:技能实体(JAVA),职能实体(JAVA开发工程师)、专业实体(计算机)JD的特征:技能实体(Spring),职能实体(JAVA后端开发)、专业实体(信息技术)从词的表面是无法区分他们的相似度的。下面就用到了embedding,embedding可以将这些实体嵌入到同一低维的向量空间,在空间中实体之间的距离可以通过数学公式计算从而表示他们的相似性。2)生成实体embedding第一步:数据的生成,我们首先利用CV、JD中不同实体的共现,以及不同工作经历之间的跳转来抽取简历中的实体跳转,这些不同的实体之间可以构成network如图1所示。不同的实体就是不同的节点,实线就是节点之间的边也可以称为关系。图1第二步:使用Deepwalk、LINE生成embedding。对于Deepwalk可以直接根据network生成不同的文本序列,利用skip-gram进行模型的训练。而对于LINE可以直接利用不同实体的共现次数作为模型的输入。第三步:优化训练数据。我们发现不同的实体出现次数的量级是不同的,比如专业在JD中就很少出现,这样就导致了数据的不平衡。我们解决的方式是,统计了不同实体之间的tfidf、npmi(NormalPointwiseMutualInformation)作为实体之间的权重,即表示了不同实体之间关系的强弱程度,之后再进行模型的训练。第四步:以上都是利用无监督的方式去训练embedding,由于e成科技有自己独立的人力资源ATS系统,包含了用户大量的真实行为数据。把其中匹配上的CV、JD作为正例,未匹配上的作为负例,构造出有监督的训练数据。将JD作为query,CV作为title,利用DSSM模型(如图2)进行有监督的模型训练。需要注意的是这里的embedding层并不是随机初始化的,而是利用第三步已经训练过的embedding作为预训练的权重。这样有监督训练的目的就是利用真实的行为数据更新embedding层的数据,使得每个实体的embedding更能好的表达在招聘这个业务场景中的语义。图1我们使用内部标注的评估数据对不同模型进行了评估,比较结果如下:以下是fasttext和graphembedding模型输出的top相关公司实体的一些例子。可以看到FastText单单只从字面意思进行了相似度匹配;而graphembedding模型输出结果能够更好地包含了具有相似业务、相似规模的公司,具有更好的语义相关性。以下是fasttext和graphembedding模型输出的top相关公司实体的一些例子。可以看到FastText单单只从字面意思进行了相似度匹配;而graphembedding模型输出结果能够更好地包含了具有相似业务、相似规模的公司,具有更好的语义相关性。0404HR+AI领跑者,助力每一个HR实现AI赋能本文主要阐述了Embedding的原理以及一些应用,具体的阐述了Graphmbedding在人力资本领域的落地应用。Embedding既可以作为计算各个实体的工具也可以作为深度学习中的embedding嵌入层增加模型的准确性。不夸张的说一切可以embedding,而且embedding在很多领域都取得了不俗的成就,尤其是NLP领域。e成科技作为HR+AI赛道的领跑者,一直专注于人力资本领域的AI创新升级,开创性地将AI技术与人才战略升级场景深度结合,我们已经将embedding技术应用到人岗匹配、面试Bot等多实际场景,接下来我们将继续优化embedding,助力AI技术在人力资源领域的更多应用。同时,基于积累多年的AI能力和行业经验,e成科技重磅打造了AI开放平台,并将AI能力开放给所有企业和友商。e成科技AI开放平台是HR赛道首个企业自主研发的聚焦人力资本场景的一站式AI能力服务平台,覆盖简历解析、人岗匹配、HR机器人等诸多场景,通过OpenAPI及需求定制等形式,面向所有自研系统大型企业、垂直招聘平台、传统HR行业厂商等企业用户提供智能化服务。参考文献:[1]Banana,神奇的Embedding,/p/53058456[2]Ethan,Embedding的理解,/p/46016518[3]PerozziB,Al-RfouR,SkienaS.DeepWalk:OnlineLearningofSocialRepresentations[J].arXivpre-printarXiv:1403.6652,2014.[4]TangJ,QuM,WangM,etal.Line:Large-scaleinformationnetworkembedding[C]//Proceedingsofthe24thinternationalconferenceonworldwideweb.InternationalWorldWideWebConferencesSteer-ingCommittee,2015:1067-1077.[5]GroverA,LeskovecJ.node2vec:Scalablefeaturelearningfornetworks[C]//Proceedingsofthe22ndACMSIGKDDinternationalconferenceonKnowledgediscoveryanddatamining.ACM,2016:855-864.[6]WangD,CuiP,ZhuW,etal.StructuralDeepNetworkEmbedding[C].knowledgediscoveryanddatamining,2016:1225-1234.[7]Wu,L.,Fisch,A.,Chopra,S.,Adams,K.,Bordes,A.,&Weston,J.(2017).StarSpace:EmbedAllTheThings!arXivpreprintarXiv:1709.03856作者:e成科技知识图谱团队白永斌(扫描二维码查看文章)人才画像画得好,数字化HR有妙招AI黑科技:BertELMo(EmbeddingfromLanguageModels)模型Embeddingattention人才画像画得好,数字化HR有妙招俗话说“人才画像画得好,HR招聘快不少”。人才画像是现在企业人才招聘和人才管理的核心,并应用在人岗匹配、薪酬预测、人才盘点等诸多场景。数字化时代,画像成为人才招聘和人才管理的入口,通过上百个维度进行提炼、总结进行人才全方位刻画。但如何刻画画像,画像准不准,还得这背后默默运行的AI算法和知识图谱说了算。(persona)的概念最早由交互设计之父AlanCooper提出:“Personasareaconcreterepresentationoftargetusers.”是指真实用户的虚拟代表,是建立在一系列属性数据之上的目标用户模型。如今,为了提高客户体验和运营效率,画像早已被应用在各行各业。金融企业是最早开始使用用户画像的行业,在人力资本领域,人才/岗位画像的应用大大提升了HR的工作效率和质量,是人力资本数字化的重要入口和核心要素。所谓人才/岗位画像,即是基于企业招聘的显性的职位描述和隐形的内在潜质共同组成的用户画像(以下简称“画像”)。△一张画像,没有读不懂的人才构建画像的核心工作,主要是利用存储在服务器上的海量日志和数据库里的大量数据进行分析和挖掘,给用户贴“标签”,而“标签”是能表示用户某一维度特征的标识。字段进行数值化处理。其中结构化数据比较容易进行数值编码(例如:性别/年龄/工作年限等而非结构化数据(例如工作经历/职能/技能等)多数为文本类型处理难度较高。对于非结构化数据,生成具备语义含义的Embedding是业界较为广泛使用的方案。职能/技能可以统称为用户的知识体系,即使每一个职能/技能生成了具备语义含义的Embedding,如何通过聚合生成用户整个知识体系的数值表达并尽可能保留文本自身的信息,依旧是亟待解决的问题。据(例如文本类型)包含了更全面和深度的用户潜在信息,目前通过词向量加权平均依旧是主流使用的处理方法。此类方法存在一些缺陷:1.生成的Embedding完全基于语义表达,缺失了其内在业务含义;2.直接加权平均的方法,容易掩盖掉重要的信息,且权重不好定义。基于此,我们针对人力资本场景,借鉴Bert的思想提出了一个新方法,能够更好地用数学的方法对人才/岗位画像进行表示。为了让AI+数据驱动的数字化招聘更为精准智能,我们以e成科技独有的HR行业职能/技能知识图谱作为先验的业务知识,并基于海量简历和岗位描述数据(千万级借鉴Bert的模型架构,专门对画像中的知识体系相关字段(职能/技能)进行了深度优化。该方法提供的知识表征,首先包含了技能/职能的内在关系,其次通过attention的方式聚合能保证重要业务信息的不丢失。经过优化的人才/岗位画像,在数字化招聘、人岗匹配、人才盘点、薪酬预测等多个下游业务场景中均取得显著的优化提升。部分场景举例人才选拔:通过人才画像分析,使人才供给与业务发展速度高度匹配,优化人才队伍配置效率,降低人才流失率;人才任用:通过岗位画像和人才画像的分析与匹配度分析,实现人才和岗位最优配置,使优秀人才能充分发挥能力与主观能动性,提高人力资本效率;薪酬预测:根据人才画像和岗位画像,结合行业岗位知识,分析人才/候选人技能及发展水平,预测候选人及企业未来薪酬水平;接下来,院长就将为大家介绍e成科技在有关领域的最新方案以及应用成果。ELMoVSELMoVSWord2Vec,更优的特征提取器Word2Vec是近几年非常流行的WordEembedding提取模型。模型通过预先构建的词表将输入语句中某单词前、后所有词语编码为多个one-hot向量传入模型,随后通过一个共享的参数矩阵将这些向量映射到隐藏层,最后使用softmax将隐藏层的输出转化为词表中每个单词的概率作为输出,其中概率最高的单词即为最终预测结果。经过充分训练后,词表中每个单词的语义信息已经充分“嵌入”了用于映射输入层和隐藏层的参数矩阵中。使用时只需用单词的one-hot向量和参数矩阵相乘就可以得到对应的WordEmbedding。这样的网络结构为Word2Vec带来了一个严重的问题,它无法为语言中常见的多义词提取Embedding。由于同一个单词在参数矩阵中只占据一个向量,网络只能将多义词的不同语义信息全部编码到相同的向量中,反而降低了这些词向量的表达能力。此外,Word2Vec只采用了一个线性隐藏层,特征提取能力较弱,对Embedding的表现也有很大的影响。ELMo(EmbeddingfromLanguageModels)模型使用与Word2Vec截然不同的方式提取Embedding,并采用更优的特征提取器,很好地解决了多义词问题,同时增强了词向量的表达能力。模型使用两层双向LSTM(LongShortTermMemory)单元作为模型中间层,其中正向LSTM顺序接受输入语句中给定单词的上文,逆向LSTM倒序接受语句中给定单词的下文。训练完成后将输入层Embedding和两层LSTM产生的Embedding加权结合后作为句中每个单词的Embedding使用。与Word2Vec查表式获取静态的Embedding不同,ELMo可以根据上下文信息动态调整词语的Embedding。多层LSTM特征提取器可以从文本中分别提取句法、语义等不同层次的信息,大大提升了词语特征的丰富程度。Attention机制是近几年提出的新型特征提取器,在NLP领域的表现效果远超以往使用的卷积Self-Attention单元构成的大型网络和巧妙设计的无监督训练方式使模型可以利用丰富的自由文本进行训练,从中提取多层次的语言特征。0303e成科技的应用:知识表征模型我们的知识表征模型(以下简称“模型”)同样使用了多层Self-Attention单元作为基本的特征提取器,尝试从e成科技丰富的数据中挖掘出可描述职能和技能各自特征及其相关关系的Embedding。为了训练这样的模型,我们借鉴并调整了Bert的设计思路,建立一套符合我们诉求的模型结构。模型将e成科技知识图谱中职能和技能的实体名称作为Embedding提取粒度,端到端地进行损失。模型训练时,我们使用职能、技能前后拼接的数据结构,其中来自相同CV数据的职能、技能作1。为了防止模型仅抽取职能对技能的依赖关系,我们在将职能和技能调换顺序后的数据加入样本中同时训练,以提取双向的依赖关系。经过充分训练后,模型可以提供多样化的使用方式。模型最后一层输出和输入序列等长的Embedding序列,其中第一个Embedding包含整条数据的特征,之后每个Embedding与输入序列的词语一一对应,分别是每个词语的动态特征。将序列头Embedding接入下游任务网络中可以对模型进行fine-tune,可进一步用于不同的细分领域任务。同时,其余Embedding也可以直接作为词语特征使用。考虑到模型结构复杂,运算时间较长,针对某些性能要求较高的业务场景,可以将模型输入层对应的Embedding作为静态词向量使用,通过查表方式大大简化运算流程。我们使用内部标注的薪酬预测、人岗匹配数据对不同模型进行了评估,结果如下:薪酬预测任务中,每个模型需要提取候选人的技能Embedding作为下游任务的参数,辅助判断候选人的薪酬水平。实验中模型之间互不影响,且使用相同的下游薪酬预测模型。结果中可以看到,我们的知识技能表达模型对下游任务各项指标均有5%左右的提升。而人岗匹配任务中,我们将岗位和候选人各自技能Embedding之和作为它们的特征向量,通过特征向量相似度判断候选人和岗位是否匹配。评估结果显示,我们的模型表现非常出众,提升效果明显。分未正确还原的情况。可以看到即使还原失败,模型也能够预测到行业内与正确结果相似的答案。数字化时代,HR作为推动企业数字化升级的核心力量之一,通过数字化工具助力人才管理和人才引进数字化,已经成为必然趋势。e成科技创新研发的画像+Bot两大引擎,助力人才知己、企业知人、社会知命。利用大数据和人工智能技术构建的画像,将对人才的素质、性格、职业动力都进行全方位描述,帮助人才认识自己,进行自我反思,同时帮助企业和HR更全面、更立体、更准确识别候选人,实现选、融、育、激各个环节高效的人才管理。作为HR+AI赛道的领跑者,e成科技从创立伊始就将AI基因根植于业务,并开创性地将AI技术与人才战略升级场景深度结合。同时,基于积累多年的AI能力和HR行业经验,e成科技重磅打造了AI开放平台,通过OpenAPI及需求定制等形式将AI能力开放给所有企业和友商。e成科技AI开放平台是HR赛道首个企业自主研发的聚焦人力资本场景的一站式AI能力服务平台,覆盖简历解析、人岗匹配、HR机器人等诸多场景,这些HR+AI的创新应用和智能产品背后,都是e成科技领先的AI能力和默默潜心研发的科学家及算法工程师们作为支撑。未来,e成科技将持续打造更多创新智能产品,全面加速人力资本数字化升级!作者:e成科技AI算法团队陈嘉钦(扫描二维码查看文章)场景:音视频面试内容:AI面试官来袭,HR你准备好了吗?AI黑科技:机器学习、语音识别、面部识别、排名算法、计算机视觉技术、语义理解能力、跨媒体协同推理技术AI面试官来袭,HR你准备好了吗?这回院长为大家带来一个神秘炸弹:猎豹(Leopard)项目!听起来是不是很炫酷?你一定想不到,这个猎豹(Leopard)项目是做什么的吧?没错!就是众多候选人“闻风丧胆”的AI面试!这是e成科技AI算法团队研究的新成果,之所以起这个名字是希望我们的AI面试像草原上狩猎的猎豹一样敏捷高效!下面就随院长一起看看“这只猎豹”背后的黑科技吧!说到AI面试,相信很多参加过校招的候选人都不陌生,被HireVue支配的恐惧还历历在目,不少小伙伴面完忍不住把一首“凉凉”送给自己……对于很多企业和HR来说,AI面试更是应用广泛。招聘是企业和HR亘古不变的主题,尤其是众多大厂每年要面临千百万量级的候选人,面对如此庞大的应聘者数量,AI技术无疑是简化招聘的利器。AI的力量。过去几年,使用AI视频面试的公司从14%上升至60%,联合利华、欧莱雅、可口可达能、高盛、瑞士银行、摩根大通等全球600多家企业陆续开始使用AI面试的形式进行首轮面试。在提供AI面试的企业中,以视频面试公司HireVue开发的服务最为著名。在一个典型的AI视回答情况,结合面试者声音及面部表情的信息,判断其能否通过这一场面试。△图片来自HireVue官网之所以越来越接受的企业愿意类似的AI面试,院长觉得有如下几个原因:1.相比于传统的人工面试,基于音视频的AI面试可以在前期大大减少HR的工作量,降低企业2.在简历筛选和初面阶段,由于不同面试官的专业水平和个人喜好不同,会使得面试存在着很大的偶然性。而基于AI的音视频面试的面试评价标准相对统一,对每个面试者也更加公平;3.基于音视频的AI面试除了能够对面试者的回答进行分析外,还可以对面试者的表情及回答内容给出实时的分析与反馈,既能提升面试者体验,也有助于提升公司的品牌形象。不过,要做到体验级的音视频面试能力,对于产品和技术的要求都是非常高的。不同的行业与招聘场景,对于音视频面试的要求都是不同的,想要产品既契合场景且体验出色,少不了大量高大上的AI面试背后的黑科技。0202黑科技揭秘:AI面试为何那么神2004年HireVue成立之初,只是为了记录面试者视频数据,供HR参考。10年后,HireVue融入了AI技术,重新定义了“面试”。这些AI技术是基于机器学习的复杂算法,并结合语音识别以及面部识别,协同排名算法,通过15000+个不同的维度(包括肢体语言、语音模式、眼神活动、做题速度、声音大小等)来对候选者进行评分。△AI面试可以通过15000+个不同维度对候选者评分,图片来自BusinessInsider之前有同学跟院长说,现在我们的语音识别和人脸识别技术都已经非常成熟,做基于AI的音视频频面试只是把这些能力进行一下组合,难度并不大。这种说法确实有一些道理,AI面试产品的出现确实是得益于近年来人工智能飞速的发展,特别是深度学习在计算机视觉和语音识别等领域的广泛应用。但是,面试场景又对AI能力有很多特殊的要求,需要有针对性做大量工作,下面院长结合e成科技在这方面的研究成果和创新研发进行介绍:语义理解能力要对求职者的能力有好的判断,面试官必须对求职者所说的内容做到充分的理解,AI面试官也不例外。除了够理解面试者的意图,并且判断面试者的通用表达能力、语言逻辑性的通用语义理解外,AI面试官还需要具备更加专业的知识。借助于六年来积累的大量人力资源行业专家知识及知识图谱,e成科技开发的AI面试产品不但可以基于不同岗位的需求进行技能追问和熟练度判断,并且研发行业内首个BEI机器人,通过分析候选人提供的故事来判断其在不同岗位要求素质项上的评分。对话能力为了保证求职者拥有更好的面试体验,AI面试官也得像普通面试官一样跟候选人流畅地对话,这除了依赖前面所说的语义理解能力外,也需要强大的对话能力作为支持。e成科技近年来开发多款HR场景聊天机器人,并沉淀出统一对话框架Snowball。基于该对话框架,AI面试机器人可以进行统一的意图识别和对话策略管理,并同时支持知识库问答和闲聊(Chitchat),带给候选人更好的面试体验。语音与视觉能力进行音视频面试非常核心的工作是对语音和视频内容的理解。其中语音识别是整个AI面试对候识别外,e成科技的科学家和算法工程师们还在探索基于一些基础的语音信息对面试者的面试状态(比如,面试者是否紧张)、基础表达能力和普通话能力进行分析。与状态,对于一些顶替、偷看资料等面试作假的情况,可以利用人脸识别和动作场景识别的计算机视觉算法进行识别。更进一步地,与HireVue等AI面试产品类似,e成科技也在开发利用计算机视觉技术对面试者进行更细致的分析,比如借助微表情和情绪识别技术判断面试者在回答问题过程中的心理状态,甚至捕捉到一些候选人可信度不够高的回答。跨媒体有了音视频的处理能力,AI面试官可以从视觉、语音、语义等不同维度获取候选人的信息,虽然每个维度都能够获取大量候选人信息,但要真正想把AI面试做好,必须对这些不同维度的信息进行统一分析。举个例子,当候选人在提到某个关键概念时,说话的语气和眼神可能会有一的参考和帮助。想要实现这样的功能,除了各个本身的内容理解外,还需要引入“跨媒体协同推理”技术。这一技术是新一代人工智能的重要组成部分,通过视听感知、机器学习和语言计算等理论和方法,构建出实体世界的统一语义表达,从而跨媒体的分析和推理。e成科技在自己的音视频面试产品断的准确性。0202黑科技揭秘:AI面试为何那么神AI技术似乎具有与生俱来的争议性。虽然基于音视频的AI面试已经在很多场合得到广泛应用,但是也有不少人对其产生质疑。一方面,到底AI面试官的信效度如何,能否达到专业面试官的水平?院长觉得机器和人类各有优劣,机器并不是要替代人类,而是要辅助人类,和人类更好地合作。在具体形式上,AI面试官和专业面试官可以有很多协同方式,比如由AI面试官进行候选人的初筛,并且给后续专业面试官提供面试评价与建议。也有人会觉得AI面试可能产生一些伦理问题,如是否会产生一些对相貌和言语的歧视?其实这好这些问题,让自己成为AI时代的受益者。简而言之,AI面试的初衷是帮助优秀的候选人脱颖而出,从而让招聘者重点关注优秀候选人;同时,可以大大帮助HR节省时间,把更多精力放在关注人才质量、选拔多样性上。人工智能是应对这些挑战的最佳方式。而从创立之初就将AI基因深植于业务的e成科技,一直在潜心研发和积累,致力于将AI技术深度应用于人力资本全场景中,推动人力资本智能变革。凭借自身在AI能力和行业经验的独特优势,以及来自全球顶尖跨媒体技术实验室的AI核心团队,拥有顶尖的跨媒体AI技术,结合多年积累的知识图谱与对话技术,e成科技推出的AI面试机器人更是如虎添翼。△e成科技AI开放平台四大算法中台目前,e成的音视频面试技术已经在一线员工自动化招聘和候选人Bot等场景中落地,为大量的用户赋能,助力企业降本增效。未来,随着科技飞速发展,AI技术正在根据大数据和深度学习不断优化和升级,AI在行业的应用也会越来越广泛和深入,我们也必须拥抱变化,适应人机交互新模式,通过驾驭智能工具,实现数字化升级。e成科技愿意借助于自身在AI开放平台、技术、产品、行业经验等优势,助您实现人力资本数字化新升级!作者:e成科技AI算法团队刘洋(扫描二维码查看文章)真技术还是伪AI,HR如何选择合适的智能工具?HR图灵学院|一文读懂RPA、AI与HR的关系AI黑科技:语音识别(ASR)、自然语言理解(NLU)、对话管理(DM)、文本生成(NLG)、语音合成(TTS)、文本检索、情感分析、光学文字识别(OCR)……一文读懂RPA、AI与HR的关系近两年,科技行业热词里突然多了一个简写—RPA,有人把RPA当作解放劳动力的救星,认为任何大规模、重复性工作都能用RPA机器人代替,大大节省了人力、时间和金钱。比如在人力资本领域,研究表明,HR们大约93%时间花费在重复性工作上,但65%的工作流程其实可以实现自动化,RPA可以将HR从大量、繁琐、重复的任务中解放出来,如简历筛选、面试邀约、员工入职、员工数据管理、考勤管理、离职管理……从而将时间和资源聚焦在更高价值和战略性任务上。Gartner研究表明,到2022年底85%的大型和超大型组织将部署某种形式的RPA。一时间,RPA风头无两,被认为未来市场前景广阔,引得各路投资人争先恐后。但也存在不同声音,有人说RPA是开数字化历史的倒车,认为RPA只不过是在重复执行脚本,不过是不断执行命令的“手脚”,AI才是发布命令的“大脑”。面对众说纷纭、信息纷繁,我们似乎只能管中窥豹难得全貌,那么到底该如何看待RPA?RPA和AI有哪些联系?RPA和HR又有哪些关系呢?本期,院长就聊一聊关于RPA你想知道的那些事儿。(扫描二维码查看文章)真技术还是伪AI,HR如何选择合适的智能工具?2019年,RPA突然火了,成为新兴风口、资本的宠儿,甚至有些媒体宣称人力资源部门一定要部署RPA,但这种火热到底是资本炒作,还是RPA真的有用,相信很多人都心存疑惑……01RPA能满足HR需求吗RPA(RoboticProcessAutomation是指用软件流程自动化方式实现在各个行业中本来是人工操作计算机完成的业务。事实上,第一期院长和大家探讨了RPA与AI的关系,传统RPA并没有用到特别前沿的人工智能技术,RPA也并不等同于人工智能。但随着近些年来,软件流程自动化技术与AI这两个互补概念结合在一起,RPA很多环节上用到了越来越多的人工智能技术,使得工具更加智慧,也提升了效率减少了人工,于是RPA在金融、财务和工业自动化等领域应用越来越广泛。对于企业人力资源部门来讲,HR每天都需面对大量事务性工作,这些事务性工作大都可以通过自动化的方式由机器人来替代。而借助语音识别、OCR等AI能力,也的确能够进一步提升RPA的灵活性与智能性,替代人工将繁琐的业务操作流程自动化,解放HR们的双手,提升HR的工作效率。可见,RPA的真正价值在于,其可以将HR从以往大量、繁琐、重复的事务性工作(如筛选简历、入离职办理、社保、福利、开具证明等)中解放出来,将时间和资源集中在高价值的、战略性任务上(比如支持组织转型、引入职业发展规划、寻找最新培训材料、理解业务特点和实操场景、为企业战略提供决策依据等),提高人资效率。但RPA真的能满足HR的所有工作需求吗?院长曾经和一些在互联网公司的HR小伙伴们探讨这个问题,他们纷纷表示人资软件操作并非他们工作的主要内容,单纯的软件流程自动化对他们帮助非常有限。首先,我们知道不同于金融、财务等工作,HR每天更多时间花在了与候选人、员工的面试与沟通上。这些沟通需要HR与员工协同进行,时间与方式都非常灵活,很难通过传统软件进行自动化。其次,优秀的HR进行的沟通应该是有温度的,这样的温度很难在软件自动化中体现和传递出来。最后,很多重要的决策也需要基于沟通的结果,结合大量的专业知识来进行,这也并非简单RPA可以实现的。可见,即使有了AI的助力,RPA也不能完全满足HR需求,还需要有更强大的工具来帮助HR提升相关的工作效率。0202实现人与人更好地连接:画像+Bot事实上,人力资源部门不缺自动化技术及系统。市场上种类繁多的自动化工具和系统,都能或多或少解决HR们的一部分需求,通过自动化大大降低HR处理事务性工作的时间和精力。但HR需要的仅仅是一个代替自己双手的自动化工具吗?一个RPA机器人就够了吗?工作已经不能满足企业发展的需求,如何充分利用人与技术的合作,全面提升组织与人才管理、员工体验和组织数字化升级变革成为重中之重。相比于RPA,我们相信智能对话机器人(ChatBot)更能实现人与人之间更好地相互连接,更适合帮助HR完成日常琐碎的沟通工作,提升HR的工作效率与员工体验。这里的机器人既可以是基于文字交互的聊天机器人,也可以是基于电话线路的外呼机器人。HR只需要简单配置,就可以将这些机器人应用在各种场景中,比如与候选人进行面试邀约,进行电话面试并7*24小时回答候选人各种问题,还可以和在职员工进行实时交流,了解他们对于自己和公司的各种想法。当画像与Bot结合在一起时,还会发生更加奇妙的化学反应。如果把画像比作大脑,Bot就相Bot也具备了更强的专业性和个性化能力,更能像一个专业HR一样与候选人或者员工进行交流。首先,“画像+Bot”与“RPA+AI”本身的动机是类似的,都是致力于通过自动化、数字化、智能化提升HR工作效率,降低人资部门的流程负担;其次,仅仅靠RPA实现流程自动化提升HR工作效率是远远不够的,注重体验性和智能性的对话机器人对HR的效率提升更为关键;最后,AI这个概念过于庞大,对人力资源领域而言,画像是AI最为重要的体现,大量智能化工作都需要围绕着画像进行体现;所以,相比于RPA+AI,画像+Bot的提法更贴近人力资源的实际场景需求,也更有利于真正将HR从事务性工作中解放出来,给候选人及员工更好的体验。罗马不是一天建成的,构建好Bot与画像能力也一样,一方面需要长期的数据与技术积累,另一方面也需要有大量的实际业务经验。反观行业内一些公司,在RPA与AI的热潮下,短时间内摇身一变就成了一家RPA+AI的公司,这其中究竟有多少AI能力,而这些AI能力有真正能对业务产生多大帮助,恐怕要打上一个大大的问号。能做出HR真正满意的产品,靠的不是蹭热点,而是对业务的深入理解和对技术的不断追求。RPA能满足HR需求吗e成科技从成立伊始就秉持“科技助力人才升级”的公司使命,并以“画像”和“Bot”作为两大核心驱动力。经过多年的技术积累,e成科技在智能对话机器人领域沉淀出自主研发的Snowball对话框架,具备意图识别、槽位提取、实体识别、对话管理、问答对话、闲聊对话等诸多对话能力。尤其针对人力资源领域特点,Snowball有针对性的搜集语料进行模型训练,并且增加了许多定制化功能以保证对话系统的专业性及良好体验。而在用户画像方面,基于多年的丰富行业经验,e成科技形成了包含百万级实体和千万级关系的知识图谱作为画像的知识储备,同时加入专业咨询团队的理论编写大量专家规则,并结合业界前沿的机器学习、神经网络模型,构建了覆盖广、精度高的用户画像体系,带动相关业务的发展。基于以上对话与画像能力,e成科技研发了大量覆盖人力资本全场景的智能应用,将AI技术与HR场景深度融合,更加贴合数字化时代下HR的业务需求。部分应用小e外呼:基于人工智能意图识别及对话管理,利用电话外呼技术实现的高潜候选人自动意向沟通最佳解决方案,突破性提高人才复用率;员工机器人:将e成科技多年积累的HR领域业务知识与智能对话机器人结合,减少HR重复工作,提升员工工作体验;面试机器人:基于岗位画像和专家知识对候选人进行智能化面试,通过刻画人才画像帮助HR全面了解候选人;HR机器人:通过Bot构建交互信息的采集和分析系统,打造面向HR、员工、候选人的全场景高效对话体验;人岗匹配:基于人才及岗位画像,结合专家知识与前沿深度学习模型个性化推荐人才,提升HR工作效率;△从Bot集群到超级Bot,科技助力人才升级HR行业首个AI开放平台,赋能行业变革部AI技术,于是一时间市场上涌现众多“HR+AI”、“RPA+AI”的人力资本产品或服务,可谓乱花渐欲迷人眼。但通用AI技术往往与业务场景有着巨大的鸿沟,AI技术与垂直行业的融合,绝非一朝一夕之事。诚然,目前的“AI热”或者“RPA热”反映了市场的焦虑和人力资本领域数字化转型的迫切需求,AI”的道路上越走越远。AI技术成功应用到人力资本场景,是不断试错,不断创新和优化的过程,需要长时间的研发和打磨。作为HR+AI赛道领跑者,e成科技的AI能力从创立起就深植于基因,并伴随着人力资本业务发展不断学习和进化,融合了深厚的HR行业经验积累、顶尖专家团队提供专业知识,突破技术边界,才在HRSaaS领域形成独一无二的“护城河”。e成科技AI核心优势AI技术优势:6年的AI能力积累,掌握深度学习、数据挖掘与分析、自然语言处理、知识图谱、智能推荐、人才素质模型、情感分析、实体识别等核心AI技术,引领AI技术与人力资本场景深度融合;顶尖团队优势:3位顶尖AI科学家,超过50人的来自BAT等互联网巨头的优秀算法团队,超过30人的来自全球知名咨询企业的HRTech行业咨询团队阵容;行业知识优势:超大规模全行业人力资源知识图谱,历时6年,10,000+家企业使用验证,成功构建50,000,000+实体关系;AI行业认可:HR赛道唯一入选上海人工智能发展联盟(SAIA)和中国人工智能产业发展联盟(AIIA)的会员单位,多次斩获人工智能技术应用十强、AI商业落地百强等诸多荣誉;基于以上优势和能力,经过多年积累和孵化,e成科技打造了HR赛道首个AI开放平台,并将多年AI能力积累开放给所有HR友商,助力实现人力资本智能化升级与变革。e成科技AI开放平台是HR赛道首个企业自主研发的聚焦人力资本场景的一站式AI能力服务平台,覆盖简历解析、人岗匹配、HR机器人等诸多场景,通过OpenAPI及需求定制等形式,面向所有自研系统大型企业、垂直招聘平台、传统HR行业厂商等企业用户提供智能化服务。e成科技AI开放平台提供的服务主要集中在这三种形式:标准化AI能力:将NLP、NLU等前沿的AI技术全面应用于HR各类核心业务场景,为用户直接输出单个或多个AI技术能力,如简历解析、职位解析、人岗匹配等;组件化AI产品:基于业务深度理解,实现AI产品组件化、平台化,用户通过标准API接入,实现快速调用AI产品,无需企业再次开发;个性化场景解决方案:根据用户的个性化场景需求提供定制化的AI能力和服务,打造企业专属目前,e成科技AI开放平台已助力多家企业合作伙伴智能应用落地,赋能行业智能化变革。后续,我们将为大家分享一些精彩案例,盘点下AI赋能企业变革的那些事儿。院长结语:数字化时代,企业纷纷在寻求智慧变革,人力资源部门是推动企业变革的重要动力之一,HR也要时刻随着时代和科技的变化而变化,找到并驾驭合适、高效的智能化工具,将助力人力资源工作者和企业领先同行,实现数字化升级弯道超车。为客户服务的道路上没有终点,为了实现这一目标,未来,e成科技将持续努力把技术能力与人力资本业务更好地结合,推出更多满足HR场景需求的智能化产品与服务,与合作伙伴们一起携手开启人力资本数字化新时代!作者:e成科技AI算法团队刘洋(扫描二维码查看文章)场景:智能聊天机器人内容:请回答BERT:HR聊天机器人强大聊天技能背后的秘密AI黑科技:BERT(BidirectionalEncoderRepresentationsfromTransformers)BERT-base\BERT_wwm\ernie模型自然语言处理(NLP)请回答BERT:HR聊天机器人强大聊天技能背后的秘密聊天机器人等智能应用的出现,无疑在人力资本领域掀起了一场声势浩大的革命,它的即时性、全天候、智能化回应,不仅提升了候选人/员工的体验,也大大地提升了HR效率,降低企业成本。不难想象,未来这些智能化应用将会给我们带来更多惊喜。在这里,院长不禁要问,你知道这么好用的聊天机器人背后,是什么AI技术在支撑吗?很多人都说当然是NLP,没错,但NLP背后呢?还有一个利器就是:BERT!2018年底到2019年,NLP领域从学术界到工业界最火热最强大的模型是什么?那就是BERT!BERT已然成为NLP技术历史上最重大转折点之一,是NLP技术向加速产业落地迈进的一大步。e成科技作为HR+AI赛道领跑者,从BERT一经发布就敏锐察觉到了机遇,积极布局相关研究,不断跟进最近进展、探索相关应用,取得不错的积累和成果。在这篇文章里,院长将简单向大家阐述BERT的相关背景、原理、升级,以及e成科技在人力资本领域的一些应用、探索和思考。01背景:什么是BERTBERT(BidirectionalEncoderRepresentationsfromTransformers),是google于2018年底提出的一个预训练语言模型,它通过无监督的方法对大规模的自然语言的语料进行学习,从中提取出人类语言的内在基本规律,辅助后续的自然语言理解的相关任务。例如,对于一段文本:e成科技是HR+AI赛道的领跑者,在NLP领域有很多的技术积累。用通俗的语言理解,BERT在学习的是以下两方面的能力:1.当输入了“e成科技是一家HR+AI___的领跑者”的时候,模型要学习到填而不是其他的任何的无关词。2.当输入了“e成科技是HR+AI赛道的领跑者”的时候,模型要学习到“在NLP领域有很多的技术积累”是最佳的下一句,而不是其他的任何句子。以上两方面的能力,可以理解为是人类语言的基本规律,那么当模型学习到这种规律之后,有BERT的强大能力以BERT模型为基础,通过finetune的方式,可以在BERT已经习得的语言知识的基础上,1.理解更深入。由于已经在大量的自然语言中习得了基本的语言规律,当模型面临一个新的自然语言任务的时候,模型可以利用的知识就包含了已经习得的海量语言规律+新任务里的知识,使得模型能够更加深入新任务所表达的规律。2.更少的样本依赖。在
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护理会诊的理由
- 如何缓解护理工作压力
- 吊车与升降设备维护协议
- 总裁给新人培训
- 《画里空间》教学课件-2024-2025学年湘美版(2024)初中美术七年级下册
- 幼儿园获奖公开课:大班健康《身体部位》课件
- 大众创业万众创新意义
- 常见传染病管理流程
- 彩云衣美术课件
- 小家电设计工作室创业计划
- 《容积和容积单位》5·3天天练
- 离婚协议书无子女无共同财产范本2024年
- 包头市重点中学2024-2025学年初三考前仿真模拟化学试题含解析
- DL∕T 1910-2018 配电网分布式馈线自动化技术规范
- 气瓶检验站质量记录表格汇编
- 2024北京八中初一(下)期中数学(教师版)
- 2024版《硫化氢培训课件》课件
- 用友离散行业细分领域铸造行业解决方案
- 2024年航空港区国际教育投资集团招聘笔试冲刺题(带答案解析)
- 塔式太阳能光热发电站运行规程
- 2024-2030年中国电子级氟化液行业应用状况与供需趋势预测研究报告
评论
0/150
提交评论