AI+HR黑科技秘笈-AI賦能人力資本智能化變革_第1頁
AI+HR黑科技秘笈-AI賦能人力資本智能化變革_第2頁
AI+HR黑科技秘笈-AI賦能人力資本智能化變革_第3頁
AI+HR黑科技秘笈-AI賦能人力資本智能化變革_第4頁
AI+HR黑科技秘笈-AI賦能人力資本智能化變革_第5頁
已閱讀5頁,還剩190頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

AI黑科技揭秘AI+HR創(chuàng)新應用頂尖科學家團隊力作獻給走在數(shù)字化浪潮前沿的HR們,數(shù)字經(jīng)濟時代已全面開啟,大數(shù)據(jù)、人工智能、云計算等新科技推動經(jīng)濟、社會、企業(yè)發(fā)生翻天覆地的變化,也將賦予人力資本巨大的變革力量。企業(yè)紛紛在尋求智慧變革,人力資源部門是推動企業(yè)變革的重要動力之一,HR也要時刻隨著時代和科技的變化而變化,找到并駕馭合適、高效的智能化工具。在這場浪潮中,思變的企業(yè)和HR們已經(jīng)開始尋求變革新路徑。作為人力資本數(shù)字化平臺和數(shù)字化人才戰(zhàn)略的先行者,e成科技將始終與您同在,攜手開啟人力資本數(shù)字化新時代!”本專欄內(nèi)容由HR圖靈學院出品,HR圖靈學院是e成科技打造的HR領域第一AI專欄,希望以此為窗口,向HR傳達專業(yè)的AI知識與信息,賦予人力資本領域變革力量,以AI為鑰,攜手HR開啟數(shù)字化變革之門!在這里,HR們可以得到前沿技術思考、行業(yè)技術干貨、全球AI好物、HR+AI創(chuàng)新應用等。02-0910-1702-0910-1718-2318-2324-2924-2930-3637-4230-3637-4243-5143-5152-6061-6852-6061-6869-75第七部分智能職業(yè)發(fā)展規(guī)劃76-8476-8485-9485-94讓AI技術提升人崗匹配效果,我們做了這些探索解鎖這項AI黑科技,馬上實現(xiàn)人崗匹配自由AI黑科技:Embedding、知識圖譜(KG)方法、自然語言處理(NLP)、非線性樹模型、deep模型、BERT、Word2Vec模型等讓AI技術提升人崗匹配效果,我們做了這些探索本期和大家討論下“人崗匹配排序的探索與實踐”。從人力資源管理的發(fā)展來看,人崗匹配大致經(jīng)歷了三個階段,“三歷對照法”、“冰山挖掘法”、“全人匹配法”,而AI技術的引用將為企業(yè)迎來第四個——“數(shù)據(jù)解剖法”。AI技術實現(xiàn)人崗匹配,離不開數(shù)據(jù)的處理和模型的選擇與訓練,看似高深、復雜的人崗匹配算創(chuàng)新應用。“人崗匹配”是企業(yè)人力資源管理的核心問題,更是所有HR追求的目標。毫不夸張地說,“人崗匹配”是人力資源的起點,也是人力資源的核心目標之一。本質(zhì)上,企業(yè)和個人是利益共同體,只有使得組織利益和個體價值得才能使人才發(fā)揮最大價值,同時激活組織。那么,HR如何做好人崗匹配呢?以前,在千百萬份簡歷中篩選人才,是HR工作中“解不開的劫”,每天花費大量的時間和精力對優(yōu)秀簡歷和職位信息人工做匹配,不僅消耗著HR的積極性,往往結果也不盡如人意,篩不到合適的人才,難以滿足業(yè)務部門的需求。現(xiàn)在,數(shù)字經(jīng)濟時代的新技術給HR帶來了更多可能,AI技術將助力HR實現(xiàn)智能人崗匹配、大大提升人崗匹配效率與準確率,將HR從機械、瑣碎的招聘工作中解放出來。那么,實現(xiàn)AI人崗匹配背后的依據(jù)和邏輯又是什么呢?e成科技基于前沿的自然語言處理技術和深度學習模型,并結合大量數(shù)據(jù)和知識圖譜,通過不斷探索和反復實踐,形成一套高效的人崗匹配推薦算法系統(tǒng),下面院長將詳細為大家介紹這套系統(tǒng)及其背后的邏輯。根據(jù)發(fā)布職位來推薦簡歷,該場景中需要優(yōu)化推薦的準確率、召回率,提升HR更高的工作效率,提升崗位和簡歷的匹配度來減少招聘人才的成本。在經(jīng)典的機器學習排序模型中通常分為兩種:復雜的人工特征工程+簡單的模型,簡單的人工特征+復雜的模型。本著該原則我們對以文本為主的職位和簡歷對進行了匹配排序?qū)嵺`。特征為王以JD和CV對為背景,該場景為經(jīng)典的機器學習排序問題,目標在于預測JD和CV是否匹配,數(shù)據(jù)集的采集則是來自我司產(chǎn)品ATS平臺,HR從系統(tǒng)根據(jù)JD推薦的CV來進行選擇,符合要求將要走面試程序的則標為1,否則標為0。2.1特征介紹常見的JD如下圖1所示,其中包含格式化離散數(shù)據(jù)和整段文本數(shù)據(jù),從整段文本數(shù)據(jù)獲取招聘意圖是提取JD特征的重點難點。為了更好的解決該問題,我們分別引入知識圖譜(KG)方法和自然語言處理(NLP)方法,其中KG負責去充分提取文本中實體的關系和聯(lián)系,NLP則更好的獲取JD本文和CV文本相似性信息。因涉及個人隱私此處不展示CV信息。在以JD和CV對是否匹配的背景下,我們將特征主要分為以下幾類:JD特征:包含地點,學歷硬性要求和利用知識圖譜中提取的實體特征如(職能,公司,技能,專業(yè),行業(yè))等;CV特征:包含性別,年齡,學歷等基礎信息和從工作經(jīng)歷描述文本中提取的實體信息,以及文本類特征等。2.2特征處理>在獲取JD和CV的基礎特征之后我們主要將特征主要分為四種類型:ID離散特征:比如UID,職能ID,公司ID,行業(yè)ID,技能ID,專業(yè)ID等。硬性離散類特征:除了性別,年齡,工作地點等基礎類型特征,還包含有知識圖譜提取的實體之間的關系特征比如學校是否匹配,職能(工作職位對應能力)是否匹配等,此處成為match特征。連續(xù)性特征:除薪資等,還包含有知識圖譜提取的實體之間的graphembedding的vector相似性值,此處成為IDsim特征。Emdedding特征:包括了ID離散特征的vector,該vector有知識圖譜的graphembedding方法產(chǎn)生(如DeepWalk,LINE等)。文本embedding特征,該特征以JD和CV對的方式輸入DSSM模型產(chǎn)生vector。在此基礎上我們還加入了相應統(tǒng)計特征,統(tǒng)計特征主要有強特征的共現(xiàn)特征以及強特征之間的能力不同。模型演變在模型方面主要可以分為兩個總方向,分別是非線性樹和deep模型的探索,在探索上主要是根據(jù)不同模型的性質(zhì)進行特征工程。3.1非線性樹模型>我們主要以gbdt為主的樹模型展開特征工程的探索,gbdt的實現(xiàn)以xgboost和lgb為主。gbdt模型結構如圖2所示,gbdt為一個boosting模型,通過疊加多個弱模型來提升擬合能力,根據(jù)xgboost模型的優(yōu)缺點我們可以充分挖掘可用特征。我們再次整理上一節(jié)可用特征,主要有ID類特征(職能、行業(yè)、公司、技能、專業(yè)等基本信息匹配特征(年齡,工作經(jīng)驗,學校等)該特征為二分類特征,以JD和CV的ID類特征是否匹配來構建二分類特征(如職能是否匹配等稱為match特征將這兩類統(tǒng)稱為硬性離散類特征;JD和CV類的graphembedding產(chǎn)生vector對計算余弦值作為連續(xù)特征(稱為IDsim特征),加上文本相似性特征(稱為textsim特征)和薪資組成連續(xù)特征。值得注意的是文本特征主要根據(jù)JD和CV的格式分為title和description兩個部分來挖掘xgboost處理連續(xù)值的缺點我們將連續(xù)值進行分桶,桶數(shù)可由某維特征的分布來確定。將ID類特征也一同加入到樹模型中,這是考慮到組合特征的業(yè)務意義。分析特征重要性之后,我們根據(jù)特征現(xiàn)象去做統(tǒng)計特征,比如出現(xiàn)頻率統(tǒng)計,特征共現(xiàn)統(tǒng)計,多維特征多樣性統(tǒng)計等操作。相對應的title和description文本特征也可通過簡單的加權命中率來構成特征加入到樹模型中。總之實驗證明ID類特征,二分類特征,連續(xù)特征離散化,統(tǒng)計類特征,以及的vector的交叉特征都會給模型帶來正向收益。embedding產(chǎn)生3.2深度模型的探索>的弊端就是模型的可解釋性變差,根據(jù)結果反向特征工程變得困難起來。我們在JD和CV匹配場景下分別使用了DNN,Wide&Deep,DeepFM,等模型嘗試。同時并借鑒了PNN、DCN、DLRM和DKN網(wǎng)絡原理正在適配適合現(xiàn)有數(shù)據(jù)類型的模型。本節(jié)主要簡要介紹DNN和Wide&Deep,DeepFM的使用,再闡述對現(xiàn)有數(shù)據(jù)的思考。以YouTube的經(jīng)典NN為開端(如圖3,引用自相應論文),現(xiàn)有的數(shù)據(jù)下如何去使用DNN達到收益正是我們所考慮的。在現(xiàn)有的特征中除了上文提到的二分類特征,embedding相似性等特征之外我們包含知識圖譜抽取的實體embedding和文本embedding。文本embedding主要有DSSM模型產(chǎn)生,雙塔模型的輸入分別為JD的title、description,CV工作經(jīng)驗的title、description,雙塔輸出為JD和CV是否匹配。我們以雙塔的每坐塔的最后輸出vector作為JD和CV的表征。本著論文中提到的原理我們?nèi)コ藰淠P椭蠭D類特征,換成了ID對應的vector,保留原有的二分類和連續(xù)特征,另外在加入了文本embedding特征,最后的結果不是很樂觀。因此分析原因可能是某些特征缺失ID(比如CV職能等)初始化為0導致,還存在的原因可能是由于IDvector的知識結構和文本embedding知識結構不同導致,此處知識結構可以理解為不同訓練任務下的embedding空間結構。經(jīng)歷了DNN嘗試沒帶來正向收益我們偏向于以線性和深度非線性結合的Wide&Deep結構(如圖4)進行適配,此時我們考慮到DNN的實驗產(chǎn)生的問題。embedding的結果,我們采用ID類特征進行隨機初始化的embedding在連接match,IDsim和textsim等特征作為deep的輸入,將match,IDsim,textsim連接作為wide的輸入。以輸入ID類特征,match類特征,IDsim特征,textsim的xgboost模型作為wide&deep的比較模型,實驗證明wide&deep模型略優(yōu)于xgboost模型,但是如果對此基礎上xgboost做統(tǒng)計特征則可超過wide&deep模型。以上可得deep模型非線性表征能力還是略微的比xgboost能力強。deepFM模型,deepFM模型結構圖如圖5所示(引用自deepFM相應論文),deepFM將wide&deep的wide部分替換成了FM機制提升了模型對特征的交叉組合能力。根據(jù)此模型特征我們將UID,圖譜產(chǎn)生的ID類特征等稀疏特征輸入FM部分,match特征、IDsim特征以及textsim特征為dense特征輸入。結果很是令人歡喜,達到了以上實驗的最優(yōu)值,可能這就是深度學習帶來的魅力吧。在喜悅的同時,我們想現(xiàn)有的ID初始化embedding都能產(chǎn)生如此大的魅力,利用graphembedding豈不更加喜人。在DeepFM模型輸入基礎上我們將ID的graphembedding也加入到模型的densefeature部分,然而實驗證明并沒有想當然的好,甚至產(chǎn)生了負作用。但至少證明了特征交叉能帶來收益,至于graphembedding的加入為啥效果不好卻是值得思考和探索的問題。經(jīng)過上面的探索我們獲取了一些經(jīng)驗,例如交叉特征有用,用embedding產(chǎn)生的向量兩兩相似性計算對樹模型有用,因此我們本著上面積累的經(jīng)驗進行了人工構建交叉特征作為xgboost模型的輸入。在此基礎上加入統(tǒng)計特征,這波操作再次給我們帶來了0.5%的收益。最后總結下模型方面的探索結果,以上實驗說明我們還沒有充分利用graphembedding和由DSSM產(chǎn)出的文本embedding,也證明了embedding內(nèi)涵的巨大作用,后期我們將加大力度去挖掘該部分的內(nèi)容。03現(xiàn)階段成果和未來展望4.1現(xiàn)階段成果>經(jīng)過上文特征和模型的探索在此我們分方案來展示我們的實驗結果,分別包含以下方案:方案1:ID類特征+match特征+IDsim特征+textsim特征+gbdt方案2:IDvector特征+match特征+IDsim特征+textvector特征+dnn方案3:ID類特征(隨機初始化embedding)+match特征+IDsim特征+textsim特征+deepFM方案4:ID類特征+match特征+IDsim特征+IDvectorinner(交叉)特征+textsim特征+統(tǒng)計特征+gbdt主要以這四種有效的遞進關系來展示,其中多種的組合嘗試就不一一列舉了。效果如表格1中,我們的評價指標主要為正例的準確率,召回率,F(xiàn)1值和總的AUC值作為評價指標。以上結果都為數(shù)據(jù)清洗特征工程后結果,本次數(shù)據(jù)量JD和CV對大致為86萬,其中負例和正例比大致為7:1,我們將其隨機分成8:1:1其中8成訓練集、1成訓練集和1成測試集。4.2未來展望>據(jù)質(zhì)量和量的保證下我們相信深度學習帶來的魅力是巨大的。最近由Facebook出品的DLRM處理異構embedding的能力使我們躍躍欲試。另外由微軟出品的DKN網(wǎng)絡也證明了graphembedding所隱藏的信息量對推薦效果有很大幫助。文獻5中結合知識圖譜在電商環(huán)境下的推薦也使得我們相信充分挖掘embedding信息可以帶來不錯的收益。作為以技術為驅(qū)動的企業(yè),e成科技在AI技術的基礎上,創(chuàng)新性地提出基于人才畫像和崗位畫像的匹配,為人崗匹配帶來革命性變革。e成科技作為HR+AI賽道的領跑者,一直專注于AI技術在人力資本領域創(chuàng)新應用,開創(chuàng)性地將AI技術與人力資本場景深度結合。基于6年的AI能力和行業(yè)經(jīng)驗積累,e成科技打造了AI開放平臺,將AI能力和產(chǎn)品整合至AI開放平臺,并通過開放平臺將AI能力開放給所有企業(yè)和友商。e成科技AI開放平臺是HR賽道首個企業(yè)自主研發(fā)的聚焦人力資本場景的一站式AI能力服務平臺,覆蓋簡歷解析、人崗匹配、HR機器人等諸多場景,通過OpenAPI及需求定制等形式,面向所有自研系統(tǒng)大型企業(yè)、垂直招聘平臺、傳統(tǒng)HR行業(yè)廠商等企業(yè)用戶提供智能化服務。未來,我們將一直保持高效的創(chuàng)新與研發(fā)能力,將前沿的AI技術深度融合至人力資本場景,為所有企業(yè)賦能。文獻引用:[1]ChenT,GuestrinC.XGBoost:AScalableTreeBoostingSystem[J].2016.[2]CovingtonP,AdamsJ,SarginE,etal.DeepNeuralNetworksforYouTubeRecommendations[C].-conferenceonrecommendersystems,2016:191-198.[3]ChengH,KocL,HarmsenJ,etal.Wide&DeepLearningforRecommenderSystems[C].conferenceonrecommendersystems,2016:7-10.[4]GuoH,TangR,YeY,etal.DeepFM:AFactorization-MachinebasedNeuralNetworkforCTRPre-diction[J].arXiv:InformationRetrieval,2017.[5]WangJ,HuangP,ZhaoH,etal.Billion-scaleCommodityEmbeddingforE-commerceRecommen-dationinAlibaba[C].knowledgediscoveryanddatamining,2018:839-848.作者:e成科技人崗匹配團隊汪序明(掃描二維碼查看文章)一切皆可Embedding一切皆可Embedding解鎖這項AI黑科技,馬上實現(xiàn)人崗匹配自由人崗匹配,是企業(yè)人力資源管理的核心之一,更是HR招聘工作的精髓。傳統(tǒng)工作方式下,簡歷搜索和人崗匹配往往消耗HR大量時間和精力,結果卻往往不精準,隨著人工智能和NLP技術的發(fā)展,一些招聘網(wǎng)站紛紛推出自動化推薦功能,但卻同質(zhì)化嚴重,準確率不高。現(xiàn)在“graphembedding”在人力資本領域落地且取得不俗效果,助力人崗匹配更加高效,這樣的AI技術,作為HR的你值得擁有!在NLP(自然語言處理)中,自然語言無法直接應用到數(shù)學模型的建立中,需要將其映射到歐式空間。Embedding就是解決如何將自然語言表示為向量的,Google推出了Word2Vec模型,可以將語義相近的詞映射到向量空間中相近的位置,之后Google又提出了BERT,BERT可以析等多個語言任務的表現(xiàn)。同時,Embedding也可以作為深度學習模型的隱藏層,可以極大提高模型的表現(xiàn)。自從word2vec橫空出世,似乎各行各業(yè)的一切東西都在被Embedding,Embedding在數(shù)學上表示一個映射F:X->Y,也就是一個函數(shù),其中該函數(shù)是一一對應的而且保持空間同構性(即在X空間是近鄰的,則被映射到Y空間也是近鄰的)。Embedding技術被應用在了多種業(yè)務場1)在Airbnb中實現(xiàn)實時個性化搜索,利用用戶近幾周或者近幾個月點擊過的房源行為數(shù)據(jù)實時對用戶的搜索目標房源進行相似度比較和排序,這樣既極大的提高了效率而且也保證的搜索房源的準確性提高了用戶體驗。2)在電子商務領域,根據(jù)用戶的瀏覽和購買行為數(shù)據(jù),通過深度學習模型可以將用戶和物品同時嵌入(embedding)到相同的低維空間,然后利用Embedding計算用戶和物品之間的相似度(匹配度)直接給用戶推薦感興趣的物品。在人力資本領域,求職者、公司、職位、專業(yè)、技能等不同的實體間存在著多種類型的關系,構成了一個知識圖譜(KnowledgeGraph)。這里,我們主要關注的是GraphEmbedding(其實也可以稱為NetworkEmbedding)。我們利用GraphEmbedding技術,把這些實體嵌入到低維的向量空間,可以直接比較他們的相似性,并能大大的提高簡歷和崗位的匹配效果。對于具有較多類型節(jié)點且各類型節(jié)點的數(shù)量巨大來說這是比較好的嘗試,而且取得了一些效果。生成GraphEmbedding常用方法及其原理由于graphembedding的廣泛應用,同時衍生出了很多計算embedding的方法,下面我們介紹幾種商業(yè)上比較常用的幾種方法:1)DeepWalkDeepWalk[3]是KDD2014的一篇文章,我們常用的word2vec是根據(jù)詞的共現(xiàn)關系利用skipgram和COBW將詞映射到低維向量。DeepWalk算法思路其實是利用了word2vec生成embedding的一種方法skipgram,對于已經(jīng)建立的Graph來說每個節(jié)點可以是不同的實體且實體時間可以有不同的關系,從圖上的一個節(jié)點開始隨機游走(randomwalk如果節(jié)點之間有weight可以根據(jù)weight的不同進行walk來生成類似文本的序列數(shù)據(jù),實體id作為一個個詞使用skipgram訓練得到詞向量。算法的大體思路就是:根據(jù)圖中節(jié)點隨機游走->生成一定長度的序列->利用skip-gram進行訓練。2)LINELINE(Large-scaleInformationNetworkEmbedding)是2015年文章[4]中微軟亞洲研究院提出來的一種算法,LINE定義了兩種度量節(jié)點相似度的方法:一階相似度(First-orderproximity)和二階相似度(Second-orderproximity)。一階相似度節(jié)點之間無連接,則一階相似度為0;對每個無向邊,定義頂點和的聯(lián)合概率分布為:是頂點的低維向量表示,我們的目的就是使得經(jīng)驗分布和概率分布盡可能的接近,于是我們定義以下一階相似度的目標函數(shù):其中為兩種分布之間的距離,為空間上的一個分布,=是它的經(jīng)驗分布,其中W為兩點間邊權重總和。我們選擇KL散度來計算(2)式子。分布q,比較兩個概率分布的相似性:將,帶入KL散度的公式我們得到︰KL散度的計算公式其實是熵計算公式的簡單變形,在原有概率分布分布q,比較兩個概率分布的相似性:將,帶入KL散度的公式我們得到︰其中C為一個常數(shù),需要注意的是,一階相似度僅適用于無向圖,而不適用于有向圖。二階相似度越高則它們的相似性就越高。二階相似性假定與其他頂點共享鄰居頂點的兩個點彼此相似(無向有向均可),一個向量和分別表示頂點本身和其他頂點的特定“上下文”,意為二階相似。對于每個有向邊,我們首先定義由頂點生成“上下文”的概率:式子(5)是一個條件分布,對于頂點,我們的目的就是要擬合與其經(jīng)驗分布。為邊的權重,為相鄰邊的權重的和,因此最小化以下目標函數(shù):d(,)上文已經(jīng)說明,來表示頂點的度數(shù)。這里我們令利用KL散度同一階相似性的推導類似我們可以得到二階相似性的計算公式(去掉常數(shù)項)為:3)Node2vecNode2vec[5]3)Node2vecNode2vec[5]算法是在DeepWalk基礎上進行了改進,主要的創(chuàng)新點在于改進了隨機游走的策略,DeepWalk中根據(jù)邊的權重進行隨機游走,而Node2vec加了一個權重調(diào)整參數(shù),同時考慮到局部和宏觀的信息,并且具有很高的適應性。除了以上提到的常用的生成embedding方法,學術界和工業(yè)界還提出了很多方法,像SDNE[6]、Struc2vec、Starspace[7](Facebook用的技術)、EGES(阿里巴巴推薦使用的技術之一)GraphEmbedding為人崗匹配帶來新突破在人力資本行業(yè)最主要的兩大核心要素就是簡歷CV和工作崗位JD,如何讓CV和JD匹配是人力資本行業(yè)一直非常重視的問題也是一個難題。我們在人力資本行業(yè)領域?qū)mbedding的嘗試和應用,并且取得了一定的效果。有效的graph1)原始文本處理想要有效的進行人崗匹配(即CV和JD的合理匹配),需要綜合考慮包括職能、行業(yè)、技能、專業(yè)等維度在內(nèi)的多維度匹配。首先應該提取CV、JD中的文本特征,可以利用深度學習模型提取出CV、JD的文本特征,我們這里稱為實體。抽取出實體之后,我們就可以進行CV和JD的匹配,對于自由文本來說除了CV和JD的實體完全匹配上,可以算他們的相似度,詞的語義相似度無法完全的詮釋。舉個例子:CV的特征:技能實體(JAVA),職能實體(JAVA開發(fā)工程師)、專業(yè)實體(計算機)JD的特征:技能實體(Spring),職能實體(JAVA后端開發(fā))、專業(yè)實體(信息技術)從詞的表面是無法區(qū)分他們的相似度的。下面就用到了embedding,embedding可以將這些實體嵌入到同一低維的向量空間,在空間中實體之間的距離可以通過數(shù)學公式計算從而表示他們的相似性。2)生成實體embedding第一步:數(shù)據(jù)的生成,我們首先利用CV、JD中不同實體的共現(xiàn),以及不同工作經(jīng)歷之間的跳轉(zhuǎn)來抽取簡歷中的實體跳轉(zhuǎn),這些不同的實體之間可以構成network如圖1所示。不同的實體就是不同的節(jié)點,實線就是節(jié)點之間的邊也可以稱為關系。圖1第二步:使用Deepwalk、LINE生成embedding。對于Deepwalk可以直接根據(jù)network生成不同的文本序列,利用skip-gram進行模型的訓練。而對于LINE可以直接利用不同實體的共現(xiàn)次數(shù)作為模型的輸入。第三步:優(yōu)化訓練數(shù)據(jù)。我們發(fā)現(xiàn)不同的實體出現(xiàn)次數(shù)的量級是不同的,比如專業(yè)在JD中就很少出現(xiàn),這樣就導致了數(shù)據(jù)的不平衡。我們解決的方式是,統(tǒng)計了不同實體之間的t?df、npmi(NormalPointwiseMutualInformation)作為實體之間的權重,即表示了不同實體之間關系的強弱程度,之后再進行模型的訓練。第四步:以上都是利用無監(jiān)督的方式去訓練embedding,由于e成科技有自己獨立的人力資源ATS系統(tǒng),包含了用戶大量的真實行為數(shù)據(jù)。把其中匹配上的CV、JD作為正例,未匹配上的作為負例,構造出有監(jiān)督的訓練數(shù)據(jù)。將JD作為query,CV作為title,利用DSSM模型(如圖2)進行有監(jiān)督的模型訓練。需要注意的是這里的embedding層并不是隨機初始化的,而是利用第三步已經(jīng)訓練過的embedding作為預訓練的權重。這樣有監(jiān)督訓練的目的就是利用真實的行為數(shù)據(jù)更新embedding層的數(shù)據(jù),使得每個實體的embedding更能好的表達在招聘這個業(yè)務場景中的語義。圖1我們使用內(nèi)部標注的評估數(shù)據(jù)對不同模型進行了評估,比較結果如下:以下是fasttext和graphembedding模型輸出的top相關公司實體的一些例子。可以看到FastText單單只從字面意思進行了相似度匹配;而graphembedding模型輸出結果能夠更好地包含了具有相似業(yè)務、相似規(guī)模的公司,具有更好的語義相關性。以下是fasttext和graphembedding模型輸出的top相關公司實體的一些例子。可以看到FastText單單只從字面意思進行了相似度匹配;而graphembedding模型輸出結果能夠更好地包含了具有相似業(yè)務、相似規(guī)模的公司,具有更好的語義相關性。0404HR+AI領跑者,助力每一個HR實現(xiàn)AI賦能本文主要闡述了Embedding的原理以及一些應用,具體的闡述了Graphmbedding在人力資本領域的落地應用。Embedding既可以作為計算各個實體的工具也可以作為深度學習中的embedding嵌入層增加模型的準確性。不夸張的說一切可以embedding,而且embedding在很多領域都取得了不俗的成就,尤其是NLP領域。e成科技作為HR+AI賽道的領跑者,一直專注于人力資本領域的AI創(chuàng)新升級,開創(chuàng)性地將AI技術與人才戰(zhàn)略升級場景深度結合,我們已經(jīng)將embedding技術應用到人崗匹配、面試Bot等多實際場景,接下來我們將繼續(xù)優(yōu)化embedding,助力AI技術在人力資源領域的更多應用。同時,基于積累多年的AI能力和行業(yè)經(jīng)驗,e成科技重磅打造了AI開放平臺,并將AI能力開放給所有企業(yè)和友商。e成科技AI開放平臺是HR賽道首個企業(yè)自主研發(fā)的聚焦人力資本場景的一站式AI能力服務平臺,覆蓋簡歷解析、人崗匹配、HR機器人等諸多場景,通過OpenAPI及需求定制等形式,面向所有自研系統(tǒng)大型企業(yè)、垂直招聘平臺、傳統(tǒng)HR行業(yè)廠商等企業(yè)用戶提供智能化服務。參考文獻:[1]Banana,神奇的Embedding,/p/53058456[2]Ethan,Embedding的理解,/p/46016518[3]PerozziB,Al-RfouR,SkienaS.DeepWalk:OnlineLearningofSocialRepresentations[J].arXivpre-printarXiv:1403.6652,2014.[4]TangJ,QuM,WangM,etal.Line:Large-scaleinformationnetworkembedding[C]//Proceedingsofthe24thinternationalconferenceonworldwideweb.InternationalWorldWideWebConferencesSteer-ingCommittee,2015:1067-1077.[5]GroverA,LeskovecJ.node2vec:Scalablefeaturelearningfornetworks[C]//Proceedingsofthe22ndACMSIGKDDinternationalconferenceonKnowledgediscoveryanddatamining.ACM,2016:855-864.[6]WangD,CuiP,ZhuW,etal.StructuralDeepNetworkEmbedding[C].knowledgediscoveryanddatamining,2016:1225-1234.[7]Wu,L.,Fisch,A.,Chopra,S.,Adams,K.,Bordes,A.,&Weston,J.(2017).StarSpace:EmbedAllTheThings!arXivpreprintarXiv:1709.03856作者:e成科技知識圖譜團隊白永斌(掃描二維碼查看文章)人才畫像畫得好,數(shù)字化HR有妙招AI黑科技:BertELMo(EmbeddingfromLanguageModels)模型Embeddingattention人才畫像畫得好,數(shù)字化HR有妙招俗話說“人才畫像畫得好,HR招聘快不少”。人才畫像是現(xiàn)在企業(yè)人才招聘和人才管理的核心,并應用在人崗匹配、薪酬預測、人才盤點等諸多場景。數(shù)字化時代,畫像成為人才招聘和人才管理的入口,通過上百個維度進行提煉、總結進行人才全方位刻畫。但如何刻畫畫像,畫像準不準,還得這背后默默運行的AI算法和知識圖譜說了算。(persona)的概念最早由交互設計之父AlanCooper提出:“Personasareaconcreterepresentationoftargetusers.”是指真實用戶的虛擬代表,是建立在一系列屬性數(shù)據(jù)之上的目標用戶模型。如今,為了提高客戶體驗和運營效率,畫像早已被應用在各行各業(yè)。金融企業(yè)是最早開始使用用戶畫像的行業(yè),在人力資本領域,人才/崗位畫像的應用大大提升了HR的工作效率和質(zhì)量,是人力資本數(shù)字化的重要入口和核心要素。所謂人才/崗位畫像,即是基于企業(yè)招聘的顯性的職位描述和隱形的內(nèi)在潛質(zhì)共同組成的用戶畫像(以下簡稱“畫像”)。△一張畫像,沒有讀不懂的人才構建畫像的核心工作,主要是利用存儲在服務器上的海量日志和數(shù)據(jù)庫里的大量數(shù)據(jù)進行分析和挖掘,給用戶貼“標簽”,而“標簽”是能表示用戶某一維度特征的標識。字段進行數(shù)值化處理。其中結構化數(shù)據(jù)比較容易進行數(shù)值編碼(例如:性別/年齡/工作年限等而非結構化數(shù)據(jù)(例如工作經(jīng)歷/職能/技能等)多數(shù)為文本類型處理難度較高。對于非結構化數(shù)據(jù),生成具備語義含義的Embedding是業(yè)界較為廣泛使用的方案。職能/技能可以統(tǒng)稱為用戶的知識體系,即使每一個職能/技能生成了具備語義含義的Embedding,如何通過聚合生成用戶整個知識體系的數(shù)值表達并盡可能保留文本自身的信息,依舊是亟待解決的問題。據(jù)(例如文本類型)包含了更全面和深度的用戶潛在信息,目前通過詞向量加權平均依舊是主流使用的處理方法。此類方法存在一些缺陷:1.生成的Embedding完全基于語義表達,缺失了其內(nèi)在業(yè)務含義;2.直接加權平均的方法,容易掩蓋掉重要的信息,且權重不好定義。基于此,我們針對人力資本場景,借鑒Bert的思想提出了一個新方法,能夠更好地用數(shù)學的方法對人才/崗位畫像進行表示。為了讓AI+數(shù)據(jù)驅(qū)動的數(shù)字化招聘更為精準智能,我們以e成科技獨有的HR行業(yè)職能/技能知識圖譜作為先驗的業(yè)務知識,并基于海量簡歷和崗位描述數(shù)據(jù)(千萬級借鑒Bert的模型架構,專門對畫像中的知識體系相關字段(職能/技能)進行了深度優(yōu)化。該方法提供的知識表征,首先包含了技能/職能的內(nèi)在關系,其次通過attention的方式聚合能保證重要業(yè)務信息的不丟失。經(jīng)過優(yōu)化的人才/崗位畫像,在數(shù)字化招聘、人崗匹配、人才盤點、薪酬預測等多個下游業(yè)務場景中均取得顯著的優(yōu)化提升。部分場景舉例人才選拔:通過人才畫像分析,使人才供給與業(yè)務發(fā)展速度高度匹配,優(yōu)化人才隊伍配置效率,降低人才流失率;人才任用:通過崗位畫像和人才畫像的分析與匹配度分析,實現(xiàn)人才和崗位最優(yōu)配置,使優(yōu)秀人才能充分發(fā)揮能力與主觀能動性,提高人力資本效率;薪酬預測:根據(jù)人才畫像和崗位畫像,結合行業(yè)崗位知識,分析人才/候選人技能及發(fā)展水平,預測候選人及企業(yè)未來薪酬水平;接下來,院長就將為大家介紹e成科技在有關領域的最新方案以及應用成果。ELMoVSELMoVSWord2Vec,更優(yōu)的特征提取器Word2Vec是近幾年非常流行的WordEembedding提取模型。模型通過預先構建的詞表將輸入語句中某單詞前、后所有詞語編碼為多個one-hot向量傳入模型,隨后通過一個共享的參數(shù)矩陣將這些向量映射到隱藏層,最后使用softmax將隱藏層的輸出轉(zhuǎn)化為詞表中每個單詞的概率作為輸出,其中概率最高的單詞即為最終預測結果。經(jīng)過充分訓練后,詞表中每個單詞的語義信息已經(jīng)充分“嵌入”了用于映射輸入層和隱藏層的參數(shù)矩陣中。使用時只需用單詞的one-hot向量和參數(shù)矩陣相乘就可以得到對應的WordEmbedding。這樣的網(wǎng)絡結構為Word2Vec帶來了一個嚴重的問題,它無法為語言中常見的多義詞提取Embedding。由于同一個單詞在參數(shù)矩陣中只占據(jù)一個向量,網(wǎng)絡只能將多義詞的不同語義信息全部編碼到相同的向量中,反而降低了這些詞向量的表達能力。此外,Word2Vec只采用了一個線性隱藏層,特征提取能力較弱,對Embedding的表現(xiàn)也有很大的影響。ELMo(EmbeddingfromLanguageModels)模型使用與Word2Vec截然不同的方式提取Embedding,并采用更優(yōu)的特征提取器,很好地解決了多義詞問題,同時增強了詞向量的表達能力。模型使用兩層雙向LSTM(LongShortTermMemory)單元作為模型中間層,其中正向LSTM順序接受輸入語句中給定單詞的上文,逆向LSTM倒序接受語句中給定單詞的下文。訓練完成后將輸入層Embedding和兩層LSTM產(chǎn)生的Embedding加權結合后作為句中每個單詞的Embedding使用。與Word2Vec查表式獲取靜態(tài)的Embedding不同,ELMo可以根據(jù)上下文信息動態(tài)調(diào)整詞語的Embedding。多層LSTM特征提取器可以從文本中分別提取句法、語義等不同層次的信息,大大提升了詞語特征的豐富程度。Attention機制是近幾年提出的新型特征提取器,在NLP領域的表現(xiàn)效果遠超以往使用的卷積Self-Attention單元構成的大型網(wǎng)絡和巧妙設計的無監(jiān)督訓練方式使模型可以利用豐富的自由文本進行訓練,從中提取多層次的語言特征。0303e成科技的應用:知識表征模型我們的知識表征模型(以下簡稱“模型”)同樣使用了多層Self-Attention單元作為基本的特征提取器,嘗試從e成科技豐富的數(shù)據(jù)中挖掘出可描述職能和技能各自特征及其相關關系的Embedding。為了訓練這樣的模型,我們借鑒并調(diào)整了Bert的設計思路,建立一套符合我們訴求的模型結構。模型將e成科技知識圖譜中職能和技能的實體名稱作為Embedding提取粒度,端到端地進行損失。模型訓練時,我們使用職能、技能前后拼接的數(shù)據(jù)結構,其中來自相同CV數(shù)據(jù)的職能、技能作1。為了防止模型僅抽取職能對技能的依賴關系,我們在將職能和技能調(diào)換順序后的數(shù)據(jù)加入樣本中同時訓練,以提取雙向的依賴關系。經(jīng)過充分訓練后,模型可以提供多樣化的使用方式。模型最后一層輸出和輸入序列等長的Embedding序列,其中第一個Embedding包含整條數(shù)據(jù)的特征,之后每個Embedding與輸入序列的詞語一一對應,分別是每個詞語的動態(tài)特征。將序列頭Embedding接入下游任務網(wǎng)絡中可以對模型進行?ne-tune,可進一步用于不同的細分領域任務。同時,其余Embedding也可以直接作為詞語特征使用。考慮到模型結構復雜,運算時間較長,針對某些性能要求較高的業(yè)務場景,可以將模型輸入層對應的Embedding作為靜態(tài)詞向量使用,通過查表方式大大簡化運算流程。我們使用內(nèi)部標注的薪酬預測、人崗匹配數(shù)據(jù)對不同模型進行了評估,結果如下:薪酬預測任務中,每個模型需要提取候選人的技能Embedding作為下游任務的參數(shù),輔助判斷候選人的薪酬水平。實驗中模型之間互不影響,且使用相同的下游薪酬預測模型。結果中可以看到,我們的知識技能表達模型對下游任務各項指標均有5%左右的提升。而人崗匹配任務中,我們將崗位和候選人各自技能Embedding之和作為它們的特征向量,通過特征向量相似度判斷候選人和崗位是否匹配。評估結果顯示,我們的模型表現(xiàn)非常出眾,提升效果明顯。分未正確還原的情況。可以看到即使還原失敗,模型也能夠預測到行業(yè)內(nèi)與正確結果相似的答案。數(shù)字化時代,HR作為推動企業(yè)數(shù)字化升級的核心力量之一,通過數(shù)字化工具助力人才管理和人才引進數(shù)字化,已經(jīng)成為必然趨勢。e成科技創(chuàng)新研發(fā)的畫像+Bot兩大引擎,助力人才知己、企業(yè)知人、社會知命。利用大數(shù)據(jù)和人工智能技術構建的畫像,將對人才的素質(zhì)、性格、職業(yè)動力都進行全方位描述,幫助人才認識自己,進行自我反思,同時幫助企業(yè)和HR更全面、更立體、更準確識別候選人,實現(xiàn)選、融、育、激各個環(huán)節(jié)高效的人才管理。作為HR+AI賽道的領跑者,e成科技從創(chuàng)立伊始就將AI基因根植于業(yè)務,并開創(chuàng)性地將AI技術與人才戰(zhàn)略升級場景深度結合。同時,基于積累多年的AI能力和HR行業(yè)經(jīng)驗,e成科技重磅打造了AI開放平臺,通過OpenAPI及需求定制等形式將AI能力開放給所有企業(yè)和友商。e成科技AI開放平臺是HR賽道首個企業(yè)自主研發(fā)的聚焦人力資本場景的一站式AI能力服務平臺,覆蓋簡歷解析、人崗匹配、HR機器人等諸多場景,這些HR+AI的創(chuàng)新應用和智能產(chǎn)品背后,都是e成科技領先的AI能力和默默潛心研發(fā)的科學家及算法工程師們作為支撐。未來,e成科技將持續(xù)打造更多創(chuàng)新智能產(chǎn)品,全面加速人力資本數(shù)字化升級!作者:e成科技AI算法團隊陳嘉欽(掃描二維碼查看文章)場景:音視頻面試內(nèi)容:AI面試官來襲,HR你準備好了嗎?AI黑科技:機器學習、語音識別、面部識別、排名算法、計算機視覺技術、語義理解能力、跨媒體協(xié)同推理技術AI面試官來襲,HR你準備好了嗎?這回院長為大家?guī)硪粋€神秘炸彈:獵豹(Leopard)項目!聽起來是不是很炫酷?你一定想不到,這個獵豹(Leopard)項目是做什么的吧?沒錯!就是眾多候選人“聞風喪膽”的AI面試!這是e成科技AI算法團隊研究的新成果,之所以起這個名字是希望我們的AI面試像草原上狩獵的獵豹一樣敏捷高效!下面就隨院長一起看看“這只獵豹”背后的黑科技吧!說到AI面試,相信很多參加過校招的候選人都不陌生,被HireVue支配的恐懼還歷歷在目,不少小伙伴面完忍不住把一首“涼涼”送給自己……對于很多企業(yè)和HR來說,AI面試更是應用廣泛。招聘是企業(yè)和HR亙古不變的主題,尤其是眾多大廠每年要面臨千百萬量級的候選人,面對如此龐大的應聘者數(shù)量,AI技術無疑是簡化招聘的利器。AI的力量。過去幾年,使用AI視頻面試的公司從14%上升至60%,聯(lián)合利華、歐萊雅、可口可達能、高盛、瑞士銀行、摩根大通等全球600多家企業(yè)陸續(xù)開始使用AI面試的形式進行首輪面試。在提供AI面試的企業(yè)中,以視頻面試公司HireVue開發(fā)的服務最為著名。在一個典型的AI視回答情況,結合面試者聲音及面部表情的信息,判斷其能否通過這一場面試。△圖片來自HireVue官網(wǎng)之所以越來越接受的企業(yè)愿意類似的AI面試,院長覺得有如下幾個原因:1.相比于傳統(tǒng)的人工面試,基于音視頻的AI面試可以在前期大大減少HR的工作量,降低企業(yè)2.在簡歷篩選和初面階段,由于不同面試官的專業(yè)水平和個人喜好不同,會使得面試存在著很大的偶然性。而基于AI的音視頻面試的面試評價標準相對統(tǒng)一,對每個面試者也更加公平;3.基于音視頻的AI面試除了能夠?qū)γ嬖囌叩幕卮疬M行分析外,還可以對面試者的表情及回答內(nèi)容給出實時的分析與反饋,既能提升面試者體驗,也有助于提升公司的品牌形象。不過,要做到體驗級的音視頻面試能力,對于產(chǎn)品和技術的要求都是非常高的。不同的行業(yè)與招聘場景,對于音視頻面試的要求都是不同的,想要產(chǎn)品既契合場景且體驗出色,少不了大量高大上的AI面試背后的黑科技。0202黑科技揭秘:AI面試為何那么神2004年HireVue成立之初,只是為了記錄面試者視頻數(shù)據(jù),供HR參考。10年后,HireVue融入了AI技術,重新定義了“面試”。這些AI技術是基于機器學習的復雜算法,并結合語音識別以及面部識別,協(xié)同排名算法,通過15000+個不同的維度(包括肢體語言、語音模式、眼神活動、做題速度、聲音大小等)來對候選者進行評分。△AI面試可以通過15000+個不同維度對候選者評分,圖片來自BusinessInsider之前有同學跟院長說,現(xiàn)在我們的語音識別和人臉識別技術都已經(jīng)非常成熟,做基于AI的音視頻頻面試只是把這些能力進行一下組合,難度并不大。這種說法確實有一些道理,AI面試產(chǎn)品的出現(xiàn)確實是得益于近年來人工智能飛速的發(fā)展,特別是深度學習在計算機視覺和語音識別等領域的廣泛應用。但是,面試場景又對AI能力有很多特殊的要求,需要有針對性做大量工作,下面院長結合e成科技在這方面的研究成果和創(chuàng)新研發(fā)進行介紹:語義理解能力要對求職者的能力有好的判斷,面試官必須對求職者所說的內(nèi)容做到充分的理解,AI面試官也不例外。除了夠理解面試者的意圖,并且判斷面試者的通用表達能力、語言邏輯性的通用語義理解外,AI面試官還需要具備更加專業(yè)的知識。借助于六年來積累的大量人力資源行業(yè)專家知識及知識圖譜,e成科技開發(fā)的AI面試產(chǎn)品不但可以基于不同崗位的需求進行技能追問和熟練度判斷,并且研發(fā)行業(yè)內(nèi)首個BEI機器人,通過分析候選人提供的故事來判斷其在不同崗位要求素質(zhì)項上的評分。對話能力為了保證求職者擁有更好的面試體驗,AI面試官也得像普通面試官一樣跟候選人流暢地對話,這除了依賴前面所說的語義理解能力外,也需要強大的對話能力作為支持。e成科技近年來開發(fā)多款HR場景聊天機器人,并沉淀出統(tǒng)一對話框架Snowball。基于該對話框架,AI面試機器人可以進行統(tǒng)一的意圖識別和對話策略管理,并同時支持知識庫問答和閑聊(Chitchat),帶給候選人更好的面試體驗。語音與視覺能力進行音視頻面試非常核心的工作是對語音和視頻內(nèi)容的理解。其中語音識別是整個AI面試對候識別外,e成科技的科學家和算法工程師們還在探索基于一些基礎的語音信息對面試者的面試狀態(tài)(比如,面試者是否緊張)、基礎表達能力和普通話能力進行分析。與狀態(tài),對于一些頂替、偷看資料等面試作假的情況,可以利用人臉識別和動作場景識別的計算機視覺算法進行識別。更進一步地,與HireVue等AI面試產(chǎn)品類似,e成科技也在開發(fā)利用計算機視覺技術對面試者進行更細致的分析,比如借助微表情和情緒識別技術判斷面試者在回答問題過程中的心理狀態(tài),甚至捕捉到一些候選人可信度不夠高的回答。跨媒體有了音視頻的處理能力,AI面試官可以從視覺、語音、語義等不同維度獲取候選人的信息,雖然每個維度都能夠獲取大量候選人信息,但要真正想把AI面試做好,必須對這些不同維度的信息進行統(tǒng)一分析。舉個例子,當候選人在提到某個關鍵概念時,說話的語氣和眼神可能會有一的參考和幫助。想要實現(xiàn)這樣的功能,除了各個本身的內(nèi)容理解外,還需要引入“跨媒體協(xié)同推理”技術。這一技術是新一代人工智能的重要組成部分,通過視聽感知、機器學習和語言計算等理論和方法,構建出實體世界的統(tǒng)一語義表達,從而跨媒體的分析和推理。e成科技在自己的音視頻面試產(chǎn)品斷的準確性。0202黑科技揭秘:AI面試為何那么神AI技術似乎具有與生俱來的爭議性。雖然基于音視頻的AI面試已經(jīng)在很多場合得到廣泛應用,但是也有不少人對其產(chǎn)生質(zhì)疑。一方面,到底AI面試官的信效度如何,能否達到專業(yè)面試官的水平?院長覺得機器和人類各有優(yōu)劣,機器并不是要替代人類,而是要輔助人類,和人類更好地合作。在具體形式上,AI面試官和專業(yè)面試官可以有很多協(xié)同方式,比如由AI面試官進行候選人的初篩,并且給后續(xù)專業(yè)面試官提供面試評價與建議。也有人會覺得AI面試可能產(chǎn)生一些倫理問題,如是否會產(chǎn)生一些對相貌和言語的歧視?其實這好這些問題,讓自己成為AI時代的受益者。簡而言之,AI面試的初衷是幫助優(yōu)秀的候選人脫穎而出,從而讓招聘者重點關注優(yōu)秀候選人;同時,可以大大幫助HR節(jié)省時間,把更多精力放在關注人才質(zhì)量、選拔多樣性上。人工智能是應對這些挑戰(zhàn)的最佳方式。而從創(chuàng)立之初就將AI基因深植于業(yè)務的e成科技,一直在潛心研發(fā)和積累,致力于將AI技術深度應用于人力資本全場景中,推動人力資本智能變革。憑借自身在AI能力和行業(yè)經(jīng)驗的獨特優(yōu)勢,以及來自全球頂尖跨媒體技術實驗室的AI核心團隊,擁有頂尖的跨媒體AI技術,結合多年積累的知識圖譜與對話技術,e成科技推出的AI面試機器人更是如虎添翼。△e成科技AI開放平臺四大算法中臺目前,e成的音視頻面試技術已經(jīng)在一線員工自動化招聘和候選人Bot等場景中落地,為大量的用戶賦能,助力企業(yè)降本增效。未來,隨著科技飛速發(fā)展,AI技術正在根據(jù)大數(shù)據(jù)和深度學習不斷優(yōu)化和升級,AI在行業(yè)的應用也會越來越廣泛和深入,我們也必須擁抱變化,適應人機交互新模式,通過駕馭智能工具,實現(xiàn)數(shù)字化升級。e成科技愿意借助于自身在AI開放平臺、技術、產(chǎn)品、行業(yè)經(jīng)驗等優(yōu)勢,助您實現(xiàn)人力資本數(shù)字化新升級!作者:e成科技AI算法團隊劉洋(掃描二維碼查看文章)真技術還是偽AI,HR如何選擇合適的智能工具?HR圖靈學院|一文讀懂RPA、AI與HR的關系AI黑科技:語音識別(ASR)、自然語言理解(NLU)、對話管理(DM)、文本生成(NLG)、語音合成(TTS)、文本檢索、情感分析、光學文字識別(OCR)……一文讀懂RPA、AI與HR的關系近兩年,科技行業(yè)熱詞里突然多了一個簡寫—RPA,有人把RPA當作解放勞動力的救星,認為任何大規(guī)模、重復性工作都能用RPA機器人代替,大大節(jié)省了人力、時間和金錢。比如在人力資本領域,研究表明,HR們大約93%時間花費在重復性工作上,但65%的工作流程其實可以實現(xiàn)自動化,RPA可以將HR從大量、繁瑣、重復的任務中解放出來,如簡歷篩選、面試邀約、員工入職、員工數(shù)據(jù)管理、考勤管理、離職管理……從而將時間和資源聚焦在更高價值和戰(zhàn)略性任務上。Gartner研究表明,到2022年底85%的大型和超大型組織將部署某種形式的RPA。一時間,RPA風頭無兩,被認為未來市場前景廣闊,引得各路投資人爭先恐后。但也存在不同聲音,有人說RPA是開數(shù)字化歷史的倒車,認為RPA只不過是在重復執(zhí)行腳本,不過是不斷執(zhí)行命令的“手腳”,AI才是發(fā)布命令的“大腦”。面對眾說紛紜、信息紛繁,我們似乎只能管中窺豹難得全貌,那么到底該如何看待RPA?RPA和AI有哪些聯(lián)系?RPA和HR又有哪些關系呢?本期,院長就聊一聊關于RPA你想知道的那些事兒。(掃描二維碼查看文章)真技術還是偽AI,HR如何選擇合適的智能工具?2019年,RPA突然火了,成為新興風口、資本的寵兒,甚至有些媒體宣稱人力資源部門一定要部署RPA,但這種火熱到底是資本炒作,還是RPA真的有用,相信很多人都心存疑惑……01RPA能滿足HR需求嗎RPA(RoboticProcessAutomation是指用軟件流程自動化方式實現(xiàn)在各個行業(yè)中本來是人工操作計算機完成的業(yè)務。事實上,第一期院長和大家探討了RPA與AI的關系,傳統(tǒng)RPA并沒有用到特別前沿的人工智能技術,RPA也并不等同于人工智能。但隨著近些年來,軟件流程自動化技術與AI這兩個互補概念結合在一起,RPA很多環(huán)節(jié)上用到了越來越多的人工智能技術,使得工具更加智慧,也提升了效率減少了人工,于是RPA在金融、財務和工業(yè)自動化等領域應用越來越廣泛。對于企業(yè)人力資源部門來講,HR每天都需面對大量事務性工作,這些事務性工作大都可以通過自動化的方式由機器人來替代。而借助語音識別、OCR等AI能力,也的確能夠進一步提升RPA的靈活性與智能性,替代人工將繁瑣的業(yè)務操作流程自動化,解放HR們的雙手,提升HR的工作效率。可見,RPA的真正價值在于,其可以將HR從以往大量、繁瑣、重復的事務性工作(如篩選簡歷、入離職辦理、社保、福利、開具證明等)中解放出來,將時間和資源集中在高價值的、戰(zhàn)略性任務上(比如支持組織轉(zhuǎn)型、引入職業(yè)發(fā)展規(guī)劃、尋找最新培訓材料、理解業(yè)務特點和實操場景、為企業(yè)戰(zhàn)略提供決策依據(jù)等),提高人資效率。但RPA真的能滿足HR的所有工作需求嗎?院長曾經(jīng)和一些在互聯(lián)網(wǎng)公司的HR小伙伴們探討這個問題,他們紛紛表示人資軟件操作并非他們工作的主要內(nèi)容,單純的軟件流程自動化對他們幫助非常有限。首先,我們知道不同于金融、財務等工作,HR每天更多時間花在了與候選人、員工的面試與溝通上。這些溝通需要HR與員工協(xié)同進行,時間與方式都非常靈活,很難通過傳統(tǒng)軟件進行自動化。其次,優(yōu)秀的HR進行的溝通應該是有溫度的,這樣的溫度很難在軟件自動化中體現(xiàn)和傳遞出來。最后,很多重要的決策也需要基于溝通的結果,結合大量的專業(yè)知識來進行,這也并非簡單RPA可以實現(xiàn)的。可見,即使有了AI的助力,RPA也不能完全滿足HR需求,還需要有更強大的工具來幫助HR提升相關的工作效率。0202實現(xiàn)人與人更好地連接:畫像+Bot事實上,人力資源部門不缺自動化技術及系統(tǒng)。市場上種類繁多的自動化工具和系統(tǒng),都能或多或少解決HR們的一部分需求,通過自動化大大降低HR處理事務性工作的時間和精力。但HR需要的僅僅是一個代替自己雙手的自動化工具嗎?一個RPA機器人就夠了嗎?工作已經(jīng)不能滿足企業(yè)發(fā)展的需求,如何充分利用人與技術的合作,全面提升組織與人才管理、員工體驗和組織數(shù)字化升級變革成為重中之重。相比于RPA,我們相信智能對話機器人(ChatBot)更能實現(xiàn)人與人之間更好地相互連接,更適合幫助HR完成日常瑣碎的溝通工作,提升HR的工作效率與員工體驗。這里的機器人既可以是基于文字交互的聊天機器人,也可以是基于電話線路的外呼機器人。HR只需要簡單配置,就可以將這些機器人應用在各種場景中,比如與候選人進行面試邀約,進行電話面試并7*24小時回答候選人各種問題,還可以和在職員工進行實時交流,了解他們對于自己和公司的各種想法。當畫像與Bot結合在一起時,還會發(fā)生更加奇妙的化學反應。如果把畫像比作大腦,Bot就相Bot也具備了更強的專業(yè)性和個性化能力,更能像一個專業(yè)HR一樣與候選人或者員工進行交流。首先,“畫像+Bot”與“RPA+AI”本身的動機是類似的,都是致力于通過自動化、數(shù)字化、智能化提升HR工作效率,降低人資部門的流程負擔;其次,僅僅靠RPA實現(xiàn)流程自動化提升HR工作效率是遠遠不夠的,注重體驗性和智能性的對話機器人對HR的效率提升更為關鍵;最后,AI這個概念過于龐大,對人力資源領域而言,畫像是AI最為重要的體現(xiàn),大量智能化工作都需要圍繞著畫像進行體現(xiàn);所以,相比于RPA+AI,畫像+Bot的提法更貼近人力資源的實際場景需求,也更有利于真正將HR從事務性工作中解放出來,給候選人及員工更好的體驗。羅馬不是一天建成的,構建好Bot與畫像能力也一樣,一方面需要長期的數(shù)據(jù)與技術積累,另一方面也需要有大量的實際業(yè)務經(jīng)驗。反觀行業(yè)內(nèi)一些公司,在RPA與AI的熱潮下,短時間內(nèi)搖身一變就成了一家RPA+AI的公司,這其中究竟有多少AI能力,而這些AI能力有真正能對業(yè)務產(chǎn)生多大幫助,恐怕要打上一個大大的問號。能做出HR真正滿意的產(chǎn)品,靠的不是蹭熱點,而是對業(yè)務的深入理解和對技術的不斷追求。RPA能滿足HR需求嗎e成科技從成立伊始就秉持“科技助力人才升級”的公司使命,并以“畫像”和“Bot”作為兩大核心驅(qū)動力。經(jīng)過多年的技術積累,e成科技在智能對話機器人領域沉淀出自主研發(fā)的Snowball對話框架,具備意圖識別、槽位提取、實體識別、對話管理、問答對話、閑聊對話等諸多對話能力。尤其針對人力資源領域特點,Snowball有針對性的搜集語料進行模型訓練,并且增加了許多定制化功能以保證對話系統(tǒng)的專業(yè)性及良好體驗。而在用戶畫像方面,基于多年的豐富行業(yè)經(jīng)驗,e成科技形成了包含百萬級實體和千萬級關系的知識圖譜作為畫像的知識儲備,同時加入專業(yè)咨詢團隊的理論編寫大量專家規(guī)則,并結合業(yè)界前沿的機器學習、神經(jīng)網(wǎng)絡模型,構建了覆蓋廣、精度高的用戶畫像體系,帶動相關業(yè)務的發(fā)展。基于以上對話與畫像能力,e成科技研發(fā)了大量覆蓋人力資本全場景的智能應用,將AI技術與HR場景深度融合,更加貼合數(shù)字化時代下HR的業(yè)務需求。部分應用小e外呼:基于人工智能意圖識別及對話管理,利用電話外呼技術實現(xiàn)的高潛候選人自動意向溝通最佳解決方案,突破性提高人才復用率;員工機器人:將e成科技多年積累的HR領域業(yè)務知識與智能對話機器人結合,減少HR重復工作,提升員工工作體驗;面試機器人:基于崗位畫像和專家知識對候選人進行智能化面試,通過刻畫人才畫像幫助HR全面了解候選人;HR機器人:通過Bot構建交互信息的采集和分析系統(tǒng),打造面向HR、員工、候選人的全場景高效對話體驗;人崗匹配:基于人才及崗位畫像,結合專家知識與前沿深度學習模型個性化推薦人才,提升HR工作效率;△從Bot集群到超級Bot,科技助力人才升級HR行業(yè)首個AI開放平臺,賦能行業(yè)變革部AI技術,于是一時間市場上涌現(xiàn)眾多“HR+AI”、“RPA+AI”的人力資本產(chǎn)品或服務,可謂亂花漸欲迷人眼。但通用AI技術往往與業(yè)務場景有著巨大的鴻溝,AI技術與垂直行業(yè)的融合,絕非一朝一夕之事。誠然,目前的“AI熱”或者“RPA熱”反映了市場的焦慮和人力資本領域數(shù)字化轉(zhuǎn)型的迫切需求,AI”的道路上越走越遠。AI技術成功應用到人力資本場景,是不斷試錯,不斷創(chuàng)新和優(yōu)化的過程,需要長時間的研發(fā)和打磨。作為HR+AI賽道領跑者,e成科技的AI能力從創(chuàng)立起就深植于基因,并伴隨著人力資本業(yè)務發(fā)展不斷學習和進化,融合了深厚的HR行業(yè)經(jīng)驗積累、頂尖專家團隊提供專業(yè)知識,突破技術邊界,才在HRSaaS領域形成獨一無二的“護城河”。e成科技AI核心優(yōu)勢AI技術優(yōu)勢:6年的AI能力積累,掌握深度學習、數(shù)據(jù)挖掘與分析、自然語言處理、知識圖譜、智能推薦、人才素質(zhì)模型、情感分析、實體識別等核心AI技術,引領AI技術與人力資本場景深度融合;頂尖團隊優(yōu)勢:3位頂尖AI科學家,超過50人的來自BAT等互聯(lián)網(wǎng)巨頭的優(yōu)秀算法團隊,超過30人的來自全球知名咨詢企業(yè)的HRTech行業(yè)咨詢團隊陣容;行業(yè)知識優(yōu)勢:超大規(guī)模全行業(yè)人力資源知識圖譜,歷時6年,10,000+家企業(yè)使用驗證,成功構建50,000,000+實體關系;AI行業(yè)認可:HR賽道唯一入選上海人工智能發(fā)展聯(lián)盟(SAIA)和中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)的會員單位,多次斬獲人工智能技術應用十強、AI商業(yè)落地百強等諸多榮譽;基于以上優(yōu)勢和能力,經(jīng)過多年積累和孵化,e成科技打造了HR賽道首個AI開放平臺,并將多年AI能力積累開放給所有HR友商,助力實現(xiàn)人力資本智能化升級與變革。e成科技AI開放平臺是HR賽道首個企業(yè)自主研發(fā)的聚焦人力資本場景的一站式AI能力服務平臺,覆蓋簡歷解析、人崗匹配、HR機器人等諸多場景,通過OpenAPI及需求定制等形式,面向所有自研系統(tǒng)大型企業(yè)、垂直招聘平臺、傳統(tǒng)HR行業(yè)廠商等企業(yè)用戶提供智能化服務。e成科技AI開放平臺提供的服務主要集中在這三種形式:標準化AI能力:將NLP、NLU等前沿的AI技術全面應用于HR各類核心業(yè)務場景,為用戶直接輸出單個或多個AI技術能力,如簡歷解析、職位解析、人崗匹配等;組件化AI產(chǎn)品:基于業(yè)務深度理解,實現(xiàn)AI產(chǎn)品組件化、平臺化,用戶通過標準API接入,實現(xiàn)快速調(diào)用AI產(chǎn)品,無需企業(yè)再次開發(fā);個性化場景解決方案:根據(jù)用戶的個性化場景需求提供定制化的AI能力和服務,打造企業(yè)專屬目前,e成科技AI開放平臺已助力多家企業(yè)合作伙伴智能應用落地,賦能行業(yè)智能化變革。后續(xù),我們將為大家分享一些精彩案例,盤點下AI賦能企業(yè)變革的那些事兒。院長結語:數(shù)字化時代,企業(yè)紛紛在尋求智慧變革,人力資源部門是推動企業(yè)變革的重要動力之一,HR也要時刻隨著時代和科技的變化而變化,找到并駕馭合適、高效的智能化工具,將助力人力資源工作者和企業(yè)領先同行,實現(xiàn)數(shù)字化升級彎道超車。為客戶服務的道路上沒有終點,為了實現(xiàn)這一目標,未來,e成科技將持續(xù)努力把技術能力與人力資本業(yè)務更好地結合,推出更多滿足HR場景需求的智能化產(chǎn)品與服務,與合作伙伴們一起攜手開啟人力資本數(shù)字化新時代!作者:e成科技AI算法團隊劉洋(掃描二維碼查看文章)場景:智能聊天機器人內(nèi)容:請回答B(yǎng)ERT:HR聊天機器人強大聊天技能背后的秘密AI黑科技:BERT(BidirectionalEncoderRepresentationsfromTransformers)BERT-base\BERT_wwm\ernie模型自然語言處理(NLP)請回答B(yǎng)ERT:HR聊天機器人強大聊天技能背后的秘密聊天機器人等智能應用的出現(xiàn),無疑在人力資本領域掀起了一場聲勢浩大的革命,它的即時性、全天候、智能化回應,不僅提升了候選人/員工的體驗,也大大地提升了HR效率,降低企業(yè)成本。不難想象,未來這些智能化應用將會給我們帶來更多驚喜。在這里,院長不禁要問,你知道這么好用的聊天機器人背后,是什么AI技術在支撐嗎?很多人都說當然是NLP,沒錯,但NLP背后呢?還有一個利器就是:BERT!2018年底到2019年,NLP領域從學術界到工業(yè)界最火熱最強大的模型是什么?那就是BERT!BERT已然成為NLP技術歷史上最重大轉(zhuǎn)折點之一,是NLP技術向加速產(chǎn)業(yè)落地邁進的一大步。e成科技作為HR+AI賽道領跑者,從BERT一經(jīng)發(fā)布就敏銳察覺到了機遇,積極布局相關研究,不斷跟進最近進展、探索相關應用,取得不錯的積累和成果。在這篇文章里,院長將簡單向大家闡述BERT的相關背景、原理、升級,以及e成科技在人力資本領域的一些應用、探索和思考。01背景:什么是BERTBERT(BidirectionalEncoderRepresentationsfromTransformers),是google于2018年底提出的一個預訓練語言模型,它通過無監(jiān)督的方法對大規(guī)模的自然語言的語料進行學習,從中提取出人類語言的內(nèi)在基本規(guī)律,輔助后續(xù)的自然語言理解的相關任務。例如,對于一段文本:e成科技是HR+AI賽道的領跑者,在NLP領域有很多的技術積累。用通俗的語言理解,BERT在學習的是以下兩方面的能力:1.當輸入了“e成科技是一家HR+AI___的領跑者”的時候,模型要學習到填而不是其他的任何的無關詞。2.當輸入了“e成科技是HR+AI賽道的領跑者”的時候,模型要學習到“在NLP領域有很多的技術積累”是最佳的下一句,而不是其他的任何句子。以上兩方面的能力,可以理解為是人類語言的基本規(guī)律,那么當模型學習到這種規(guī)律之后,有BERT的強大能力以BERT模型為基礎,通過?netune的方式,可以在BERT已經(jīng)習得的語言知識的基礎上,1.理解更深入。由于已經(jīng)在大量的自然語言中習得了基本的語言規(guī)律,當模型面臨一個新的自然語言任務的時候,模型可以利用的知識就包含了已經(jīng)習得的海量語言規(guī)律+新任務里的知識,使得模型能夠更加深入新任務所表達的規(guī)律。2.更少的樣本依賴。在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論