6/06/2019

LinkedIn 的求職推薦系統

LinkedIn 使用了一個包含三個因素的標準來描述搜索推薦模型需要實現的目標。 
1.關聯: 搜索結果不僅需要返回給相關的候選人,還需要顯示可能對目標職位感興趣的候選人。

2.智能查詢: 搜索結果不僅應該返回匹配特定條件的候選人,還應該返回相近條件的候選人。例如,搜索機器學習應該返回在技能集中列出資料科學的候選人。 
3.個性化: 通常,為一家公司尋找到理想候選人考慮的因素並不在搜索條件裡。還有些時候,招聘人員也不確定使用什麼標準。個性化搜索結果是任何成功的搜索和推薦體驗的關鍵因素。 
LinkedIn 招聘產品搜索和推薦體驗的第四個關鍵標準不像前三個標準那麼明顯,它關注的是簡單的衡量指標 。為了簡化推薦體驗,LinkedIn 對一系列關鍵指標進行了建模,這些指標是成功招聘的有效指標。例如,站內信閱讀數量似乎是判斷搜索和推薦過程有效性的一個明確指標。從這個角度來看,LinkedIn 將這些資料作為衡量其機器學習演算法優化程度的關鍵指標。... 
LinkedIn Recruiter 最初的搜索和推薦經驗是基於線性回歸模型。雖然線性回歸演算法很容易解釋和調試,但它們在 LinkedIn 等大型資料集中找不到非線性關聯。為了改善這種體驗,LinkedIn 決定使用梯度增強決策樹(GBDT)來將不同的模型組合成更複雜的樹結構。除了更大的假設空間外,GBDT 還具有其他一些優點,如能夠很好地處理特徵共線性、處理不同範圍的特徵以及缺少特徵值等等。 
與線性回歸相比,GBDT 本身提供了一些切實的改進,但也未能解決搜索體驗的一些關鍵挑戰。有一個著名的例子,輸入搜索牙醫的請求,卻返回了具有軟體工程頭銜的候選人,因為搜索模型優先考慮尋找工作的候選人。為了改善這一點,LinkedIn 添加了一系列基於成對優化技術的上下文感知功能。從本質上講,該方法擴展了 GBDT 的兩兩排序目標,以比較相同背景下的候選人,並評估哪個候選人更適合當前的情況。
Multi-armed bandit 翻成「多臂拉霸」比「多武器強盜模型」好

沒有留言:

張貼留言