7/11/2020

如何打造一個「頂級數據科學團隊」?

TechOrange,如何打造一個「頂級數據科學團隊」? Linkedin:狂用 A/B Test 就對了!,2020/07/09 (本文經合作夥伴 大數據文摘 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈數據科學家”或許不再性感,但“數據團隊”的產業化才剛開始 〉。)
那麼到底如何讓數據的價值最大化呢?從團隊運作方式、商業影響力設定和社會責任等角度,許亞給出了 LinkedIn 的答案:「嵌入式工作,中心化管理」,數據科學團隊更加「專業化」、「工程化」。 
和多數網路服務公司一樣,LinkedIn 的數據科學團隊規模也在近幾年飛速增長。許亞表示,僅是近兩年來,LinkedIn 的數據團隊擴張了近一倍,從 150 人增加到目前的 300 多人。 
許亞提到的數據團隊是指 LinkedIn 中心化的數據科學部門。 如果用一句話來概括 LinkedIn 的中心數據科學團隊的運作方式,那就是「嵌入式工作,中心化管理」。 
和國內不少互聯網公司將數據分析師歸屬於業務 BU、向業務主管匯報不同,LinkedIn 的數據科學團隊成員由許亞的中心部門統籌。雖然在項目工作上,數據科學家們依然會在工位分佈和職能上與業務部門緊密聯繫,但是從職級從屬上,都直接向許亞匯報,不同領域的數據科學家在工作中會有交集,還會一起開會。...
LinkedIn 將數據團隊做明確分工:工程、演算法、業務 
在人員構成上,和十年前相比,LinkedIn 的數據團隊也更加專業化了,底層架構人員也從數據科學團隊分離了出來。 
目前 LinkedIn 的數據科學團隊也根據員工不同的專業領域設立了三個工作方向: 
1. 工程專家 :可以很有效的建立起數據管道(data pipeline)和數據流(data flow) 
2. 演算專家 :在預測、算法領域的技術咖 
3. 業務專家 :有很強的業務屬性,將數據見解和公司戰略結合起來 
由於工作側重不同,在管理的過程中也會有意的區分這三類數據科學家,並且保持各類員工的競爭力。... 
許亞表示,兩年前她接手 LinkedIn 數據團隊後做的第一件事就是擬定了團隊成功的三要素。雖然數據團隊的價值有時候很難量化,但是有三個指標可以作為探討的基礎。在數據團隊內部不同組可能會有不同的側重,但對大部分組來說這三個因素都很重要。 
1. 數據易得性和工作效率 
數據易得性,指的是當外界需要數據的時候,獲得這些數據的難易程度; 工作效率 ,指的是一個人的工作是否可以提升整個團隊的工作效率。 
許亞表示,數據科學家之前被人詬病過於追求新鮮感,喜歡挑戰高難度問題,但做完 MVP(Minimum Viable Product)後沒有維護迭代的習慣,永遠都在追逐下一個新難題。其實數據團隊擁有許多數據資源,比如原始數據,指標數據,數據模型,數據可視化。 
當外界需要這些資源時,如何保證這些需求能夠隨時被滿足? 軟體開發有一系列衡量數據獲取難易程度的指標,比如 SLA(Service-Level Agreement)的達標率就是一個很好的量化指標。... 
2. 戰略化思維 
戰略化思維,指的是數據分析結果對公司重要戰略性決策是否有指導作用。 
許亞的數據團隊和公司很多高層會打交道,因為他們團隊有一個很重要的職責就是透過數據來確保公司重要決策的大方向是準確的。比如他們需要了解用戶在疫情期間是如何使用 LinkedIn 服務,如何通過 LinkedIn 的產品獲取價值的。...
3. 直接商業影響力 
直接商業影響力(Direct Business Impact),指的是工作成果對公司商業目標的直接影響力。 
每個部門的工作開展是和公司要達到的大目標息息相關的,LinkedIn 有公司層面的四個核心指標, 數據部門在計劃工作的時候,需要考慮如何對公司的商業目標產生積極影響。...

產品/功能推出後,LinkedIn 靠 A/B Test 分析使用者體驗 
我們都知道,企業在做產品/功能測試時一般都會用到 A/B test ,即分為兩組用戶,一組對照組,一組實驗組。對照組採用已有的產品或功能,實驗組採用新功能。要做的是找到他們的不同反應,並以此確定哪個版本更好。 
A/B test 能對大範圍的事情進行測試,例如亞馬遜對個性化推薦進行 A/B test 後,發現個推顯著提升收益;谷歌在對搜索廣告進行排名時也用到了 A/B test。... 
LinkedIn 做為社群的一份子,如何確保平台公平公正? 
在許亞看來,維護公平是一個很有挑戰的課題,因為你很難明確定義公平。 
「當我們在說公平的時候,我們在說公平的機會?公平的結果?還是公平的待遇?我之前看過一個有意思的問題,給三個不同高矮的人提供凳子,在公平原則下,你該給他們提供同樣高度的凳子?還是提供不同高度的凳子讓他們坐上去之後一樣高呢?我很難說這個問題有一個絕對正確的答案。」 
LinkedIn 對公平的定義是,擁有同等才能的兩個人,應該獲得同等的職業機會, 而不受到種族或者自身人脈的影響 。過去兩年時間 LinkedIn 做了很多努力來解決公平問題,取得了不錯的成果。... 
LinkedIn 守則:「取之數據,用之數據」 
最後,從整個公司文化上面來說,許亞透露,除了達到數據保護條例的一些要求,LinkedIn 也用到了一些很前端的技術,來確保用戶的隱私不被洩露。另外,LinkedIn 也十分重視在數據分享方面的問題,並表示會對此加強技術防護。

沒有留言:

張貼留言