
導語:張溪夢現在Linkedln任職,負責整個商業數據分析。年會上與大家分享他在Linkedln過去將近五年的過程中學習到的一些經驗。
非常感謝!不好意思,稍微晚了一些,我叫張溪夢,現在在Linkedln任職,負責整個商業數據分析,我們的數據分析組織支持所有的與營收有關的業務。今天想跟大家分享一下在Linkedln過去的將近五年的過程中學習到的一些經驗,希望大家多提寶貴意見。
在講數據之前想跟大家簡單介紹一下我自己,我在美國大約工作了十來年,一直在數據分析領域里面,在此之前,我在中國做了兩年醫生,但是因為特別喜歡電腦,特別喜歡計算機所以跑到美國來學了一個商學院,不知道為什么,今天就忽然間變成做大數據了。所以大家如果聽見我講了很多不靠譜的東西希望多多指導。
首先,LinkedIn是世界上最大的職業社交網站。到今天為止,有3.4億用戶,Linkedln的商業模式是2003年就已經確定了,非常非常簡單三個最主要的步驟:第一步,用戶使用和增長產生了大量的數據;第二步,通過這些海量的數據我們又開發了新的產品服務,還有解決方案,為下一輪的增長做更好的準備;第三步,這些新的產品新的服務新的解決方案,進一步刺激了用戶的繼續增長。所以大家可以看到在左邊的,數據是Linkedln業務里面非常非常重要的一環,整個LinkedIn的產品都可以說是從數據里面迭代出來的。舉一個例子,Linkedln在用戶增長上我們有三種不同的產品關注點,第一個就是每個人用的簡歷,第二部分是用戶的社交關系、社會關系,因為我們的創始人Reid Hoffman非常堅信社會關系就是最重要的生產力。第三部分也是我們最近在幾年之內慢慢的引入的,就是關于職業的各種知識,這種產品體現在,比如每天在LinkedIn上如果大家使用的話可以看到很多人在發不同的信息,很多的非常有名的資深專業人士在分享他們的職業發展經驗,這三塊組成了我們的針對于非付費用戶的主要的主打產品。很多人都問我說Linkedln怎么賺錢呢?Linkedln主要的營收主要來自三大塊業務,人力、市場推廣、銷售,人力資源部分為Linkedln創造61%的營收,市場推廣也就是廣告還有現在越來越多的移動端的廣告位Linkedln產生19%的營收。其余的銷售和個人的訂閱服務為Linkedln產生剩余的20%的營收,到今天為止的話大約每年Linkedln的業務營收在接近20億美元區間左右。
下面我講一下我們這個團隊,從我個人來講,我覺得非常幸運能為Linkedln這樣的公司工作,大約四年半以前,我加入Linkedln數據科學團隊,三年半之前轉到新的組開始建立商業分析團隊,當時就我一個人,到今天為止我發展出來了大約70人左右的團隊,明年我們這個團隊會增長到百人左右。想和大家分享的是,我們的團隊增長速度是超過了整體公司的增長速度的,為什么呢?就是因為我們不斷的為不同的部門,通過數據產生了很大的價值,包括銷售、市場推廣、產品、運營、客戶服務、風控,各個不同的部門,直接間接的我們支持5000以上的Linkedln內部的員工。首先一個數據基礎設施,其次商業智能也就是報表開發,再次數據科學和數據挖掘以及統計分析,加上若干分析的小組還有另外一個就是軟件的研發。為什么我們要把五個部門完全做在一個組織里邊,我下面就跟大家分享一下在過去的四年中我們學到了一個最重要的知識就是叫做端對端的數據分析。講數據之前我想跟大家先分享一下什么是分析,因為如果我們只有數據不做分析的話基本上沒有任何價值,數據分析其實很簡單就是了解歷史預測未來,以前李世民講過一句話叫做以史為鏡可以知興替,以人為鏡可以明得失,以銅為鏡可以正衣冠,分析就是這樣理解歷史。比如說過去發生了什么事情為什么發生了?,F在正在發生什么,未來會發生什么,前面這四步就是他們的關于用歷史數據來預測未來但是只預測未來沒有任何的就是相關的剩余價值的產生,我們必須在預測未來以后能夠改變未來。真正的改變未來,這個過程就是我們產生很大的價值的一個過程。講完了分析咱們看一看什么是大數據,實際上大部分人看到大數據是海平面以上的冰山,記得以前大約在三四個月以前我回過一次國,其中有幾個朋友問我大數據是不是就是欺詐純忽悠,基本沒有看到什么價值。實際上大部分人看到大數據還不是海平面上面的這一塊大部分人看到的大數據是下面的,比如說LinkedIn來說,我們LinkedIn的數據源是包含了全世界基本上很多公司的信息。Salesforce這個是我們的CRM的一個系統,然后我們還有內部的數據倉庫,等等。在這張圖上,我還可以再往上放100個以上在數據源的圖標。它不是一個虛構的,這是事實。大家可以看到,這么雜亂那么巨大,但是復雜卻并沒有表現直接商業價值。真正的大家唯一感興趣不是這個數據分析的大冰川,大家希望得到是冰茶、冰激凌、冰水。也就是分析的結果!
下面來講講我們的商業分析部門的基本戰略和原則。 大約在四年半之前我加入Linkedln的時候,每天我基本上工作到每天一點到晚上一兩點甚至四點鐘,在第一年大約完成了500個左右不同的大的小的項目包括建模、報表,用數據回答問題,但是我們發現這個過程是非常緩慢和冗長的,但是當時我作為一個內部員工來說我支持大約200個內部員工,大家想一想一年做500個項目200個員工需要數據平均每年每個人只會被回答兩次,這個不是數據驅動,甚至可以說完全非數據驅動,所以說我們建立了一個新的數據發展戰略,這套戰略的在三年半之前設好,然后一步步實施。
第一步就是打造一個非常堅實的數據分析平臺和基礎,這一步是最重要的一環。
第二步把整個的數據分析解決方案化,也就是我們內部有一個口號就是讓所有的員工都能做到數據輔助決策驅動。
第三步我們不但要幫助內部的銷售市場產品經理各種不同的人員我們還要把我們的數據分析做成數據產品讓所有Linkedln的用戶也能得到好處。
第四步我們發現我們要建造大量的數據分析的產品讓他們之間產生很多的迭代。這也是我們講的一個數據分析產品的生態圈的構建。
當時我們設置的這個是四步在今天來說的話我們基本上完成了前三步,現在正在建造第四步。這個金字塔理論, 我每次演講我都要講,不是實在沒什么事可說而反復重復,這是我在過去的十年的職業生涯里做數據分析中學到看到最重要的一個結構。
我們來講講第個發展周期,也是其中最重要的一環。建造一個有效的基礎。
傳統的數據分析五個層面,第一步數據存儲也就是數據倉庫ETL等等這些系統的建造,第二步就是說傳統企業它需要做各種不同的數據分析比如說回答內部的市場推廣人員產品經理還有銷售人員各種各樣的問題,用數據來回答他們的問題,然后你再上面一步的話就是報表BI。 深度分析的話一般來說在現在為止分成三個不同的流派,第一個流派就是總傳統的統計的流派,比如說銀行、保險、零售在美國的話已經發展了接近20年甚至超過30年了一個時間段,而且非常成熟就是用來預測比如說哪個客戶會買哪個客戶會買多少,他的風險是多少這是第一個流派。第二個流派就是管理咨詢,他們生產了很多的新的方法論。在過去的起碼幾十年之內,特別是戰后,就是比如說這個戰略性分析、策略性分析、競爭分析這個是管理咨詢公司他們非常注重強調的。第三個流派也就是最近新興的一個流派,即不是傳統的統計方法,而是用大規模的迭代運算或用機器來模擬。比如說社交網絡模型背后就要很多迭代的算法。我想跟大家講一下,首先,這個傳統5層結構忽略的最重要的一點就是業務基礎。 分析師或者數據科學家他必須要對產品對客戶對業務有一個非常深刻的理解,如果他對業務不理解的話很難做成有價值的分析這是第一步,就是必須要明白我們自己的客戶和我們的產品,第二步在生產數據之前我們必須要做正確的數據標記和數據采集,如果沒有正確的數據采集和數據標記,收集來的東西也就不會有太多的價值。 第三步,就是說好的數據分析師數據科學家他必須對硬件軟件各種架構有非常深刻的理解,同時他能很有效的利用各種的工具這是我們要求我們內部的員工做到,再上一步是傳統的分析師要做的工作,比如說做報表做分析,然后建模。 在Linkedln商業分析部有的一個不成文的規定,或者說是一個死的規定,生產出來的分析結果我們必須要確認分析的結果具有可執行性和可決策性。當然最后的目的不是為了做決策而做決策,而決策是要為了產生價值而服務。這就是我們內部一個金字塔的一個結構。
第二環:“金字塔”到“菱形”的轉變。
以前在大約四年之前我們做了一個內部的調研,我們問每一個內部數據科學家我是當時的可能是第14個Linkedln的數據科學家。我們問了所有的做數據的Linkedln分析師和數據科學家。問你大部分的時間花在哪里,所有的人的回答是非常非常的一致,大約是85%和95%的時間花在金字塔的最下面的四層也就是說產品理解、數據標記、數據存儲加上一些分析。但是大家都認為真正的價值是在決策這一塊,改變才產生更多的價值,如果我們的時間全花在了數據的清洗和數據的整理上那么在很多時候不能為業務帶來大規模的價值。 如何解決呢?我們想像出來一個新的模型,就是把金字塔不斷變成一個菱形的結構的一個模式,這個模式并不表示我們不做以下的那些臟活累活。 這個模型最重要的一點就是我們要把大量的科技的技術不斷的把金字塔的底部收縮和做小,做小的同時讓人有更多的時間做更重要的工作,舉一個例子大家可能剛才記得我們剛才說的第一年九個月,如果我今天跟大家說每天我們內部的分析系統大約有三千個員工平均每天回答十次以上的問題,那么它這個系統每天的工作已經超過了一年工作的幾十甚至一百多倍,這就是我們今天在Linkedln內部為什么它能夠大幅度的用數據來驅動業務的過程。很多人可能不太相信,大約需要一兩個月的工作,今天來說在Linkedln內部也許只需要幾十秒鐘。一會兒我給大家舉個例子我們怎么做到的。
第三個重要環節:就是數據產品化的過程。
比如說我們內部的話我們產生很多比如說針對銷售針對市場推廣很多的分析解決方案今天來說的話已經變成Linkedln的一個新的業務,這個功能就是我們在過去三年半左右的一個時間里邊產生了一個叫魔術師的一個系統,我們的工程和產品團隊采取了5%的功能放在網站上,目前已經開始銷售了。在今天為止的話大約1%的營收來自這個新產品線。
第四環:數據產品化之后的話我們要建立什么呢,數據產品的生態圈,我們發現當開發第一個數據產品的時候需要花百分之百的努力,第二個第三個第四個,會相對來說越來越少,但它的價值會產生越來越多我給大家舉個例子用明顯的數據舉個例子。
好咱們講一講社交網絡吧,大家認為社交網絡純粹就是忽悠的請舉一下手,沒有人認為社交網絡是忽悠那就太好了。(笑)。過去Linkedln從2009年 到今天我們營收大約增長了不到20倍,這個過程大家可以看到是從2010年開始的是成倍的增長而且速度慢慢在加快,其中一個原因就是因為我們在大量運用Linkedln內部的基于職業的社交關系數據驅動營收。 大家可以看到這個社交網絡圖譜。在這個里面有綠色、紫色還有中間的淺粉色,如果我跟大家說這個模型只用了一個變量就是人與人之間的關系,紫色的就是中間的是他們的CEO,紫色下面的就是他們的運維和HR大家相信不相信這是真的,再下一步我們通過這張社交圖我們迭代出來他們內部可能的組織結構,當我們明白了一個公司的組織結構之后話我們就開始做下一個產品,數據驅動的銷售方案,傳統的銷售人員會問傳統的幾個問題,很簡單,第一個問題我需要向哪個公司銷售Linkedln的產品,它會花多少錢?我得到一個名單400個公司到底哪個公司價值多少錢是第一個問題。 第二個問題這個公司里誰是決策人,誰能讓我把這個產品銷售給他。第三步,這個決策人我知道了如何我才能和他接洽呢?比如說我在LinkedIn認識的人中幾百個人都認識這個主管,誰是和他關系最近的人?第四個問題,我們Linkedln內部以前的話我們大約200個銷售人員,今天的話大約幾千人以上,哪個銷售員工和這個客戶和這個公司的關系最近?第五步我們到了那里講一個什么樣的故事? 以往的話需要準備這樣的數據,大家拍腦子、拍胸脯、拍大腿、拍鍵盤,也大約得拍兩個星期到八個星期才能準備一個分析,今天來說再Linkedln的話我們可以很簡單,就是用Linkedln的數據我們知道這個公司的人員增長是多少,流失率是多少他招的人從哪兒來他的人都到哪里去了,同時我們通過分析Linkedln職業網絡,找到真正的決策人。我們發現真正買Linkedln的產品的人不是他們那邊的HR的老大,一般來說的話是他的一線的經理同時還在用Linkedln的人,這個是我們當時增加了好幾倍轉化率的一個原因。下一步的話我們分析整個的Linkedln內部的銷售人員誰和這個人的關系最近,誰和這個人通過他的介紹的關系來和這個人進行接洽,這是另外一個利用社交網絡的關系,最后一步的話就是把我剛才說的所有的東西,公司、接洽的人還有它的社交關系所有的東西通過一個按鈕做成一個自動化的,但是這并不是結束。在今天來說的話,我們已經把所有的這個按鈕都去掉,而把它演變成了一個數據驅動的信息服務。比如說給大家舉個例子,假設公司A的HR的主管離職,那么我們立刻會產生兩條數據驅動信息,發給我們的客戶經理,通知他這個客戶離職以后那么他這個賬戶可能會流失,第二步的話就是這個客戶離職,但加入新的公司后。他又給Linkedln帶來新的潛在客戶。所以說他同時會驅動兩條數據,一部分是減低客戶的流失,另外一個是增加了用戶的增長。這就是一個如何用數據來驅動銷售的例子。大家仔細看一看技術細節,(見圖),實際上整個的過程就是把數據的金字塔從巨大無比變成非常微小的過程。 就是大數據最后變成小數據的過程。
這就是今天我給大家分享的主要的部分,因為時間的關系,我只想說最后一點,也是數據分析中最重要的一點。我覺得不是技術力,我覺得最重要的一點是人的想象力,和他是不是對這個東西有信念。正如一個很老的美國電影《星球大戰》,當中提到的“You would fail if you think it is impossible.” 實際上數據分析本身來說產生的價值的大小完全取決于我們有沒有這種信念和想象力,這種想象力決定了最后的價值的產生,謝謝大家!
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25