2019 年,一場組織變革的風暴席卷了阿里、騰訊、百度、京東等國內互聯網公司,在未來的轉型計划中,他們不約而同地提到了一個詞——數據中台,甚至表示將數據中台上升為核心方向,並基於此做了企業組織架構調整。
世間諸事大抵如此,火爆的東西總是容易被模仿、被跟風,所以當“數據中台”的熱風吹起時,我們看到了很多不同類型的公司都聲稱自己可以搭建數據中台或是數據中台的一部分,這其中當然免不了有些是跟風、夠概念。如何區分跟風與實干,數據中台到底是什么?我們對話了 Kyligence 聯合創始人兼 CTO 李揚,請他談談他對數據中台的理解。
在采訪中,李揚坦然表示先前對於國內風靡的數據中台也沒有深刻認識,最近專門做了一些功課,發現數據中台並不是一個全新的概念,2016 年他去都柏林參加了 Hortonworks 舉辦的 Hadoop Summit 活動,當時 Hortonworks CEO RobBearden 帶來的第一個 keynote 分享就是“Data is Transforming the World of Business”,這其實與現在的數據中台有異曲同工之妙。
數據中台起初是個企業管理概念
很多人都知道“中台”這個名詞,在國內最早是由馬雲提出來的。2015 年,馬雲參觀了一家芬蘭游戲公司——Supercell,觀察到 Supercell 每個游戲開發的小團隊都只有六七個人,但是他們開發新游戲的速度特別快,同時放棄游戲也很快。而能夠做到這一切的主要原因是他們把游戲開發過程中用到的一些通用的游戲素材和算法整理出來了,作為工具提供給小團隊使用,同一套工具可以支持多個游戲研發團隊。
馬雲發覺這種方法很好,不久之后,阿里就成立了一個數據中台的團隊,“數據中台”這個名詞也漸漸在國內流行起來,在公開場合中談數據中台的企業也多了起來,原因也很簡單,大家都想往更新、更熱的概念上湊,增強用戶購買欲、推動業務增長。
但李揚認為從數據中台的由來來看,數據中台首先是個企業管理概念,“主要是通過復用數據資產來驅動前線業務的高速創新和改造,如果要是讓我給數據中台下個定義的話,從企業管理層面來看,我認為數據中台是個組織,它提供 3 個方面的東西:共享的數據服務(Data-as-a-Service)、集中治理數據資產(Goverance)、用數據改造業務(Data changes business)。”
如果從企業管理概念出發,理論上來說,不使用 IT 技術也可以完成數據中台。舉個不太恰當的例子,假設我們匯總了紙質報表,進行人工審核,並從中得到了某些趨勢洞察,進而改造了多條前線業務,那么這些紙質報表也可以稱之為“數據中台”。
數據中台的出現是有其時代背景的,如果市場處於空白期,我們根本就不需要數據來輔助決策,當紅利期過后,存量市場變得越來越小,這時企業之間就要比拼誰的服務質量更高、誰的成本更低、人效更高。於是,就出現了之前爆火的信息化,企業從手工作坊式轉型到用電子系統來管理。當企業完成了內部的組織架構調整和信息化之后,並且簡單的、侵略性的市場推廣不再奏效時,才適合聊數字化驅動前線業務的高速創新增長,也正是在這個時間節點才會出現“數據中台”這樣的概念。
數據中台過渡到技術概念
從數據中台的由來看,它是個企業管理概念,為什么很多人在談到“數據中台”的時候都談到技術呢?李揚解釋道:“在信息化時代,負責數據中台的組織的主要職責就是維護數據、並提供數據服務,而他們使用的工具通常是電子信息相關的技術,所以很自然的,數據中台就會從一個企業管理概念過渡到技術概念。”
從技術概念來看,數據中台和另一個平行概念有點相像——數據平台。如果非要在技術概念的層面給數據中台下個定義,數據中台就是以驅動業務為目的的數據平台。對應前文提到的數據中台包含的三個內容,數據平台本身就提供共享的數據服務和集中治理數據資產。
所以數據中台和數據平台的區別就在於是否以數據驅動業務為目的,並不是所有的數據平台都有此目的,例如 Data Lake 是整個數據鏈條中比較靠底層的部分,它不是直接來驅動業務的,而是為了向上上一層的數據倉庫或者更上層提供數據,所以,Data Lake 不能稱之為數據中台,頂多可以稱為數據中台的一部分。
想要實現數據中台需要經歷哪些階段呢?李揚認為關鍵的有三步:第一步,需要有個完整的地方把所有數據串聯起來;第二步,數據需要打通,並被整理好;第三步,數據要能夠驅動業務增長。其中,只有第二步和軟件架構有關系,其它兩步與軟件架構的關聯都不是那么緊密,第一步是信息化,第三步與管理層更緊密。
數據中台中包含了很多系統,如果非要划分一下數據中台的組成部分,李揚認為一種典型的設計可以分為三層,從最底層到最上層分別為:Data Lake、Data Warehouse 和 Data Mart,再往上面就是對接 BI。比如 Kyligence 就提供有下一代的智能數據倉庫產品,處於 Data Mart 或 Data Warehouse 的定位,負責底層大數據與上層 BI 的高速對接,釋放數據生產力,賦能前線業務。在 Kyligence 接觸的客戶中,已經有不少企業內部建立了中台的項目,Kyligence 也被貼上了“中台供應商”參與其中,而我們提供的技術方案實質並沒有因為中台這個概念而發生變化。
談數據中台的企業與數據中台的關系
前文提到現在談數據中台的企業特別多,如果我們把這些企業稍稍分類一下,大致可分為三類:第一類是做大數據營銷、SaaS 企業,第二類是數據庫、數據倉庫、開發平台類企業;第三類是外包咨詢類軟件企業。當然,這些企業中不乏有炒概念的,但除去這些,我們來看看這三類企業和數據中台有哪些聯系?
大數據營銷、SaaS 企業:這類企業主要提供的是共享的數據服務,即 Data-as-a-Service。如果更加直白的來說,它們具備一定的數據能力,是一個工具可以被用來建設數據中台。當他們理解了用戶的業務增長方式,並把這種增長方式與其 SaaS 產品結合起來,那么勉強可以成為數據中台,否則他們永遠提供的是數據服務。
數據庫、數據倉庫、平台開發類企業:數據庫其實是在數據中台更低一層的系統,企業因為信息化的歷史周期不同,會沉淀非常多的數據系統。如果我們認可了前面數據中台從最底層到最上層分別為 Data Lake、Data Warehouse 和 Data Mart,那么數據庫、數據倉庫等企業只能是數據中台的一部分,無法成為一個完整的數據平台。
外包咨詢類企業:與前兩類企業相比,這類企業提供的更多的是一個解決方案,根據客戶定制化需求交付產品。同時也可能是對“數據中台”概念理解最深刻的一類企業。
數據中台是個新概念嗎?
數據中台是個新概念嗎?李揚認為在國內是,但全球來看並不是。早在三年前,Hortonworks 在都柏林舉辦 Hadoop Summit 活動,其 CEO RobBearden 帶來的 keynote 分享“Data is Transforming the World of Business”就與數據中台有異曲同工之妙。由於國外數字化建設進程總體領先,在數年前就提出了數據驅動商務革新的概念,僅大會上提到的案例就覆蓋了風控、醫療、智能汽車等多個領域。現在只是國內恰好發展到這一階段了,數據中台的概念適時被提出來了,它的精妙之處在於指出了我們已不再處於野蠻生長的狀態了,而是需要使用精細化來提高質量、實現下一輪增長。
“數據中台是個很精煉的概念”,李揚這樣解釋數據中台,“數據指出了原動力,中台前台的概念中,前台指的是業務線,而中台就是在支撐業務線,代表數據賦能業務的意思。只用四個字就概括出了數據為核心、平台為支撐、驅動前線商務變革,這三層意思,成功地在業務和技術之間建立了一個溝通的橋梁。”
如果數據中台不再是個新概念,那么它帶來的主要變化是什么?李揚表示:“當一個組織、企業喊出了要建設‘數據中台’的口號,那么最大的變化就在於該組織決心要用數據去改造業務了。”
“數據中台的建設一定會伴隨着企業組織架構調整,這才是真正切到了數據中台的關鍵。”李揚表示。首先,企業組織架構很明顯的變化會是,之前負責數據的部門或團隊可能缺乏話語權,但是建設數據中台之后,數據中台團隊化被動為主動;其次,之前數據團隊的主要工作是項目管理、需求管理等等,現在可能還需要研究業務、數據和模型等;第三,數據中台團隊要從傳統的支撐角色逐步向運營角色轉變。
當人人都在談數據中台時,它會是一個通用的存在嗎?“絕對不會有通用的數據中台,除非兩家公司所有的業務都一模一樣,”李揚認為:“不要試圖把中台做成一個標准的架構,那不現實,因為每家的業務都不一樣。最好的情況是提供一個參考架構,在此基礎上定制出自己的框架,這也是為什么架構師是個腦力活,如果每個架構都是標准化的,那架構師的工作也就不值錢了!