什么是藍鯨
藍鯨智雲,簡稱藍鯨,是騰訊游戲運營部“騰訊智營”下的一個子品牌。它是一套基於PaaS的技術解決方案,提供了完善的前后台開發框架、調度引擎、公共組件等模塊,幫助業務的產品和技術人員快速構建低成本、免運維的支撐工具和運營系統;是騰訊游戲運營部沉淀多年的技術運營支撐體系,承擔着數百款業務線上運營的使命。
騰訊藍鯨智雲(Tencent BlueKing),簡稱藍鯨,是騰訊互動娛樂事業群(Interactive Entertainment Group
,簡稱IEG
)自研自用的一套用於構建企業研發運營一體化體系的PaaS開發框架,提供了aPaaS(DevOps流水線、運行環境托管、前后台框架)和iPaaS(持續集成、CMDB、作業平台、容器管理、計算平台、AI等原子平台)等模塊,幫助企業技術人員快速構建基礎運營PaaS。
傳統的Linux等單機操作系統已發展數十年,隨着雲時代的到來,企業所需資源數暴增,操作節點(物理或虛擬服務器及容器)數量普遍達到數千個,大型互聯網公司甚至達到百萬級別,混合雲模式成為常態,雖然IaaS供應商的出現從一定程度上解決了資源切割調度問題,但並未很好的解決資源與應用的融合,企業需要一種介於IaaS與應用(SaaS)之間的層級,用於屏蔽及控制IaaS,快速開發及托管SaaS,我們將其稱之為基礎PaaS層,並着重發展用於研發及托管企業內技術運營類SaaS的基礎運營PaaS,並將其作為區別於傳統OS的下一代企業級分布式運營操作系統。
企業IT應用的全生命周期可划分為研發、運維、運營三段,在各行業進行互聯網化轉型的過程中,融入敏捷思維,即形成持續集成、持續部署、持續運營的概念(CI-CD-CO)。
為降低轉型成本,不以增加人力數量為轉型前提,騰訊IEG以運維團隊作為轉型起點,充分利用這一群體低價值重復性工作量占比高的特點,從CD領域切入,以PaaS技術進行運維自動化領域的煙囪治理,形成運維PaaS體系。將自動化所釋放的人力資源,轉型為運維開發團隊,利用PaaS的自增長屬性,將運維PaaS逐步向CI及CO拓展,最終完成企業級研發-運維-運營基礎PaaS構建,落地企業研發運營一體化。
目前,藍鯨智雲團隊秉承着開放共贏的態度,正逐漸開放其自主研發的一套具有多項探索式創新的體系—藍鯨智雲軟件體系。該套體系不僅提供了基礎運維(發布變更、監控處理、數值調整、數據提取等)的無人值守服務,而且還給運維人員提供了解決方案(工具),並隨時調整,避免重復性的操作服務。而運維人員則可以做些“用戶體驗優化”和“運營決策輔助”等運維增值工作,並且可以通過藍鯨智雲提供的集成平台,低成本的學習DevOps開發技能,進一步提升自己的能力,加速轉型。此外,這套體系還可以運行輕應用、管理類、及職能類應用,是個全方位的運維、管理平台。
藍鯨智雲,運維領域的一張新名片,正在多個層次、多個領域嶄露着頭角,逐漸釋放着自身特有的價值,引領着行業新標桿,開創了運維體系2.0的新局面。
成長歷程
2021年
- 4月社區版V6.0.3攜手容器管理平台正式發布
- 5月社區版產品使用視頻教程上線
- 6月持續集成套餐(藍盾)上線
- 6月問答社區全新改版
- 7月2021年線上運維日之運維人的成長故事
- 7月騰訊IEG研運平台通過首批IOMM研運數字化工具流程整合成熟度卓越級評估
- 7月可視化開發平台上線
2020年
- 1月社區版V5.1全新上線
- 2月社區V5.1推新SaaS:ITSM(流程服務)
- 3月V5.1mini體驗版支持容器化部署
- 7月第五屆「7·24運維日」線上特別活動
- 8月Gartner2020最新研究報告,藍鯨獲評中國AIOps代表!
- 10月第二次校企合作藍鯨高校SaaS開發培訓課程開始
- 10月騰訊藍盾平台BK-CI獲得本年度OSCAR開源治理評估結果的可信開源項目
- 10月騰訊IEG技術運營部藍鯨產品中心技術副總監劉章雄獲得年度開源人物獎項
- 10月第五屆運維技術沙龍圓滿成功
- 11月社區版6.0開放下載
- 12月社區版6.0首次系列直播公開課
2019年
- 4月正式宣布開源“PaaS平台”和“標准運維”SaaS
- 7月藍鯨合作伙伴嘉為科技獲得騰訊投資
- 7月第四屆「7·24運維日」技術沙龍
- 9月騰訊藍鯨智雲開源,正式登陸碼雲Gitee
- 10月與西安理工大學建立藍鯨高校SaaS開發培訓課程
- 12月騰訊藍鯨智雲榮獲「2019年最受歡迎中國開源軟件」
2018年
- 4月新版藍鯨配置平台開源
- 4月社區版4.0正式開放下載
- 7月第三屆「7·24運維日」技術沙龍
- 8月社區版4.1正式開放下載
- 8月運維開發必修課-Python運維開發實戰上線
- 10月社區發布標准運維和CICDKit
- 11月國內首家通過工信部的研發運營一體化(DevOps)能力4級認證
2017年
- 7月第二屆「7·24運維日」技術沙龍
2016年
- 3月藍鯨微信服務號上線
- 8月社區版V1.0正式上線
- 8月藍鯨榮獲智能化商標(藍鯨智雲)
- 12月社區版V2.0正式上線
- 12月藍鯨智雲配置平台開源
2015年
- 1月藍鯨校園版上線
2014年
- 1月騰訊游戲運營部50%以上運維使用藍鯨SaaS
2012年
- 1月藍鯨首個版本上線
- 2月藍鯨SaaS框架誕生
核心優勢
- PaaS理念
軟件的整個設計是基於PaaS理念,非侵入式地與企業已有的的系統結合,支持橫向擴展。
- 原子平台
底層由各原子平台組成,各平台專注於自身的功能建設,以便上層的場景類SaaS可以靈活、高效研發定制化系統。
- 開放生態
不僅提供了豐富的API,而且在不斷提升開放的力度,官方核心產品提供了插件式/二次開發(開源項目)的模式,促進運維生態發展。
- 企業賦能
通過線上線下的公開課、認證考試、運維開發挑戰賽等多種模式,賦能企業,提升企業技術能力,讓企業員工具備自建系統的能力。
體系架構
騰訊藍鯨智雲體系由原子平台和通用的一級SaaS服務組成,平台包括管控平台、配置平台、作業平台、PaaS平台等,通用SaaS包括節點管理、標准運維、日志平台、監控平台、故障自愈等,為各種雲(公有雲、私有雲、混合雲)的用戶提供不同場景、不同需求的一站式技術運營解決方案。
騰訊藍鯨智雲體系依托企業級SOA、集成等理念,運用Docker等最先進的雲技術構建起了全新的運維模式,致力於以“原子服務集成”和“低成本工具構建”的方式落地DevOps,幫助運維快速實現“基礎服務無人值守”及“增值服務”,並進一步通過DevOps的落地實現企業更全面和可持續的效率提升。
三大領域
- CI領域 - 面向研發的持續集成能力
一站式DevOps研發平台,從業務安全出發,貫穿產品研發、測試和運營的全生命周期;助力業務平滑過渡到敏捷研發模式,打造一站式研發運維體系,持續快速交付高質量的產品。
- CD領域 - 面向異構業務的海量自動化運維的持續部署能力
騰訊游戲業務的復雜性和來自全球不同開發商業務之間的異構性,使得支撐團隊必須提供一套完全松耦合於業務的海量運維管控與持續部署的解決方案。騰訊藍鯨智雲自主研發的管控平台,支持全球20W+主機節點的跨雲管控,再配合配置管理、作業執行、容器管理、標准運維、故障自愈等能力,極大提升了運維自動化程度,進一步為業務的持續部署能力保駕護航。
- CO領域 - 提升業務體驗、輔助運營決策的持續運營能力
企業在不斷發展的過程中,會催生出各類業務,每一款業務都值得去精細化運營,騰訊藍鯨通過運維大數據平台的建設,讓運維人員可以對業務大數據進行采集、清洗、分析、展示等,實現自動開合服,優化網絡性能,預警系統故障等,不斷提升業務體驗,輔助運營決策。
版本類別
騰訊藍鯨智雲有2個主要版本線:社區版和企業版,根據軟件包的功能和技術服務提供方的不同,細分為軟件基礎包、軟件增強包、合作商軟件包。各版本的描述和產品內容詳見下表:
版本類別 | 詳細描述 |
---|---|
社區版 | 可以從騰訊藍鯨智雲官方網站下載,並免費使用,用戶以運維社區的個人/企業為主,通過社區力量,協助騰訊藍鯨更好地驗證產品的功能和性能。目前該版本的軟件由基礎平台(管控平台、配置平台、作業平台、PaaS平台)和官方提供的SaaS(節點管理、日志平台、監控平台、故障自愈、標准運維等)組成,且PaaS平台上可運行基於騰訊藍鯨統一開發框架研發的各種場景SaaS。 |
企業版 | 企業版是付費軟件,通過購買License的方式永久授權。用戶以企業客戶為主。其軟件產品在功能、性能、服務等方面均優於社區版。藍鯨的“企業版技術合作伙伴”為軟件銷售和實施的授權方。 |
版本功能差異
類別 | 社區版 | 軟件基礎包 | 軟件增強包 | 合作商軟件包 |
---|---|---|---|---|
管控平台 | √ | √ | -- | -- |
配置平台 | √ | √ | -- | -- |
作業平台 | √ | √ | -- | -- |
PaaS平台 | √ | √ | -- | -- |
故障自愈 | √ | √ | -- | -- |
標准運維 | √ | √ | -- | -- |
監控平台 | √ | √ | -- | -- |
日志平台 | √ | √ | -- | -- |
流程服務(原ITSM) | √ | √ | -- | -- |
容器管理平台 | -- | -- | √ | -- |
持續集成平台(藍盾) | -- | -- | √ | -- |
網絡管理 | -- | -- | -- | √ |
版本服務差異
類別 | 社區版 | 企業版軟件基礎包 | 企業版軟件增強包 |
---|---|---|---|
是否收費 | 免費 | License永久授權 | License永久授權 |
服務時間 | 工作日9:30-12:00,14:00-18:00 在線客服 | 7*8h | 工作日9:30-12:00,14:00-18:00 |
培訓服務 | 免費在線培訓 | 企業內部培訓 | 企業內部培訓 |
通用SaaS | 基礎功能SaaS | 基礎功能SaaS | 基礎功能SaaS |
高可用方案 | 無 | 支持 | 支持 |
API | 無限制(6.0.3+) | 無限制 | 無限制 |
監控保障 | 基礎監控服務 | 企業標准監控服務 | 企業標准監控服務 |
官方技術保障 | 通用技術支持 | 專家技術支持 | 專家技術支持 |
企業商品購買
原子平台
- 管控平台
藍鯨管控平台是藍鯨體系的底層管控系統,是上層運維服務體系與底層IaaS的連接器,為上層提供指令、文件、數據的通道,支持直連模式、代理模式以及為達到最優連接指定級聯路由的模式。管控平台是典型的兩層分布式C/S結構,主要包含智能的藍鯨Agent、提供各種服務的Server以及ZooKeeper、Redis、MySQL等周邊保障模塊。其中藍鯨Agent是部署在業務機器上的程序,每台業務機器僅部署一個藍鯨Agent,其他模塊部署無具體要求,用戶可以單獨部署,也可以混合部署。
在整個藍鯨體系中,管控平台無需直面用戶,但其在體系中卻是不可或缺的,它為其他平台模塊提供了人機交互的通道與能力。管控平台主要提供了三種類型的服務能力:文件分發傳輸能力、命令實時執行與反饋的能力、大數據采集與傳輸的能力。
- 配置平台
藍鯨配置平台(CC)是一款面向應用的CMDB,在ITIL體系里,配置管理數據庫(CMDB)是構建其它流程的基礎,配置平台作為面向業務層面的CMDB,為藍鯨體系的其它平台提供了各種運維場景的配置數據服務,存儲與管理企業IT架構中設備的各種配置信息,它與所有服務支持和服務交付流程都緊密相聯,支持這些流程的運轉、發揮配置信息的價值,同時依賴於相關流程保證數據的准確性。配置平台提供的主要功能有主機管理、業務拓撲、業務管理、資源池管理、自定義屬性管理、操作審計等。
- 作業平台
藍鯨作業平台(Job)是一套底層基於管控之上的基礎運維操作平台,並且具備海量的並發處理能力,除了支持腳本執行、文件拉取/分發、定時執行等一系列可實現的基礎運維場景以外,還運用流程化的理念很好的將零碎的單個任務組裝成一個作業流程。同時,可通過平台提供的API實現對任意作業的調用、查看等操作,與其它平台或系統聯動,實現調度自動化。作業平台的主要功能有:快速傳輸文件、web化腳本管理、支持批量高效執行、流程式管理,一切皆“作業”等。
- PaaS平台
藍鯨PaaS平台是一個開放的平台,又稱藍鯨PaaS,讓用戶可以簡單、快速地創建、部署和管理應用,他提供了完善的前后台開發框架、服務總線(ESB)、調度引擎、公共組件等模塊,幫助用戶快速、低成本、免運維地構建支撐工具和運營系統。PaaS平台為一個應用從創建到部署,再到后續的維護管理提供了完善的自助化和自動化服務,如日志查詢、監控告警等,從而使用戶可以將全部精力投入到應用的開發之中。PaaS平台的主要功能有:支持多語言的開發框架/樣例、免運維托管、SaaS運營數據可視化、企業服務總線(API Gateway)、可拖拽的前端服務(MagicBox)等。
- 容器管理平台
藍鯨容器管理平台是一個用於支撐業務容器化及微服務化的平台,是一種DevOps實踐。藍鯨容器管理平台提供了持續集成、持續構建、持續部署的具體實現,並在此基礎上,構建了分布式配置管理、服務發現、倉庫管理(兼容JFrog與docker hub)、安全健康檢查、網絡配置服務等主要功能。藍鯨容器管理平台會以SaaS服務的形式提供交互,用戶只需通過頁面點擊就能完成業務鏡像的構建、發布等操作。
- 移動平台
藍鯨移動平台借助微信公眾號解決方案,整合藍鯨的功能特性,助力運維最大化提高工作效率和便捷性,已支持用戶在手機端管理/執行作業任務、創建/修改定時任務等操作,真正做到“工作・生活,彈指一瞬間”。
場景SaaS
- 節點管理
一款設計用於在瀏覽器端進行后台服務管理的的應用。目前的版本中,支持gse_agent的安裝與升級,滿足用戶直觀簡便的在受控主機上部署Agent及管理GSE插件。
- 日志平台
藍鯨智雲日志平台是為了解決運維場景中查詢日志難的問題而推出的一款SaaS,基於業界主流的全文檢索引擎,通過藍鯨智雲的專屬Agent進行日志采集,無需登錄各台機器,集中管理所有日志。
- 監控平台
監控平台是一款針對主機和互聯網應用進行監控的產品,監控服務可用於收集主機資源(系統性能、組件服務、數據庫、日志等)的監控指標,探測互聯網應用服務的可用性,並對指標進行告警設置。
- 故障自愈
故障自愈是一款實現服務器故障自動處理的解決方案,提升企業服務可用性和降低故障處理的人力投入。通過自動化處理來節省人力投入,通過預定的恢復流程讓恢復過程更可靠,通過並行分析達到更快的故障定位和恢復,最終減少業務損失的風險。
- 標准運維
標准運維是通過一套成熟穩定的任務調度引擎,把在多系統間的工作整合到一個流程,助力運維實現跨系統調度自動化的SaaS應用。
軟件包類別
軟件包類別 | 詳細描述 |
---|---|
基礎包 | 基礎包是企業內落地自動化運維解決方案的基礎軟件,包含基礎平台(管控平台、配置平台、作業平台、PaaS平台)和官方提供的SaaS(如:節點管理、監控平台、故障自愈、標准運維、日志平台、流程服務(原ITSM)等)。 |
增強包 | 增強包是更高級的運維產品的集合,必須基於基礎包一起使用。如:容器管理平台、持續集成平台等,目前已對外開源,藍鯨官方僅提供開源社區的更新服務。合作伙伴可根據企業需求,自行從開源社區獲取源代碼包提供給客戶使用。 |
合作商軟件包 | 合作商軟件包是由騰訊藍鯨合作伙伴提供的運維解決方案場景類的產品,如網絡管理等,該類產品可在已有基礎包的前提下,以“插件”的方式,面向用戶提供更多功能場景。由於開發者/技術服務提供方均非騰訊藍鯨團隊,涉及到合作、銷售、推廣等事宜需要與軟件提供方商榷。 |
交流渠道
群名 | QQ號 | 用途 |
---|---|---|
藍鯨社區版交流1群 | 495299374 | 社區問題綜合群,處理社區版的通用類問題,部署、開發、咨詢等 |
運維開發群 | 878501914 | SaaS開發、標准運維、PaaS平台等開源項目交流群 |
CMDB開源群 | 305496802 | 藍鯨配置平台開源項目交流群 |
bk-ci技術交流區 | 744672165 | 藍鯨bk-ci開源項目交流分享群 |
標准運維社區用戶群 | 861919432 | 藍鯨標准運維社區用戶交流群 |
交流論壇
能力認證
為了保障騰訊藍鯨智雲軟件在企業內快速落地,得到穩定有效的運行,騰訊藍鯨智雲在對外輸出產品的同時,對給企業提供服務的人員按照其具備的能力進行有效的考核與認證。此類認證考試統稱為“騰訊藍鯨智雲工程師系列認證”,是針對運維自動化和運維開發領域的專業人員,在中國信息通信技術研究院(中國信通院)的指導下,由雲計算開源產業聯盟和騰訊公司共同頒發的資格證書。
在藍鯨智雲認證系統進行報名,考生按照指引報名即可。客戶可以前往"認證動態"(https://bk.tencent.com/training_exam/)查詢服務工程師的能力,也可以主動要求提供服務的工程師出示證書。
- 騰訊藍鯨智雲-運維自動化工程師(BKOS)認證
Tencent Blueking Operations Specialist(BKOS)
- 騰訊藍鯨智雲-運維自動化工程師(BKOS)認證-服務認證
服務認證需要工程師通過全部考試科目(理論基礎、軟件部署、產品使用),持有此類證書的運維自動化工程師才可以給客戶提供整體的服務,包括軟件部署、維護、接入以及SaaS開發。
- 騰訊藍鯨智雲-運維自動化工程師(BKOS)認證-使用認證
使用認證需要工程師通過2個考試科目(理論基礎、產品使用),持有此類證書的運維自動化工程師僅可以給客戶提供軟件使用的培訓和指導服務,包括企業內部熟練接入各平台產品,及使用官方SaaS滿足自有場景。
說明:本指南中若提到運維自動化工程師的持證人員,無特殊備注,則默認為“服務認證”。
- 騰訊藍鯨智雲-運維開發工程師(BKDS)認證
Tencent Blueking Development Specialist(BKDS)
持證人將具備根據企業場景,快速開發運營/運維系統的能力,通過工具文化,提高企業辦公效率。
說明:騰訊藍鯨專家技術支持服務,僅開放給通過認證的人員,各合作伙伴由持證人發起客戶問題的咨詢與溝通。獲得認證的工程師人數越多,則代表該合作伙伴的技能指數越高。
客戶案例
藍鯨寄語
運維行業發展階段有:手工操作 > 腳本自動化 > WEB自動化 > 調度自動化 > 智能化運維,目前很多公司的運維同仁尚處於“腳本自動化”階段,而藍鯨智雲團隊已經完全經歷了前四個階段的洗禮,正在積極地擁抱智能化運維帶來的福利。
為了給運維行業提供更好的服務,藍鯨智雲團隊從2016年3月啟動開放計划,並且不斷加大開放力度,甚至是開源。目前已經開放了社區版6.0,其功能特性可以讓運維同仁直接進入“調度自動化”的階段,通過提升自身能力,低成本地構建運維工具,自建運營系統。
2016年12月16日,騰訊游戲藍鯨產品中心負責人黨受輝發布了“藍鯨智雲”品牌的宏大願景「改變中國運維行業」。未來,藍鯨將繼續建設和維護社區版,打造藍鯨開發者社區、SaaS市場、腳本社區等豐富的運維生態。
運維行業是一片藍海,藍鯨智雲團隊希望能和優秀的企業一起合作,為合作伙伴提供技術支持,藍鯨將更專注於技術研究,持續輸出更多的產品,一起為運維行業服務。
源碼倉庫
- Github - 騰訊藍鯨持續集成平台BK-CI
- Github - 騰訊藍鯨作業平台BK-JOB
- Github - 騰訊藍鯨容器管理平台BK-BCS
- Github - 騰訊藍鯨標准運維平台BK-SOPS
- Github - 騰訊藍鯨PaaS平台BK-PAAS
- Github - 騰訊藍鯨配置平台BK-CMDB
- Github - 騰訊藍鯨基礎計算平台BK-BASE
- Github - 騰訊藍鯨容器管理平台BK-SAAS
- Gitee - Tencent-BlueKing