原文:來看看字節跳動內部的數據血緣用例與設計

數據血緣描述了數據的來源和去向,以及數據在多個處理過程中的轉換。數據血緣是組織內使數據發揮價值的重要基礎能力。本文從字節的數據鏈路概況開始,介紹了數據血緣在字節的應用場景,總體設計,數據模型以及衡量指標。 文 羅小亮 拾捌 大濱來自字節跳動數據平台開發套件團隊 字節跳動數據鏈路介紹 為了明確問題的討論范圍,我們首先介紹一下字節的數據鏈路。 字節的數據的來源分為兩種: 端數據:APP 和 Web ...

2022-02-24 10:49 0 851 推薦指數:

查看詳情

看看阿里、字節跳動、華為等這些大廠的年終獎都發了多少

前言 發年終獎這件事,在互聯網公司正在成為一種傳統,就像不加班都不好意思說是搞互聯網的一樣。 年終獎其實是一件非常有儀式感的事情:年末拿錢回家過年。 今天,和大家看一下那些互聯網行業被大家津津樂道且羡慕嫉妒的年終獎們,同時也期待一下今年的年終獎(嘿嘿嘿 看看阿里、字節跳動、華為等這些大廠 ...

Tue Jul 07 04:10:00 CST 2020 0 5011
深度介紹Flink在字節跳動數據流的實踐

本文是字節跳動數據平台開發套件團隊在1月9日Flink Forward Asia 2021: Flink Forward 峰會上的演講分享,將着重分享Flink在字節跳動數據流的實踐。 字節跳動數據流的業務背景 數據流處理的主要是埋點日志。埋點,也叫Event Tracking,是數據和業務 ...

Wed Jan 12 21:10:00 CST 2022 1 1787
字節跳動數據湖技術選型的思考與落地實踐

本文是字節跳動數據平台開發套件團隊在 Flink Forward Asia 2021: Flink Forward 峰會上的演講,着重分享了字節跳動數據湖技術上的選型思考和探索實踐。 文 | Gary Li 字節跳動數據平台開發套件團隊高級研發工程師,數據湖開源項目 Apache ...

Mon Jan 24 22:49:00 CST 2022 0 1284
【面經記錄】字節跳動實習面試【大數據

字節跳動面試 時間:2019年7月30日 地點:北京海淀區丹棱街1號互聯網金融中心15層 面試崗位:大數據研發實習生 面試過程:   一共四面,三面是技術面,最后一面是HR面,流程很正式。不愧是出了名的重視算法題,整個面試過程以手寫算法題為主。(應該是一共寫了七八道算法題)   主要 ...

Fri Dec 18 00:51:00 CST 2020 2 519
字節跳動基於Apache Hudi構建EB級數據湖實踐

來自字節跳動的管梓越同學一篇關於Apache Hudi在字節跳動推薦系統中EB級數據量實踐的分享。 接下來將分為場景需求、設計選型、功能支持、性能調優、未來展望五部分介紹Hudi在字節跳動推薦系統中的實踐。 在推薦系統中,我們在兩個場景下使用數據湖 我們使用 ...

Sun Aug 29 17:26:00 CST 2021 0 367
【Daticist】_(一)字節跳動數據分析筆試一、准備二、開始三、反思

因為自己准備的時候戰戰兢兢,所以希望給學弟學妹一些經驗,希望大家都萬事勝意o( ̄▽ ̄)ブ 不知道這算不算侵字節爸爸的權啊,是的話麻煩提醒一下,我就刪了…… 一、准備 崗位描述: 1、負責分字節跳動旗下國內外產品及業務的數據分析工作; 2、分析各項影響產品提升與增長的因素 ...

Fri Jul 02 01:33:00 CST 2021 0 170
字節跳動(用戶喜好)

題干: [編程題] 用戶喜好 時間限制:3秒 空間限制:262144K 為了不斷優化推薦效果,今日頭條每天要存儲和處理海量數據。假設有這樣一種場景:我們對用戶按照它們的注冊時間先后來標號,對於一類文章,每個用戶都有不同的喜好值,我們會想知道某一段時間內注冊的用戶(標號相連的一批用戶 ...

Sat Mar 16 05:27:00 CST 2019 0 923
字節跳動面試總結

此文轉載自:https://blog.csdn.net/huanqingdong/article/details/112389152#commentBox 拿到字節offer已經有兩周多了,目前手頭工作也交接的差不多了。今天對字節面試過程做個總結 ...

Wed Jan 13 22:44:00 CST 2021 0 444
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM