原文:来看看字节跳动内部的数据血缘用例与设计

数据血缘描述了数据的来源和去向,以及数据在多个处理过程中的转换。数据血缘是组织内使数据发挥价值的重要基础能力。本文从字节的数据链路概况开始,介绍了数据血缘在字节的应用场景,总体设计,数据模型以及衡量指标。 文 罗小亮 拾捌 大滨来自字节跳动数据平台开发套件团队 字节跳动数据链路介绍 为了明确问题的讨论范围,我们首先介绍一下字节的数据链路。 字节的数据的来源分为两种: 端数据:APP 和 Web ...

2022-02-24 10:49 0 851 推荐指数:

查看详情

看看阿里、字节跳动、华为等这些大厂的年终奖都发了多少

前言 发年终奖这件事,在互联网公司正在成为一种传统,就像不加班都不好意思说是搞互联网的一样。 年终奖其实是一件非常有仪式感的事情:年末拿钱回家过年。 今天,和大家看一下那些互联网行业被大家津津乐道且羡慕嫉妒的年终奖们,同时也期待一下今年的年终奖(嘿嘿嘿 看看阿里、字节跳动、华为等这些大厂 ...

Tue Jul 07 04:10:00 CST 2020 0 5011
深度介绍Flink在字节跳动数据流的实践

本文是字节跳动数据平台开发套件团队在1月9日Flink Forward Asia 2021: Flink Forward 峰会上的演讲分享,将着重分享Flink在字节跳动数据流的实践。 字节跳动数据流的业务背景 数据流处理的主要是埋点日志。埋点,也叫Event Tracking,是数据和业务 ...

Wed Jan 12 21:10:00 CST 2022 1 1787
字节跳动数据湖技术选型的思考与落地实践

本文是字节跳动数据平台开发套件团队在 Flink Forward Asia 2021: Flink Forward 峰会上的演讲,着重分享了字节跳动数据湖技术上的选型思考和探索实践。 文 | Gary Li 字节跳动数据平台开发套件团队高级研发工程师,数据湖开源项目 Apache ...

Mon Jan 24 22:49:00 CST 2022 0 1284
【面经记录】字节跳动实习面试【大数据

字节跳动面试 时间:2019年7月30日 地点:北京海淀区丹棱街1号互联网金融中心15层 面试岗位:大数据研发实习生 面试过程:   一共四面,三面是技术面,最后一面是HR面,流程很正式。不愧是出了名的重视算法题,整个面试过程以手写算法题为主。(应该是一共写了七八道算法题)   主要 ...

Fri Dec 18 00:51:00 CST 2020 2 519
字节跳动基于Apache Hudi构建EB级数据湖实践

来自字节跳动的管梓越同学一篇关于Apache Hudi在字节跳动推荐系统中EB级数据量实践的分享。 接下来将分为场景需求、设计选型、功能支持、性能调优、未来展望五部分介绍Hudi在字节跳动推荐系统中的实践。 在推荐系统中,我们在两个场景下使用数据湖 我们使用 ...

Sun Aug 29 17:26:00 CST 2021 0 367
【Daticist】_(一)字节跳动数据分析笔试一、准备二、开始三、反思

因为自己准备的时候战战兢兢,所以希望给学弟学妹一些经验,希望大家都万事胜意o( ̄▽ ̄)ブ 不知道这算不算侵字节爸爸的权啊,是的话麻烦提醒一下,我就删了…… 一、准备 岗位描述: 1、负责分字节跳动旗下国内外产品及业务的数据分析工作; 2、分析各项影响产品提升与增长的因素 ...

Fri Jul 02 01:33:00 CST 2021 0 170
字节跳动(用户喜好)

题干: [编程题] 用户喜好 时间限制:3秒 空间限制:262144K 为了不断优化推荐效果,今日头条每天要存储和处理海量数据。假设有这样一种场景:我们对用户按照它们的注册时间先后来标号,对于一类文章,每个用户都有不同的喜好值,我们会想知道某一段时间内注册的用户(标号相连的一批用户 ...

Sat Mar 16 05:27:00 CST 2019 0 923
字节跳动面试总结

此文转载自:https://blog.csdn.net/huanqingdong/article/details/112389152#commentBox 拿到字节offer已经有两周多了,目前手头工作也交接的差不多了。今天对字节面试过程做个总结 ...

Wed Jan 13 22:44:00 CST 2021 0 444
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM