原文:如何打造百亿级数据处理量的弹性调度容器平台

一 数据处理业务场景 首先介绍一下七牛数据处理业务的背景。七牛云目前平台上有超过 万家企业客户,图片超过 亿张,累积超过 亿小时的视频。 用户把这些图片和视频存储在七牛上后会有一些数据处理方面的需求,如缩放 裁剪 水印等。 这些文件持续在线且数据种类多样,如果用户把这些文件在自己的基板上处理好后再上传到七牛,是非常不合算的事情。而七牛最先提供基于存储的数据处理功能方便用户去做数据处理,这些数据处 ...

2016-11-08 13:57 2 4190 推荐指数:

查看详情

百亿级数据处理优化

最近在做大数据处理时,遇到两个大表 join 导致数据处理太慢(甚至算不出来)的问题。我们的数仓基于阿里的 ODPS,它与 Hive 类似,所以这篇文章也适用于使用 Hive 优化。处理优化问题,一般是先指定一些常用的优化参数,但是当设置参数仍然不奏效的时候,我们就要结合具体的业务,在 SQL ...

Tue Jul 16 16:32:00 CST 2019 8 2065
基于内存映射的千万级数据处理框架

基于内存映射的千万级数据处理框架 在计算机的世界里,将大问题切分为多个小问题予以解决是非常优秀的思想。 许多优秀的数据存储框架都采用分布式架构解决海量数据的存储问题,在典型的数据库中间件架构中, 往往抽象出逻辑的数据表概念,一个逻辑表对应多个物理表,写入的数据 ...

Thu Dec 04 04:04:00 CST 2014 8 2561
思源:秒级体验百亿级数据量监控钻取

编者荐语: 当业务快速增长的时候,业务保障平台就要应运而生,预判问题发出告警,越快越好,从宏观到微观一路下钻响应越快越好,尤其是交易暴涨的高峰时段。怎么做到?看思源的现身说法: 以下文章来源于云纵达摩院 ,作者刘勤红 ——业务保障平台性能 ...

Tue Nov 19 19:17:00 CST 2019 1 1652
PHP+MySQL 千万级数据处理案例(一)(分表)

场景 一个金融公司有 500w 投资用户,每天充值投资 50w 笔,那么该公司每年将近有 1 亿条充值记录,那么我们改如何处理这个充值订单表的数据呢?难不成都放一张表里面,那万一哪天我让你去统计满足某个需求的记录,1 亿条数据里面检索你会累死 mysql 的!今天我们就来讲述一下如何去处理 ...

Tue Apr 21 00:44:00 CST 2020 0 1715
百亿级数据分表后怎么分页查询?

当业务规模达到一定规模之后,像淘宝日订单在5000万单以上,美团3000万单以上。数据库面对海量的数据压力,分库分表就是必须进行的操作了。而分库分表之后一些常规的查询可能都会产生问题,最常见的就是比如分页查询的问题。一般我们把分表的字段称作shardingkey,比如订单表按照用户ID ...

Mon Nov 09 16:49:00 CST 2020 9 2980
elasticsearch 百亿级数据检索案例与原理

版权说明: 本文章版权归本人及博客园共同所有,转载请标明原文出处( https://www.cnblogs.com/mikevictor07/p/10006553.html ),以下内容为个人理解,仅供参考。 一、前言 数据平台已迭代三个版本,从头开始遇到很多常见的难题,终于 ...

Thu Nov 29 17:28:00 CST 2018 16 3491
Mongodb百亿级数据添加,修改,删除,查询等性能测试【四】

集群的结构,大家可以查看我的另一遍文章,Mongodb的三种集群 在最后一种集群中,介绍到。 目前使用的数据就是最后一个测试集群,留下的数据。 简单介绍一下,四个分片的配置 mongos和conf服务器的配置也是差不多,就不贴出来了,不是很重要。 很遗憾的是,片健当初 ...

Fri Jan 12 23:56:00 CST 2018 4 2249
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM