原文:我的《海量数据处理与大数据技术实战》出版啦!

我是如何持续写作的 其实,关于写作,我也没多想,就是想着总结自己学习和工作中遇到的一些问题。我最开始写文章并不是在CSDN或者其他的一些博客平台,而是在QQ空间。那时的我还在上学,在QQ空间里写下了自己的第一篇原创文章 SQL注入攻击三部曲 。没错,你哥我最初就是搞渗透 后面,又开始持续写一些文章。 还有上学时对于计算机操作系统的一些天马行空的想象。 不过现在看来,那时的我的瞎想还是有一定 远见 ...

2020-08-28 01:31 0 856 推荐指数:

查看详情

利用大数据技术处理海量GPS数据

我秀中国物联网地图服务平台目前接入的监控车辆近百万辆,每天采集GPS数据7亿多条,产生日志文件70GB,使用传统的数据处理方式非常耗时。 比如,仅仅对GPS做一些简单的统计分析,程序就需要几个小时才能跑完一天的数据,完全达不到实时 ...

Wed Oct 24 18:02:00 CST 2018 0 1589
大数据开发实战:离线大数据处理的主要技术--Hive,概念,SQL,Hive数据

  1、Hive出现背景       Hive是Facebook开发并贡献给Hadoop开源社区的。它是建立在Hadoop体系架构上的一层SQL抽象,使得数据相关人员使用他们最为熟悉的SQL语言就可以进行海量数据处理、分析和统计工作,     而不是必须掌握Java等编程语言和具备开发 ...

Fri Aug 10 22:01:00 CST 2018 0 2095
撰写的《大数据处理框架Apache Spark设计与实现》出版

拖拖拉拉写了很久的书《大数据处理框架Apache Spark设计与实现》终于出版了。书的内容是以Apache Spark为主,系统总结了大数据处理框架的一些基本问题、设计原理、实现方案、以及性能和可靠性。相比之前在github上写的 《SparkInternals》,内容更完善专业深入,书中 ...

Tue Jul 21 19:52:00 CST 2020 6 1730
php 大数据量及海量数据处理算法总结

下面的方法是我对海量数据处理方法进行了一个一般性的总结,当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理绝大多数遇到的问题。下面的一些问题基本直接来源于公司的面试笔试题目,方法不一定最优,如果你有更好的处理方法,欢迎与我讨论。 1.Bloom filter 适用范围 ...

Tue Feb 28 21:55:00 CST 2017 0 6564
大数据算法---海量数据处理面试题整理

1. 海量数据处理常用数据结构 数据结构: 【Bloom Filter】 它实际上是一个很长的二进制向量和一系列随机映射函数 布隆过滤器可以用于检索一个元素是否在一个集合中 它的优点是空间效率和查询时间都远远超过一般的算法,缺点是有一定的误识别率和删除困难 ...

Sun Aug 19 20:43:00 CST 2018 0 1848
SparkStreaming实时流式大数据处理实战总结

总结《SparkStreaming实时流式大数据处理实战》 一、初始spark 1. 初始sparkstreaming 1.1 大数据处理模式 1. 一种是原生流处理(Native)的方式,即所有输入记录会一条接一条地被处理,storm 和 flink 2. 另一种是微批处理(Batch ...

Sat Jan 30 04:12:00 CST 2021 0 598
javascript 大数据处理方法

随着前端的飞速发展,在浏览器端完成复杂的计算,支配并处理大量数据已经屡见不鲜。那么,如何在最小化内存消耗的前提下,高效优雅地完成复杂场景的处理,越来越考验开发者功力,也直接决定了程序的性能。 本文展现了一个完全在控制台就能模拟体验的实例,通过一步步优化,实现了生产并操控多个1000000(百万 ...

Thu Apr 12 17:58:00 CST 2018 0 4814
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM