花费 30 ms
Hive 实战(2)--hive分区分桶实战

前言:   互联网应用, 当Mysql单机遇到性能瓶颈时, 往往采用的优化策略是分库分表. 由于互联网应用普遍的弱事务性, 这种优化效果非常的显著.而Hive作为数据仓库, 当数据量达到一定数量时 ...

Thu Jul 03 19:22:00 CST 2014 0 14029
Hive自定义函数的学习笔记(1)

前言:   hive本身提供了丰富的函数集, 有普通函数(求平方sqrt), 聚合函数(求和sum), 以及表生成函数(explode, json_tuple)等等. 但不是所有的业务需求都能涉 ...

Sun Oct 09 01:28:00 CST 2016 0 5935
HBase 实战(1)--HBase的数据导入方式

前言:   作为Hadoop生态系统中重要的一员, HBase作为分布式列式存储, 在线实时处理的特性, 备受瞩目, 将来能在很多应用场景, 取代传统关系型数据库的江湖地位. 本篇博文重点讲解HB ...

Mon Jul 14 21:02:00 CST 2014 3 4143
Kafka实战系列--Kafka API使用体验

前言:   kafka是linkedin开源的消息队列, 淘宝的metaq就是基于kafka而研发. 而消息队列作为一个分布式组件, 在服务解耦/异步化, 扮演非常重要的角色. 本系列主要研究k ...

Wed Jul 23 00:00:00 CST 2014 0 4788
Flume 实战(1) -- 初体验

前言:   Flume-ng是数据收集/聚合/传输的组件, Flume-ng抛弃了Flume OG原本繁重的zookeeper和Master, Collector, 其整体的架构更加的简洁和明了. ...

Thu Jul 03 23:34:00 CST 2014 0 2507
hive-jdbc/odbc的解读和看法

当前的项目中, 涉及到了hive-jdbc/odbc这块, 因此把这几天所调研的资料作一份总结.本文讲解hive-jdbc/hive-odbc的实现, 以期对jdbc/odbc规范和实现有个较深 ...

Sat Apr 26 01:09:00 CST 2014 1 2129
HBase 实战(2)--时间序列检索和面检索的应用场景实战

前言:   作为Hadoop生态系统中重要的一员, HBase作为分布式列式存储, 在线实时处理的特性, 备受瞩目, 将来能在很多应用场景, 取代传统关系型数据库的江湖地位. 本篇主要讲述面向时 ...

Sat Jul 26 22:54:00 CST 2014 0 2210

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM