花费 24 ms
Spark安装与学习

摘要:Spark是继Hadoop之后的新一代大数据分布式处理框架,由UC Berkeley的Matei Zaharia主导开发。我只能说是神一样的人物造就的神器,详情请猛击http://w ...

2012-08-13 19:36 11 184525
KafkaConsumer 长时间地在poll(long )方法中阻塞

一,问题描述 搭建的用来测试的单节点Kafka集群(Zookeeper和Kafka Broker都在同一台Ubuntu上),在命令行下使用: 创建了一个3个分区的Topic如下:(T ...

2017-08-19 23:35 2 50532
ElasticSearch的基本原理与用法

一、简介 ElasticSearch和Solr都是基于Lucene的搜索引擎,不过ElasticSearch天生支持分布式,而Solr是4.0版本后的SolrCloud才是分布式版本,Solr的分布 ...

2015-10-12 00:35 9 49125
MongoDB 更新数组中的元素

本文记录如何更新MongoDB Collection 中的Array 中的元素。假设Collection中一条记录格式如下: 现要删除scores 数组中,"type" 为 "homework ...

2017-11-04 04:08 1 23234
Scala

学习路上的新起点:大数据Scala + Spark +(HDFS + HBase),本文主要介绍下Scala的基本语法和用法吧。最后再简单介绍一种Java开发工具IntelliJ IDEA的使用。 ...

2017-03-15 06:47 0 27340
Kafka基本原理

简介 Apache Kafka是分布式发布-订阅消息系统。它最初由LinkedIn公司开发,之后成为Apache项目的一部分。Kafka是一种快速、可扩展的、设计内在就是分布式的,分区的和可复制的提 ...

2016-05-14 23:24 5 28749

 
粤ICP备18138465号  © 2018-2024 CODEPRJ.COM