一、基本操作 1.DDL 官网的DDL语法教程:点击查看 建表语句 数据类型 说明: 1、CREATE TABLE 创建一个指定名字的表。如果相同名字的表已经存在,则抛出异常;用户可以用 ...
一 基本概念 .什么是hive The Apache Hive data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage using SQL. Structure can be projected onto data alread ...
2018-02-24 14:33 0 1184 推荐指数:
一、基本操作 1.DDL 官网的DDL语法教程:点击查看 建表语句 数据类型 说明: 1、CREATE TABLE 创建一个指定名字的表。如果相同名字的表已经存在,则抛出异常;用户可以用 ...
一、Linux环境安装 1.VM的安装 参考Linux环境搭建随笔:http://www.cnblogs.com/jiangbei/p/7248054.html 2.CentOS的安装 同参考上述随笔,此处不再赘述 3.网络基础配置 相关的IP ...
一、概述 根据之前的凡技术必登其官网的原则,我们当然先得找到它的官网:http://hadoop.apache.org/ 1.什么是hadoop 先看官网介绍: Th ...
和failover机制,Pig和Hive为HBase提供了进行数据统计处理的高层语言支持,Sqoop则为HB ...
一、概述 推荐路神的ES权威指南翻译:https://es.xiaoleilu.com/010_Intro/00_README.html 官网:https://www.elastic.co ...
下面整理了“入门大数据”的一系列知识,可供学习和参考。 --Hadoop-- >>Hadoop是什么? >>HDFS,Zookeeper,ZookeeperFailOverController(简称:ZKFC),JournalNode是什么? >> ...
Hive是为了解决hadoop中mapreduce编写困难,提供给熟悉sql的人使用的。只要你对SQL有一定的了解,就能通过Hive写出mapreduce的程序,而不需要去学习hadoop中的api。 在部署前需要确认安装jdk以及Hadoop 如果需要安装jdk以及hadoop ...
推荐书籍:《网站分析实战——如何以数据驱动决策,提升网站价值》 相关随笔:http://blog.csdn.net/u014033218/article/details/76847263 一、网站点击流数据分析项目业务背景 1.什么是点击流数据 1.web访问日志 ...