原文:【赵强老师】在Hive中使用Load语句加载数据

一 Hive中load语句的语法说明 Hive Load语句不会在加载数据的时候做任何转换工作,而是纯粹的把数据文件复制 移动到Hive表对应的地址。语法格式如下: 几点说明: 如果命令中带有LOCAL,说明从本地文件系统加载数据,文件路径可以是相对路径,也可以是绝对路径。在这种情况下,首先将文件从本地复制到hdfs相应的位置,然后移动到hive表格中,这个时候原始数据文件是存在于Hive表之下 ...

2020-05-22 11:40 0 992 推荐指数:

查看详情

老师使用Weblogic的WLST工具

一、什么是Weblogic WLST? WebLogic 脚本工具 (WebLogic Scripting Tool , WLST) 是一种命令行脚本界面,系统管理员和操作员用它来监视和管理 W ...

Fri Jan 22 19:31:00 CST 2021 0 324
老师使用kubeadmin部署K8s集群

首先,我们来看一下整体的架构。 K8s的部署方式: yum方式部署 二进制包:手动使用tar包来部署 minikube:单机版,用于开发测试。 kubeadm:可以把kubeadmin看成一个部署工具,它简化K8s的部署过程。 (一)准备工作 安装 ...

Fri Apr 03 19:26:00 CST 2020 0 1844
老师】Oracle RAC集群的概念

一、什么是Oracle RAC(Real Application Cluster)? Oracle RAC 是一个具有共享缓存架构的集群数据库,它克服了传统的无共享方法和共享磁盘方法的限制,为您的所有业务应用提供了一种具有高度可扩展性和可用性的数据库解决方案。Oracle RAC ...

Tue Apr 07 16:21:00 CST 2020 0 588
老师】大数据分析引擎:Presto

一、什么是Presto? 背景知识:Hive的缺点和Presto的背景 Hive使用MapReduce作为底层计算框架,是专为批处理设计的。但随着数据越来越多,使用Hive进行一个简单的数据查询可能要花费几分到几小时,显然不能满足交互式查询的需求。Presto是一个分布式SQL ...

Sat Apr 04 18:30:00 CST 2020 0 969
老师】利用Python完成数据分布特征的分析

在对数据的质量进行分析后,接下来就可以对数据的特征进行分析和计算,也可以通过绘制图表对数据的特征进行展示。数据的特征分析通过有以下几种方式:分布分析、对比分析、统计量分析、周期性分析、贡献度分析(帕累托分析)、相关性分析、正态性检验。 分布分析能揭示数据的分布特征和分布类型 ...

Wed Nov 24 00:38:00 CST 2021 0 132
老师】Flink的Watermark机制(基于Flink 1.11.0实现)

使用eventTime的时候如何处理乱序数据?我们知道,流处理从事件产生,到流经source,再到operator,中间是有一个过程和时间的。虽然大部分情况下,流到operator的数据都是按照事件产生的时间顺序来的,但是也不排除由于网络延迟等原因,导致乱序的产生,特别是使用kafka的话 ...

Mon Jul 20 16:52:00 CST 2020 0 956
老师】在Spark SQL中读取JSON文件

Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用。为什么要学习Spark SQL?如果大家了解Hive的话,应该知道它是将Hive SQL转换成MapReduce然后提交到集群上执行,大大简化 ...

Sun Apr 05 20:28:00 CST 2020 0 971
老师】史上最详细的PostgreSQL体系架构介绍

PostgreSQL是最像Oracle的开源数据库,我们可以拿Oracle来比较学习它的体系结构,比较容易理解。PostgreSQL的主要结构如下: 一、存储结构 PG数据存储结构分为:逻辑存储结构和物理存储存储。其中:逻辑存储结构是内部的组织和管理数据的方式;物理存储结构是操作系统中 ...

Tue Sep 07 20:25:00 CST 2021 0 183
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM