MySQL、Hive以及MySQL Connector/J安裝過程


MySQL安裝

①官網下載mysql-server(yum安裝)

wget http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm

若wget不可用,下載安裝wget:yum -y install wget

②解壓rpm -ivh mysql-community-release-el7-5.noarch.rpm

③安裝yum install mysql-community-server

④重啟mysql服務:service mysqld restart (以后開機不需啟動mysql)

⑤進入mysql:mysql -u root

為root用戶設置密碼root:mysql> set password for 'root'@'localhost' =password('root');

以下步驟可選:

配置文件/etc/my.cnf加上編碼配置:[mysql]  default-character-set =utf8

遠程連接設置:

把在所有數據庫的所有表的所有權限賦值給位於所有IP地址的root用戶:

mysql> grant all privileges on *.* to root@' %'identified by 'root';

mysql>flush privileges; 刷新權限

如果是新用戶而不是root,則要先新建用戶:

mysql>create user 'username'@' %' identified by 'password'; 

 

卸載MySQL

重新安裝mysql之前需徹底清除mysql。

①查看是否有安裝的mysql:rpm -qa |grep -i mysql

②依次卸載mysql各安裝包:rpm -e --nodeps 安裝包名字

③查看殘留的mysql目錄或文件:find / -name mysql 、 whereis mysql。

④依次刪除查詢出的各目錄:rm -rf 目錄名

⑤刪除mysql 配置文件:/usr/my.cnf、 /root/.mysql_sercret。

 

注:

ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES)

root用戶密碼錯誤

 

Hive安裝與配置

①下載壓縮包

官網下載地址:http://mirror.bit.edu.cn/apache/hive/

選擇apache-hive-2.3.4-bin.tar.gz,在Windows里面下載。

 

②將壓縮包從Windows傳輸到Linux當前目錄下¬¬

SecureCRT 【File】→【Connect SFTP Session】開啟sftp操作

③解壓

解壓安裝到指定目錄下/opt/module(/opt是系統自帶目錄,之下的/module是自己創建的)

修改解壓目錄名為hive。

④修改環境變量

修改etc/profile文件,添加HIVE_HOME安裝路徑。

Source命令更新etc/profile文件,使其生效。

⑤配置hive-env.sh

進入/opt/module/hive/conf目錄,修改hive-env.sh.template的文件名為hive-env.sh。(可以使用cp或者mv命令)

cp hive-env.sh.template  hive-env.sh

修改Hadoop的安裝路徑

HADOOP_HOME=/opt/module /hadoop-2.7.3

修改Hive的conf目錄的路徑

export HIVE_CONF_DIR=/opt/module/hive/conf

⑥配置hive-site.xml

進入/opt/module/hive/conf目錄,修改default.xml.template的文件名為hive-site.xml。(可以使用cp或者mv命令)

cp hive- default.xml.template  hive-site.xml

在最后添加以下屬性:

<property>

<!-- 元數據庫的鏈接地址 mysql -->

       <name>javax.jdo.option.ConnectionURL</name>        

<value>jdbc:mysql://bigdata131:3306/hivedb?createDatabaseIfNotExist=true</value>

       <description>JDBC connect string for a JDBC metastore</description>

</property>

<property>

<!-- 指定mysql驅動 -->

<!-- mysql5的驅動是com.mysql.jdbc.Driver,mysql6以后的是com.mysql.cj.jdbc.Driver。 -->

        <name>javax.jdo.option.ConnectionDriverName</name>

        <value>com.mysql.jdbc.Driver</value>

        <description>Driver class name for a JDBC metastore</description>

</property>

<property>

<!-- 指定mysql用戶名 -->

        <name>javax.jdo.option.ConnectionUserName</name>

        <value>root</value>

        <description>username to use against metastore database</description>                   

</property>

<property>

<!-- 指定mysql密碼 請輸入自己的MySQL連接密碼 -->

        <name>javax.jdo.option.ConnectionPassword</name>

        <value>root</value>

        <description>password to use against metastore database</description>

</property>

注:

查看Hive建庫、建表默認的hdfs目錄為/user/hive/warehouse

<property>

<name>hive.metastore.warehouse.dir</name>

<value>/user/hive/warehouse</value>

<description>location of default database for the warehouse</description>

</property>

 

MySQL Connector/J安裝

①下載壓縮包

官網下載地址:http://ftp.ntu.edu.tw/MySQL/Downloads/Connector-J/   

mysql-connector-java-5.1.47.tar.gz

②將壓縮包從Windows傳輸到Linux當前目錄下­­

SecureCRT 【File】→【Connect SFTP Session】開啟sftp操作

③解壓

解壓到指定目錄下/opt/module(/opt是系統自帶目錄,之下的/module是自己創建的)

④拷貝驅動包

將驅動包mysql-connector-java-5.1.47-bin.jar復制到/opt/module/hive/lib目錄中。

啟動hive

①啟動Hadoop:start-all.sh

②初始化Metastore架構:schematool -dbType mysql -initSchema

③啟動Hive:hive

hive> 進入hive shell

④創建/刪除/修改/查看 數據庫、表、視圖,向表中裝載數據,查詢數據等等。

注:

①啟動hive報錯:Exception in thread "main" java.lang.IllegalArgumentException: java.net.URISyntaxException: Relative path in absolute URI: ${system:java.io.tmpdir%7D/$%7Bsystem:user.name%7D,原因是hive-site.xml里的臨時目錄沒有設置好。

修改${system:Java.io.tmpdir}為自己創建的臨時目錄/opt/module/hive/tmp。

<property>

<name>Hive.exec.local.scratchdir</name> <value>${system:Java.io.tmpdir}/${system:user.name}</value>

<description>Local scratch space for Hive jobs</description>

</property>

<property>

<name>hive.downloaded.resources.dir</name> <value>${system:java.io.tmpdir}/${hive.session.id}_resources</value>

<description>Temporary local directory for added resources in the remote file system.</description>

</property>

<property>

    <name>hive.server2.logging.operation.log.location</name>

    <value>${system:java.io.tmpdir}/${system:user.name}/operation_logs</value>

    <description>Top level directory where operation logs are stored if logging functionality is enabled</description>

</property>

<property>

    <name>hive.querylog.location</name>

    <value>${system:java.io.tmpdir}/${system:user.name}</value>

    <description>Location of Hive run time structured log file</description>

  </property>

②schematool -dbType mysql -initSchema時報錯:Schema initialization FAILED! Metastore state would be inconsistent !!

網上教程都是說在文件頭部加上mysql的連接配置,但是hive-site.xml.templat中原本是有derby的配置,這樣就會被下面的derby配置覆蓋,導致初始化失敗。方法就是可以將mysql配置放在最下面,或者刪除derby的配置。

刪除derby的配置產生的metastore_db目錄。

③hive命令(如show databases ,show tables),會報出如下錯誤:Failed with exception Java.io.IOException:java.lang.IllegalArgumentException: java.NET.URISyntaxException: Relative path in absolute URI: ${system:user.name}

找到hive-site.xml的<name>hive.exec.local.scratchdir</name>的值里面的${system.user.name}改為${user.name}。

Hive應用實例:wordcount

①建數據源文件並上傳到hdfs的/user/input目錄下

②建數據源表t1:create table t1 (line string);

 

③裝載數據:load data inpath '/user/input' overwrite into table t1;

 

④編寫HiveQL語句實現wordcount算法,建表wct1保存計算結果:

create table wct1 as select word, count(1) as count from (select explode (split (line, ' ')) as word from t1) w group by word order by word;

 

⑤查看wordcount計算結果:

 

學習資料

日志分析_統計每日各時段的的PV、UV

https://www.cnblogs.com/eRrsr/p/6051616.html

Hive學習之路 (一)Hive初識

http://www.cnblogs.com/qingyunzong/articles/8707885.html

Hive學習之路 (二)Hive安裝

https://www.cnblogs.com/qingyunzong/p/8708057.html

Hive分區和桶的概念

https://www.cnblogs.com/xiohao/p/6429305.html

hive-4 hql語句對應mapreduce簡介

https://blog.csdn.net/iteye_3893/article/details/82611410

深入學習Hive應用場景及架構原理

https://www.cnblogs.com/zimo-jing/p/9028949.html

Hive的三種安裝方式(內嵌模式,本地模式遠程模式)

https://www.cnblogs.com/tq03/p/5107949.html  

centos7 mysql數據庫安裝和配置

https://www.cnblogs.com/starof/p/4680083.html

Hive學習之路 (一)Hive初識

https://www.cnblogs.com/qingyunzong/p/8707885.html

Hive學習之路 (三)Hive元數據信息對應MySQL數據庫表

https://www.cnblogs.com/qingyunzong/p/8710356.html

Hive學習之路(四):Hive內置函數介紹與實現WordCount

https://www.cppentry.com/bencandy.php?fid=117&id=219004


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM