想起馬上就能回家了,心情是按捺不住的激動,唉,還是繼續努力吧,其實不希望那么快就回家,感覺回去了就意味着馬上就要回來了,人真的是神奇呀
今天我們來使用zeppelin,這個就是可以把我們查找的數據可以圖形化的方式顯示出來,好了,今天開始我們的任務吧
1.首先我們要下載zeppelin的壓縮包,當我們解壓之后(這一台主機上面已經安裝過了java的環境)
2.修改配置環境
進入conf/
將zeppelin-env.sh.template修改為zeppelin-env.sh
將zeppelin-site.xml.template修改為zeppelin-site.xml

然后我們接下來修改conf/zeppelin-env.sh新增
export SPARK_MASTER_IP=192.168.109.136
export SPARK_LOCAL_IP=192.168.109.136
3.啟動zeppelin
進入zeppelin:進入bin目錄下執行./zeppelin-daemon.sh start
然后瀏覽器訪問192.168.109.136:8080進入界面

此時就啟動成功
4.zeppelin簡單實用
1.text

2.html

3.table


5.可以對數據進行分析
對於我做的最多的分析,就是基於學校的那個資料,我有學校里面的信息,這個里面的每一行的信息是以","
進行分隔,這個其中里面的民族,此時我們對這個民族進行分析

由於我們這個zeppelin是在linux里面的啟動,所以我們必須把原有的數據放到linux的里面,此時zeppelin讀的文件目錄是linux里面的目錄




則此時我們就可以對數據庫里面的東西進行視圖分析,我們通過這個數據,我們發現通過讀取數據
,以分組的方式,然后在查詢數據有多少個,這樣就可以對數據進行顯示
a.
val text = sc.textFile("/tmp/xjdx.txt") case class Person(college:String,time:Integer) val rdd1 = text.map(line =>{ val fields = line.split(",") if(fields.length >=10){ val mz = fields(10) Person(mz,1) }else{ Person("1",1) } })
b.
rdd1.toDF().registerTempTable("rdd1")
c.
%sql select college,count(1) from rdd1 group by college
這個里面只是針對於存儲介質是文件的形式,對於數據庫的那個有問題,我會在以后的章節繼續介紹的,敬請期待
