1、練習一
1、 提出問題:對某個學校或者一個城市的教育水平進行評估,或者多個學校的教育水平進行比較
指標:學生考試成績
根據考試成績高低判斷教育水平;影響因素:學生餐飲,從多個維度分析,各城市在不同時期的教育水平狀態
(1)各科成績平均值隨時間的變化關系?
(2)不同城市不同學校不同老師,各科平均成績?
(3)年級、餐飲狀態、考試科目與平均成績隨 時間變化的關系?
(4)各學校在地圖上的分布情況?
2、理解數據
3、清洗數據
4、建模分析
5、數據可視化處理
(1)各科成績平均值隨時間的變化關系?
將我們的數據源導入到Tableau中,可以在Tableau的左側維度看到相應指標。將“日期”,“分數”分別拖到Tableau中對應的行與列中,
將日期格式設置為年/月,以觀察各年各月的數據,“分數”方式改為計算平均值。
顏色編碼:將考試科目拖到菜單欄下的顏色中,用不同的顏色來區分不同的科目。
布局:在智能顯示中選擇”線圖“連續。為了讓數據分布在圖形的中間區域,在圖中的y軸區域,編輯軸,設置y軸起點與終點。 隱藏:如果視圖中出現1個null值,想去掉這個顯示,右鍵點擊,使用隱藏指示器,這樣隱藏就掉了。如圖1-1所示
分析:我們可以從圖中看到三個科目的均分都在0.8附近浮動,數學從2011年11月份到哦2012年五月份都很均勻,根本不沒有浮動,
科學這個科目在2011年12月份有較大的浮動,而閱讀分數普遍高於數學與科學,通過這個圖,發現學生普遍喜歡閱讀多與科學與數學。
(2)不同城市不同學校不同老師,各科平均成績?
設計這個視圖主要目的時幫助查看不同老師教的學生各科成績如何,並且用顏色加以明顯區分。
(a) 新建一個新的工作表
(b) 將“教師編號“,”學生編號“拖至行,這種排列方式讓我們看到不同編號老師所帶學生的成績。
(c) 將分數拖至標記菜單欄中的文本中,計算平均值。選擇突顯表
(d) 考試科目拖至列
(e) 顏色編碼:點擊編輯顏色按鈕后,單擊色版,於下拉菜單中選擇要用的顏色,並且設置顏色的區分間隔,我們選擇六個顏色區分度,從左往右,不同顏色代表分值越大。
(f) 使用“篩選器”:我們選擇城市作為篩選的維度,來看不同城市的細節數據展現,將“城市”拖到篩選器欄中,也將“學校名稱”,“教師編號”作為過濾器來使用。
(g) 在“篩選器”中選擇不同的城市,則將會在凸顯表中,出現不同城市的數據。

(3)年級、餐飲狀態、考試科目與平均成績隨 時間變化的關系?
不同年級,參加不同學校餐飲計划的學生,在不同時期的課程分數。 (a) 將日期及分數分別拖到對應的行與列中,將列中日期格式設置為年/月,以觀察各年各月的數據,分數方式改為平均值。
(b) 多層篩選的實現--設置參數:
在維度或度量的空白處,點擊右鍵,在彈出的選項中選擇創建參數,將參數命名為“比較選擇”,將“年級”賦值為1,“考試狀態”賦值為2,考試科目賦值為3.然后在維度和度量下面會新增名為參數的選項集。
(c) 新建一個字段
在維度的空白處,右鍵點擊在彈出的選項中選擇“創建計算字段“,並命名為比較,在公式中輸入如下代碼:
if[比較選擇]=1THEN STR([年級])
elseif[比較選擇]=2 THEN [餐飲狀態]
else [考試科目] end
目的時,當參數“比較選擇“的值為1時,“比較”這個字段顯示的是“年級”;當參數“參數比較”的值為2時,“比較”這個字段顯示的時餐飲狀態;否則顯示的時考試科目。
(d) 視覺編碼:
將新建的“比較”拖至標記菜單欄中的顏色,用顏色區分不同的維度。同時把比較作為篩選器來使用,並且顯示出來。
那么,在參數“比較選擇”當中,任選擇一個難度,會顯示相應維度的選項。
例如選擇“考試科目”,那么篩選器顯示的時數字,科學及閱讀。有選擇的時年級的,顯示的時10,11,12.
如圖中所示,我們通過多層篩選,能夠更加快捷,更加方便地查看在時間維度上不同年級,
不同餐飲狀態以及選擇不同科目的學生的考試分數,進而來分析影響教育水平的因素哪些影響程度大,哪些影響程度小。
(4)各學校在地圖上的分布情況?
a) 新建一個工作表名為“城市地圖”的工作表。
b) 布局:
將latitude和Longitude分別放到對應的行與列上,工作區會自動生成一張這些經緯度所在位置的地圖,這里地圖初始情況只顯示一個點,
因為默認顯示的時所有精度的平均值和緯度的平均值。將分數拖到標記欄下的“大小”中,以平均值展現,設置顏色以有更好的區分度;
將學生拖到標記欄下的“大小”中,目的時通過學生個數多少,來衡量地圖上圖標大小。
c) 創建層級:
在維度當中連續選擇“城市”,“學院名稱”,“教師編號”,“學生編號”,創建分層結
