利用Microsoft Azure Machine Learning Studio創建機器學習實例


    Microsoft Azure雲服務推出機器學習的模塊,用戶只需上傳數據,利用機器學習模塊提供的一些算法接口和R語言或別的語言接口,就能利用Microsoft Azure強大的雲計算能力來實現自己的機器學習的任務。

    本文淺嘗了該機器學習模塊,參照官方實例和幫助文檔,完成了一個簡單的應用實例,具體步驟如下。

1、新建workspace

注意,在填寫workspace owner,一定要填寫一個有效的windows live 賬號

 

 

進入創建的workspace,界面如下圖所示

2、上傳數據

數據源:http://archive.ics.uci.edu/ml/datasets/Statlog+(German+Credit+Data)

下載名為german.data,該數據用於信用風險的機器學習算法,數據包括20個變量,1000條信用記錄,其中700條問低風險,300條為高風險。注意,由於Azure Machine Learning stidio 只支持csv文件,所以需要把german.data轉化為csv文件。

點擊ML studio下方的"+new"鏈接,按下圖所示將數據已建立好workspace

3、新建Azure ML的實驗

點擊ML studio下方的"+new"鏈接,選擇Experiment選項,打開如下界面后

    第一步,可以給這個實驗添加一個標題,本文命名為"Experiment by Jiahua"

    第二步,在左側找到上傳的數據,名字為上傳數據是給定的數據名字,本文為"UCI German Credit Card Data",將數據拖到中間的工作區,然后右側會給出數據的描述信息。數據進入工作區之后,用一個圓角的矩形表示,矩形下有一個圓圈,稱為"output port",將鼠標放在上面並點擊右鍵后,可以進行數據可視化等操作。拖動圓圈,可以指向下一個數據處理操作。

    第三步,添加完數據集之后,就需要對數據集進行相應的處理,包括數據預處理,訓練樣本和測試樣本划分,選擇機器學習算法等等,詳細操作課參加官方實例。完成上述操作后,一個可視化的機器學習過程就完成,如下圖所示:

        

第四步,模型運行。完成上述操作后,就就可以運行程序了,點擊下方的"Run",模型就會運行,每個模塊運行完成之后會在右上方標示一個綠色小勾,如果每個模塊或步驟出錯了,會在同樣的地方出現一個紅色的,鼠標放上去之后就會提示錯誤的類型。

第五步,查看結果,在"Evaluate Model"方框下的圓點處點擊右鍵,選擇"Visualize"即可查看模型運行結果,部分結果如下圖所示:

5、小結

這樣一個利用Azure雲服務的機器學習實例就完成了,當然如果必要的的話還可以將完成模型發布到web服務器上,這里就不細述,可以參考幫助文檔。

利用Azure雲服務做機器學習研究,給我最大的體會是可視化的操作步驟使得算法的運行過程更加清晰明聊,將算法拆分為數據准備、數據預處理、訓練數據和測試數據分割、模型選擇、模型參數調整、模型評價等環節,每個環節以處理框的形式出現,通過帶箭頭的連線,可以清晰的看出每個環節的輸入和輸出關系,從而研究者能更容易的抓住和控制算法的要點。

初步的嘗試就到此結束,由於時間和能力的關系,本文只做了最簡單的嘗試,敘述過程省略了很多細節,尤其是在新建實驗部分,如果感興趣可以詳細查閱官方幫助文檔。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM