Netflix或Amazon Prime推送您喜歡看的電影,這背后的邏輯你不覺得驚訝嗎?或者,你不好奇是什么讓Google地圖可以預測您所行駛的路線上的路況?
我們都知道機器學習是如何使用算法和統計模型來執行任務並提出完美的解決方案。同樣,這種方法可以檢測癌症,並有助於檢測Facebook上的面孔以及多種用途。
機器學習:需求
機器學習算法模仿人類及其日常發展的規律。 簡單來說,機器學習可分為兩個概念:訓練和預測。
機器學習已經出現在了我們的日常生活中,但我們幾乎沒有意識到。 例如,在社交媒體平台上給用戶加標簽只不過是機器學習簡單的工作而已。 機器學習應用廣泛如欺詐檢測,推薦系統和識別。在不久的將來,機器學習將被用在自我糾正,提供有深刻見解的價值觀念和個性化服務這些技術上。
機器學習算法是如何工作的
機器學習創建了一個可以回答用戶提出的每個問題的系統。 然后,該系統通過訓練最適當的算法來建立模型,並以此為基礎回答問題。
准確地說,機器學習有一個需要遵循的七步模型:
從檢測需要立即修復的自動扶梯到檢測皮膚疾病,機器學習催生了計算機系統,它能夠神奇地處理一些我們無法理解的事情。 但是機器學習如何工作? 在沒有顯式編程地情況下,將采取哪些步驟以及它們如何起作用? 這是您需要知道的。
在這里,我們將通過引用一個示例來演示機器學習的工作原理:我們拿啤酒和葡萄酒舉例,通過它可以創建一個系統,系統將回答給定的飲料是葡萄酒還是啤酒。
1、數據收集
這里可以舉一個簡單的例子說明。要收集的數據是從裝有啤酒或葡萄酒的玻璃杯中獲取的。從分析玻璃杯的形狀到檢查泡沫的數量,收集的數據可以是任何東西。在這里,將這些液體的顏色選擇為光的波長,並將內容物(酒精)作為特征。 第一步也是最重要的一步,包括從零售商店購買幾種類型的酒精,以及配備可以進行正確測量的設備,例如用於測量顏色的分光計,以及用於測量酒精含量的比重計。
此步驟至關重要,因為所收集數據的質量和數量將有助於提高預測模型的准確性。 收集每種飲料的酒精含量和顏色是為了找出酒精或葡萄酒的成分,這和我們准備用來訓練數據的系統是同一個系統。
2、數據准備
一旦收集了數據,就需要將其加載到系統中,並為機器學習訓練做好准備。
這些數據是隨機放置的,因此系統一開始不會知道飲料是葡萄酒還是啤酒的一部分。但是系統應該可以識別出飲料是葡萄酒還是啤酒。同時,可以進行可視化操作以確保變量之間不會存在不平衡。
然而,如果我們收集的啤酒數據比葡萄酒多,那么訓練的模型可能會顯示出對啤酒的一定程度的偏差,因為收集的大多數數據都是關於啤酒的。 但是在實時情況下,如果模型同時使用了相等數量的啤酒和葡萄酒數據,那么啤酒預測可能有一半是錯誤的。
因此,為兩個變量提供正確的數據量同樣重要。
3、選擇合適的模型
如何知道哪種模型合適? 根據多位研究人員和數據科學家的說法,很明顯,專家們會對選擇正確模型有自己的想法。
例如,其中一些模型經過設計,最適合於音樂或文本之類的序列,而另一些則適合數字序列。 在我們的啤酒和葡萄酒示例中,它將是一個線性模型,因為您將看到啤酒和葡萄酒這兩個不同的特征。
4、訓練模型
這是一個至關重要的過程,因為它使用數據進一步改善了模型的性能-預測葡萄酒和啤酒。y=m*x+b
y是截距,m是直線的斜率,y也是直線在x位置的值,b是直線在X軸的截距。 m,b和y是唯一可以訓練和評估的值。
在機器學習中,您將遇到多個m變量,可以從中構造w矩陣或權重矩陣。
5、評價
接下來是評價,評價過程需要檢查模型是否得到有效的訓練或是否可以完成任務。 通過這種方法,您可以輕松用訓練中未出現過的數據來測試模型。這樣是為了測試模型如何響應尚未遇到的數據。理想情況下,進行評價是為了分析模型如何實時執行。
6、超參數調整
這是為了檢查正在訓練的模型是否仍有改進的余地。可以通過調整某些參數(學習率或在訓練過程中訓練模型運行的次數)來實現。
在訓練期間,你要考慮多個參數。對於每個參數,你要知道它們在模型訓練中所起的作用,否則您可能會發現自己在浪費時間或經過調參后耗時更長了。
7、預測
最后一步,一旦遵循了上述參數,就可以對模型進行測試。給定顏色和酒精含量,機器可以預測哪種飲料是啤酒和哪種是葡萄酒。機器學習可借助模型而不是使用標准規則或人工判斷來確定葡萄酒與啤酒之間的差異。
已知的機器學習應用
甚至在我們意識到之前,我們就已經使用機器學習了,這是令人難以置信的。 眾所周知,機器學習在多種行業中都有應用,例如醫學診斷,語音識別,學習協會,金融服務,預測等。
醫學診斷
機器學習提供了有益於醫療領域的工具和技術,它有助於解決疾病預測和診斷問題。
它還被用來分析臨床參數用於疾病預測,例如,它有助於預測疾病的進展,還有助於治療計划的改進,總體上主要用於患者管理。
語音識別
在語音識別中,機器學習幫助將口語單詞轉化成文本,即自動化語音識別或語音成文本或計算機語音識別。
學習聯想
這是一個將見解發展為產品之間關聯的過程。 簡而言之,無關的產品也可以揭示它們之間的關聯。
金融服務
機器學習系統是一個良好的工具,通過持續監控個人活動來檢測欺詐並評估該個人的活動是否屬於本用戶。
預測
機器學習能夠預測客戶拖欠貸款的可能性。但是,為了進行計算,系統需要對特定組的數據進行分類。
原文鏈接:https://imba.deephub.ai/p/18f788a063fe11ea83daff02656c39f6
微信掃描二維碼,獲取更多干貨