機器學習 | 深度學習 | 人工智能的數學基礎


AI現在隨便一個人都能忽悠兩句,網上甚至有三條python語句的傻瓜神經網絡應用工具,似乎人人都能成為AI“磚家”。

AI入門還是比較簡單的,尤其是現在python盛行,隨便誰一天之內都能寫出不錯的AI程序。

但是AI的精通其實是非常難的,大部分玩的都是別人准備好的訓練數據,根本就不知道怎么處理真實數據,其實AI的60%以上的工作都在原始數據的處理上。

你得足夠了解自己的數據,這是你的命根子,你得用各種統計學方法來觀察檢測自己的數據,你都不了解自己的數據就去隨便套模型,出來的結果自己都不知道是什么,還想忽悠別人相信?

數據准備好了之后,就可以根據自己的經驗來挑選模型,其實經過這么多年的優化,不同模型之間的性能差距真的不大,比較幾個常見模型就好了,真沒必要每個模型都試一下。

調參。。。

言歸正傳~ 數學基礎,機器學習離不開數學,非科班出生的同學一看到數學的部分就開始心煩,心里抱怨,為什么當初我就沒學好數學呢?恨不得立馬惡補各種公開課,教材。

我也一樣,各種搜索,想要補回來數學基礎。但都以失敗而告終。

因為我對機器學習的興趣僅僅限於我現有數據的應用上,從頭開始啃大部頭,一我沒時間;二我沒興趣,所以實在沒必要死磕到數學里。

數學專業:他們才是最有能力探索底層數學的人;

機器學習理論專業:探索最前沿的AI模型,從數學的角度;但數學能力和數學專業的人還是有差距的;

機器學習應用專業:偏重已有模型的解讀和應用,數學基礎以能理解現有模型為重;

交叉學科的機器學習應用者:我就在這,這些人都手握大量的珍貴數據,看着機器學習現在這么熱,也想來探索一下自己的數據。有能力的大老板就會直接招機器學習專業的小老板;一般的老板就只能招個非科班出生的博士。我們的使命是探索數據中的知識,而不是開發最前沿的AI模型。這群人數學能力偏弱,甚至無法理解自己模型的數學原型。

所以,該不該補數學,怎么補,取決於你在哪個應用層。

作為交叉學科的應用者,精力有限,不可能從頭開始補數學,所以只能在應用中零碎的去補了。要明確我們的優勢,我們是數據導向的,不是算法導向的。

你一個交叉學科的非要去和純AI學科的人在算法數學理論領域拼刺刀,那我只能說你傻。

呵護好自己的數據,選擇一個自己能足夠掌控的成熟模型,得到一些同行認可的有價值的結果,這就足夠了。

如果你要全職轉去AI行業,那就必須要提高對自己的要求了。


 

參考:機器學習應該准備哪些數學預備知識?

 

一些數學符號:

vector向量:lower case bold Roman letters. (default: column vector)

T轉置:transcpose of a matrix or vector.

Matrices矩陣:uppercase bold roman letters

[a,b]:closed interval

(a,b):open interval

E, expectation: 

var, vriance:

cov, covariance:

norm, 范數:有時候為了便於理解,我們可以把范數當作距離來理解。代碼理解加深理解。原來我之前在python中見到的L1和L2就是這里的范數。

 

待續~

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM