AI現在隨便一個人都能忽悠兩句,網上甚至有三條python語句的傻瓜神經網絡應用工具,似乎人人都能成為AI“磚家”。
AI入門還是比較簡單的,尤其是現在python盛行,隨便誰一天之內都能寫出不錯的AI程序。
但是AI的精通其實是非常難的,大部分玩的都是別人准備好的訓練數據,根本就不知道怎么處理真實數據,其實AI的60%以上的工作都在原始數據的處理上。
你得足夠了解自己的數據,這是你的命根子,你得用各種統計學方法來觀察檢測自己的數據,你都不了解自己的數據就去隨便套模型,出來的結果自己都不知道是什么,還想忽悠別人相信?
數據准備好了之后,就可以根據自己的經驗來挑選模型,其實經過這么多年的優化,不同模型之間的性能差距真的不大,比較幾個常見模型就好了,真沒必要每個模型都試一下。
調參。。。
言歸正傳~ 數學基礎,機器學習離不開數學,非科班出生的同學一看到數學的部分就開始心煩,心里抱怨,為什么當初我就沒學好數學呢?恨不得立馬惡補各種公開課,教材。
我也一樣,各種搜索,想要補回來數學基礎。但都以失敗而告終。
因為我對機器學習的興趣僅僅限於我現有數據的應用上,從頭開始啃大部頭,一我沒時間;二我沒興趣,所以實在沒必要死磕到數學里。
數學專業:他們才是最有能力探索底層數學的人;
機器學習理論專業:探索最前沿的AI模型,從數學的角度;但數學能力和數學專業的人還是有差距的;
機器學習應用專業:偏重已有模型的解讀和應用,數學基礎以能理解現有模型為重;
交叉學科的機器學習應用者:我就在這,這些人都手握大量的珍貴數據,看着機器學習現在這么熱,也想來探索一下自己的數據。有能力的大老板就會直接招機器學習專業的小老板;一般的老板就只能招個非科班出生的博士。我們的使命是探索數據中的知識,而不是開發最前沿的AI模型。這群人數學能力偏弱,甚至無法理解自己模型的數學原型。
所以,該不該補數學,怎么補,取決於你在哪個應用層。
作為交叉學科的應用者,精力有限,不可能從頭開始補數學,所以只能在應用中零碎的去補了。要明確我們的優勢,我們是數據導向的,不是算法導向的。
你一個交叉學科的非要去和純AI學科的人在算法數學理論領域拼刺刀,那我只能說你傻。
呵護好自己的數據,選擇一個自己能足夠掌控的成熟模型,得到一些同行認可的有價值的結果,這就足夠了。
如果你要全職轉去AI行業,那就必須要提高對自己的要求了。
一些數學符號:
vector向量:lower case bold Roman letters. (default: column vector)
T轉置:transcpose of a matrix or vector.
Matrices矩陣:uppercase bold roman letters
[a,b]:closed interval
(a,b):open interval
E, expectation:
var, vriance:
cov, covariance:
norm, 范數:有時候為了便於理解,我們可以把范數當作距離來理解。代碼理解,加深理解。原來我之前在python中見到的L1和L2就是這里的范數。
待續~