機器學習四大分類

本文轉載自查看原文 2020-03-28 15:55 1410

機器學習分為四大塊，分別是classification (分類)，regression (回歸), clustering (聚類), dimensionality reduction (降維)。

聚類（clustering）

無監督學習的結果。聚類的結果將產生一組集合，集合中的對象與同集合中的對象彼此相似，與其他集合中的對象相異。

沒有標准參考的學生給書本分的類別，表示自己認為這些書可能是同一類別的（具體什么類別不知道，沒有標簽和目標，即不是判斷書的好壞（目標，標簽），只能憑借特征而分類）。
分類（classification）

有監督學習的兩大應用之一，產生離散的結果。

例如向模型輸入人的各種數據的訓練樣本，產生“輸入一個人的數據，判斷是否患有癌症”的結果，結果必定是離散的，只有“是”或“否”。（即有目標和標簽，能判斷目標特征是屬於哪一個類型）
回歸（regression）

有監督學習的兩大應用之一，產生連續的結果。

例如向模型輸入人的各種數據的訓練樣本，產生“輸入一個人的數據，判斷此人20年后今后的經濟能力”的結果，結果是連續的，往往得到一條回歸曲線。當輸入自變量不同時，輸出的因變量非離散分布（不僅僅是一條線性直線，多項曲線也是回歸曲線）。
1，給定一個樣本特征 , 我們希望預測其對應的屬性值 , 如果是離散的, 那么這就是一個分類問題，反之，如果是連續的實數, 這就是一個回歸問題。

2，如果給定一組樣本特征 , 我們沒有對應的屬性值 , 而是想發掘這組樣本在二維空間的分布, 比如分析哪些樣本靠的更近，哪些樣本之間離得很遠, 這就是屬於聚類問題。

3，如果我們想用維數更低的子空間來表示原來高維的特征空間, 那么這就是降維問題。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Mysql學習---SQL語言的四大分類機器學習實戰-----八大分類器識別樹葉帶源碼機器學習分類三、機器學習的分類機器學習算法分類機器學習--分類問題機器學習——分類和回歸機器學習——算法分類機器學習算法分類機器學習簡介和分類