1、PCA是一種常用於減少大數據集維數的降維方法,把大變量集轉換為仍包含大變量集中大部分信息的較小變量集。
減少數據集的變量數量,自然是以犧牲精度為代價的,降維的好處是以略低的精度換取簡便。因為較小的數據集更易於探索和可視化,並且使機器學習算法更容易和更快地分析數據,而不需處理無關變量。
總而言之,PCA的概念很簡單——減少數據集的變量數量,同時保留盡可能多的信息。
1、PCA是一種常用於減少大數據集維數的降維方法,把大變量集轉換為仍包含大變量集中大部分信息的較小變量集。
減少數據集的變量數量,自然是以犧牲精度為代價的,降維的好處是以略低的精度換取簡便。因為較小的數據集更易於探索和可視化,並且使機器學習算法更容易和更快地分析數據,而不需處理無關變量。
總而言之,PCA的概念很簡單——減少數據集的變量數量,同時保留盡可能多的信息。
本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。