Z-score模型
Z-score是一維或低維特征空間中的參數異常檢測方法。該技術假定數據是高斯分布,異常值是分布尾部的數據點,因此遠離數據的平均值。距離的遠近取決於使用公式計算的歸一化數據點z i的設定閾值Zthr:
其中xi是一個數據點,μ是所有點xi的平均值,δ是所有點xi的標准偏差。
然后經過標准化處理后,異常值也進行標准化處理,其絕對值大於Zthr:
Zthr值一般設置為2.5、3.0和3.5。該技術是使用KNIME工作流中的行過濾器節點實現的。
Z-score是一維或低維特征空間中的參數異常檢測方法。該技術假定數據是高斯分布,異常值是分布尾部的數據點,因此遠離數據的平均值。距離的遠近取決於使用公式計算的歸一化數據點z i的設定閾值Zthr:
其中xi是一個數據點,μ是所有點xi的平均值,δ是所有點xi的標准偏差。
然后經過標准化處理后,異常值也進行標准化處理,其絕對值大於Zthr:
Zthr值一般設置為2.5、3.0和3.5。該技術是使用KNIME工作流中的行過濾器節點實現的。
本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。