本文是對機器學習算法的一個概覽,以及個人的學習小結。通過閱讀本文,可以快速地對機器學習算法有一個比較清晰的了解。本文承諾不會出現任何數學公式及推導,適合茶余飯后輕松閱讀,希望能讓讀者比較舒適地獲取到一點有用的東西。 本文主要分為三部分,第一部分為異常檢測算法的介紹 ...
時序異常檢測算法概覽 : : 分類: 人工智能與大數據 來自:論智 微信號:jqr AI ,作者:Pavel Tiunov,編譯:weakish來源:statsbot,原文鏈接 編者按:Statsbot CTO Pavel Tiunov簡要介紹了最流行的時序異常檢測算法,並討論了它們的優點和缺點 在Statsbot,我們持續檢查異常檢測方法這一領域的研究,並據此更新我們的模型。 本文概覽了最流行的 ...
2020-01-05 10:10 0 312 推薦指數:
本文是對機器學習算法的一個概覽,以及個人的學習小結。通過閱讀本文,可以快速地對機器學習算法有一個比較清晰的了解。本文承諾不會出現任何數學公式及推導,適合茶余飯后輕松閱讀,希望能讓讀者比較舒適地獲取到一點有用的東西。 本文主要分為三部分,第一部分為異常檢測算法的介紹 ...
異常點檢測,有時也叫離群點檢測,英文一般叫做Novelty Detection或者Outlier Detection,是比較常見的一類非監督學習算法,這里就對異常點檢測算法做一個總結。 1. 異常點檢測算法使用場景 什么時候我們需要異常點檢測算法呢?常見的有三種情況。一是在做 ...
所謂異常檢測就是發現與大部分對象不同的對象,也就是發現離群點。一般規定數據具有“正常”模型,而異常被認為是與這個正常模型的偏差。異常點在某些場景下反而令分析者感到極大興趣,如疾病預測,通常健康人的身體指標在某些維度上是相似,如果一個人的身體指標出現了異常,那么他的身體情況在某些方面肯定發生了改變 ...
南大周志華老師在2010年提出一個異常檢測算法Isolation Forest,在工業界很實用,算法效果好,時間效率高,能有效處理高維數據和海量數據,這里對這個算法進行簡要總結。 iTree 提到森林,自然少不了樹,畢竟森林都是由樹構成的,看Isolation Forest(簡稱 ...
...
四分位數(Quartile)應用於統計學中的箱線圖繪制,是統計學中分位數的一種,即把所有數值由小到大排列並分成四等份,處於三個分割點位置的數值就是四分位數。如下圖 其中四分位數的位置算法: Q1的位置 = (n+1) × 0.25 Q2的位置 = (n+1) × 0.5 ...
離散度 標准差是反應一組數據離散程度最常用的一種量化形式,是表示精確度的重要指標。說起標准差首先得搞清楚它出現的目的。我們使用方法去檢測它,但檢測方法總是有誤差的,所以檢測值並不是其真實值。檢測值與真實值之間的差距就是評價檢測方法最有決定性的指標。但是真實值是多少,不得而知 ...
1. 基於統計的異常檢測 Grubbs' Test Grubbs' Test為一種假設檢驗的方法,常被用來檢驗服從正太分布的單變量數據集(univariate data set)\(Y\) 中的單個異常值。若有異常值,則其必為數據集中的最大值或最小值。原假設與備擇假設如下: \(H_0 ...