聚類分析是一類廣泛被應用的分析方法,其算法眾多,目前像SAS、Splus、SPSS、SPSS Modeler等分析工具均以支持聚類分析,但是如何使用,尤其在網游數據分析方面,作用還是很大的,尤其是我們對於某些客群的分析時,排除人為的分組的干擾,客觀和全面的展現客群的特征是一件很重要的事。 網游 ...
昨天分享了以前學習的聚類分析算法K Means的部分知識,其實這個主要是了解一下這個算法的原理和適用條件就行了,作為應用而不是作為深入研究,能夠很好的將業務和算法模型緊密結合的又有幾人呢 所以一些基本知識還是很必要的,這里就是簡單把看過的一些知識點列舉一下,梳理一下,快速了解和使用。 今天把TwoSteps的知識也梳理一下,順便做個小的演示,使用SPSS ,后續在使用SPSS Modeler或者叫 ...
2012-06-14 17:54 2 15777 推薦指數:
聚類分析是一類廣泛被應用的分析方法,其算法眾多,目前像SAS、Splus、SPSS、SPSS Modeler等分析工具均以支持聚類分析,但是如何使用,尤其在網游數據分析方面,作用還是很大的,尤其是我們對於某些客群的分析時,排除人為的分組的干擾,客觀和全面的展現客群的特征是一件很重要的事。 網游 ...
關聯分析的學習 在說關聯分析之前,先說說自己這段時間的一些感受吧,這段時間相對輕松一些,有一些時間自己自己來學習一些新東西和知識,然而卻發現捧着一本數據挖掘理論的書籍在一點一點的研讀實在是很漫長,而且看過了沒有什么感覺。數據這一行理論很多,算法很多,模型很多,自己現在一直是結合業務來做的數據分析 ...
早些時候寫過關於購物籃分析的文章,其中提到了C5.0和Apriori算法,沒有仔細說說這算法的含義,昨天寫了一下關聯分析的理論部分,今天說說關聯分析算法之一的Apriori算法,很多時候大家都說,數據分析師更多的是會用就可以了,不必糾結於那些長篇累牘的理論,其實我覺得還是有點必要的,你未必要去設計 ...
何為聚類分析 聚類分析或聚類是對一組對象進行分組的任務,使得同一組(稱為聚類)中的對象(在某種意義上)與其他組(聚類)中的對象更相似(在某種意義上)。它是探索性數據挖掘的主要任務,也是統計 數據分析的常用技術,用於許多領域,包括機器學習,模式識別,圖像分析,信息檢索,生物信息學,數據 ...
聚類分析 百度百科:聚類分析指將物理或抽象對象的集合分組為由類似的對象組成的多個類的分析過程。同一個簇中的對象有很大的相似性,而不同簇間的對象有很大的相異性。 方法——(還可直接用SPSS) 1. 系統聚類法(適用於數據量比較小的情況) 2. K-均值法:先把樣品粗略分為 ...
上次簡單的說了一下SPSS下使用兩步聚類分析的大致過程,今天簡單說說在Clementine下怎么進行聚類分析,方法同樣是兩步聚類。 之前說過聚類分析是無指導的,揭示的輸入字段集的模式,不是一種預測。在我們輸入的字段上進行聚類分析找出組合最佳,能夠反映共同屬性的模式。兩步聚類有兩步,第一步是擴展 ...
今天說到的這個題目,看起來有點大,不過作為游戲數據分析師,早晚都要設計和分析數據指標。在《移動游戲運營數據分析指標白皮書》(http://www.xuefenxi.com/forum.php?mod=viewthread&tid=2&extra=page%3D1)中,提煉了一些針對 ...
前段時間說過一些關於玩家生命周期的問題,其實那些有點大,有點虛,從宏觀的角度了解我們此時此刻正在做的分析是屬於那一部分,哪一個體系的,說實話,這是為了建立一種意識而要做的工作,玩家生命周期價值源於電信行業的客戶生命周期管理和PLC(產品生命周期)的解讀和應用,限於本人水平和能力因素,不夠深刻 ...