不多說,直接上干貨!
Win7/8/10里如何下載並安裝最新穩定版本官網IBM SPSS Modeler 18.0 X64(簡體中文 / 英文版)(破解永久使用)(圖文詳解)
我這里,是以SPSS Modeler 18.0為例
IBM SPSS Modeler 18.0功能特色:
1、訪問各種類型的數據
借助SPSS Modeler,您可以使用各種分析技術訪問數據源, 如數據倉庫、數據庫、Hadoop 分布或平面文件,以便從您 的數據中發現隱含的模式。這些統計技術使用歷史數據來預 測當前狀況或未來事件。這些統計技術還包括數據訪問、數 據准備、數據建模和交互可視化功能。借助准備和建模自動 化流程,該產品適用於各種分析能力。
2、通過一系列技術拓寬您的分析范圍
借助 SPSS Modeler,您的分析師可利用設計用於處理簡單 的描述性分析問題、最復雜的優化問題以及這兩者之間的一 切問題的單一平台,解決業務問題。SPSS Modeler 具有超 出當今分析師標准分析要求的功能。一系列模型以及自動建 模和數據准備、文本分析、實體分析和社交網絡分析功能, 可以幫助您處理最復雜的問題。
3、一系列模型及算法
分類算法-根據歷史數據和技術進行預測。分段算法-利用自動聚類、異常檢測和聚類神經網絡技術 將工作人員進行分組或檢測不尋常的模式。關聯算法-發現先驗、CARMA 和序列關聯性的關聯、鏈 接或序列。時間系列和預測-隨着時間的推移,利用統計建模技術生成一個或多個系列的預測。可擴展性與 R 編程語言-應用轉型,用腳本進行分析, 並用 R 編程語言匯總或生成文本和圖形輸出。
4、數據准備和操作
SPSS Modeler 使數據准備自動化,以簡化流程並幫助您確 保您的數據格式為便於分析的最好格式。自動化任務包括進 行分析數據和識別修復工具,篩選字段,必要時派生新屬性, 並通過智能篩選技術提高性能。
5、自動數據建模
借助 SPSS Modeler 的自動建模功能,非分析師人員無需 專業技能即可迅速構建准確的模型。此外,先進的預測建 模功能可支持專業分析人員創建最復雜的流。
6、地理空間分析
借助 SPSS Modeler,您可探索與某個位置有關的各個數 據元素之間的關系並對您的數據進行地理空間分析,以發掘在圖表或表格中不可見的洞察力。通過空間挖掘,您可 利用 ESRI shape file 文件輕松挖掘地理空間數據。通過分 析空間數據和非空間數據,可以提高整個模型的准確性, 且您可以獲取對人員和事件的更深入洞察力。
7、文本分析
借助可定制 的特定行業文本分析包,您可以對正確的上下文里的除首 字母縮寫、表情符號和俚語之外的相關術語和詞組進行分 析。交互式圖表可幫助您探索和顯示文本數據和模式,以 便進行快速分析。
8、實體分析
借助 SPSS Modeler 的實體分析功能,您可非常輕松高效地 將身份、行為和行動數據與各自的實體實時或批量關聯起來。 您還可適時合並記錄或將它們分離開來。結果會怎樣呢?您 的組織將具有可幫助提高模型質量的關聯企業數據。
9、社交網絡分析
SPSS Modeler 可提供相關社交網絡分析功能,將與關系有 關的信息轉為顯示個人和團隊的社會行為的關鍵業績指標。 您可以利用這些指標來識別影響網絡中他人行為的社交領導 者。結合這些結果與其他措施,您可以創建全面的個人資料 文件,並以此作為您的預測性模型的基礎。
10、借助靈活部署適應您的各種需要
SPSS Modeler 架構是一個支持一系列平台和語言的開放 式平台。您可以在您的環境中或從雲端部署 SPSS Modeler,然后 在您的現有系統中自信地用它來優化性能和處理業務問題。 通過按計划或按要求為工作人員和流程提供結果,這種靈 活部署可彌合分析和行動之間的差距。
11、改善決策和成果
利用各種高級算法構建預測模型。
結合使用預測模型、業務規則和優化技術,在給定參數內通過雲執行決策。
在影響點向人員和系統提供建議,改善決策和操作。
將分析結果集成到現有業務流程和運營應用中。
將 SPSS Modeler 與 IBM Cognos Business Intelligence 集成時,在 BI 報表或儀表盤中顯示分析。
集成 IBM Cognos TM1,以在 Cognos TM1 多維數據集中使用或顯示數據。
12、從數據中提取價值
無論數據存儲在何處(例如,數據倉庫、數據庫、平面文件等),均可執行分析。
將 SPSS Modeler 與 IBM SPSS Analytic Server 結合使用時,可在 Hadoop 版本中分析數據。
不僅可分析結構化數據(例如,年齡、價格、產品、位置等),也可以分析非結構化數據(例如,文本、電子郵件、社交媒體數據等)。
使用統計算法和文本分析揭示數據中隱藏的洞察和模式。
使用實體分析進行實體解析和社交網絡分析,顯示個人和群體的社交行為。
通過自動化的數據准備、建模和基於 Web 的訂閱降低復雜性。
13、更輕松地集成到現有系統中
與 IBM 數據庫或其他供應商的數據庫配合使用,更快速、更高效地部署模型並評分。
通過將 SPSS Modeler 與 SPSS Statistics、Cognos Business Intelligence、Cognos TM1 和 InfoSphere Streams 集成,實現更流暢的分析工作流程。
通過使用那些支持 IBM Pure DataTM Systems、InfoSphere Warehouse、IBM DB2 和 Linux on IBM System z 功能的服務器版本,最小化數據移動,並提高性能。
通過“冠軍/挑戰者”方法評估預測模型,並自動執行評估。
14、支持的平台更加廣泛(MAC / Windows 10)
相比於Modeler的兄弟產品,SPSS Statistics早在3年前的 21.0 版本已經開始支持 Mac 操作系統,而Modeler一直只能支持Windows操作系統,可謂愁死了廣大的果粉了。很多果粉小伙伴為了能夠在Mac上用上Modeler可謂是費苦心啊。
但是現在,Modeler的18.0版本也正式發布了Mac版本,從此與虛擬機“Say Byebye”,咱們終於也能夠在Mac上直接使用了。
15、性能/功能更加強大的大數據算法
15.1 所有算法都支持本地運行而不需要連接Analytics Server
在Modeler之前的版本中,為更好滿足客戶的需求,特意設計了部分支持分布式計算的算法,而這些算法的實現是需要Analytics Server(簡稱AS,大家可以把AS理解為SPSS Modeler與Hadoop的連接器)這一模塊才能運行的,而現在這些新的算法都支持在本地client端運行。
15.2 所有新算法都支持基於內存的分布式計算
毫無疑問,對於大規模數據集來說,使用多線程計算將能更好地利用我們的硬件資源,更重要的是能夠節省我們的建模時間。在舊版本的SPSS Modeler版本中,只有部分的算法(CHAID,C&RT樹,QUEST,線性模型,神經網絡)能夠支持多線程,並且只有在連接上Modeler Server中的時候,才能啟用這項功能。

而在剛剛 15.1 提到的所有算法當中,現在都能支持多線程計算,並且直接在Modeler client端中即可啟用多線程,而無需連接至服務器端。
15.3 算法優化
(1) 線性SVM以及廣義線性模型(AS算法)提供了正則化功能
我們知道過擬合是我們機器學習過程中常常面臨的問題,為了避免模型過於復雜帶來的問題,我們可以通過正則化對模型添加先驗,使得模型的復雜度得到控制,從而減少噪聲的擾動。因此在Modeler的18版本中,GLE以及LSVM都提供了正則化的功能:

(2) 樹模型和LSVM模型提供了專門的數據准備功能
為了增強Tree-AS以及LSVM的能力,在Modeler的18版本當中,特意結合了數據准備功能在這兩個節點中,具體能力包括:連續字段分箱處理,分類字段進行類別合並,時間戳進行字段轉換,把缺失值自動視為新的類別(Tree-AS)等等

(3) 隨機樹節點新增功能選項
隨機樹節點,大家可以理解為隨機森林,但因為隨機森林最早被Leo Breiman和Adele Cutler提出后,就被注冊成了商標,因此這里稱之為隨機樹模型。該模型新增了兩個功能選項:

(a) 指定要用於拆分的最小預測變量數:如果是構建拆分模型,請設置要用於構建每個拆分的最小預測變量數。這防止拆分創建過小的子組。
(b) 當准確性無法再提高時停止構建 要:改進模型構建時間,請選擇此選項,以在結果的准確性無法提高時停止模型構建過程。
(4)時間序列算法的增強
時間序列算法主要增強在兩方面,一個是支持了多線程計算,二是增加了同時計算多個時間序列模型功能。
例如在舊版本中,當我們的原始數據是6個銷售門店從2015年1月到2016年6月的銷售額,那么我們只能通過編程或分別使用多個時間序列節點才能完成對6個銷售門店時間序列的預測,但是在新版本中,我們則可以一次性構建多個模型,大大簡化了建模的步驟。

16、在開源技術上更多的擴展和更強大的支持
16.1 在開源工具上更好的擴展和支持
機器學習是一個充滿生命力的技術領域,開源技術每天都會有長足的進步,為了能夠保證能夠在SPSS Modeler平台上使用到新的數據技術,Modeler在開源技術上一直有很好的支持。
從15版本開始集成R語言,16版本開始集成Python,17版本集成Spark。而來到我們的18版本,SPSS Modeler在集成上再更進一步,以往在集成Python以及Spark上需要AS組件的支持,但是現在我們能夠直接在Modeler的客戶端上直接集成Python的能力,並且我們能夠把相關的R語言代碼/Python代碼直接集成成為一個建模節點。

16.2 全新的擴展中心
除了通過上述的方法,通過在Modeler中嵌入相關的R/Python代碼定制相關節點外,IBM也開發了更多的功能在Github上,而現在我們可以直接在Modeler上下載應用相關的功能節點。

更直接的做法就是:
SPSS學習系列之SPSS Modeler的幫助文檔怎么調出來使用?

同時,大家可以關注我的個人博客:
http://www.cnblogs.com/zlslch/ 和 http://www.cnblogs.com/lchzls/ http://www.cnblogs.com/sunnyDream/
詳情請見:http://www.cnblogs.com/zlslch/p/7473861.html
人生苦短,我願分享。本公眾號將秉持活到老學到老學習無休止的交流分享開源精神,匯聚於互聯網和個人學習工作的精華干貨知識,一切來於互聯網,反饋回互聯網。
目前研究領域:大數據、機器學習、深度學習、人工智能、數據挖掘、數據分析。 語言涉及:Java、Scala、Python、Shell、Linux等 。同時還涉及平常所使用的手機、電腦和互聯網上的使用技巧、問題和實用軟件。 只要你一直關注和呆在群里,每天必須有收獲
對應本平台的討論和答疑QQ群:大數據和人工智能躺過的坑(總群)(161156071)






