使用SQL Server Analysis Services數據挖掘的關聯規則實現商品推薦功能(四)


假如你有一個購物類的網站,那么你如何給你的客戶來推薦產品呢?這個功能在很多電商類網站都有,那么,通過SQL Server Analysis Services的數據挖掘功能,你也可以輕松的來構建類似的功能。

 

 

此篇獨立於前三篇,主要介紹如何通過Excel的數據挖掘來獨立的實現商品推薦功能,將通過微軟提供的示例數據來進行演示。

 

 

Excel是大家再熟悉不過的工具,它是微軟Office里的組件之一。在baidu百科中你可以找到如下的描述:

Excel 是微軟辦公套裝軟件的一個重要的組成部分,它可以進行各種數據的處理、統計分析和輔助決策操作,廣泛地應用於管理、統計財經、金融等眾多領域。

數據處理,統計分析是我們經常用Excel來做的事,而輔助決策對應商業智能中的最高的一個層次,也就是微軟提供的Excel數據挖掘功能。

在Excel中進行數據挖掘,需要安裝一個插件:SQL Server Data Mining Tools Add-ins for Office。

 

下載SQL Server Data Mining Tools Add-ins for Office的頁面:

http://www.microsoft.com/en-us/download/details.aspx?id=29061

本文中使用的版本是SQL Server 2012和Office 2010,這個下載鏈接對應的就是這個版本。

下載時需要留意下語言的版本,要跟機器上安裝的Office版本相對應,還有需要留意你所安裝的是32位的還是64位的,都有對應的版本。

對於以前的office 2007版本,有對應的2005,2008和2008 R2的SQL Server版本與之對應,這些版本都可以從那個下載頁面的底端找到。

 

 

下載安裝完成后,首先找到工具給的示例數據來看一下Excel下的數據挖掘都能給我們提供哪些功能。

如果你安裝了Windows 8,那么進入到開始界面,然后敲Excel進入到應用搜索,通常第二個結果就是。

打開Excel的過程中,可能會彈出這個界面:

這里選擇第二項,不要在意里面的2008版本信息。

點擊后會彈出另外一個工具:

點擊下一步:

指定好一個分析服務實例,點擊下一步:

這里會有一個提示,從提示中我們可以看到,Excel的這個Add-ins會在分析服務庫中創建臨時的挖掘模型,而且這個模型會在用戶關閉連接之后自動刪除。

點擊下一步:

這里會讓我們指定是創建一個新庫還是用一個已經存在的庫,這里默認選擇創建新庫。點擊下一步:

這里需要為用戶指定權限。此篇演示按照默認設置就可以,點擊Finish。

工具會自動創建分析服務數據庫和相應的用戶權限。完成后點擊Close關閉工具。

以上,Excel Data Mining Add-ins的配置就完成了。

 

 

轉到剛才打開的示例Excel,可以看到示例中提供的數據挖掘示例數據:

這里直接選擇最后一個Associate and Shopping Basket。關聯規則和購物籃。

然后會跳轉到Associate標簽里面的樣本數據。這個工具就是根據樣本數據,利用關聯規則模型的算法,來發現里面的購買規律。

其中Order Number是訂單編號,往后依次是產品分類,產品名稱和產品價格。

留意一下安裝了Data Mining Add-ins for Office之后的Excel的Ribbon工具欄:

多了一項Table Tools,這里我們要用到里面的Shopping Basket Analysis。

首先留意一下右邊的Connection工具,Excel的這個數據挖掘插件是需要SQL Server Analysis Services支持的,點擊它連接一個分析服務。

點擊New新建連接。

添寫要連接到的分析服務,Catalog name直接選default就可以。Test Connection沒問題后點OK完成設置。

然后點擊Shopping Basket Analysis按鈕。

接下來會彈出如圖的工具,需要根據模型算法的特點指定一些列的信息。

Transation ID直接對應訂單編碼Order Number,Item在演示中為了降低項的個數這里直接選擇Category,Item Value選擇Product Price產品價格。

直接點擊Run開始處理數據:

處理完畢后,會自動生成兩個標簽頁記錄模型分析的結果:

在第一個標簽頁中,會給我們一些銷售捆綁建議。

結果是按照最后一列的捆綁總銷售額,挖掘結果根據這一列進行了排序。前面幾列對應的信息分別是綁定包的大小,比如一個咖啡和伴侶,那么這個包的大小就是2,第二列跟支持度差不多,也就是在樣本數據中,有多少是用戶是同時買了這幾樣產品的,后面一列是這個捆綁包的總價是多少。

比如第一行,Road Bikesh和Helmets這個捆綁建議,它的包大小是2,在樣本數據,也就是歷史數據中,有805個訂單里同時包括這兩樣產品,這個捆綁包的價格是1570.228025,樣本數據中這樣的產品在一起一共賣了1264033.56。

通過這個報告,我們就可以知道哪些捆綁商品值得創建。

在另外一個標簽頁中,可以看到商品推薦建議信息:

這里會列出最值得推薦的幾個組合建議,后兩列信息跟前一個報告一樣。前兩列信息依次是給定的一個商品和根據這個給定產品最值得推薦的產品。

往后列依次是,有多少個訂單包含了給定的產品,接下來一列是在包含給定產品的訂單中,有多少又同時包含了推薦的產品。后面的百分比就是這個比例。

 

 

以上報告中提供的統計信息都是我們在做銷售捆綁決策時很重要的參考信息,而不同人做的決策肯定會有所差別。

比如,一個保守點的老板覺得Helmets跟Tires and Tubes這樣的組合很多,而且Helmets購買量也足夠大,為了讓不太好賣的產品更好賣些,比如Bike Racks賣的很少,但明顯Tires and Tubes賣的比較多,那么我就可以推行Bike Racks和Tires and Tubes這樣的搭配方案來促進銷售。

而另外一個老板可能認為目前的銷售應該趁熱打鐵,什么好賣賣什么,於是肯定會大力推行Helmets和Tires and Tubes這樣的搭配方案,因為Helmets已經賣得夠好了,那么更希望能帶動Tires and Tubes的銷量。

總之,根據不同的銷售策略和特點,根據這些統計信息可以為用戶提供不同的決策數據依據。

 

 

在處理數據的過程中,可能會出現如下的錯誤提示:

出現這個錯誤主要是由於連接分析服務失敗,檢查下分析服務的角色設置就可以。

 

 

總結:

此篇根據微軟提供的示例數據,通過Excel實現購物籃預測功能,結果為Excel里的兩篇報告。通過此篇,相信大家應該對這個挖掘工具需要什么樣的樣本數據已經有了大體的了解。后續的文章,我會進行一個實際操作過程來演示如何在我們的實際業務中,組織數據來進行類似的預測分析。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM