很多電商做的設計都會做商品搜索功能
流程和邏輯圖
1,分詞
http://www.phpbone.com/phpanalysis/可以使用這個php分詞插件,但是詞典需要更新,因為商品搜索詞在根據時代變遷
可以將一個沒有搜索結果的詞,進入特殊處理的,人工校驗之后,作為新詞加入
還有就是使用第三方根據類似xunsearch等。
2,商品的分類,商品tag標簽,基礎屬性(比如男,女,年齡等需要你去前期在商品上可以分析的屬性)
分詞完成之后,一個很重要的就是分析詞的基礎屬性,比如nike的基礎屬性,就是鞋子,nike品牌,去要品標表查詢,還得去商品分類表查詢,還有追加詞,比如耐克短褲男,其實就是長尾詞分析,語義分析,如果如果有大量新詞沒有搜索結果,就需要人工增加,字典的詞根,就是分詞使用的詞根。
比如商品的一些基礎屬性,男,大碼,修身等屬性都需要在商品屬性相關表有體現,作為權重節點,比如搜索耐克鞋子,就是進行先品牌,后分類,最后產品名字,一層一層的進行處理數據,每個層級都有權重,這個需要長時間分析之后,設計權重具體是多少,中間還可以加入其它層級,比如地區,包郵,不包郵等,進行權重或者剔除條件。
這個都需要你在前期做商品的時候要做好准備
3,實際搜索處理
實際處理邏輯需要數據學習之后,不斷完善代碼邏輯,最好是層級處理,方便修改和維護,這是一個及其繁瑣和消耗耐心的過程
后面會有一個demo提供參考
4,結果內容處理,返回結果矯正
比如此次搜索需要將搜索內容,時間,返回結果都存起來,做一個邏輯分析,比如連續搜索一個短語的詞根,在一個比較短的時候連續搜索,多半可能是沒有返回給用戶正確數據,把這些數據進行定期,比如一天一次,把熱詞提取出來,做熱門搜索詞,在比如分析用戶搜索詞,做個性化推薦,個人熱門搜索內容等。這些都是數據分析作為基礎,提供的數據接口。
比如在結果的頁面,提供用戶反饋,矯正數據,去更新詞根和維護數據學習代碼。
5,后台處理給運用分析數據
最后就是把這些數據定期處理,提供給運營人員進行數據分析,這個挺重要的。