微信現已開放小程序內搜索,為了讓小程序搜索爬蟲更好地發現及理解豐富的頁面,我們對開發者提供了以下的小程序設計建議。
爬蟲訪問小程序內頁面時,會攜帶特定的 user-agent:mpcrawler 及場景值:1129
1. 小程序里跳轉的頁面(url)能夠直接打開,不依賴上下文狀態。
小程序頁面內的跳轉url是我們爬蟲發現頁面的重要來源,且搜索引擎召回的結果頁面(url)是必須能直接打開,不依賴上下文狀態的。
建議頁面所需的參數都包含在url里
2. 頁面跳轉優先采用navigator組件。
小程序提供了兩種頁面路由方式:
navigator 組件
路由api,包括 navigateTo、redirectTo、switchTab、navigateBack、reLaunch
若兩種方式均能滿足開發者需求,建議使用 navigator 組件,以便更好的被爬蟲理解。
若無法使用navigator組件,建議針對爬蟲的訪問屏蔽針對點擊設置的時間鎖或變量鎖。
3. 頁面跳轉的url參數清晰簡潔。
結構清晰、簡潔的url有利於爬蟲的抓取及理解,如將json數據作為參數的方式是對爬蟲不友好的設計。
4. 必要的時候才請求用戶進行授權、登錄、綁定手機號等。
建議在關鍵的路徑上才要去用戶進行授權。
5. 頁面不能是web-view組件。
爬蟲不會去抓取web-view組件渲染的h5頁面。
6. 利用sitemap配置引導爬蟲抓取,同時屏蔽無搜索價值的路徑。
具體配置參看:https://developers.weixin.qq.com/miniprogram/dev/framework/sitemap.html
7. 設置一個清晰的標題和頁面縮略圖。
頁面標題和縮略圖對於搜索引擎理解頁面和結果展示有重要的作用。
建議通過wx.setNavigationBarTitle 或 自定義轉發內容onShareAppMessage 對頁面標題、縮略圖進行設置,另外video、audio組件建議設置poster屬性,明確音視頻封面圖。
8. 使用頁面路徑推送能力
頁面路徑推送能力的使用,可提高平台對小程序頁面內容的收錄量,進而提高小程序內容的曝光機會。具體可參看:
https://developers.weixin.qq.com/miniprogram/dev/api-backend/open-api/search/search.submitPages.html
官方原文地址:https://developers.weixin.qq.com/community/develop/doc/000a0a1191c3a817e7a9c6f1e51409
