分享 百度網盤搜索引擎原理以及實現部分源碼


先給出大家示例:百度網盤搜索示例參考https://pan.90xz.com/

一、搜索引擎結構

網盤搜索引擎---》既然是搜索引擎---》最終都是蜘蛛爬尋程序

蜘蛛爬尋就必須有網,網在哪里呢,百度都給你了,但現在隱藏了如下圖

圖上紅色字體 【粉絲】,和【關注】 這倆貨百度給隱藏了,原來都顯示,記住是隱藏了,相當於程序的警告,無視他,當然你也看不到。

網就在粉絲和關注這里,關注相當於吳亦凡,粉絲就是吳亦凡的一個小粉絲,如果其中一個小粉絲在關注下蒼老師,那粉絲就無窮無盡了。這就是蜘蛛爬尋的網的結構。

二、主要結構API--js調用地址

以下{0}=237243058=用戶Id

1.獲取粉絲

http://pan.baidu.com/pcloud/friend/getfanslist?query_uk={0}&limit=24&start=0&bdstoken=null&channel=chunlei&clienttype=0&web=1

2.獲取關注

http://pan.baidu.com/pcloud/friend/getfollowlist?query_uk={0}&limit=24&start=0&bdstoken=null&channel=chunlei&clienttype=0&web=1

3.獲取分享

http://pan.baidu.com/pcloud/feed/getsharelist?t=時間&category={1}&auth_type=1&request_location=share_home&start=0&limit=100&query_uk={0}&channel=chunlei&clienttype=0&web=1&bdstoken=null

{1}=0、1、2、3、4、5、6==全部分享\專輯\圖片\文檔\音樂\視頻\其他 這個自己一一對應吧

4.獲取分享專輯

http://yun.baidu.com/pcloud/album/getlist?t=時間&start=0&limit=100&query_uk={0}&channel=chunlei&clienttype=0&web=1&bdstoken=null

以上返回都是json數組

采用的是Newtonsoft.Json 反序列化類。

Newtonsoft.Json  用法http://www.cnblogs.com/yanweidie/p/4605212.html

三、需要實現功能

1.代理IP

畢竟百度不是全心全意支持你爬尋他的,必須用匿名代理Ip來實現爬尋API 

C# 通過代理發HTTP請求 https://q.cnblogs.com/q/88682/

2.這么多資源怎么讓人看到呢

盤古+Lucene .net  實現 大牛盤古介紹使用http://www.cnblogs.com/eaglet/category/143427.html

2千萬資源搜索速度還是挺不錯的,示例:百度網盤搜索引擎https://pan.90xz.com/ 90網盤

3. mvc+NVelocity 模板解析

NVelocity  簡介http://www.cnblogs.com/wysky/archive/2007/12/06/985832.html

四、其他要說的事

1.覺得不錯的話多多推薦一下吧:百度網盤搜索引擎https://pan.90xz.com/ 90網盤 ^_^

2.功能實現容易,推廣難,再推薦一下吧

3.源碼太多 方法最重要就不展示了,源碼下載分享-----卡卡卡

4.學習提高 kindle電子書:

https://book.90xz.com?wid=1

it電子書 https://book.90xz.com/IT?wid=1 登陸才能查看

5.以上所貼博客園文章是作者自己百度/谷歌搜索所得,自己參考了

 

 

 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM