花費 8 ms
國家統計局數據采集

概述 國家統計局的公開數據真實性強,宏觀且與我們的生活息息相關。 因此,采集此數據作為數據分析實驗的數據再好不過。 采集過程 采集各種公開數據的第一步就是分析網頁。 上面的圖是國家統計局 ...

Fri Apr 09 20:13:00 CST 2021 0 627
數據采集實戰(一)-- 鏈家網成交數據

概述 最近在學習python的各種數據分析庫,為了嘗試各種庫中各種分析算法的效果,陸陸續續爬取了一些真實的數據來。 順便也練習練習爬蟲,踩了不少坑,后續將采集的經驗逐步分享出來,希望能給后來者一些 ...

Thu Jul 01 02:45:00 CST 2021 0 376
數據采集實戰(三)-- 王者榮耀2021世冠數據

1. 概述 王者榮耀是一直都挺喜歡的一個手游,玩了好幾年,最近一段開始喜歡看比賽,所以想着采集點數據看看各個戰隊或者選手的情況。 順便也練習練習 puppeteer 的使用。 數據來源於:尚牛電競 ...

Sat Aug 21 08:44:00 CST 2021 1 234
數據采集實戰(二)-- 京粉商品

1. 概述 京粉(https://union.jd.com/)是京東聯盟下的網站,通過分享其中的商品鏈接可以賺取佣金,類似淘客聯盟。 采集京粉的商品,既可以練習 puppeteer的使用,平時想在 ...

Tue Jul 27 10:26:00 CST 2021 0 170
數據采集實戰(四)-- 線性代數習題答案下載

1. 概述 前段時間在看一本很多人推薦的線性代數教材《線性代數應該這樣學》第三版,這一版每個章節都有大量的習題。 官方網站上雖然按照章節提供了習題的答案,一來因為網站是國外的,訪問不流暢,二來答案 ...

Sat Oct 09 01:32:00 CST 2021 0 133
數據采集實戰(五)-- 當當網童書排名

1. 概述 現在學校越來越重視孩子課外知識的掌握,給孩子挑選課外書一般都是參考學校或者家長之間的推薦。 有時,也會想看看在兒童階段,目前到底流行的是些什么樣的書。 ​ 於是,就簡單寫了這個小爬蟲, ...

Mon Dec 06 23:36:00 CST 2021 0 124
南京二手房成交數據分析

數據來源 數據頁面: 鏈家網南京(https://nj.lianjia.com/chengjiao/) 鏈家網數據量很大,這里只用南京的二手房成交數據。 如下圖: 數據采集 鏈家網的頁面數 ...

Thu Apr 15 19:02:00 CST 2021 2 248
利用pandas分析交易數據

概要 實戰過程 原始數據格式 漲跌幅分析 分析步驟 01:去除多余的列 分析步驟 02:幣種列轉為行,每個交易日一行數據 ...

Thu May 27 02:07:00 CST 2021 0 221
pandas 基於日期的統計

概要 分析時間序列數據時,按照日期的維度進行統計幾乎是必備的需求。 基於pandas,可以方便的進行各種日期維度(年份,季度,月,周等等)的統計,不用去遍歷每行數據去統計。 示例-銷售數據統計 ...

Sun Jan 30 09:42:00 CST 2022 0 852
箱圖在數據預處理中的應用

箱圖簡介 箱型圖是一種用作顯示一組數據分布情況的統計圖,因型狀如箱子而得名。 1977年由美國著名統計學家約翰·圖基(John Tukey)發明。它能顯示出一組數據的最大值、最小值、中位數及上下四分 ...

Fri Feb 25 09:50:00 CST 2022 0 694

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM