pandas + jupyter進行數據處理


前言

上一篇文章已經將python所有職位的數據全部爬取並保存了下來,接下來我們要進行數據的處理,從所有的python職位中篩選出有測試、開發、運維的關鍵字職位來進行對比分析python在開發、測試、運維中的使用程度,具體的關鍵字大家可以靈活選擇。此文章只提供一種處理方法或思路,並不適用任何場景。

安裝

anaconda安裝

官網地址:https://www.anaconda.com/products/individual

它內部已經集成pandas、jupyter等一系列數據分析的開源庫

image-20210101161855135

數據處理

打開jupyter,開始編碼

import pandas as pd
work = pd.read_csv('job.csv',encoding='gbk')
pd.read_csv('job.csv',encoding='gbk')

image-20210101175145807

wk = work.sort_index(ascending=True)	#排序
DevOps = wk[wk['zhiwei'].str.contains('運維')]	#部分匹配關鍵字
test = wk[wk['zhiwei'].str.contains('測試')]
dev = wk[wk['zhiwei'].str.contains('開發')]
data = wk[wk['zhiwei'].str.contains('數據')]
data.shape[0] 	#查看列表的總行數
DevOps.shape[0]
dev.shape[0]
DevOps_to = DevOps['zhiwei']	#匹配zhiwei行的數據
test_to = test['zhiwei']
dev_to = dev['zhiwei']
data_to = data['zhiwei']
DevOps_to.to_csv('devops.csv')	#保存數據到新的csv
test_to.to_csv('test.csv')
dev_to.to_csv('dev.csv')
data_to.to_csv('data.csv')

從下面的編碼和結果已經看出開發、運維、測試、數據崗位使用python

的數量。(因為進行了地區和學歷以及工作年限的篩選所以總體的數據量不是很大。)數據:43,運維:47,開發:103,測試:54,雖然這些數據不能完全說明整體的情況,但依然也有部分參考的價值。

image-20210101175449596

當然這些數據也都保存到了csv文本里。

image-20210101180104130

image-20210101180526428


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM