本文的文字及圖片來源於網絡,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯系我們以作處理。
作者: A字頭
PS:如有需要Python學習資料的小伙伴可以加點擊下方鏈接自行獲取
http://note.youdao.com/noteshare?id=3054cce4add8a909e784ad934f956cef
有些朋友在工作中會有這樣的困惑:明明我從早忙到晚,為什么得到的評價還不高?
要知道,企業對一個員工的評價是出於“產出”而非“付出”。所以,如果把大量時間花在機械重復的工作上,不但工作效率不高,對個人發展來說也無甚幫助。
而這些工作,如果對於會點編程的人來說,往往通過幾行代碼就可以快速搞定了。
於是,我去了解了一下身邊不同崗位(HR、產品、運營、市場、數據分析師等)每天需要面對的重復性勞動(肯定會有不全,歡迎補充~),總結了一些在工作中非常常見的例子,並且將源碼整理好供參考。希望這些程序可以讓你的工作更高效!(升職加薪了別忘了回來發紅包哦~)
那么如何將這些統統實現呢?
我將這些分為以下幾類,大家可以自行評估,各取所需:
系統錄入自動化
由於你經常需要不斷的將一些信息錄入系統,每一次錄入的過程中你可能需要不斷的點擊一些按鈕,面對這種情況,完全可以寫一個自動腳本,每次代替你來執行這些點擊的行為。
這里寫了一個自動登錄郵箱的腳本,可以實現文本輸入和網頁點擊:
1 import time 2 from splinter import Browser 3 4 def splinter(url): 5 browser = Browser() 6 #login 126 email websize 7 browser.visit(url) 8 #wait web element loading 9 time.sleep(5) 10 #fill in account and password 11 browser.find_by_id('idInput').fill('xxxxxx') 12 browser.find_by_id('pwdInput').fill('xxxxx') 13 #click the button of login 14 browser.find_by_id('loginBtn').click() 15 time.sleep(8) 16 #close the window of brower 17 browser.quit() 18 19 if __name__ == '__main__': 20 websize = 'https://mail.163.com/' 21 splinter(websize)
同理可以寫一個簡單的游戲掛機腳本,游戲掛機腳本,無非就是自動移動鼠標,自動點擊,進行重復操作,所以,第一步就是如何控制鼠標。
1 import win32api 2 import time 3 def move_click(x, y, t=0): # 移動鼠標並點擊左鍵 4 win32api.SetCursorPos((x, y)) # 設置鼠標位置(x, y) 5 win32api.mouse_event(win32con.MOUSEEVENTF_LEFTDOWN | 6 win32con.MOUSEEVENTF_LEFTUP, x, y, 0, 0) # 點擊鼠標左鍵 7 if t == 0: 8 time.sleep(random.random()*2+1) # sleep一下 9 else: 10 time.sleep(t) 11 return 0 12 # 測試 13 move_click(30, 30) 14 15 def resolution(): # 獲取屏幕分辨率 16 return win32api.GetSystemMetrics(0), win32api.GetSystemMetrics(1)
值得注意的是,一定要在管理員權限下的cmd中運行,否則點擊無效。
這個時候,你已經可以寫個循環,不停地點擊屏幕上不同的幾個點,最基礎的掛機腳本就實現了。
Excel自動化處理
Excel合並
在實際應用中可能會有不同月份的數據或者不同周的報告等等的Excel數據,都是單個獨立的文件,如果想要整體使用的話就需要合並一下,那么如何利用python把指定目錄下的所有Excel數據合並成一個文件呢?
思路:利用python xlrd包讀取excle文件,然后將文件內容存入一個列表中,再利用xlsxwriter將內容寫入到一個新的excel文件中。
1 # -*- coding: utf-8 -*- 2 3 #將多個Excel文件合並成一個 4 import xlrd 5 import xlsxwriter 6 7 #獲取excel中所有的sheet表 8 def getsheet(fh): 9 return fh.sheets() 10 11 #獲取sheet表的行數 12 def getnrows(fh,sheet): 13 table=fh.sheets()[sheet] 14 return table.nrows 15 16 #讀取文件內容並返回行內容 17 def getFilect(file,shnum): 18 fh=open_xls(file) 19 table=fh.sheets()[shnum] 20 num=table.nrows 21 for row in range(num): 22 rdata=table.row_values(row) 23 datavalue.append(rdata) 24 return datavalue
或者直接用concat+一個循環來實現:
1 for i in var_list: 2 df_0 = data[['var_1','var_2','var_3','var_4',i]][data[i]=='信息'] 3 df_0['month'] = date_replace(i) 4 df_0 = df_0[['var_1','var_2','var_3','var_4','var_5']] 5 li.append(df_0) 6 7 writer = pd.ExcelWriter(r'C:\Users\mapping.xlsx') 8 df = pd.concat(li) 9 df.to_excel(writer,'Sheet1',index=False,header = None)
Excel中添加數據圖表
整理好excel文件后下一步需要做的是處理文件里的數據,根據數據來生成一些自己需要的圖表:
1 import xlsxwriter 2 3 #設置一個例子 4 data = [20, 45, 26, 18, 45] 5 6 #創建表格 7 workbook = xlsxwriter.Workbook("temp.xlsx") 8 worksheet = workbook.add_worksheet("data") 9 10 #添加數據 11 worksheet.write_column('A1', data) 12 13 #創建圖表 14 chart = workbook.add_chart({'type': 'line'}) 15 16 #圖表添加數據 17 chart.add_series({ 18 'values': '=data!$A1:$A6', 19 'name': '圖表名稱', 20 'marker': { 21 'type': 'circle', 22 'size': 8, 23 'border': {'color': 'black'}, 24 'fill': {'color': 'red'} 25 } , 26 'data_labels': {'values': True}, 27 'trendline': { 28 'type': 'polynomial', 29 'order': 2, 30 'name': '趨勢線', 31 'forward': 0.5, 32 'backward': 0.5, 33 'display_equation':True, 34 'line': {'color': 'red', 'width':1, 'dash_type': 'long_dash'} 35 } 36 }) 37 38 worksheet.insert_chart('c1', chart) 39 workbook.close()
實現效果:
這部分圖文來自網絡,侵刪。
word關鍵信息提取
假設你收到1萬份簡歷,你想先根據學校做一些篩選,這時候利用python將大量的簡歷進行信息匯總,只提取關鍵信息用excel查看起來更加方便。
docx文件自己本身是壓縮文件,打開壓縮包之后竟然發現里面有個專門存儲word里面文本的文件。 那么步驟就變得簡單了:
-
打開docx的壓縮包
-
獲取word里面的正文信息
-
利用正則表達式匹配出我們想要的信息
-
將信息存儲到txt中(txt可以用excel打開)
-
批量調用上述過程,完成一萬份簡歷的提取工作
利用正則匹配獲取關鍵信息:
1 import re 2 def get_field_value(text): 3 value_list = [] 4 m = re.findall(r"姓 名(.*?)性 別", table) 5 value_list.append(m) 6 m = re.findall(r"性 別(.*?)學 歷", table) 7 value_list.append(m) 8 m = re.findall(r"民 族(.*?)健康狀況", table) 9 value_list.append(m) 10 ''' 11 此處省略其他字段匹配 12 ''' 13 return value_list
自動化運營監控
在平時的工作中,一定會有對運營情況的監控,假設你管理一家店鋪,那么一些關鍵指標肯定是你需要每天查看到的,比如店鋪訪問數,商品瀏覽數,下單數等等,這個時候不用每天重復地去統計這些數據,這需要寫一個自動化程序,每天將數據保存在固定的文件夾下就可以實現報表的實時監控。
如果你的數據來源是線下文件:
-
利用python操作線下文件將其載入數據庫
-
通過數據庫對數據進行處理
-
利用python輸出結果
1 from impala.dbapi import connect 2 from impala.util import as_pandas 3 import datetime 4 5 conn = connect(host='host',port=21050,auth_mechanism='PLAIN',user='user',password='password') 6 #host:數據庫域名 7 #user:數據庫用戶名 8 #password:數據庫密碼 9 df_data = pd.read_excel('temp.xlsx') 10 11 rows =[] 12 for index, row in df_data.iterrows(): 13 rows.append('('+'"'+str(row['case_id']).replace('nan','null')+'"'+','+'"'+str(row['birth_date'])+'"'+')'+',') 14 a= ''' 15 INSERT into table 16 (case_id, birth_date) 17 values ''' 18 for i in rows: 19 a += i 20 a = a[:-1] 21 22 cursor1 = conn.cursor() 23 cursor1.execute(a) 24 cursor1.close() 25 conn.close() 26 print('成功導入數據至數據庫...') 27 del a 28 del rows
如果你的數據來源是線上文件(存在數據庫)
-
直接利用python鏈接數據庫進行一些列的操作
-
導出你所需要的結果
1 import sql #sql是封裝的sql文件 2 sql_end = sql.sql_end 3 cursor1 = conn.cursor() 4 for i in sql_end.split(';'): 5 print(i) 6 cursor1.execute(i) 7 cursor1.close() 8 conn.close() 9 print('程序運行結束,請執行下一步。')
自動發送郵件
使用Python實現自動化郵件發送,可以讓你擺脫繁瑣的重復性業務,節省非常多的時間。
數據分析師經常會遇到一些取數需求,有些數據需求是每天都需要的,有些數據需求是每周一次的。對於這些周期性的數據需求,每次都重復性地手動導出這些數據,並回傳給需求方,是很繁瑣且浪費時間的。所以完全可以設置自動郵件來解決。
"Talk is cheap, show you the code" 常見的郵件肯定有三部分: 1、正文 2、圖片 3、附件 OK 導入我們需要用到的包
1 from email.mime.text import MIMEText 2 from email.mime.multipart import MIMEMultipart 3 from email.mime.image import MIMEImage 4 import smtplib 5 6 msg = MIMEMultipart()
在郵件中插入正文:
1 ##在郵件中插入文本信息 2 df_text='''<html> 3 <body> 4 <p> Hi all ,</p> 5 <p> 這是一個測試郵件,詳情請參考附件 </p> 6 <p> 情況如下圖: </p> 7 </body></html>''' 8 msgtext = MIMEText(df_text, 'html', 'utf-8') 9 msg.attach(msgtext)
如果你需要插入圖片,利用同樣的方法,在郵件中插入圖片:
1 ##在郵件中插入圖片信息 2 image = open('temp.jpg','rb') 3 msgimage = MIMEImage(image.read()) 4 msg.attach(msgimage)
在郵件中插入附件:
1 ##在郵件添加附件 2 msgfile = MIMEText(open('temp.xlsx', 'rb').read(), 'base64', 'utf-8') 3 msgfile["Content-Disposition"] = 'attachment; filename="temp.xlsx"' 4 msg.attach(msgfile)
剩下的就是設置一些郵件參數來發送郵件:
1 #設置郵件信息常量 2 email_host= '' # 服務器地址 3 sender = '' # 發件人 4 password ='' # 密碼,如果是授權碼就填授權碼 5 receiver = '' # 收件人
發送郵件:
1 try: 2 smtp = smtplib.SMTP(host=email_host) 3 smtp.connect(email_host) 4 smtp.starttls() 5 smtp.login(sender, password) 6 smtp.sendmail(sender, receiver.split(',') , msg.as_string()) 7 smtp.quit() 8 print('發送成功') 9 except Exception: 10 print('發送失敗')
然后將你的任務設置定時執行就可以輕松實現啦
實現效果:
平時的工作中,真的有太多可以去自動化的任務,由於經驗受限這里不能一一舉例說明,只能盡量分享一些我遇到過或者聽說過的例子。