感覺要總結總結了,希望這次能寫個系列文章分享分享心得,和大神們交流交流,提升提升。
因為半桶子水的水平,一直在想寫什么,為什么寫,怎么寫。
直到現在找到了一種好的辦法:
1.寫什么 自己手上掌握的,工作中經常用到的,從數據源 到 最后可視化 所有一套流程。
2.為什么寫 因為很長一段時間沒有進行總結和梳理了,總感覺很多東西很零散,另一方面,寫寫筆記也是對那些東西的一次鞏固。
3.怎么寫 這個問題其實想了很久,后來想通了,就是怎么把工具都放在手上,結合着用起來,按流程走。
接下來都會這么寫:
1.梳理思路
2.找數據
3.連數據
4.pandas xjb一頓操作
5.可視化
6.總結
找數據:
理由:本人之前從事過金融貸款行業的工作,而且現在國家互聯網金融行業盛行,找些投資借款數據用來練手還是可行的。
備注:僅是部分樣本數據,目的只有一個:練手。
可以這么理解:如果你想練刀工,重點不在於你是切雞肉還是鴨肉,在於你手上的刀玩得溜不溜,不管是雞肉,鴨肉還是鵝肉,切好他們的同時讓你刀工更加進步。
連數據:
我用的是 python + pymysql 方式,還有用pandas讀取excel,csv,txt文件都是ok的。
python連接數據庫有很多人用的是MySQL-python,mysqlclient,peewee或者SQLAlchemy庫,也是ok的。
順便說一下各個庫
MySQL-python:又叫 MySQLdb,是用的比較多的一種驅動,基於C開發的庫,可是它只支持python2.X,而且在windows平台經常抽風。
mysqlclient:這個據說是django ORM的依賴工具,之后可視化部分我應該也會用到django。
pymysql:這個是純Python實現的,最大的優點就是安裝so easy ,我剛接觸python+mysql時,選擇了這個,所以就一直用這個庫來操作mysql了。
peewee:ORM框架,如果對Django的ORM操作很熟悉的話,這個就so_easy了,但是我覺得很麻煩,哈哈哈。
SQLachemy :這個不錯,既支持原生SQL,也支持ORM,pandas操作中會涉及這個。
pandas xjb一頓操作:
這也是為什么我要寫文章鞏固梳理的地方,數據操作重點就在這里。
可視化操作:
可視化(excel,python可視化庫,在線制圖,以及非常牛逼的highcharts,echarts web交互)。
表比文字好,圖比表好。
人要穿衣服,但是衣服也有漂亮和丑之分,如果目的僅僅是穿衣服,那么隨便穿,只要掩體就行,可視化也是一個道理,圖表有裝逼和不裝逼之分,關鍵看你只是達到目的,還是為了更美觀。
excel:這個如果是默認的圖表確實不夠炫酷,但是可以調得非常美觀,比如這個還看得過去吧。
在線制圖:我平時用到的,只是為了偷懶,比如用pandas把數據整出來了,要做個雲詞圖,直接百度一個在線雲詞圖工具,數據甩進去就好了,怎么快怎么搞,而且更美觀。
highcharts,echarts:只能說很牛逼,這個。如果搞web的話,直接用js接入這兩個的其中一個就行了,交互式圖表,更加符合現代互聯網企業的發展。這兩個相比較,我更傾向於echarts,但是手上的報表系統是highcharts的,所以highcharts的參數我更熟悉一點,如果真要美觀,裝逼,高大上的話,還是入手echarts吧。
https://www.hcharts.cn/docs/basic-title
http://echarts.baidu.com/tutorial.html
總結:
介紹了基本情況,下面進入半桶子水時刻,qq1749061919 (歡迎交流,共同進步)
出處:http://www.cnblogs.com/buddyquan/p/7986225.html
