臨時處理一個Numpy的二進制文件,分析知道里面是dict類型,簡單小記一下,如果Numpy和Python基礎不熟悉可以看我之前寫的文章
In [1]:
%%time
import numpy as np
In [2]:
%%time
import pandas as pd
In [3]:
%%time
df = pd.DataFrame(np.load("data.npy")) # 通過narry創建DataFrame
In [4]:
%%time
df.head(10) # 快速預覽前10行
Out[4]:
In [5]:
%%time
# 提取email列
df['Email'] = df[0].map(lambda x : dict(x)["email"])
# 提取pwd列
df['MD5'] = df[0].map(lambda x : dict(x)["pwd"] )
# 刪除無用列
del df[0]
In [6]:
%%time
df.size # 查看總共多少數據
Out[6]:
In [7]:
%%time
df.shape
Out[7]:
In [8]:
%%time
df.head(10)
Out[8]:
In [9]:
%%time
df.T.to_json("user.json") # 重新保存為Json(轉置只是為了存儲成我們常見的json格式)
關於怎么知道是dict類型的擴展:可以加載看看:np.load("data.npy")