pandas
加載文件方式:
注意,read_csv和read_table都是是加載帶分隔符的數據,每一個分隔符作為一個數據的標志,但二者讀出來的數據格式還是不一樣的,read_table是以制表符 \t 作為數據的標志,也就是以行為單位進行存儲。
read_csv 與 read_table 的區別
比如讀取以上excel中的數據:
read_table讀取
import pandas as pd
import numpy as np
c=pd.read_table('career_data.csv',nrows=5) # 只讀了前5行
print c
print ('去掉列名和索引')
print c.values
print '\t'
print ('行列數')
c.values.shape
可以看出,讀完后每個字符串之間有逗號相隔,這其實表明每一行作為一個維度進行了存儲,所以最后它是一個5行1列的數組,每一行字符串為一列而不是每一個字符串。
read_csv 讀取
import pandas as pd
import numpy as np
c=pd.read_csv('career_data.csv',nrows=5)
print c
print ('去掉列名和索引')
print c.values
print '\t'
print ('行列數')
c.values.shape
而 read_csv讀完后是一個5行4列的數組,每一個字符串作為一列,這是二者的區別。還有固定寬度讀取的read_ffw 和table 的效果一樣。
。
原文鏈接:https://blog.csdn.net/qq_43243022/article/details/82978898