DataFrame按行讀取:DataFrame之values


 

http://blog.csdn.net/u014607457/article/details/51290582

 

    def fill_core(self):
        RatingTable=pd.read_csv(self.path+'/RatingTable.csv',header=None)
        list1=RatingTable.loc[0].values
        print(type(list1))
        print(list1)

        # print(RatingTable.index)RangeIndex(start=0, stop=943, step=1)
        # print(userRatingTable.loc[1][0:-1])
        # for indexs in RatingTable.index:
        #     print(RatingTable.loc[indexs].values)#返回value二維array
            # values[0:] values[0:-1]b是負數,表示去除后幾位
            #%.2f是將該浮點數float保留兩位小數。2表示保留的位數
            # val[0:-1] 是對字符串的截取操作,str[a:b]表示截取字符串的a開始的位置,b表示結束位置
            # b是負數,表示去出后幾位
        # f1=open(self.path+'/RatingTable.csv','r',encoding='utf-8')
        # dict1=[]
        # for line1 in f1.readlines():
        #     tmp=[]
        #     theme_num=line1.strip().split(',')
        #     # print(theme_num)
        #     for g in theme_num:
        #         tmp.append(int(g))
        #     dict1.append(tmp)

 

 

pandas是python環境下最有名的數據統計包,而DataFrame翻譯為數據框,是一種數據組織方式,這么說你可能無法從感性上認識它,舉個例子,你大概用過Excel,而它也是一種數據組織和呈現的方式,簡單說就是表格,而在在pandas中用DataFrame組織數據,如果你不print DataFrame,你看不到這些數據,下面我們來看看DataFrame是如何使用的。

首先是引入pandas和numpy,這是經常配合使用的兩個包,pandas依賴於numpy,引入以后我們可以直接使用np/pd來表示這個兩個模塊

先創建一個時間索引,所謂的索引(index)就是每一行數據的id,可以標識每一行的唯一值

  

為了快速入門,我們看一下如何創建一個6X4的數據:randn函數用於創建隨機數,參數表示行數和列數,dates是上一步創建的索引列

 

我們還可以使用字典來創建數據框,例如創建一個列名為A的數據框,索引是自動創建的整數

 

這又是一個字典創建DataFrame的例子

可以使用dtypes來查看各行的數據格式

接着看一下如何查看數據框中的數據,看一下所有的數據

使用head查看前幾行數據(默認是前5行),不過你可以指定前幾行

查看前三行數據

使用tail查看后5行數據

查看數據框的索引

查看列名用columns

查看數據值,用values

查看描述性統計,用describe

使用type看一下輸出的描述性統計是什么樣的數據類型——DataFrame數據

使用T來轉置數據,也就是行列轉換

對數據進行排序,用到了sort,參數可以指定根據哪一列數據進行排序。

好了,這篇入門教程到這里,后面還有很多,希望有志同道合的朋友一起交流學習,有什么說的不對的地方,請批評指正。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM