使用Pandas groupby連接來自多行的字符串

本文轉載自查看原文 2020-10-25 19:07 776

Pandas Dataframe.groupby（）方法用於根據某些條件將數據分為幾組。分組的抽象定義是提供標簽到組名的映射。

要使用Dataframe.groupby（）連接多行中的字符串，請執行以下步驟：

使用需要連接其屬性的Dataframe.groupby（）方法對數據進行分組。
通過使用join函數連接字符串，並使用lambda語句轉換該列的值。

我們將使用具有2列的CSV文件，該文件的內容如下圖所示：

點擊放大

示例1：我們將在分支列中具有相同名稱的數據進行連接。

Python3

亮度_4

 
                     # import pandas library  
                    
                     import 
                     pandas as pd  
                    
                     # read csv file  
                    
                     df  
                     = 
                     pd.read_csv( 
                     "Book2.csv" 
                     )  
                    
                     # concatenate the string  
                    
                     df[ 
                     'branch' 
                     ]  
                     = 
                     df.groupby([ 
                     'Name' 
                     ])[ 
                     'branch' 
                     ].transform( 
                     lambda 
                     x :  
                     ' ' 
                     .join(x))  
                    
                     # drop duplicate data  
                    
                     df  
                     = 
                     df.drop_duplicates()     
                    
                     # show the dataframe  
                    
                     print 
                     (df)

輸出：

點擊放大

示例2：我們也可以在多列上執行Pandas groupby。

我們將使用具有3列的CSV文件，該文件的內容如下圖所示：

在名稱和年份列上應用分組依據

Python3

亮度_4

 
                     # import pandas library  
                    
                     import 
                     pandas as pd  
                    
                     # read a csv file  
                    
                     df  
                     = 
                     pd.read_csv( 
                     "Book1.csv" 
                     )  
                    
                     # concatenate the string  
                    
                     df[ 
                     'branch' 
                     ]  
                     = 
                     df.groupby([ 
                     'Name' 
                     ,  
                     'year' 
                     ])[ 
                     'branch' 
                     ].transform(  
                    
                     lambda 
                     x:  
                     ' ' 
                     .join(x))  
                    
                     # drop duplicate data  
                    
                     df  
                     = 
                     df.drop_duplicates()            
                    
                     # show the dataframe  
                    
                     df

輸出：

在多列上分組

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 pandas groupby合並列字符串 pandas入門--篩選字符串+groupby+sort js ES6 多行字符串連接字符串 JavaScript:多行字符串 python多行字符串 python多行字符串 postgres groupby 合並字符串 Pandas Series.str.cat()連接字符串 js多行字符串 js與多行字符串