MYSQL 逗號分割行轉列 方法


前言:

    由於很多業務表因為歷史原因或者性能原因,都使用了違反第一范式的設計模式。即同一個列中存儲了多個屬性值(具體結構見下表)。

這種模式下,應用常常需要將這個列依據分隔符進行分割,並得到列轉行的結果。

 

表數據:

ID  Value
1 tiny,small,big
2 small,medium
3 tiny,big

 

期望得到結果:

ID Value
1 tiny
1 small
1 big
2 small
2 medium
3 tiny
3 big

 

正文:

#需要處理的表
create table tbl_name (ID int ,mSize varchar(100)); insert into tbl_name values (1,'tiny,small,big'); insert into tbl_name values (2,'small,medium'); insert into tbl_name values (3,'tiny,big'); #用於循環的自增表 create table incre_table (AutoIncreID int); insert into incre_table values (1); insert into incre_table values (2); insert into incre_table values (3);

 

select a.ID,substring_index(substring_index(a.mSize,',',b.AutoIncreID),',',-1) from tbl_name a join incre_table b on b.AutoIncreID <= (length(a.mSize) - length(replace(a.mSize,',',''))+1) order by a.ID;
 
 

原理分析:

這個join最基本原理是笛卡爾積。通過這個方式來實現循環。

以下是具體問題分析:

length(a.Size) - length(replace(a.mSize,',',''))+1  表示了,按照逗號分割后,改列擁有的數值數量,下面簡稱n

join過程的偽代碼:

根據ID進行循環

{

判斷:i 是否 <= n

{

獲取最靠近第 i 個逗號之前的數據, 即 substring_index(substring_index(a.mSize,',',b.ID),',',-1)

i = i +1 

}

ID = ID +1 

}

 

總結:

這種方法的缺點在於,我們需要一個擁有連續數列的獨立表(這里是incre_table)。並且連續數列的最大值一定要大於符合分割的值的個數。

例如有一行的mSize 有100個逗號分割的值,那么我們的incre_table 就需要有至少100個連續行。

當然,mysql內部也有現成的連續數列表可用。如mysql.help_topic: help_topic_id 共有504個數值,一般能滿足於大部分需求了。

改寫后如下:

 

select a.ID,substring_index(substring_index(a.mSize,',',b.help_topic_id+1),',',-1) from tbl_name a join mysql.help_topic b on b.help_topic_id < (length(a.mSize) - length(replace(a.mSize,',',''))+1) order by a.ID;
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM