mysql不同字符集的轉換過程

本文轉載自查看原文 2020-04-13 13:34 1380 字符集/ MySQL/ mysql

一、概述及字符集

在工作中，有時我們會遇到更換數據庫字符集的問題，那如何正確更換數據庫的字符集呢？更換之后數據庫的數據不會出現亂碼，下面簡單講解一下數據庫不同字符集的轉換過程。

1、原有數據庫的字符集由於前期規划不足，隨着業務的發展不能滿足業務的需求。如原來業務系統用的是utf8字符集，后期有存儲表情符號的需求，uft8字符集就不能滿足此時的業務需求了。需要用utf8mb4字符集。

2、數據庫遷移，源和目標數據庫的字符集不一致，此時就需要在遷移之前進行轉換。

GBK是國家標准GB2312基礎上擴容后兼容GB2312的標准。GBK的文字編碼是用雙字節來表示的，即不論中、英文字符均使用雙字節來表示，為了區分中文，將其最高位都設定成1。GBK包含全部中文字符，是國家編碼，通用性比UTF8差，不過UTF8占用的數據庫比GBK大。支持簡體中文及繁體中文。
utf8字符集：是一種UTF-8編碼的Unicode字符集，每個字符占用1到3個字節。UTF-8包含全世界所有國家需要用到的字符，是國際編碼，通用性強。
utf8mb4字符集：是一種UTF-8編碼的Unicode字符集，每個字符占用1到4個字節。可以覆蓋BMP范圍內的字符和增補字符。BMP范圍內的字符編碼和utf8字符集中的編碼是完全相同的，長度也是完全一樣的，所以utf8mb4字符集可以兼容utf8字符集。
GB2312是GBK的子集，GBK是GB18030的子集。
big5支持繁體中文

以下模擬的是將latin1字符集的數據庫修改成GBK的過程。其他字符集的轉換過程類似。需要注意的是要轉換的目標字符集一定是源字符集的超級或者目標字符集的范圍包含源字符集的范圍。

mysqldump -uroot -p --default-character-set=gbk -d databasename >createtb.sql

其中--default-character-set=gbk表示設置以什么字符集連接，-d表示只導出表結構，不導出數據。

mysqldump -root -p --quick --no-create-info --extended-insert --default-character-set=latin1 databasename>data.sql

create database databasename default charset bgk;

mysql -root -p databasename <createtb.sql

mysql -root -p databasename <data.sql

新的字符集一定要是原字符集的超集，不然轉化之后，數據會出現亂碼。常見字符集轉換如下：

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 MySQL字符集 mysql字符集 MySQL 字符集 Mysql字符集 js字符集的轉換 Oracle字符集轉換 linux的字符集轉換 MySQL字符集轉換引發插入亂碼問題 MySQL字符集詳解 MySQL字符集詳解