mysql 的大文本存儲TEXT & BLOB


TEXT & BLOB

一般在保存少量字符串的時候,我們會選擇 CHAR 或者 VARCHAR;而在保存較大文本時,
通常會選擇使用 TEXT 或者 BLOB,二者之間的主要差別是 BLOB 能用來保存二進制數據,比
如照片;而 TEXT 只能保存字符數據,比如一篇文章或者日記。TEXT 和 BLOB 中有分別包括
TEXT、MEDIUMTEXT、LONGTEXT 和 BLOB、MEDIUMBLOB、LONGBLOB3 種不同的類型,它們
之間的主要區別是存儲文本長度不同和存儲字節不同,用戶應該根據實際情況選擇能夠滿足
需求的最小存儲類型。

BLOB 和 TEXT 值會引起一些性能問題,特別是在執行了大量的刪除操作時.
可以使用合成的(Synthetic)索引來提高大文本字段(BLOB 或 TEXT)的查詢性能;

如果散列算法生成的字符串帶有尾部空格,就不要把它們存儲在 CHAR 或 VARCHAR 列中,它們會受到尾部空格去除的影響。合
成的散列索引對於那些 BLOB 或 TEXT 數據列特別有用。用散列標識符值查找的速度比搜索BLOB列本身的速度快很多。

create table t_synthetic (id varchar(100),context blob,hash_value varchar(40));

insert into t_synthetic values(1,'beijingbeijing',md5(context));

insert into t_synthetic values(2,repeat('beijing',2),md5(context));

insert into t_synthetic values(3,repeat('beijing 2008',2),md5(context));

SELECT * from t_synthetic where hash_value = MD5(repeat('beijing',2));


合成索引的用法,由於這種技術只能用於精確匹配,在一定程度上減
少 I/O,從而提高查詢效率。如果需要對 BLOB 或者 CLOB 字段進行模糊查詢,MySQL 提供了
前綴索引,也就是只為字段的前 n 列創建索引,舉例如下

CREATE INDEX idx_blob ON t_synthetic(context(100));

desc select * from t_synthetic where context like 'beijing%'


在不必要的時候避免檢索大型的 BLOB 或 TEXT 值。

把 BLOB 或 TEXT 列分離到單獨的表中。


總結;
對於字符類型,要根據存儲引擎來進行相應的選擇。
對精度要求較高的應用中,建議使用定點數來存儲數值,以保證結果的准確性。
對含有 TEXT 和 BLOB 字段的表,如果經常做刪除和修改記錄的操作要定時執行
OPTIMIZE TABLE 功能對表進行碎片整理。
日期類型要根據實際需要選擇能夠滿足應用的最小存儲的日期類型。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM