1、简介
列族(Column Families)是rocksdb3.0提出的一个机制,用于对同一个数据库的记录(键值对)进行逻辑划分。默认情况下所有的记录
都会存储在一个默认列族里(ROCKSDB_NAMESPACE::kDefaultColumnFamilyName)
列族具有的属性
1)可以跨列族进行原子写,弥补了rocksdb在单个进程内只能操作一个数据库的问题。
2)在不同的列族,提供数据库的一致性视图
3)可以对列族进行独立配置
4)动态添加和drop列族
2、使用
1)列族的配置
Options, ColumnFamilyOptions, DBOptions
ColumnFamilyOptions用于配置列族,DBOptions用于数据库粒度的配置,Options继承了ColumnFamilyOptions, DBOptions,
因此Options可以执行上述两种配置。
2)主要操作
每个列族通过句柄类ColumnFamilyHandle进行操作,包括列族的创建和销毁都要使用ColumnFamilyHandle完成。
创建列族,
下列代码就创建了一个名为"new_cf"的列族
ColumnFamilyHandle *handl;
db->CreateColumnFamily(ColumnFamilyOptions(), "new_cf", &handl);
db->DestroyColumnFamilyHandle(handl);
使用列族,
基于列族打开数据库,和常规的方式不同。具体来说,如果我们以读写模式打开数据库,则必须要给open传入所有的列族,
否则open方法会返回Status::InvalidArgument()。每个列族通过ColumnFamilyDescriptor表示,这个类包含了
{列族名,ColumnFamilyOptions}。下列代码通过读写模式打开了一个包含所有列族的数据库:
vector<ColumnFamilyDescriptor> colume_families;
colume_families.push_back(ColumnFamilyDescriptor(ROCKSDB_NAMESPACE::kDefaultColumnFamilyName, ColumnFamilyOptions()));
colume_families.push_back(ColumnFamilyDescriptor("new_cf"), ColumnFamilyOptions())
vector<ColumnFamilyHandle *> cf_handles;
Status s = db->open(DBOptions(), DB_PATH, colume_families, &cf_handles, &db);
如果使用只读模式打开数据库,那么可以只传入我们需要读取的列族,不过默认的列族是必须要传入给open函数的
// open db read only
column_families.push_back(ColumnFamilyDescriptor("new_cf", ColumnFamilyOptions()));
column_families.push_back(ColumnFamilyDescriptor(kDefaultColumnFamilyName, ColumnFamilyOptions()));
s = DB::OpenForReadOnly(DBOptions(), kDBPath, column_families, &handles, &db);
assert(s.ok());
s = db->Get(ReadOptions(), handles[0], Slice("key2"), &value1);
assert(s.ok());
3) WriteBatch
通过WriteBatch我们可以原子的操作不同的列族,例如可以通过handles[0]去删除handles[1]插入的键值对{"key": "value"}
// put and get from non-default column family
s = db->Put(WriteOptions(), handles[1], Slice("key"), Slice("value"));
assert(s.ok());
std::string value;
s = db->Get(ReadOptions(), handles[1], Slice("key"), &value);
assert(s.ok());
// atomic write
WriteBatch batch;
batch.Put(handles[0], Slice("key2"), Slice("value2"));
batch.Put(handles[1], Slice("key3"), Slice("value3"));
batch.Delete(handles[0], Slice("key"));
s = db->Write(WriteOptions(), &batch);
assert(s.ok());
3、原理和实现
简单的说,不同的列族是共享WAL的,但是memtable和SST file是隔离的。