OceanBase是阿里巴巴集團自主研發的可擴展的關系型數據庫,實現了跨行跨表的事務,支持數千億條記錄、數百TB數據上的SQL操作。在阿里巴巴集團下,OceanBase數據庫支持了多個重要業務的數據存儲。包含收藏夾、直通車報表、天貓評價等。
截止到2013年4月份。OceanBase線上業務的數據量已經超過一千億條。
看起來挺厲害的,今天我們來研究下它的源碼。
關於OceanBase的架構描寫敘述有非常多文檔。這篇筆記也不打算涉及這些東西,僅僅討論OceanBase的SQL編譯部分的代碼。
OceanBase是一個開源的數據庫,托管在github上,點擊下載。本文討論的源代碼路徑相應為:oceanbase_0.3/src/sql。最新的版本號為0.4,本文討論的代碼基於0.3版本號的OceanBase.眼下OceanBase的能解析的SQL還比較少,包含Select,Insert,Update,Delete,Show,Explain等.
選擇OceanBase 0.3 版本號進行學習。基於幾個原因:
- OceanBase 的高質量。高可讀性
- OceanBase 版本號低,沒有歷史負擔
- OceanBase SQL解析相對簡單。更easy窺見全貌。利於理解設計開發中要解決的主要問題。
- 與其它數據庫的SQL解析部分進行對照,深入理解問題本質
該部分主要功能包含了。SQL語句解析,邏輯計划的生成。物理操作符運算等。
入口:ObSql類
本部分的入口函數在ob_sql.h中,調用函數ObSql::direct_execute能夠直接運行SQL語句,並返回結果集ObResultSet。
函數stmt_prepare用於解析要預編譯的SQL語句,stmt_execute則用於運行Prepare過的SQL語句。
class ObSql
{
public:
ObSql(){}
~ObSql(){}
int direct_execute(const common::ObString &stmt, ObResultSet &result)
int stmt_prepare(const common::ObString &stmt, ObStmtPrepareResult &result);
int stmt_execute(const uint64_t stmt_id, const common::ObArray<common::ObObj> params, ObResultSet &result);
int stmt_close(const uint64_t stmt_id);
};
在0.4版本號中。direct_execute,stmt_prepare,stmt_execute等函數都被聲明為static函數,意味着調用SQL語句運行時能夠直接ObSql::direct_execute能夠運行SQL語句,而不必再先定義一個ObSql對象。OceanBase還有年輕。還存在不足,我們閱讀源代碼時應該帶着批判思考的精神。
直接進入direct_execute函數,能夠看到整個運行的過程,函數中有許多的if,else語句。主要是由於OceanBase有一個編碼規范要求:一個函數僅僅能有一個返回出口.按單出口的規范寫代碼會使得寫代碼的思路很清晰,不easy出現內存泄露等問題。在大型項目中還是應該盡量保持函數單出口.當然,我認為保持一個函數功能簡潔、簡單易懂也是很重要的。
在你閱讀源代碼的過程中,遇到的大部分函數都會是這個樣.刨去其它干擾信息,結合凝視,能夠看到,SQL運行分為5個步驟:
- 初始化
parse_init(&parse_res) - 解析SQL語法樹
parse_sql(&parse_res, stmt.ptr(), static_cast<size_t>(stmt.length())); - 制定邏輯計划
resolve(&logical_plan, parse_res.result_tree_)
ObMultiPlan* multi_plan = static_cast<ObMultiPlan*>(logical_plan.plan_tree_); - 生成物理計划:
trans.add_logical_plans(multi_plan);
physical_plan = trans.get_physical_plan(0) - 運行物理計划:
exec_plan->open()
初始化不過初始化一個緩沖區,能夠略過來研究后面關鍵的4步。
解析SQL語法樹
像PostgreSQL,MySQl等一樣,OceanBase採用lex和yacc系的詞法和語法解析工具生成語法樹。
GNU下的詞法和語法工具為Flex和Bison.Flex利用正則表達式識別SQL語句中的全部詞語,Bison則依據類似BNF的語法規則識別SQL語義,從而構建語法樹。
不熟悉Flex與Bison的同學推薦閱讀《FLEX與BISON》(貌似我也沒找到其它類似的書籍,^_^),里面也有專門的一章講述利用Flex與Bison實現一個簡單的SQL分析器。
OceanBase的SQL語法樹與PostgreSQL更為相似。可是設計上也有非常多差別。
節點設計
語法樹由一系列的節點串連而成。我選取較為簡單的Update語句作為演示樣例,以下是一個例句:
Update student set sex="M" where name="小明";
其SQL語法樹能夠表示為:
|--Update Stmt
|--Table:student
|--TargeList:
|--sex = "M"
|--Qualifications:
|--name="小明"
語法解析的作用就是怎樣用數據結構來表示上面這棵語法樹。不同的數據庫有不同的方案。為加強對照,我選取了PostgreSQL,RedBase與OceanBase作為參照。
PostgreSQL語法樹的節點設計
PostgreSQL中每一種語法都會有一個相應的結構體,比方更新語句Update相應的結構體為UpdateStmt:
typedef struct UpdateStmt
{
NodeTag type; /* 枚舉類型 */
RangeVar *relation; /* 要更新的關系 */
List *targetList; /* 要更新的項 */
Node *whereClause; /* 更新條件 */
List *fromClause; /* optional from clause for more tables */
List *returningList; /* 返回的表達式列表 */
WithClause *withClause; /* WITH clause */
} UpdateStmt;
當中type是個枚舉值,表示結構體的類型,在UpdateStmt中為T_UpdateStmt。
其它字段分別相應UPdate語句的各個部分,該結構體能夠支持更復雜的Update語句。
PostgreSQL中另一個基礎的結構體:
typedef struct Node
{
NodeTag type;
} Node;
用於語法解析的結構體都能夠強制轉換成Node * 類型。PostgreSQL中傳遞語法結構體是都會轉化成Node *類型。僅僅有在須要明白類型的時候依據type枚舉值轉換成須要的類型。
Node *的作用有的類似於void * ,可是更利於調試。我們也能夠簡單的覺得:諸如UpdateStmt的語法解析結構體們都繼承自Node。
因為每一個語法相應一個結構體,因此在PostgreSQL中存在非常多類似的結構體,包含SelectStmt,InsertStmt,DeleteStmt等。
終於這些結構體還會被統一轉換成Query結構體。即Query是統一的語法樹結構體。
在PostgreSQL中。演示樣例中的SQL語法樹可表示為:
|--UpdateStmt
|--type: T_UpdateStmt
|--relation: student
|--targetList:
|--targest[0]:
|--name: sex
|--val: "M"
|--whereClause:
|--expr: =
|--left: name
|--right: "小明"
RedBase的語法樹的節點設計
RedBase是斯坦福的數據庫系統實現這門課程(cs346)的一個項目。
RedBase比起PostgreSQL,OceanBase這種復雜數據庫而言,十分的簡單。可是其語法樹的節點設計與其它數據庫不同,因此提出來做對照。
typedef struct node{ NODEKIND kind;/*枚舉類型*/ union{ /* SM component nodes */ /* create table node */ struct{ char *relname; struct node *attrlist; } CREATETABLE; /*此處省略n多個結構體...*/ /* QL component nodes */ /* query node */ ... /* update node */ struct{ char *relname; /* 關系名 */ struct node *relattr; /* 屬性 */ struct node *relorvalue; /* 改動后值 */ struct node *conditionlist; /* 條件列表 */ } UPDATE; /*此處省略n多個結構體...*/ } u; } NODE;
RedBase數據庫的語法樹結構體僅僅有一個,就是NODE,可是這個NODE結構體的聲明有150多行(^-^).NODE包含一個枚舉類型,作用於PostgreSQL中的type一樣。全部的語法結構如UPDATE,SELECT,CREATETABLE等構成巨大的聯合體。針對Update語句的結構體包含了關系名,屬性,改動后的值,條件列表等字段,顯然這樣的設計僅僅能支持簡單的Update語句。
RedBase採用“巨型”聯合體代替PostgreSQL中的多個結構體,免去了類型轉換(語法結構體到Node*的轉換)。
假設把PostgreSQL語法樹節點看成是“繼承”結構,那么RedBase的語法樹節點能夠看成是“組合”結構。
在RedBase中,演示樣例中的SQL語法樹可表示為:
|--NODE:
|--kind: N_UPDATE
|--u:UPDATE
|--relname: student
|--relattr:
|--kind: N_RELATTR
|--u:RELATTR
|--relname: (null)
|--attrname: sex
|--relorvalue:
|--kind: N_RELATTR_OR_VALUE
|--u:RELATTR_OR_VALUE
|--relattr: (null)
|--value:
|--kind:N_VALUE
|--u:VALUE
|--sval = "M"
|--conditionlist:
|--kind:N_LIST
|--u: LIST
|--next: (null)
|--curr:
|--kind: N_CONDITION
|--u: CONDITION
|--lhsRelattr:
|--kind: N_RELATTR
|--u:RELATTR
|--relname: (null)
|--attrname: name
|--op:
|--kind: N_EQ
|--rhsRelattr:(null)
|--rhsValue:
|--kind:N_VALUE
|--u:VALUE
|--sval = "M"
OceanBase的語法樹的節點設計
OceanBase 的語法樹節點結構體也僅僅有一個,該結構體包含一個枚舉類型變量type_,和PostgreSQL與RedBase一樣,代表該結構體相應的類型。還有兩組屬性,相應終止符節點,僅僅能使用vakue_和str_value_兩個字段,分別相應64位整形值和字符串值;非終止符節點使用最后兩個字段,num_child_表示子節點的個數,children_指向子節點數組的首地址。
typedef struct _ParseNode
{
ObItemType type_;
/* 終止符節點的真實的值 */
int64_t value_;
const char* str_value_;
/* 非終止符節點的孩子節點*/
int32_t num_child_; /*孩子節點的個數*/
struct _ParseNode** children_;
// BuildPlanFunc m_fnBuildPlan;
} ParseNode;
相應一個節點而言,要么是終止符節點要么是非終止符節點,它僅僅會使用兩組屬性中的一組。int,long,float,double,string等都是終止符類型,能夠看出int,long都是用64位整形int64表示。float,double,string則用char *字符串表示。終止符的num_child_為0,children_為null.
PostgreSQL的子節點都是有名字的子節點。能夠使用名字進行訪問,如在PostgreSQL中。Update語句的where條件能夠通過 updatestmt.whereClause 來訪問 。 但在OceanBase中不行 。 全部的子節點都是匿名的 , 僅僅能通過下標來訪問。
打個例如,在PostgreSQL和RedBase中。孩子是有名字的,能夠叫小明、小紅等。依據名字你大概能夠知道這個孩子是男是女;可是在OceanBase家,他們分別叫老大。老二,老三,聽名字全然聽不出是男是女的。
OceanBase家有點不講究^-^。
能夠在執行時查看語法樹的結構。也能夠在代碼中能夠推各個子節點代表的類型。可是不如PostgreSQL和RedBase方便。在sql_parser.y文件里,定義了SQL的語法規則。同一時候也規定了各種類型的子節點的結構。
update_stmt:
UPDATE relation_factor SET update_asgn_list opt_where
{
ParseNode* assign_list = merge_tree(result->malloc_pool_, T_ASSIGN_LIST, $4);
$$ = new_non_terminal_node(result->malloc_pool_, T_UPDATE, 3, $2, assign_list, $5);
}
;
從上述代碼能夠看出,Update語法結構體中有3個子節點。第一個表示表名,第二個表示要更新列表項,第三個表示更新的條件語句。
演示樣例中的Update語句在OceanBase中能夠表示為例如以下形式:
|--ParseNode
|--type: T_UPDATE
|--num_child: 3
|--children[0]:
|--type: T_IDENT
|--str_value: student
|--children[1]:
|--type: T_ASSIGN_LIST
|--num_child:1
|--children[0]:
|--type: T_ASSIGN_ITEM
|--children[0]:
|--type: T_IDENT
|--str_value: sex
|children[1]:
|--type: T_EXPR
|--children[0]:
|--type: T_STRING
|--str_value: "M"
|--children[2]:
|--type: T_OP_EQ
|--num_child: 2
|--children[0]:
|--type: T_IDENT
|--str_value: name
|--children[1]:
|--type: T_IDENT
|--str_value: "小明"
OceanBase中採用的這樣的方式缺點非常明顯,就是使用這些結構體時必需要細致辨別各個子節點代表的意義。否則easy出錯。長處相同也非常明顯,能夠非常靈活的構建出語法樹。
語法樹的節點的設計,主要是為了解決怎樣表達語法結構。不同的數據庫有不同的詳細實現。
OceanBase採用終止符和非終止符分類,使用OceanBase的設計極具靈活性,但使用時須要細致驗證。避免出錯。
構建語法樹
SQL的語法規則非常多 。 SELECT , INSERT , UPDATE , DELETE , CREATE TABLE 等 dml , ddl 等語句都有相應的語法樹。
在上一節節中我們已經看到了UPDATE語句在內存中的語法樹形狀。本節須要些Flex和Bison的基礎知識,假設之前沒有接觸過Flex與Bison的話,能夠閱讀《Flex與Bison中文版》或者GNU Bison 2.1 中文手冊。
SQL全稱為結構化查詢語言,有獨立於各數據庫廠家的SQL標准,各數據庫基本上都會大體上遵循該標准。
像PostgreSQL數據庫兼容某些版本號的SQL標准,同一時候也有些自己獨有的語句。每一個數據庫都有自己的擅長之處,這些細微的差別有時候就體如今查詢語言的細微差別上。
OceanBase在0.3版本號僅支持有限的幾條SQL語句,依照其官方的介紹。其目標之中的一個是兼容MySQL的語法,讓我們拭目以待。
詞法分析
利用Flex進行詞法分析是構建語法樹的第一個。Flex源文件包括3部分:選項定義、詞法規則、代碼部分。
選項定義部分定義了該詞法分析器使用的特性和一些自己定義的函數。詞法規則部分為匹配語法+匹配動作。
匹配語法為正則表達式,flex從上往下按順序對每一個規則進行匹配。一旦匹配成功則運行該項后面大括號內相應的動作代碼;代碼部分則是C語言代碼。
OceanBase的詞法文件為sql_parser.l。
當中定義了一些函數,選取部分來看。
以下這兩個函數能夠使得OceanBase支持轉義字符,包含:\b,\f,\n,\r,\t.
inline unsigned char escaped_char(unsigned char c); /* quote_type: 0 - single quotes; 1 - double quotation marks */ int64_t parse_string(const char* src, char* dest, int64_t len, int quote_type);
OceanBase中的字符串用雙引號括起來的表示。並且須要進行轉義處理。
\"(\\.|\"\"|[^"\\\n])*\" {
ParseNode* node = NULL;
malloc_new_node(node, ((ParseResult*)yyextra)->malloc_pool_, T_IDENT, 0);
yylval->node = node;
char* src = yytext+1;
int len = strlen(src) - 1; //remove last quote charactor
char* dest = (char*) parse_malloc(len + 1, ((ParseResult*)yyextra)->malloc_pool_);
check_value(dest);
node->str_value_ = dest;
node->value_ = parse_string(src, dest, len, 1);/*字符串轉義處理*/
return NAME;
}
當匹配到NULL時,返回的值類型不能為NULL,由於NULL是c語言的保留字,所以須要換成其它名字。此處將NULL的類型定義為NULLX。
NULL {
/* yylval->node = new_node(((ParseResult*)yyextra)->malloc_pool_, T_NULL, 0); */
malloc_new_node(yylval->node, ((ParseResult*)yyextra)->malloc_pool_, T_NULL, 0);
return NULLX;
}
再來看關系符號的規則代碼。每一個符號分別返回一個值。
"||" {return CNNOP;}
"=" {return COMP_EQ;}
">=" {return COMP_GE;}
">" {return COMP_GT;}
"<=" {return COMP_LE;}
"<" {return COMP_LT;}
"!="|"<>" {return COMP_NE;}
在《Flex與Bison》一書中。作者讓全部關系符號返回同一個值。通過yylval的成員值來標記不同符號。
代碼類型例如以下這段。
"=" { yylval.subtok = EXPR_EQ; return COMPARISON; }
"<=>" { yylval.subtok = EXPR_COMP; return COMPARISON; }
">=" { yylval.subtok = EXPR_GE; return COMPARISON; }
">" { yylval.subtok = EXPR_GT; return COMPARISON; }
"<=" { yylval.subtok = EXPR_LE; return COMPARISON; }
"<" { yylval.subtok = EXPR_LT; return COMPARISON; }
"!=" |
"<>" { yylval.subtok = EXPR_NE; return COMPARISON; }
盡管都能完畢同樣的功能,可是從個人喜好來講,我更喜歡OceanBase這樣的做法,由於夠直接。
整數的值保留在node->value_中返回,為long long 類型 ( 64位 ) 。 而浮點數的值字面值則保存在node->str_value_ 中。
接下來。看日期時間的提取。
Date{whitespace}?'[0-9]{4}(-[0-9]{2}){2}' {
int year, month, day;
struct tm time;
int ret = 0;
/* ParseNode* node = new_node(((ParseResult*)yyextra)->malloc_pool_, T_DATE, 0); */
ParseNode* node = NULL;
malloc_new_node(node, ((ParseResult*)yyextra)->malloc_pool_, T_DATE, 0);
char* dest = strchr(yytext, '\'');
dest = parse_strdup(dest + 1, ((ParseResult*)yyextra)->malloc_pool_); // skip left quote
check_value(dest);
size_t len = strlen(dest);
dest[len - 1] = '\0'; //remove final '
node->str_value_ = dest;//字面值
ret = sscanf(dest, "%4d-%2d-%2d", &year, &month, &day);
assert(ret == 3);
memset(&time, 0, sizeof(struct tm));
time.tm_year = year - 1900;
time.tm_mon = month - 1;
time.tm_mday = day;
time.tm_hour = 0;
time.tm_min = 0;
time.tm_sec = 0;
time.tm_isdst = -1;
node->value_ = mktime(&time) * 1000000L;//轉成微秒
yylval->node = node;
return DATE_VALUE;
}
從表達式中能夠看到,OceanBase支持直接傳入日期時間,OceanBase也支持Time和Timestamp類型。詳細例如以下表:
| 類型 | 格式(不區分大寫和小寫) | 表達式 |
|---|---|---|
| Date | Date 'YYYY-MM-DD' | Date{whitespace}?'[0-9]{4}(-[0-9]{2}){2}' |
| Time | Time 'HH:MI:SS.FF'或Time 'HH:MI:SS | Time{whitespace}?'[0-9]{2}(:[0-9]{2}){2}[.][0-9]{1,6}',Time{whitespace}?'[0-9]{2}(:[0-9]{2}){2}[.]? ' |
| Timestamp | Timestamp 'YYYY-MM-DD HH:MI:SS.FF'或 Timestamp 'YYYY-MM-DD HH:MI:SS' | Timestamp{whitespace}? '[0-9]{4}(-[0-9]{2}){2}[ ][0-9]{2}(:[0-9]{2}){2}[.][0-9]{1,6}',Timestamp{whitespace}?'[0-9]{4}(-[0-9]{2}){2}[ ][0-9]{2}(:[0-9]{2}){2}[.]?' |
例如以下是一個使用日期的演示樣例:
select id,name from student where createtime <= date '2014-09-12';
語法樹中存在日期類型的節點,其str_value_存儲時間的字面值,value_存儲該時間與基准時間(1970年1月1日0時0分0秒)之差的毫秒值。
OceanBase通過拓展標准的SQL語法支持直接在SQL語句中寫入時間 ,在詞法分析階段就識別到時間類型,而 PostgreSQL 是在語法分析階段才會識別時間 。 相比而言 , OceanBase 這樣的方式更直觀,方便。
在0.4版本號的OceanBase中,添加了預編譯的功能,須要識別占位符"?",系統變量和用戶變量。相應性質例如以下:
| 名稱 | 表達式 | 動作代碼返回值 |
|---|---|---|
| 占位符(?) | "?" |
QUESTIONMARK |
| 系統變量(system_variable) | (@@[A-Za-z_][A_Za-z0-9_]*) |
SYSTEM_VARIABLE |
| 用戶變量(temp_variable) | (@[A-Za-z_][A_Za-z0-9_]*) |
TEMP_VARIABLE |
語法分析
OceanBase的SQL語法文件為sql_parser.y。.y語法文件終於由Bison轉為可編譯的.c文件。其結構與Flex的.l文件類似。分為選項部分,規則部分和代碼部分。以下的代碼都是去掉了關聯的動作代碼的規則語法。這樣有助於更專注的理解語法的實現。
select語法
在SQL的語句語法中。最復雜的語法莫過於Select語句。
我們先來看其在OceanBase中的語法。一個select語句能夠使帶括號的select語句,也能夠使不帶括號的select語句:
select_stmt:
select_no_parens %prec UMINUS /* 不到括號的select語句 */
| select_with_parens %prec UMINUS /* 帶括號的select語句 */
;
%prec用於交換左右兩個標記的優先級和結合性。即select_no_parens與UMINUS互換優先級和結核性,select_with_parens 與UMINUS互換優先級和結核性。UMINUS的定義為
%right UMINUS。全部上面兩句的結果是select_no_parens和select_with_parens都變成了右結合。
帶括號的select語句能夠是僅僅帶一個括號,也能夠帶多對括號:
select_with_parens:
'(' select_no_parens ')' /*僅僅帶一個括號*/
| '(' select_with_parens ')' /*帶多對括號*/
;
不帶括號的select語句包含簡單的select,帶order by排序。帶order by排序和limit限制的select語句3種:
select_no_parens:
simple_select
| select_clause order_by
| select_clause opt_order_by select_limit
;
select子句包含簡單slect和帶括號的select:
select_clause:
simple_select
| select_with_parens
;
為什么不包含不帶括號的select,臨時沒想通。
簡單select語句包含我們常見的select 語句,但沒有order by和limit選項;同一時候還包含UNION,INTERSECT,EXCEPT三種運算:
simple_select:
SELECT opt_distinct select_expr_list
FROM from_list
opt_where opt_groupby opt_having
| select_clause UNION opt_distinct select_clause
| select_clause INTERSECT opt_distinct select_clause
| select_clause EXCEPT opt_distinct select_clause
;
select語句的定義相對其它語句非常復雜,並且上面這段代碼還沒有包含無表的select和for update的select。
(這兩項在0.4版本號的OceanBase中已經實現)。
以下這段是從PostgreSQL9.2.3中截取的Select語法:
SelectStmt: select_no_parens %prec UMINUS
| select_with_parens %prec UMINUS
;
select_with_parens:
'(' select_no_parens ')'
| '(' select_with_parens ')'
;
select_no_parens:
simple_select
| select_clause sort_clause
| select_clause opt_sort_clause for_locking_clause opt_select_limit
| select_clause opt_sort_clause select_limit opt_for_locking_clause
| with_clause select_clause
| with_clause select_clause sort_clause
| with_clause select_clause opt_sort_clause for_locking_clause opt_select_limit
| with_clause select_clause opt_sort_clause select_limit opt_for_locking_clause
;
select_clause:
simple_select
| select_with_parens
;
simple_select:
SELECT opt_distinct target_list
into_clause from_clause where_clause
group_clause having_clause window_clause
| values_clause
| TABLE relation_expr
| select_clause UNION opt_all select_clause
| select_clause INTERSECT opt_all select_clause
| select_clause EXCEPT opt_all select_clause
;
不知道你是不是有種似曾相識的感覺。沒錯,在這里。OceanBase借鑒了PostgreSQL的語法分析方式。PostgreSQL號稱世界上最棒的開源數據庫。絕非浪得虛名。
update語法
為保證演示樣例的完整性,我們在來分析下update的語法。
/*0.3版本號的OceanBase*/
update_stmt:
UPDATE relation_factor SET update_asgn_list opt_where
;
update_asgn_list:
update_asgn_factor
| update_asgn_list ',' update_asgn_factor
;
update_asgn_factor:
NAME COMP_EQ expr
;
上面為0.3版本號中的update的語法,支持常見的update的SQL語句。假設將它和0.4版本號的update的語法相比,就會發現:0.4版本號的update在set時能夠使用保留keyword作為列名。支持hint語法,支持when子句。
隨着OceanBase逐漸完好。其解析的語法也必定會越來越復雜。在學習的時候,從一個簡單的版本號開始,由易到難,就顯得非常重要。
/*0.4版本號的OceanBase*/
update_stmt:
UPDATE opt_hint relation_factor SET update_asgn_list opt_where opt_when
;
update_asgn_factor:
column_name COMP_EQ expr
;
column_name:
NAME
| unreserved_keyword
;
opt_when:
/* EMPTY */
| WHEN expr
;
除了select,比較復雜還有create table,alter table,expr等。
本節最后僅僅討論表達式的語法問題。其它的不再討論。
表達式語法
expression 是指表達列名或者是一個可以給出真假的布爾表達式。
如
a+3 > b
a is not null
等等。
表達式最常出如今where子句中,用於過濾數據行。
表達式的語法之所以復雜,是由於表達式能夠嵌套多個子表達式,多個子表達式出現后可能會出現語法上的歧義。
BETWEEN ... AND 用於測試給的表達式是否在給定的范圍內,這個操作符中的AND 與邏輯與的AND有歧義。須要使用%prec來改變其優先級和結合性,該方法能奏效,可是PostgreSQL和OceanBase都選擇從語法樹規則上全然消除該歧義。
OceanBase中表達式有3種類型,分別為expr , arith_expr , simple_expr。當中
- expr :expr為表達式的核心。是不受約束的表達式,能夠直接用於where。having等子句中。
- arith_expr :arith_expr是能夠用於between ... and之間的表達式,是受約束的表達式。因此arith_expr是expr的一個真子集。
- simple_expr :simple_expr是簡單表達式,不能直接進行自我遞歸的表達式。是expr和aritharith_expr的共同擁有的部分。
expr_const:
STRING
| DATE_VALUE
| INTNUM
| APPROXNUM
| BOOL
| NULLX
| QUESTIONMARK
| TEMP_VARIABLE
| SYSTEM_VARIABLE
| SESSION_ALIAS '.' column_name
;
simple_expr:
column_ref
| expr_const
| '(' expr ')'
| '(' expr_list ',' expr ')'
| case_expr
| func_expr
| when_func
| select_with_parens %prec UMINUS
| EXISTS select_with_parens
;
/* used by the expression that use range value, e.g. between and */
arith_expr:
simple_expr
| '+' arith_expr %prec UMINUS
| '-' arith_expr %prec UMINUS
| arith_expr '+' arith_expr
| arith_expr '-' arith_expr
| arith_expr '*' arith_expr
| arith_expr '/' arith_expr
| arith_expr '%' arith_expr
| arith_expr '^' arith_expr
| arith_expr MOD arith_expr
expr:
simple_expr
| '+' expr %prec UMINUS
| '-' expr %prec UMINUS
| expr '+' expr
| expr '-' expr
| expr '*' expr
| expr '/' expr
| expr '%' expr
| expr '^' expr
| expr MOD expr
| expr COMP_LE expr
| expr COMP_LT expr
| expr COMP_EQ expr
| expr COMP_GE expr
| expr COMP_GT expr
| expr COMP_NE expr
| expr LIKE expr
| expr NOT LIKE expr
| expr AND expr %prec AND
| expr OR expr %prec OR
| NOT expr
| expr IS NULLX
| expr IS NOT NULLX
| expr IS BOOL
| expr IS NOT BOOL
| expr IS UNKNOWN
| expr IS NOT UNKNOWN
| expr BETWEEN arith_expr AND arith_expr %prec BETWEEN
| expr NOT BETWEEN arith_expr AND arith_expr %prec BETWEEN
| expr IN in_expr
| expr NOT IN in_expr
| expr CNNOP expr
;
simple_expr為簡單表達式,並非說它非常easy。由於simple_expr也包括了select_with_parens(帶括號的select語句)等語句,僅僅能說simple_expr不能像arith_expr和expr等一樣遞歸調用。
expr:expr BETWEEN arith_expr AND arith_expr %prec BETWEEN | expr NOT BETWEEN arith_expr AND arith_expr %prec BETWEEN ;
arith_expr用於between ... and 之間,僅僅包括了算術表達式,沒有is,like 以及比較關系表達式。
expr,arith_expr,simple_expr實際上等同於PostgreSQL中的a_expr,b_expr,c_expr。
總之,在語法樹規則和詞法分析方面,OceanBase大量的借鑒了PostgreSQL。
節點的創建
確定了節點的結構和語法樹的形狀,就到了實際創建語法樹的過程。通常,1條SQL語句的語法樹存在多個節點,數據庫中要高效的運行多條語句,就會遇到大量的節點創建問題。假設每次創建都調用new/malloc等系統函數必定會浪費大量的時,並且還會造成內存碎片。
這樣的問題經常會出如今現實中,各個數據庫都有自己不同的解決的方法,但基本原理是一次性向系統申請較大的內存,然后在須要的時候自行分配。
接下來我將對照PostgreSQL,RedBase,OceanBase 3個數據庫是各自怎樣解決這一問題的。
PostgreSQL創建語法樹節點
PostgreSQL使用兩個宏完畢節點的創建。即makeNode和newNode.
#define makeNode(_type_) ((_type_ *) newNode(sizeof(_type_),T_##_type_))
/* 針對gcc版本號的newNode */#define newNode(size, tag) \
({ Node *_result; \
AssertMacro((size) >= sizeof(Node));/* 檢測申請的內存大小,>>=sizeof(Node) */ \
_result = (Node *) palloc0fast(size); /* 申請內存 */ \
_result->type = (tag); /*設置TypeTag */ \
_result; /*返回值*/\
})
#define palloc0fast(sz) \
( MemSetTest(0, sz) ? \
MemoryContextAllocZeroAligned(CurrentMemoryContext, sz) : \
MemoryContextAllocZero(CurrentMemoryContext, sz) )
注意:要避免直接使用newNode來創建節點,由於節點的大小在不同的環境下可能是不同的。使用makeNode就可以,如:
Stmt *s = makeNode(Stmt);
我們知道,PostgreSQL中繼承自NODE*的結構體們各自大小不一,都大於等於NODE 的大小。newNode中使用palloc0fast申請內存,它仍然是個宏。終於調用的是PostgreSQL中的MemoryContextAllocZeroAligned或者MemoryContextAllocZero函數。這兩個函數來自PostgreSQL中內存管理模塊--內存上下文,該模塊可以非常好的應對內存碎片,向數據庫進程提供緩沖區管理。
RedBase創建語法樹節點
RedBase沒有提供向PostgreSQL一樣復雜的內存管理機制,而是採用簡單的方法來解決頻繁創建節點的問題。由於RedBase中語法樹的節點都是NODE類型的。全部RedBase使用一個NODE的數組來作為緩沖區,默認最大值為100,超過這個值就會創建出錯,並終於退出程序。
假設你的SQL語句須要的節點超過100,須要在編譯之前改動最大節點數目MAXNODE以適應需求。
#define MAXNODE 100 //最大節點數目
static NODE nodepool[MAXNODE];
static int nodeptr = 0;
/*
* newnode: allocates a new node of the specified kind and returns a pointer
* to it on success. Returns NULL on error.
*/
NODE *newnode(NODEKIND kind)
{
NODE *n;
/* if we've used up all of the nodes then error */
if(nodeptr == MAXNODE){
fprintf(stderr, "out of memory\n");
exit(1);
}
/* get the next node */
n = nodepool + nodeptr;
++nodeptr;
/* initialize the `kind' field */
n -> kind = kind;
return n;
}
OceanBase創建語法樹節點
OceanBase創建語法樹節點的方式與PostgreSQL類似,上層調用。底層有負責內存池管理的模塊來負責真正的創建,只是不是內存上下文,而是一個類ObStringBuf.
OceanBase的new_node函數申請內存時調用的是parse_malloc函數,該函數專用於語法樹結構體的創建,從obStringBuf中獲取內存,直到obStringBuf線程退出時才會真正釋放這些內存。
大型的數據庫都會有專門的內存管理模塊來負責語法程序執行過程中的內存申請和釋放。小型的數據庫則結合自身特點。量身定制輕量的內存管理機制。
目的都僅僅有一個:減少頻繁創建和銷毀語法樹節點的開銷。
總結
SQL的運行包含了解析語法樹,制定邏輯查詢計划,運行物理查詢計划等步驟。通過對照3個不同的數據庫的源碼。得出在解析語法樹中遇到的一些共性問題:
- 怎樣表示一個語法樹的節點
- 利用Bison定義語法樹的結構時的一些難點,如select,expr等
- 怎樣減少頻繁創建和銷毀語法樹節點的開銷
假設你要自己來寫一個SQL解析程序的話,這些問題相同難以避免。
假設閱讀本文過程中有不論什么問題,請聯系作者。轉載請注明出處。
