C++中消息自動派發之二 About IDL解析器


  前一篇blog中講了如何在C++中實現消息的自動派發,而關鍵點在於如何實現通過IDL文件自動生成msg_dispatcher模板類。有幾個網友提醒我idl解析器會比較難寫,事實卻是如此。我第一個版本的idl解析器本來只是想做demo只用。花了一個晚上時間拼湊了幾個python函數,msg_dispatcher類倒是能生成,但解析器的代碼太混亂了,簡直毫無結構可言。說實話,這個消息自動派發框架我還要深入的開發、擴展、優化,所以還是像模像樣的搞一個解析器吧。於是果斷扔掉第一版本的解析器代碼,重新實現之。仍然采用Python實現,目前只完成了cpp代碼生成器,並且只能支持消息體的decode,不支持encode,語法報錯機制也沒有加入。隨未完美,但是畢竟開了個好頭,這里講一下解析器的實現。

完整示例代碼 svn co http://ffown.googlecode.com/svn/trunk/fflib/lib/generator/

示例idl 文件:svn co http://ffown.googlecode.com/svn/trunk/fflib/lib/generator/example.idl

struct student_t
{
struct book_t
{
int16 pages;
};
string age;
};

 1. 詞法分析

    用Python的好處是解析字符串非常方便,首先要把idl源文件解析成單個的單詞。我定義了一個src_parser_t類實現此功能。解析分如下幾步:

  1> 讀入idl 源文件內容

  2> 把源文件內容分隔成單個行,只需將file_content_str.split('\n')即可。

  3> 在把每行按空格分隔成單個單詞 split(' ')即可

  4> 如果有單詞最后一個字符有分號去掉。

解析代碼如下(只有80行):

from pylib.inc import *

class src_parser_t:
def __init__(self, file):
self.file = file
self.struct_def_mgr = struct_def_mgr_t()
self.file_content = ''
self.all_words = []
f = open(file)
self.file_content = f.read()
f.close()
def get_struct_def_mgr(self):
return self.struct_def_mgr
def parse_to_words(self):
all_line = self.file_content.split('\n')
for line in all_line:
words = line.split(' ')
for w in words:
w = w.strip()
if w != '':
self.all_words.append(w)

def build_struct_relation(self):
struct_stack = []
index = 0
while index < len(self.all_words):
if len(struct_stack) < 1:
struct_stack.append(self.struct_def_mgr)

parent_struct = struct_stack[len(struct_stack) - 1]
cur_word = self.all_words[index]
if cur_word == 'struct':
struct_def = struct_def_t(self.all_words[index + 1])
parent_struct.add_struct(struct_def)
struct_stack.append(struct_def)
index = index + 1
elif cur_word == '}' or cur_word == '};':
struct_stack.pop()
elif cur_word == 'int8' or cur_word == 'int16' or cur_word == 'int32' or \
cur_word == 'float' or cur_word == 'string':
field_name = self.all_words[index + 1].split(';')[0]
field = field_def_t(field_name, cur_word, '', '')
parent_struct.add_field(field)
index = index + 1
else:
if -1 == cur_word.find('dictionary') and -1 == cur_word.find('{') and -1 == cur_word.find('array') :
field_name = self.all_words[index + 1].split(';')[0]
field = field_def_t(field_name, cur_word, '', '')
parent_struct.add_field(field)
index = index + 1
else:
field_type = ''
field_name = ''
key_type = ''
val_type = ''
if -1 != cur_word.find('array'):
field_name = self.all_words[index + 1].split(';')[0]
word_split = cur_word.split('<')
field_type = word_split[0]
key_type = word_split[1].split('>')[0]
field = field_def_t(field_name, field_type, key_type, '')
parent_struct.add_field(field)
index = index + 1
elif -1 != cur_word.find('dictionary'):
field_name = self.all_words[index + 1].split(';')[0]
word_split = cur_word.split('<')
field_type = word_split[0]
key_val_type = word_split[1].split('>')
key_type = key_val_type[0].split(',')[0]
val_type = key_val_type[0].split(',')[1]
field = field_def_t(field_name, field_type, key_type, val_type)
parent_struct.add_field(field)
index = index + 1
index = index + 1

def exe(self):
self.parse_to_words()
self.build_struct_relation()

2. 語法分析

  idl 文件語法規則非常簡單,遍歷所有單詞,依次做如下判斷:

  1> 如果當前單詞為struct, 那么下一個單詞即為新的消息體名稱,當然也有可能是子消息體,無需擔心,只需將新創建的消息體對象添加到特定棧的的棧頂struct對象中,默認struct_def_mgr存在於棧中。並把新的消息體壓入棧中。

  2> 如果為int/string/float/array/dictionary,那么下一個單詞即為消息體的字段名稱。把新字段對象add到棧頂的struct_def對象中

  3> 遇到‘}’ 代表當前struct的解析完成。pop 彈出棧頂struct_def 對象。

  4> 其他字段忽略

3. 消息體結構管理

  1> field_def_t 描述消息體字段信息,包括字段的名稱、類型、key_type、val_type、父消息體對象。如array<int>那么key_type為int,如果dictionary<int,string> 那么key_type為int, val_type為string

  2> struct_def_t 描述單個消息體的信息,包括消息體名稱、子消息集合、字段對象集合。

  3> struct_def_mgr_t 維護所有的消息體集合。

代碼即注釋:

class field_def_t:
def __init__(self, name, type, key_type, val_type_):
self.name = name
self.parent = None
self.type = type
self.key_type = key_type
self.val_type = val_type_
def get_name(self):
return self.name
def get_parent(self):
return self.parent
def set_parent(self, p):
self.parent = p
def get_type(self):
return self.type
def get_key_type(self):
return self.key_type
def get_val_type(self):
return self.val_type
def dump(self, prefix = ''):
print(prefix, self.name, self.type, self.key_type, self.val_type)

class struct_def_t:
def __init__(self, name, parent = None):
self.name = name
self.parent = parent
self.all_fields = {}
self.sub_struct = []

def get_name(self):
return self.name
def get_parent(self):
return self.parent
def set_parent(self, parent):
self.parent = parent
def add_field(self, field_def_):
self.all_fields[field_def_.get_name()] = field_def_
field_def_.set_parent(self)
def add_struct(self, struct_def_):
self.sub_struct.append(struct_def_)
struct_def_.set_parent(self)
def get_all_struct(self):
return self.sub_struct
def get_all_field(self):
return self.all_fields
def get_parent(self):
return self.parent
def has_field(self, name):
if None == self.all_fields.get(name):
return False
return True
def dump(self, prefix = ''):
print(prefix, self.name, 'include struct:')
for struct in self.sub_struct:
struct.dump(prefix + "")
print(prefix, self.name, "include fields:")
for field in self.all_fields:
self.all_fields[field].dump(prefix + "")


class struct_def_mgr_t:
def __init__(self):
self.all_struct = {}
def get_name(self):
return ''
def add_struct(self, struct_def_):
self.all_struct[struct_def_.get_name()] = struct_def_
struct_def_.set_parent(None)
def get_all_struct(self):
return self.all_struct
def get_struct(self, name):
return self.all_struct[name]
def get_parent(self):
return ''
def dump(self):
for name in self.all_struct:
self.all_struct[name].dump()


4. 中間代碼生成

  代碼是由code_generator_t 類實現的。考慮到未來需要支持多語言,中間代碼生成采用策略模式。當前只實現了cpp的code_generator。如果要增強其他語言,只需再編寫一個特定的code_generator_t類即可。

5. TODO

  1> struct 消息體只支持decode from json,還不能支持encode to json,也不能支持decode from Bin or encode to Bin。

  2> 語法報錯不夠友好。

  3> 多語言支持。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM