C++中消息自動派發之二 About IDL解析器

本文轉載自查看原文 2012-02-21 00:32 2427 msg/ idl/ c++/ dispatch/ framework.python

　　前一篇blog中講了如何在C++中實現消息的自動派發，而關鍵點在於如何實現通過IDL文件自動生成msg_dispatcher模板類。有幾個網友提醒我idl解析器會比較難寫，事實卻是如此。我第一個版本的idl解析器本來只是想做demo只用。花了一個晚上時間拼湊了幾個python函數，msg_dispatcher類倒是能生成，但解析器的代碼太混亂了，簡直毫無結構可言。說實話，這個消息自動派發框架我還要深入的開發、擴展、優化，所以還是像模像樣的搞一個解析器吧。於是果斷扔掉第一版本的解析器代碼，重新實現之。仍然采用Python實現，目前只完成了cpp代碼生成器，並且只能支持消息體的decode，不支持encode，語法報錯機制也沒有加入。隨未完美，但是畢竟開了個好頭，這里講一下解析器的實現。

完整示例代碼 svn co http://ffown.googlecode.com/svn/trunk/fflib/lib/generator/

示例idl 文件：svn co http://ffown.googlecode.com/svn/trunk/fflib/lib/generator/example.idl

struct student_t
{
    struct book_t
    {
        int16       pages;
    };
   string           age;
};

　1. 詞法分析

用Python的好處是解析字符串非常方便，首先要把idl源文件解析成單個的單詞。我定義了一個src_parser_t類實現此功能。解析分如下幾步：

　　1> 讀入idl 源文件內容

　　2> 把源文件內容分隔成單個行，只需將file_content_str.split('\n')即可。

　　3> 在把每行按空格分隔成單個單詞 split(' ')即可

　　4> 如果有單詞最后一個字符有分號去掉。

解析代碼如下（只有80行）：

from pylib.inc import *

class src_parser_t:
    def __init__(self, file):
        self.file = file
        self.struct_def_mgr = struct_def_mgr_t()
        self.file_content = ''
        self.all_words    = []
        f = open(file)
        self.file_content = f.read()
        f.close()
    def get_struct_def_mgr(self):
        return self.struct_def_mgr
    def parse_to_words(self):
        all_line = self.file_content.split('\n')
        for line in all_line:
            words = line.split(' ')
            for w in words:
                w = w.strip()
                if w != '':
                    self.all_words.append(w)

    def build_struct_relation(self):
        struct_stack = []
        index = 0
        while index < len(self.all_words):
            if len(struct_stack) < 1:
                struct_stack.append(self.struct_def_mgr)

            parent_struct = struct_stack[len(struct_stack) - 1]
            cur_word = self.all_words[index]
            if cur_word == 'struct':
                struct_def = struct_def_t(self.all_words[index + 1])
                parent_struct.add_struct(struct_def)
                struct_stack.append(struct_def)
                index = index + 1
            elif cur_word == '}' or cur_word == '};':
                struct_stack.pop()
            elif cur_word == 'int8' or cur_word == 'int16' or cur_word == 'int32' or \
               cur_word == 'float' or cur_word == 'string':
                field_name = self.all_words[index + 1].split(';')[0]
                field = field_def_t(field_name, cur_word, '', '')
                parent_struct.add_field(field)
                index = index + 1
            else:
                if -1 == cur_word.find('dictionary') and  -1 == cur_word.find('{') and -1 == cur_word.find('array') :
                    field_name = self.all_words[index + 1].split(';')[0]
                    field = field_def_t(field_name, cur_word, '', '')
                    parent_struct.add_field(field)
                    index = index + 1
                else:
                    field_type = ''
                    field_name = ''
                    key_type   = ''
                    val_type   = ''
                    if -1 != cur_word.find('array'):
                        field_name = self.all_words[index + 1].split(';')[0]
                        word_split = cur_word.split('<')
                        field_type = word_split[0]
                        key_type = word_split[1].split('>')[0]
                        field = field_def_t(field_name, field_type, key_type, '')
                        parent_struct.add_field(field)
                        index = index + 1
                    elif -1 != cur_word.find('dictionary'):
                        field_name = self.all_words[index + 1].split(';')[0]
                        word_split = cur_word.split('<')
                        field_type = word_split[0]
                        key_val_type = word_split[1].split('>')
                        key_type = key_val_type[0].split(',')[0]
                        val_type = key_val_type[0].split(',')[1]
                        field = field_def_t(field_name, field_type, key_type, val_type)
                        parent_struct.add_field(field)
                        index = index + 1
            index = index + 1
            
    def exe(self):
        self.parse_to_words()
        self.build_struct_relation()

2. 語法分析

　　idl 文件語法規則非常簡單，遍歷所有單詞，依次做如下判斷：

　　1> 如果當前單詞為struct, 那么下一個單詞即為新的消息體名稱，當然也有可能是子消息體，無需擔心，只需將新創建的消息體對象添加到特定棧的的棧頂struct對象中，默認struct_def_mgr存在於棧中。並把新的消息體壓入棧中。

　　2> 如果為int/string/float/array/dictionary，那么下一個單詞即為消息體的字段名稱。把新字段對象add到棧頂的struct_def對象中

　　3> 遇到‘}’ 代表當前struct的解析完成。pop 彈出棧頂struct_def 對象。

　　4> 其他字段忽略

3. 消息體結構管理

　　1> field_def_t 描述消息體字段信息，包括字段的名稱、類型、key_type、val_type、父消息體對象。如array<int>那么key_type為int，如果dictionary<int,string> 那么key_type為int， val_type為string

　　2> struct_def_t 描述單個消息體的信息，包括消息體名稱、子消息集合、字段對象集合。

　　3> struct_def_mgr_t 維護所有的消息體集合。

代碼即注釋：

class field_def_t:
    def __init__(self, name, type, key_type, val_type_):
        self.name       = name
        self.parent     = None
        self.type       = type
        self.key_type   = key_type
        self.val_type   = val_type_
    def get_name(self):
        return self.name
    def get_parent(self):
        return self.parent
    def set_parent(self, p):
        self.parent = p
    def get_type(self):
        return self.type
    def get_key_type(self):
        return self.key_type
    def get_val_type(self):
        return self.val_type
    def dump(self, prefix = ''):
        print(prefix, self.name, self.type, self.key_type, self.val_type)

class struct_def_t:
    def __init__(self, name, parent = None):
        self.name       = name
        self.parent     = parent
        self.all_fields = {}
        self.sub_struct = []

    def get_name(self):
        return self.name
    def get_parent(self):
        return self.parent
    def set_parent(self, parent):
        self.parent = parent    
    def add_field(self, field_def_):
        self.all_fields[field_def_.get_name()] = field_def_
        field_def_.set_parent(self)
    def add_struct(self, struct_def_):
        self.sub_struct.append(struct_def_)
        struct_def_.set_parent(self)
    def get_all_struct(self):
        return self.sub_struct
    def get_all_field(self):
         return self.all_fields
    def get_parent(self):
        return self.parent
    def has_field(self, name):
        if None == self.all_fields.get(name):
            return False
        return True
    def dump(self, prefix = ''):
        print(prefix, self.name, 'include struct:')
        for struct in self.sub_struct:
            struct.dump(prefix + "")
        print(prefix, self.name, "include fields:")
        for field in self.all_fields:
            self.all_fields[field].dump(prefix + "")

        
class struct_def_mgr_t:
    def __init__(self):
        self.all_struct = {}
    def get_name(self):
        return ''
    def add_struct(self, struct_def_):
        self.all_struct[struct_def_.get_name()] = struct_def_
        struct_def_.set_parent(None)
    def get_all_struct(self):
        return self.all_struct
    def get_struct(self, name):
        return self.all_struct[name]
    def get_parent(self):
        return ''
    def dump(self):
        for name in self.all_struct:
            self.all_struct[name].dump()

4. 中間代碼生成

　　代碼是由code_generator_t 類實現的。考慮到未來需要支持多語言，中間代碼生成采用策略模式。當前只實現了cpp的code_generator。如果要增強其他語言，只需再編寫一個特定的code_generator_t類即可。

5. TODO

　　1> struct 消息體只支持decode from json，還不能支持encode to json，也不能支持decode from Bin or encode to Bin。

　　2> 語法報錯不夠友好。

　　3> 多語言支持。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 C++中消息自動派發之三 About JSON Encode C++中消息自動派發之一 About JSON 【C++中消息自動派發之四】使用IDL構建Chat Server JSON解析器實現（C++）常見C/C++ XML解析器比較 C/C++ PeView 結構解析器 [首發] 常見C/C++ XML解析器比較 Anrlr4 生成C++版本的語法解析器 spring中EL解析器的使用 Jsoup中Xpath解析器