Python的詞法分析與語法分析

本文轉載自查看原文 2012-07-15 17:20 10968 Python

詞法分析（Lexical Analysis）：分析由字符組成的單詞是否合法，如果沒有問題的話，則產生一個單詞流。

語法分析（Syntactic Analysis）：分析由單詞組成的句子是否合法，如果沒有問題的話，則產生一個語法樹。

在詞法分析器分析源代碼文本的時候，有一個概念需要明確：

1.物理行：由回車字符序列（在Windows上是CR LF，在Unix上是LF）結尾的字符序列組成一個物理行。

2.邏輯行：由一個或者多個物理行組成，可以明確地使用反斜杠（\）來連接多個物理行使之成為一個邏輯行；或者，處在圓括號，中括號，花括號內的表達式可以跨越多個物理行，但是被當作一個邏輯行。

詞法分析器是面向邏輯行的，也就是說，對於詞法分析器而言，只有邏輯行才算是一行，它只在邏輯行結束之處才產生NEWLINE這個單詞或者說token。

對於每一處縮進，不管它有多少個空白字符，詞法分析器只會產生一個INDENT單詞或者說token，代表縮進一級，每當要退出一級縮進的時候，詞法分析器就會產生一個DEDENT單詞或者說token。注意，單詞DEDENT並沒有一個或一組字符與之對應，它是完全的邏輯概念。

Python使用稍作修改的BNF（巴科斯范式）來表示詞法與語法規則。

下面重點說一下需要注意的地方，以避免發生一些低級但是隱蔽的編程錯誤。

1.標識符是區分大小寫的，但是仍然不要僅僅用大小寫不同來區分兩個變量。

2.不要使用那些在其它編程語言中是關鍵字的標識符作為變量名，因為它們很可能會成為Python的關鍵字。

3.不要使用Python明確聲明有特殊意義的標志符作為變量名（這類變量一般以下划線開頭），除非明確自己要使用那個特殊含義。

4.不要在Python中使用$和?(字符串中除外)，它們不是合法的字符。

5.不要混用Tab和空格來表示縮進，只使用其中一種，並養成習慣。

6.整數字面常量有10，16，8，2幾種表示方法，如果使用16進制，請寫0xa或者0Xa；如果使用8進制，請寫0o7或者0O7；如果使用2進制，請寫0b1或者0B1；總之，不要省略掉那個標識進制的字母，建議只使用小寫字母。

7.在整數字面常量后加一個l或者L就形成了一個長整數，建議只使用L，因為小寫l看起來像數字1.

8.整數使用32位表示，但是長整數並不限於多少位表示，在內存允許的情況下，它可以表示任意大小的整數，這與C語言等是不一樣的。

9.如果一個整數字面常量的值超過32位整數的表示范圍，那么Python會自動將它升級為長整數，但是在早期的Python實現中可能並非如此，因此如果你預計需要一個很大的整數值，請明確使用長整數。

10.浮點數字面常量只有10進制形式。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 詞法分析、語法分析、語義分析自然語言中的詞法分析、語法分析、句法分析簡單的詞法分析和語法分析（C++實現，CodeBlocks+GCC編譯） js詞法分析詞法分析程序編譯原理----詞法分析程序----python語言版編譯原理學習--詞法分析（1）編譯原理實驗一詞法分析詞法分析——運算符的解析詞法分析程序的設計與實現