Python的詞法分析與語法分析


詞法分析(Lexical Analysis):分析由字符組成的單詞是否合法,如果沒有問題的話,則產生一個單詞流。

語法分析(Syntactic Analysis):分析由單詞組成的句子是否合法,如果沒有問題的話,則產生一個語法樹。

在詞法分析器分析源代碼文本的時候,有一個概念需要明確:

1.物理行:由回車字符序列(在Windows上是CR LF,在Unix上是LF)結尾的字符序列組成一個物理行。

2.邏輯行:由一個或者多個物理行組成,可以明確地使用反斜杠(\)來連接多個物理行使之成為一個邏輯行;或者,處在圓括號,中括號,花括號內的表達式可以跨越多個物理行,但是被當作一個邏輯行。

詞法分析器是面向邏輯行的,也就是說,對於詞法分析器而言,只有邏輯行才算是一行,它只在邏輯行結束之處才產生NEWLINE這個單詞或者說token。

對於每一處縮進,不管它有多少個空白字符,詞法分析器只會產生一個INDENT單詞或者說token,代表縮進一級,每當要退出一級縮進的時候,詞法分析器就會產生一個DEDENT單詞或者說token。注意,單詞DEDENT並沒有一個或一組字符與之對應,它是完全的邏輯概念。

Python使用稍作修改的BNF(巴科斯范式)來表示詞法與語法規則。

下面重點說一下需要注意的地方,以避免發生一些低級但是隱蔽的編程錯誤。

1.標識符是區分大小寫的,但是仍然不要僅僅用大小寫不同來區分兩個變量。

2.不要使用那些在其它編程語言中是關鍵字的標識符作為變量名,因為它們很可能會成為Python的關鍵字。

3.不要使用Python明確聲明有特殊意義的標志符作為變量名(這類變量一般以下划線開頭),除非明確自己要使用那個特殊含義。

4.不要在Python中使用$和?(字符串中除外),它們不是合法的字符。

5.不要混用Tab和空格來表示縮進,只使用其中一種,並養成習慣。

6.整數字面常量有10,16,8,2幾種表示方法,如果使用16進制,請寫0xa或者0Xa;如果使用8進制,請寫0o7或者0O7;如果使用2進制,請寫0b1或者0B1;總之,不要省略掉那個標識進制的字母,建議只使用小寫字母。

7.在整數字面常量后加一個l或者L就形成了一個長整數,建議只使用L,因為小寫l看起來像數字1.

8.整數使用32位表示,但是長整數並不限於多少位表示,在內存允許的情況下,它可以表示任意大小的整數,這與C語言等是不一樣的。

9.如果一個整數字面常量的值超過32位整數的表示范圍,那么Python會自動將它升級為長整數,但是在早期的Python實現中可能並非如此,因此如果你預計需要一個很大的整數值,請明確使用長整數。

10.浮點數字面常量只有10進制形式。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM