老師,你確定Java注釋不會被執行嗎?


之前在博客上分享過一篇文章,涉及到 Java 中的注釋,就信誓旦旦地寫了一句話:“注釋是不會被執行的!”結果,有小伙伴留言說,“老師,你確定嗎?”

我這個人一直有個優點,就是能聽得進去別人的聲音,管你是贊美的還是批評的,從來都是虛心接受。因為我相信,大多數小伙伴都是出於善的目的。

況且,我在技術上從來沒想過要成為多牛逼的大佬,就是喜歡分享的感覺,而已。很多文章中出現的錯誤,我都原封不動的保留,因為如果把修正了,那么留言中那些指出錯誤的人,在后來的讀者眼里,就會覺得不合時宜。

那些 diss 我的小伙伴們,放心,我是不會介意的。

盡管如此,但對於注釋這件事,真的是不能忍啊!注釋肯定不會被執行啊,我想這位小伙伴一定是在諷刺我。於是我就私信問他為什么,然后他就甩給了我下面這段代碼:

public class Test {
    public static void main(String[] args) {
        String name = "沉默王二";
        // \u000dname="沉默王三";
        System.out.println(name);
    }
}

我拷貝到 IDEA 中跑了一下,結果程序輸出的結果出乎我的意料:

沉默王三

竟然是王三,不是王二。看到這個結果,我算是徹底懵逼了。

那一剎那,我感覺這十來年的 Java 算是白學了。大學那會,老師說注釋是不會執行的;就連《編程思想》里也說注釋是不會執行的。那現在誰能告訴我這到底為什么?

不是說程序的世界很單純嗎?不是 0 就是 1?事情搞到這個地步,只能花心思好好研究一下了。

單純從代碼上來看,問題應該出在那串特殊的字符上——\u000d,如果不是它在作怪,把 name 的值由“沉默王二”修改為了“沉默王三”,就沒有別的原因了——沒別的,憑借多年的工作經驗,找問題的根源我還是很得心應手的。

\u000d 雖然看上去比較陌生,但我知道它是一個 Unicode 字符。問了一下搜索引擎后,知道它代表一個換行符——一種恍然大悟的感覺啊。我知道,Java 編譯器不僅會編譯代碼,還會解析 Unicode 字符。

我大致看了一眼上面這段代碼編譯后的字節碼,它長下面這個樣子:

// class version 58.65535 (-65478)
// access flags 0x21
public class com/cmower/dzone/secret/Test {

  // compiled from: Test.java

  // access flags 0x1
  public <init>()V
   L0
    LINENUMBER 3 L0
    ALOAD 0
    INVOKESPECIAL java/lang/Object.<init> ()V
    RETURN
   L1
    LOCALVARIABLE this Lcom/cmower/dzone/secret/Test; L0 L1 0
    MAXSTACK = 1
    MAXLOCALS = 1

  // access flags 0x9
  public static main([Ljava/lang/String;)V
   L0
    LINENUMBER 5 L0
    LDC "\u6c89\u9ed8\u738b\u4e8c"
    ASTORE 1
   L1
    LINENUMBER 6 L1
    LDC "\u6c89\u9ed8\u738b\u4e09"
    ASTORE 1
   L2
    LINENUMBER 7 L2
    GETSTATIC java/lang/System.out : Ljava/io/PrintStream;
    ALOAD 1
    INVOKEVIRTUAL java/io/PrintStream.println (Ljava/lang/String;)V
   L3
    LINENUMBER 8 L3
    RETURN
   L4
    LOCALVARIABLE args [Ljava/lang/String; L0 L4 0
    LOCALVARIABLE name Ljava/lang/String; L1 L4 1
    MAXSTACK = 2
    MAXLOCALS = 2
}

嗯,表示看不懂。不過沒關系,把它反編譯一下就行了,於是我看到下面這段代碼:

public class Test {
    public Test() {
    }

    public static void main(String[] args) {
        String name = "沉默王二";
        name = "沉默王三";
        System.out.println(name);
    }
}

咦,兩個反斜杠 // 真的不見了,這可以確定一點——注釋確實是不會執行的。只不過 \u000dname="沉默王三"; 擠到了 // 注釋的下一行,就好像下面這段代碼的樣子:

public class Test {
    public static void main(String[] args) {
        String name = "沉默王二";
        //
        name="沉默王三";
        System.out.println(name);
    }
}

那這算不算是 Java 的 bug 呢?說算也不算。

因為通過允許 Java 源代碼包含 Unicode 字符,可以確保在世界上任何一個區域編寫的代碼在其他地方執行。

老實說,這段話是我從網上找到,好像明白點啥,又好像不明白。那再來看一段代碼:

double π = Math.PI;
System.out.println(\u03C0);

假如說程序員小王在創建周期率這個變量的時候,不知道 π 這個字符怎么敲出來,那么他就可以選擇使用 \u03C0 來替代——編譯器知道 \u03C0 就是 π 這個變量(編譯器會在編譯其他代碼之前先解析 Unicode 字符)。

只能說 \u000d 是一種例外吧。

當然了,除非特殊情況,不要在源代碼中包含 Unicode 字符,以免更改源代碼的本意。

這篇文章沒有別的意思,我也不想探究過於深奧的東西,純粹是提高一下小伙伴們的認知:注釋有可能被編譯器執行。就好像,魯迅如果不知道茴香豆的“茴”字有 4 種寫法,那他就沒辦法讓孔乙己在魯鎮的那家茶館里裝逼。

當然了,如果有小伙伴想體驗一下裝逼的感覺的話,可以把下面這段代碼保存在一個名叫 Ugly.java 的文件中:

\u0070\u0075\u0062\u006c\u0069\u0063\u0020\u0020\u0020\u0020

\u0063\u006c\u0061\u0073\u0073\u0020\u0055\u0067\u006c\u0079

\u007b\u0070\u0075\u0062\u006c\u0069\u0063\u0020\u0020\u0020

\u0020\u0020\u0020\u0020\u0073\u0074\u0061\u0074\u0069\u0063

\u0076\u006f\u0069\u0064\u0020\u006d\u0061\u0069\u006e\u0028

\u0053\u0074\u0072\u0069\u006e\u0067\u005b\u005d\u0020\u0020

\u0020\u0020\u0020\u0020\u0061\u0072\u0067\u0073\u0029\u007b

\u0053\u0079\u0073\u0074\u0065\u006d\u002e\u006f\u0075\u0074

\u002e\u0070\u0072\u0069\u006e\u0074\u006c\u006e\u0028\u0020

\u0022\u0048\u0065\u006c\u006c\u006f\u0020\u0077\u0022\u002b

\u0022\u006f\u0072\u006c\u0064\u0022\u0029\u003b\u007d\u007d

在命令行中先執行 javac Ugly.java,再執行 java Ugly 命令就可以看到程序結果了:

Hello world

體驗過后,就拉到吧。反正寫這樣的代碼誰也看不懂,除了機器。好了,我親愛的讀者朋友,以上就是本文的全部內容了。是不是感覺認知邊界又拓寬了?

我是沉默王二,一枚有趣的程序員。如果覺得文章對你有點幫助,請微信搜索「 沉默王二 」第一時間閱讀,回復【666】更有我為你精心准備的 500G 高清教學視頻(已分門別類)。

本文 GitHub 已經收錄,有大廠面試完整考點,歡迎 Star。

原創不易,莫要白票,請你為本文點個贊吧,這將是我寫作更多優質文章的最強動力。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM