為什么 StackOverflow 上的代碼片段會摧毀你的項目?


昨天公司里碰到一件令人啞然失笑的事情。幫朋友公司做的一個項目,做SIT測試的時候發現一些bug,仔細查了下原因,原來是因為當初覺得這個項目比較簡單,交給了幾個新入職的新丁,也算是給他們練練手,結果其中一位寫了一段代碼出現了問題結果導致bug的出現。

雖然問題不大很快就修復了,但是正所謂初生牛犢不怕虎,這位出問題的新丁不太服氣,一直嚷嚷着他這段代碼是從CSDN上找到的,別人都說好用他才用的。問了問他是否理解原文中那么寫的原因,結果才支支吾吾了半天講不清楚,最后也承認他只是看到那段代碼的結果是他要的,並不是理解中間一些方法的運用到底是什么邏輯。

真是又好氣又好笑,想想現在的年輕人真是有個性,自己當年遇到這種情況只敢虛心求教,哪敢都沒明白就去用一段代碼,別人指出問題還忿忿不平。

也許是自己老了吧。晚上和一個剛從國外歸國的同學說起這個事情,他倒是深有體會,說到他們在國外留學時,遇到技術問題想到網上咨詢用的最多的是StackOverflow,相比起國內的CSDN,他覺得StackOverflow上提問題的人和回答的人都更加嚴謹,不會有太多的廢話和問題之外的討論。按他的理解,CSDN上很多國內的技術新手純粹是缺乏獨立思考的能力,都只是來求代碼完成目標,不去探究為什么這么寫,本身CSDN上問題回答質量不高,這樣很容易出事。

同學的看法,一方面可能是因為國內程序員需求極大,但整體浮躁、功利性的大環境導致很多培訓機構沒有培訓到位,很多程序員都是一邊開始工作一邊學習;但另一方面,不排除他崇洋媚外的自滿情緒。於是,我便去查閱了下StackOverflow上面的內容和相關資料。

仔細研究后發現,其實StackOverflow沒有同學說的那么好,即使是該網站上的回答,也有很多有問題的代碼。看來這還是一個世界性通用的難題~

對於國外的程序員來說,StackOverflow就是他們的CSDN,是他們遇到各種問題查詢的第一選擇,很多國外的程序員,會到StackOverflow上需求幫助,找到他們需要的解決問題的代碼,然后不假思索的直接復制使用,和我公司出問題的那位年輕人一樣,這個習慣很不好。

代碼復制本身來說並不是什么壞事,我們學開發的時候,肯定老師都教過我們代碼復用能有效提高軟件的開發效率。已經被解決了的問題,實在沒有必要再去重新寫一遍代碼。但是這個前提是,使用者,也就是開發人員,必須知道你要用的這段代碼的來龍去脈真正含義,就是你要真正明白你用的代碼。

簡單舉個例子:

  • 幾年前,很多程序員發現,在windows上使用Docker老是會碰到無法啟動的問題,原因一直不明,很多人都是重裝了系統什么的才解決。后來有一個大神發文解釋原因后我們才知道了為什么

當 Windows 后台啟動了 Razer Synapse 時,再去啟動 Docker 就會觸發此問題。根本原因是,Razer Synapse 運行后,Docker 就會認為已經有一個 Docker 實例正在運行中,所以不會再啟動一個實例,也就是真的Docker。

為什么會有這種情況呢?

因為有一段代碼中,返回的 GUID 類型是 System.Reflection.RuntimeAssembly(系統層面的運行時程序集),而不是 Windows 中對應 Docker 程序集中定義的類型。Docker處理的邏輯就是在同一時間只允許運行一個實例,判斷的方式就是通過判斷 GUID 是否存在,但在獲取GUID 時,用的是系統層面的而非自己獨立程序集里面,從而導致了這個問題。問題代碼如下:

var name = string.Format("Global\{0}", (object) 
Assembly.GetExecutingAssembly().GetType().GUID);

當然了,如果系統只有一個應用程序使用了上面的錯誤代碼,那么這個問題還是不會出現,因為只有一個實例。但實際情況是很多應用程序都使用了這一段錯誤代碼,結果就不允許兩個實例同時運行。

那這些應用程序,想必你已經猜到,都用了這段代碼,而且都是從StackOverflow上下載后不假思索的使用導致的。

  • Andreas Lundblad,國外一位大神,Palantir 的 Java 開發人員,同時也是 StackOverflow 上排名最高的貢獻者之一。

他有一段代碼,作用是將字節計數轉換為更易於閱讀的格式。打個比方,1024字節轉換為1kB,1048576 字節轉換為1MB。他最初在2010年將這一段代碼放到了StackOverflow上,根據官方統計,他的這段代碼是StackOverflow上被拷貝次數最多的Java代碼,GitHub上使用這段代碼的項目有6千多個。

當Andreas Lundblad知道此事后,出於負責,很小心謹慎的重新檢查了下這段代碼,隨后發現這段代碼里有一些問題,於是他馬上更新了版本,並發博告訴大家:

  • StackOverflow 上的代碼可能存在 bug,不管他的好評是多少。
  • 如果你拿了StackOverflow的代碼,一定記住要測試所有的可能的情況。
  • 在復制代碼時,一定要包括其來源和貢獻者,當出問題時,能快速幫你定位。

同樣的,在去年,國外另一位大神Morteza Verdi發表了一篇研究論文指出,StackOverflow上流傳最廣的一段c++代碼存在着69個重大安全隱患漏洞,GitHub上使用這段C++代碼的項目也有近3千多個。

所以,無論是StackOverflow還是CSDN,無論是國外和國內,都務必記住一點,在復用別人的代碼時,一定要搞清楚別人代碼的含義,並做好充分的測試工作,並不是說你運行了一次沒問題,就是真的沒問題,可能只是你運氣好,沒有觸發問題場景罷了。

引用 Ryan Donovan 的一句話,就是:

If you borrow things and you don’t understand the content of what you’re borrowing, then you fall in this trap of reusing code that has potential vulnerabilities. Then you are just spreading those things around.”

If you’re going to reuse code, you need to understand that code.

復用代碼,一定要理解代碼!

你復用代碼時遇到過什么問題?一起討論下吧!

歡迎關注我的公眾號:程序猿DD,獲得獨家整理的免費學習資源助力你的Java學習之路!另每周贈書不停哦~


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM