一個JavaWeb項目開發總結


一、學會如何讀一個JavaWeb項目源代碼

步驟:表結構->web.xml->mvc->db->spring ioc->log->代碼

  1. 先了解項目數據庫的表結構,這個方面是最容易忘記的,有時候我們只顧着看每一個方法是怎么進行的,卻沒有去了解數據庫之間的主外鍵關聯。其實如果先了解數據庫表結構,再去看一個方法的實現會更加容易。

  2. 然后需要過一遍web.xml,知道項目中用到了什么攔截器,監聽器,過濾器,擁有哪些配置文件。如果是攔截器,一般負責過濾請求,進行AOP等;如果是監聽器,可能是定時任務,初始化任務;配置文件有如 使用了spring后的讀取mvc相關,db相關,service相關,aop相關的文件。

  3. 查看攔截器,監聽器代碼,知道攔截了什么請求,這個類完成了怎樣的工作。有的人就是因為缺少了這一步,自己寫了一個action,配置文件也沒有寫錯,但是卻怎么調試也無法進入這個action,直到別人告訴他,請求被攔截了。

  4. 接下來,看配置文件,首先一定是mvc相關的,如springmvc中,要請求哪些請求是靜態資源,使用了哪些view策略,controller注解放在哪個包下等。然后是db相關配置文件,看使用了什么數據庫,使用了什么orm框架,是否開啟了二級緩存,使用哪種產品作為二級緩存,事務管理的處理,需要掃描的實體類放在什么位置。最后是spring核心的ioc功能相關的配置文件,知道接口與具體類的注入大致是怎樣的。當然還有一些如apectj等的配置文件,也是在這個步驟中完成

  5. log相關文件,日志的各個級別是如何處理的,在哪些地方使用了log記錄日志

  6. 從上面幾點后知道了整個開源項目的整體框架,閱讀每個方法就不再那么難了。

  7. 當然如果有項目配套的開發文檔也是要閱讀的。

二、爬蟲是如何實現的:

獲取規則url(正則表達式) -> 模擬請求(如httpclient get請求)-> 獲取列表頁html -> 獲取信息頁 -> 發送請求 -> 信息頁html -> 根據規則截取相應的字段信息 -> 對字段進行清理(如圖片壓縮) -> 靜態化(存儲到數據庫)

三、架構文檔

開發項目是需要學會寫架構文檔,而不是只是做一個碼農

包含以下內容:

  1. 模塊分級,各模塊關系,各模塊負責人
  2. 各模塊時序圖
  3. 各模塊表結構
  4. 協議文檔(接口文檔)
  5. 每個負責人工作計划

下發任務后每個模塊的負責人用開發工具畫出自己的時序圖,表結構和接口文檔,最后匯總到總項目負責人處。

 

四、其它

  1. 數據庫是否分表問題:用分表的方式管理表有時並不合理,如果讀的壓力高是不值得的,可能更慢。如果寫並發高就行(以千萬級別為准)。 讀是按緩存的,緩存密度在95%以上是比較保險的。讀的優化:讀單條信息,只需搜到這個id,然后直接從緩存中拿,緩存用id做緩存,查id的效率是很高的

  2. CMS=模板+數據:可以通過只有一套自己的模板(如用freemarker),發送請求獲取json數據填入信息。CMS有模板通過把數據填入模板即形成一個網頁。

  3. 計算機瀏覽器的網頁內容要在手機上查看,需要做到響應式HTML

  4. 如通過抓取網頁內容放到app上顯示,需要做的內容:圖片大小自適應,內容盡量保真,校驗內容是否丟失,鏈接需要替換的需要進行替換,html標簽替換

  5. 爬蟲的核心是多線程的任務管理,抓取分頁列表內容。

  6. 微信公眾號上是如何綁定用戶讓用戶只登錄一次,下次不用登陸?這個過幾天補充。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2026 CODEPRJ.COM