從誕生至今,20多年過去,Java至今仍是使用最為廣泛的語言。這仰賴於Java提供的各種技術和特性,讓開發人員能優雅的編寫高效的程序。今天我們就來說說Java的一項基本但非常重要的技術內存管理
了解C語言的同學都知道,在C語言中內存的開辟和釋放都是由我們自己來管理的,每一個new操作都要對於一個delete操作,否則就會參數內存泄漏和溢出的問題,導致非常槽糕的后果。但在Java開發過程中,則完全不需要擔心這個問題。因為jvm提供了自動內存管理的機制。內存管理的工作由jvm幫我們完成。這樣我們就不用為了釋放內存而頭疼了。
Jvm內存淺析
雖然jvm幫我們做了內存管理的工作,但是我們仍需要了解jvm到底做了什么,下面我們就一起去看一看
jvm啟動時進行一系列的工作,其中一項就是開辟一塊運行時內存。而這一塊內存中又分為了五大區域,分別用於不同的功能。
程序計數器
記錄程序運行的下一條指令的地址,這里的“地址”可以是一個本地指針,也可以是在方法字節碼中相對於該方法起始指令的偏移量。如果該線程正在執行一個本地方法,那么此時程序計數器的值為”undefined”.在多線程環境下,每一個線程都有自己的程序計數器,在jvm調度線程時,會把當前的線程的程序計數器保存到快照,以便下次線程獲取執行時間時獲取
VM Stack
虛擬機棧是Java方法執行的內存模型,每個方法執行的時候,會在棧中創建一幀用於存儲局部變量表、操作數棧、動態鏈接、方法出口。方法開始調用時,會創建棧幀並入棧,方法執行結束時會出棧。每個線程都有自己的棧。
動態鏈接:是一種在常量池中指向方法的符號引用,需要在運行期確定為直接引用
方法出口:當前執行方法的調用者的程序計數器,或異常處理表的地址
可以通過 -xxs 大小 來配置棧的大小,當嵌套調用使用不當,會導致方法不停的入棧,最終導致棧空間被占滿產生 StackOverflowError
本地方法棧
Heap
堆是用於存放對象實例的地方,幾乎所有對象實例在堆中分配。堆是線程共享的,這是多線程時同步機制的原因。
堆是GC管理的主要區域,GC在對堆進行回收前,首先要確定對象是否已死(不可能再被使用的對象)
判斷對象是否存活的算法有兩種:引用計數算法、可達性分析算法
引用計數算法是為每一個對象添加一個引用計數器,每當有一個引用指向它時,計數器就加一,任何時刻計數器為0的對象就不可能再被使用。這種算法實現簡單,但是它很難解決對象循環引用的問題(何為循環引用見下方備注)
可達性分析算法是Java語言正在使用的算法。它的基本思想是通過一系統被稱為“GC Root”的對象為起點,從這個起點向下搜索,搜索走過的路徑稱為引用鏈,當一個對象不再任何引用鏈上時,則說明這個對象是不可能再被使用的。
在Java語言中,GC Root包括以下幾種對象:
- 虛擬機棧中引用的對象
- 本地方法棧中JNI引用的對象
- 方法區中類靜態成員變量引用的對象
- 方法區中常量引用的對象
可以看出分析對象是否存活,都與引用有關。在JDK1.2之后,Java對引用的概念進行了擴充,將引用分為 強引用(Strong Reference)、軟引用(Soft Reference)、弱引用(Weak Reference)、虛引用(Phantom Reference)
- 強引用
強引用即為原來意義上的引用,只要強引用存在,被引用的對象就不會被回收
- 軟引用
SoftReference類表示軟引用,對於被軟引用關聯的對象,在系統將要發生內存溢出時,會把這些對象列入回收范圍后,進行二次回收
- 弱引用
WeakReference類表示弱引用,對於被弱引用關聯的對象,只能生存到下一次垃圾回收發生之前
- 虛引用
PhantomReference類表示虛引用,虛引用不對關聯的對象的生存時間構成影響,也無法取得對象實例,它唯一的作用是在對象被GC回收是收到一條系統通知
堆得大小可以通過-Xmx和-Xms來控制。對於主流的Jvm,GC基本都采用分代收集的算法。基於這個算法, Java堆又分為新生代(Young Generation)和老年代(Old Generation),新生代又被進一步划分為Eden和Survivor區,最后Survivor由FromSpace和ToSpace組成。新建的對象都是用新生代分配內存,Eden空間不足的時候,會把存活的對象轉移到Survivor中,新生代大小可以由-Xmn來控制,也可以用-XX:SurvivorRatio來控制Eden和Survivor的比例。老生代用於存放新生代中經過多次垃圾回收(也即Minor GC)仍然存活的對象。
永生代(Permanent Space)為方法區
方法區
方法區也為所以線程所共享,用於存放已加載的類信息、靜態變量、常量和即時編譯器編譯后的代碼。-XX:MaxPermSize用於設置方法區大小
直接內存
直接內存不是虛擬機運行時數據區的一部分。通過Native函數庫直接分配的堆外內存,然后通過存儲在Java堆中的DirectByteBuffer對象作為這塊內存的引用進行操作
內存分配和回收策略
目前為止,jvm已經發展處三種比較成熟的垃圾收集算法:1.標記-清除算法;2.復制算法;3.標記-整理算法;4.分代收集算法
1. 標記-清除算法
這種垃圾回收一次回收分為兩個階段:標記、清除。首先標記所有需要回收的對象,在標記完成后回收所有被標記的對象。這種回收算法會產生大量不連續的內存碎片,當要頻繁分配一個大對象時,jvm在新生代中找不到足夠大的連續的內存塊,會導致jvm頻繁進行內存回收(目前有機制,對大對象,直接分配到老年代中)
2. 復制算法
這種算法會將內存划分為兩個相等的塊,每次只使用其中一塊。當這塊內存不夠使用時,就將還存活的對象復制到另一塊內存中,然后把這塊內存一次清理掉。這樣做的效率比較高,也避免了內存碎片。但是這樣內存的可使用空間減半,是個不小的損失。
3. 標記-整理算法
這是標記-清除算法的升級版。在完成標記階段后,不是直接對可回收對象進行清理,而是讓存活對象向着一端移動,然后清理掉邊界以外的內存
4. 分代收集算法
當前商業虛擬機都采用這種算法。首先根據對象存活周期的不同將內存分為幾塊即新生代、老年代,然后根據不同年代的特點,采用不同的收集算法。在新生代中,每次垃圾收集時都有大量對象死去,只有少量存活,所以選擇了復制算法。而老年代中因為對象存活率比較高,所以采用標記-整理算法(或者標記-清除算法)
GC的執行機制
由於對象進行了分代處理,因此垃圾回收區域、時間也不一樣。GC有兩種類型:Scavenge GC和Full GC。
Minor GC
一般情況下,當新對象生成,並且在Eden申請空間失敗時,就會觸發Minor GC,對Eden區域進行GC,清除非存活對象,並且把尚且存活的對象移動到Survivor區。然后整理Survivor的兩個區。這種方式的GC是對年輕代的Eden區進行,不會影響到年老代。因為大部分對象都是從Eden區開始的,同時Eden區不會分配的很大,所以Eden區的GC會頻繁進行。因而,一般在這里需要使用速度快、效率高的算法,使Eden去能盡快空閑出來。
Full GC
對整個堆進行整理,包括Young、Tenured和Perm。Full GC因為需要對整個堆進行回收,所以比Minor GC要慢,因此應該盡可能減少Full GC的次數。在對JVM調優的過程中,很大一部分工作就是對於FullGC的調節。有如下原因可能導致Full GC:
1.年老代(Tenured)被寫滿
2.持久代(Perm)被寫滿
3.System.gc()被顯示調用
4.上一次GC之后Heap的各域分配策略動態變化
Java常見的內存泄漏
- 數據庫連接,網絡連接,IO連接等沒有顯示調用close關閉,會導致內存泄露
- 監聽器的使用,在釋放對象的同時沒有相應刪除監聽器的時候也可能導致內存泄露
JAVA是垃圾回收語言的一種,開發者無需特意管理內存分配。但是JAVA中還是存在着許多內存泄露的可能性,如果不好好處理內存泄露,會導致APP內存單元無法釋放被浪費掉,最終導致內存全部占據堆棧(heap)擠爆進而程序崩潰。
內存泄露
說到內存泄露,就不得不提到內存溢出,這兩個比較容易混淆的概念,我們來分析一下。
-
內存泄露:程序在向系統申請分配內存空間后(new),在使用完畢后未釋放。結果導致一直占據該內存單元,我們和程序都無法再使用該內存單元,直到程序結束,這是內存泄露。
-
內存溢出:程序向系統申請的內存空間超出了系統能給的。比如內存只能分配一個int類型,我卻要塞給他一個long類型,系統就出現oom。又比如一車最多能坐5個人,你卻非要塞下10個,車就擠爆了。
大量的內存泄露會導致內存溢出(oom)。
內存
想要了解內存泄露,對內存的了解必不可少。
JAVA是在JVM所虛擬出的內存環境中運行的,JVM的內存可分為三個區:堆(heap)、棧(stack)和方法區(method)。
-
棧(stack):是簡單的數據結構,但在計算機中使用廣泛。棧最顯著的特征是:LIFO(Last In, First Out, 后進先出)。比如我們往箱子里面放衣服,先放入的在最下方,只有拿出后來放入的才能拿到下方的衣服。棧中只存放基本類型和對象的引用(不是對象)。
-
堆(heap):堆內存用於存放由new創建的對象和數組。在堆中分配的內存,由java虛擬機自動垃圾回收器來管理。JVM只有一個堆區(heap)被所有線程共享,堆中不存放基本類型和對象引用,只存放對象本身。
-
方法區(method):又叫靜態區,跟堆一樣,被所有的線程共享。方法區包含所有的class和static變量。
內存的概念大概理解清楚后,要考慮的問題來了:
到底是哪里的內存會讓我們造成內存泄露?
內存泄露原因分析
在JAVA中JVM的棧記錄了方法的調用,每個線程擁有一個棧。在線程的運行過程當中,執行到一個新的方法調用,就在棧中增加一個內存單元,即幀(frame)。在frame中,保存有該方法調用的參數、局部變量和返回地址。然而JAVA中的局部變量只能是基本類型變量(int),或者對象的引用。所以在棧中只存放基本類型變量和對象的引用。引用的對象保存在堆中。
當某方法運行結束時,該方法對應的frame將會從棧中刪除,frame中所有局部變量和參數所占有的空間也隨之釋放。線程回到原方法繼續執行,當所有的棧都清空的時候,程序也就隨之運行結束。
而對於堆內存,堆存放着普通變量。在JAVA中堆內存不會隨着方法的結束而清空,所以在方法中定義了局部變量,在方法結束后變量依然存活在堆中。
綜上所述,棧(stack)可以自行清除不用的內存空間。但是如果我們不停的創建新對象,堆(heap)的內存空間就會被消耗盡。所以JAVA引入了垃圾回收(garbage collection,簡稱GC)去處理堆內存的回收,但如果對象一直被引用無法被回收,造成內存的浪費,無法再被使用。所以對象無法被GC回收就是造成內存泄露的原因!
垃圾回收機制
垃圾回收(garbage collection,簡稱GC)可以自動清空堆中不再使用的對象。在JAVA中對象是通過引用使用的。如果再沒有引用指向該對象,那么該對象就無從處理或調用該對象,這樣的對象稱為不可到達(unreachable)。垃圾回收用於釋放不可到達的對象所占據的內存。
實現思想:我們將棧定義為root,遍歷棧中所有的對象的引用,再遍歷一遍堆中的對象。因為棧中的對象的引用執行完畢就刪除,所以我們就可以通過棧中的對象的引用,查找到堆中沒有被指向的對象,這些對象即為不可到達對象,對其進行垃圾回收。
如果持有對象的強引用,垃圾回收器是無法在內存中回收這個對象。
引用類型
在JDK 1.2以前的版本中,若一個對象不被任何變量引用,那么程序就無法再使用這個對象。也就是說,只有對象處於可觸及(reachable)狀態,程序才能使用它。從JDK 1.2版本開始,把對象的引用分為4種級別,從而使程序能更加靈活地控制對象的生命周期。這4種級別由高到低依次為:強引用、軟引用、弱引用和虛引用。
Java/Android引用類型及其使用分析
1. 強引用(Strong reference)
實際編碼中最常見的一種引用類型。常見形式如:A a = new A();等。強引用本身存儲在棧內存中,其存儲指向對內存中對象的地址。一般情況下,當對內存中的對象不再有任何強引用指向它時,垃圾回收機器開始考慮可能要對此內存進行的垃圾回收。如當進行編碼:a = null,此時,剛剛在堆中分配地址並新建的a對象沒有其他的任何引用,當系統進行垃圾回收時,堆內存將被垃圾回收。
2. 軟引用(Soft Reference)
軟引用的一般使用形式如下:
A a = new A();
SoftReference<A> srA = new SoftReference<A>(a);
軟引用所指示的對象進行垃圾回收需要滿足如下兩個條件:
1.當其指示的對象沒有任何強引用對象指向它;
2.當虛擬機內存不足時。
因此,SoftReference變相的延長了其指示對象占據堆內存的時間,直到虛擬機內存不足時垃圾回收器才回收此堆內存空間。
3. 弱引用(Weak Reference)
同樣的,軟引用的一般使用形式如下:
A a = new A();
WeakReference<A> wrA = new WeakReference<A>(a);
WeakReference不改變原有強引用對象的垃圾回收時機,一旦其指示對象沒有任何強引用對象時,此對象即進入正常的垃圾回收流程。
4. 虛引用(Phantom Reference)
與SoftReference或WeakReference相比,PhantomReference主要差別體現在如下幾點:
1.PhantomReference只有一個構造函數
PhantomReference(T referent, ReferenceQueue<? super T> q)
2.不管有無強引用指向PhantomReference的指示對象,PhantomReference的get()方法返回結果都是null。
因此,PhantomReference使用必須結合ReferenceQueue;
與WeakReference相同,PhantomReference並不會改變其指示對象的垃圾回收時機。
內存泄露原因
如果持有對象的強引用,垃圾回收器是無法在內存中回收這個對象。
內存泄露的真因是:持有對象的強引用,且沒有及時釋放,進而造成內存單元一直被占用,浪費空間,甚至可能造成內存溢出!
其實在Android中會造成內存泄露的情景無外乎兩種:
- 全局進程(process-global)的static變量。這個無視應用的狀態,持有Activity的強引用的怪物。
- 活在Activity生命周期之外的線程。沒有清空對Activity的強引用。
檢查一下你的項目中是否有以下幾種情況:
- Static Activities
- Static Views
- Inner Classes
- Anonymous Classes
- Handler
- Threads
- TimerTask
- Sensor Manager