Java里的堆(heap)棧(stack)和方法區(method)


關於java內存區域部分的堆,棧,方法區三個部分而言,我總結了一下大概為一下這張圖。

以下是我第一次初學堆,棧,方法區的一些心得,如有不足,希望各位大佬們指點一下

棧(Stack):

1.為什么棧要用來存儲基本變量信息和對象引用

java虛擬機的基本架構就是采用棧來進行設計的。當一個程序需要運行的時候,由於要預先內存空間和運行的生命周期,所以需要進行指針的變動,來進行內存大小的分配。是的,由於這個操作會對程序的執行帶來一定的不方便,所以一般棧被用來存放一些基本的變量類型或者引用對象的地址,而對於存儲數據量較為龐大的java對象責備存儲在了堆里面了。

2.為什么說棧的提取速度比堆要快?

我對於硬件部分也不是很理解,所以這里也只好從軟件方面來分析,總結分析之后得出原因有以下幾個:
1.棧里面的內存大小一般都是程序啟動的時候由系統分配好的。
2.堆的內存大小需要在使用的時候才回去申請,而且每次對於內存大小的申請和歸還都會比較消耗性能,開銷較大。
3.cpu里面會有專門的寄存器來操作棧,堆里面都是使用間接尋址的方式來進行對象查找的,所以棧會快一些。

3.虛擬機棧里面為什么會有數據共享一說?

這個原因我們可以舉一個例子來說吧:
假設有這么一段代碼:
int j=10;
int k=10;
j=12;
對於這段簡單的代碼而言,虛擬機里面的棧又是如何處理的呢?其實比較簡單的理解就是如下所示:
首先在棧里面會先查找是否存在一個區域存放有10,如果沒有就創建一個區域存放10。然后將j引用到這個變量里面去。接着當程序執行到第二句的時候,虛擬機會先到棧里面去查找一下是否存在一個值為10的區域,如果有就直接讓k指向10。所以基本如下圖所示:

當后期對於j變量的值進行修改為12以后,棧就會重復性的先去查找是否有12,如果沒有開辟新的空間用於存儲12,然后讓j指向這個值

這里面的10這個值,被k,j共同引用的過程就叫做數據共享。

4.棧里面到底存儲了什么?

關於這個問題,我在《深入理解jvm&gc》這本書里面看到了一個比較好的解釋,棧里面存儲了很多小項,這里面我們稱之為棧幀,這是一種數據結構用於存儲方法的局部變量表,操作數棧,動態鏈接方法還有上下文數據等信息。
那么我們怎么來理解這個棧幀呢?每個棧幀里面都會存儲有相應的一下內容:
1.局部變量表
2.操作數棧
3.動態鏈接
4.返回地址
這些東西第一次聽說一般都會感覺比較陌生,那么我們來逐個逐個一一講解:

局部變量表:
這里面的作用主要是存儲一系列的變量信息,而且這些變量都是以數字數組的形式來存儲的,一般而言byte,short,char,類型的數據在存儲的時候會變為int類型,boolean類型也是存儲為數字類型,long,double則是轉換為雙字節大小的控件存儲在棧里面。

操作數棧:
關於這個小編也是有點不太了解,看了幾篇博客之后也只是知道這個東西是可以將指令在棧里面進行push和pop操作,也是一個數字數組類型。
關於詳情的分析可以去閱讀以下這篇博客:
https://blog.csdn.net/qq_28666081/article/details/85269879

動態鏈接:
動態鏈接的作用主要還是提供棧里面的對象在進行實例化的時候,能夠查找到堆里面相應的類地址,並進行引用。這一整個過程,我們稱之為動態鏈接。

返回地址:
某個子方法執行完畢之后,需要回到主方法的原有位置繼續執行程序,方法出口主要就是記錄該信息

堆(heap)

1.堆里面存放的內容主要還是new出來的對象和一些數組信息。

2.java的虛擬機不需要知道從堆內存里面存放多少空間大小的變量信息,也不需要知道每個對象的生命周期,所以一般程序運作的靈活性很高。

3.堆區里面存放了大量的對象很信息,所以也成為了gc重點回收的一個區域模塊,所以當大量內存被占用的時候,gc的垃圾回收就會成為整個系統的性能瓶頸。於是隨着jdk的不斷更新,新的技術也對於jvm的內存分配這一塊進行一定的優化改善,實現了off-heap。

好了,知道這些內容之后,基本簡單的面試問題都可以干掉了,如果要深入了解的話可以從以下幾個方面入手:

關於垃圾回收的原理和分類?
可以看看我的另一篇文章:https://blog.csdn.net/Danny_idea/article/details/87475188
什么是指針逃逸?如何對此進行優化?
可以參考我的公眾號文章:https://mp.weixin.qq.com/s/tyF9Ve40C_uu4rwcs4tUsg

靜態方法區:

關於這個概念也可以稱之為靜態區,靜態區和堆很相似,里面存放的信息也是線程共享的,它包含的信息如下圖所示:

方法區中包含的都是在整個程序中永遠唯一的元素,如class,static變量。

    方法區又被稱為靜態區,是程序中永遠唯一的元素存儲區域。和堆一樣,是各個線程共享的內存區域。它用於存儲已被虛擬機加載的類信息、常量、靜態變量、即時編譯器編譯后的代碼等數據。

    Java虛擬機規范對方法區的限制非常寬松,除了和Java堆一樣 不需要連續的內存和可以選擇固定大小或者可擴展之外,還可以選擇不實現垃圾回收。
    這區域的內存回收目標主要是針對常量池的回收和類型的卸載,一般而言,這個區域的內存回收比較難以令人滿意,尤其是類型的回收,條件相當苛刻,但是這部分區域的內存回收確實是必要的。

    很多開發者更願意把方法區稱為“永久代”(Perm Gen)(Permanent Generation)「總是存放不會輕易改變的內容」。在目前已經發布的JDK 1.7 的HotSpot中,已經把原本放在永久代的字符串常量池移至堆中。

    運行時常量池(Runtime Constant Pool)是方法區的一部分。

JDK 1.8 中,已經沒有方法區(永久代),而是將方法區直接放在一個與堆不相連的本地內存區域(Native Memory),這個區域被叫做元空間。

堆棧描述

基礎數據類型直接在棧空間分配, 方法的形式參數,直接在棧空間分配,當方法調用完成后從棧空間回收。   引用數據類型,需要用new來創建,既在棧空間分配一個地址空間,又在堆空間分配對象的類變量 。 方法的引用參數,在棧空間分配一個地址空間,並指向堆空間的對象區,當方法調用完成后從棧空間回收。局部變量 new 出來時,在棧空間和堆空間中分配空間,當局部變量生命周期結束后,棧空間立刻被回收,堆空間區域等待GC回收。 方法調用時傳入的 literal 參數,先在棧空間分配,在方法調用完成后從棧空間分配。字符串常量在 DATA 區域分配 ,this 在堆空間分配 。數組既在棧空間分配數組名稱, 又在堆空間分配數組實際的大小! 
哦 對了,補充一下static在DATA區域分配。 

從Java的這種分配機制來看,堆棧又可以這樣理解:堆棧(Stack)是操作系統在建立某個進程時或者線程(在支持多線程的操作系統中是線程)為這個線程建立的存儲區域,該區域具有先進后出的特性。 
每一個Java應用都唯一對應一個JVM實例,每一個實例唯一對應一個堆。應用程序在運行中所創建的所有類實例或數組都放在這個堆中,並由應用所有的線程共享.跟C/C++不同,Java中分配堆內存是自動初始化的。Java中所有對象的存儲空間都是在堆中分配的,但是這個對象的引用卻是在堆棧中分配,也就是說在建立一個對象時從兩個地方都分配內存,在堆中分配的內存實際建立這個對象,而在堆棧中分配的內存只是一個指向這個堆對象的指針(引用)而已。 

堆、棧、方法

這兩天看了一下深入淺出JVM這本書,推薦給高級的java程序員去看,對你了解JAVA的底層和運行機制有 
比較大的幫助。 
廢話不想講了.入主題: 
先了解具體的概念: 
JAVA的JVM的內存可分為3個區:堆(heap)、棧(stack)和方法區(method) 

堆區: 

1.存儲的全部是對象,每個對象都包含一個與之對應的class的信息。(class的目的是得到操作指令) 
2.jvm只有一個堆區(heap)被所有線程共享,堆中不存放基本類型和對象引用,只存放對象本身 

棧區: 

1.每個線程包含一個棧區,棧中只保存基礎數據類型的對象和自定義對象的引用(不是對象),對象都存放在堆區中 
2.每個棧中的數據(原始類型和對象引用)都是私有的,其他棧不能訪問。 
3.棧分為3個部分:基本類型變量區、執行環境上下文、操作指令區(存放操作指令)。 

方法區: 

1.又叫靜態區,跟堆一樣,被所有的線程共享。方法區包含所有的class和static變量。 
2.方法區中包含的都是在整個程序中永遠唯一的元素,如class,static變量。 
為了更清楚地搞明白發生在運行時數據區里的黑幕,我們來准備2個小道具(2個非常簡單的小程序)。 
AppMain.java

OK,讓我們開始行動吧,出發指令就是:“java AppMain”,包包里帶好我們的行動向導圖,Let’s GO!

系統收到了我們發出的指令,啟動了一個Java虛擬機進程,這個進程首先從classpath中找到AppMain.class文件,讀取這個文件中的二進制數據,然后把Appmain類的類信息存放到運行時數據區的方法區中。這一過程稱為AppMain類的加載過程。 

接着,Java虛擬機定位到方法區中AppMain類的Main()方法的字節碼,開始執行它的指令。這個main()方法的第一條語句就是: 
Sample test1=new Sample("測試1"); 
語句很簡單啦,就是讓java虛擬機創建一個Sample實例,並且呢,使引用變量test1引用這個實例。貌似小case一樁哦,就讓我們來跟蹤一下Java虛擬機,看看它究竟是怎么來執行這個任務的: 
1、 Java虛擬機一看,不就是建立一個Sample實例嗎,簡單,於是就直奔方法區而去,先找到Sample類的類型信息再說。結果呢,嘿嘿,沒找到@@,這會兒的方法區里還沒有Sample類呢。可Java虛擬機也不是一根筋的笨蛋,於是,它發揚“自己動手,豐衣足食”的作風,立馬加載了Sample類,把Sample類的類型信息存放在方法區里。 
2、 好啦,資料找到了,下面就開始干活啦。Java虛擬機做的第一件事情就是在堆區中為一個新的Sample實例分配內存, 這個Sample實例持有着指向方法區的Sample類的類型信息的引用。這里所說的引用,實際上指的是Sample類的類型信息在方法區中的內存地址,其實,就是有點類似於C語言里的指針啦~~,而這個地址呢,就存放了在Sample實例的數據區里。 
3、 在JAVA虛擬機進程中,每個線程都會擁有一個方法調用棧,用來跟蹤線程運行中一系列的方法調用過程,棧中的每一個元素就被稱為棧幀,每當線程調用一個方法的時候就會向方法棧壓入一個新幀。這里的幀用來存儲方法的參數、局部變量和運算過程中的臨時數據。OK,原理講完了,就讓我們來繼續我們的跟蹤行動!位於“=”前的Test1是一個在main()方法中定義的變量,可見,它是一個局部變量,因此,它被會添加到了執行main()方法的主線程的JAVA方法調用棧中。而“=”將把這個test1變量指向堆區中的Sample實例,也就是說,它持有指向Sample實例的引用。 
OK,到這里為止呢,JAVA虛擬機就完成了這個簡單語句的執行任務。參考我們的行動向導圖,我們終於初步摸清了JAVA虛擬機的一點點底細了,COOL! 
接下來,JAVA虛擬機將繼續執行后續指令,在堆區里繼續創建另一個Sample實例,然后依次執行它們的printName()方法。當JAVA虛擬機執行test1.printName()方法時,JAVA虛擬機根據局部變量test1持有的引用,定位到堆區中的Sample實例,再根據Sample實例持有的引用,定位到方法去中Sample類的類型信息,從而獲得printName()方法的字節碼,接着執行printName()方法包含的指令。

內存與回收

在windows中使用taskmanager查看java進程使用的內存時,發現有時候會超過 -Xmx制定的內存大小, -Xmx指定的是java heap,java還要分配內存做其他的事情,包括為每個線程建立棧。 
VM的每個線程都有自己的棧空間,棧空間的大小限制vm的線程數量,太大了,實用的線程數減少,太小容易拋出java.lang.StackOverflowError異常。windows默認為1M,linux必須運行ulimit -s 2048。 
在C語言里堆(heap)和棧(stack)里的區別 
簡單的可以理解為: 
heap:是由malloc之類函數分配的空間所在地。地址是由低向高增長的。 
stack:是自動分配變量,以及函數調用的時候所使用的一些空間。地址是由高向低減少。 
一個由c/C++編譯的程序占用的內存分為以下幾個部分 
1、棧區(stack)— 由編譯器自動分配釋放 ,存放函數的參數值,局部變量的值等。其操作方式類似於數據結構中的棧。 
2、在Java語言里堆(heap)和棧(stack)里的區別 
    1. 棧(stack)與堆(heap)都是Java用來在Ram中存放數據的地方。與C++不同,Java自動管理棧和堆,程序員不能直接地設置棧或堆。 
  2. 棧的優勢是,存取速度比堆要快,僅次於直接位於CPU中的寄存器。但缺點是,存在棧中的數據大小與生存期必須是確定的,缺乏靈活性。另外,棧數據可以共享,詳見第3點。堆的優勢是可以動態地分配內存大小,生存期也不必事先告訴編譯器,Java的垃圾收集器會自動收走這些不再使用的數據。但缺點是,由於要在運行時動態分配內存,存取速度較慢。 
  3. Java中的數據類型有兩種。 
  一種是基本類型(primitive types), 共有8種,即int, short, long, byte, float, double, boolean, char(注意,並沒有string的基本類型)。這種類型的定義是通過諸如int a = 3; long b = 255L;的形式來定義的,稱為自動變量。值得注意的是,自動變量存的是字面值,不是類的實例,即不是類的引用,這里並沒有類的存在。如int a = 3; 這里的a是一個指向int類型的引用,指向3這個字面值。這些字面值的數據,由於大小可知,生存期可知(這些字面值固定定義在某個程序塊里面,程序塊退出后,字段值就消失了),出於追求速度的原因,就存在於棧中。 
  另外,棧有一個很重要的特殊性,就是存在棧中的數據可以共享。假設我們同時定義 
  int a = 3; 
  int b = 3; 
  編譯器先處理int a = 3;首先它會在棧中創建一個變量為a的引用,然后查找有沒有字面值為3的地址,沒找到,就開辟一個存放3這個字面值的地址,然后將a指向3的地址。接着處理int b = 3;在創建完b的引用變量后,由於在棧中已經有3這個字面值,便將b直接指向3的地址。這樣,就出現了a與b同時均指向3的情況。 
  特別注意的是,這種字面值的引用與類對象的引用不同。假定兩個類對象的引用同時指向一個對象,如果一個對象引用變量修改了這個對象的內部狀態,那么另一個對象引用變量也即刻反映出這個變化。相反,通過字面值的引用來修改其值,不會導致另一個指向此字面值的引用的值也跟着改變的情況。如上例,我們定義完a與 b的值后,再令a=4;那么,b不會等於4,還是等於3。在編譯器內部,遇到a=4;時,它就會重新搜索棧中是否有4的字面值,如果沒有,重新開辟地址存放4的值;如果已經有了,則直接將a指向這個地址。因此a值的改變不會影響到b的值。 
  另一種是包裝類數據,如Integer, String, Double等將相應的基本數據類型包裝起來的類。這些類數據全部存在於堆中,Java用new()語句來顯示地告訴編譯器,在運行時才根據需要動態創建,因此比較靈活,但缺點是要占用更多的時間。 
4.每個JVM的線程都有自己的私有的棧空間,隨線程創建而創建,java的stack存放的是frames ,java的stack和c的不同,只是存放本地變量,返回值和調用方法,不允許直接push和pop frames ,因為frames 可能是有heap分配的,所以j為ava的stack分配的內存不需要是連續的。java的heap是所有線程共享的,堆存放所有 runtime data ,里面是所有的對象實例和數組,heap是JVM啟動時創建。 
  5. String是一個特殊的包裝類數據。即可以用String str = new String("abc");的形式來創建,也可以用String str = "abc";的形式來創建(作為對比,在JDK 5.0之前,你從未見過Integer i = 3;的表達式,因為類與字面值是不能通用的,除了String。而在JDK 5.0中,這種表達式是可以的!因為編譯器在后台進行Integer i = new Integer(3)的轉換)。前者是規范的類的創建過程,即在Java中,一切都是對象,而對象是類的實例,全部通過new()的形式來創建。Java 中的有些類,如DateFormat類,可以通過該類的getInstance()方法來返回一個新創建的類,似乎違反了此原則。其實不然。該類運用了單例模式來返回類的實例,只不過這個實例是在該類內部通過new()來創建的,而getInstance()向外部隱藏了此細節。那為什么在String str = "abc";中,並沒有通過new()來創建實例,是不是違反了上述原則?其實沒有。 
  5. 關於String str = "abc"的內部工作。Java內部將此語句轉化為以下幾個步驟: 
  (1)先定義一個名為str的對String類的對象引用變量:String str; 
  (2)在棧中查找有沒有存放值為"abc"的地址,如果沒有,則開辟一個存放字面值為"abc"的地址,接着創建一個新的String類的對象o,並將o 的字符串值指向這個地址,而且在棧中這個地址旁邊記下這個引用的對象o。如果已經有了值為"abc"的地址,則查找對象o,並返回o的地址。 
  (3)將str指向對象o的地址。 
  值得注意的是,一般String類中字符串值都是直接存值的。但像String str = "abc";這種場合下,其字符串值卻是保存了一個指向存在棧中數據的引用! 
為了更好地說明這個問題,我們可以通過以下的幾個代碼進行驗證。 
  String str1 = "abc"; 
  String str2 = "abc"; 
  System.out.println(str1==str2);  //true 
  注意,我們這里並不用str1.equals(str2);的方式,因為這將比較兩個字符串的值是否相等。==號,根據JDK的說明,只有在兩個引用都指向了同一個對象時才返回真值。而我們在這里要看的是,str1與str2是否都指向了同一個對象。 
  結果說明,JVM創建了兩個引用str1和str2,但只創建了一個對象,而且兩個引用都指向了這個對象。 
  我們再來更進一步,將以上代碼改成: 
  String str1 = "abc"; 
  String str2 = "abc"; 
  str1 = "bcd"; 
  System.out.println(str1 + "," + str2);  //bcd, abc 
  System.out.println(str1==str2);  //false 
  這就是說,賦值的變化導致了類對象引用的變化,str1指向了另外一個新對象!而str2仍舊指向原來的對象。上例中,當我們將str1的值改為"bcd"時,JVM發現在棧中沒有存放該值的地址,便開辟了這個地址,並創建了一個新的對象,其字符串的值指向這個地址。 
  事實上,String類被設計成為不可改變(immutable)的類。如果你要改變其值,可以,但JVM在運行時根據新值悄悄創建了一個新對象,然后將這個對象的地址返回給原來類的引用。這個創建過程雖說是完全自動進行的,但它畢竟占用了更多的時間。在對時間要求比較敏感的環境中,會帶有一定的不良影響。 
  再修改原來代碼: 
  String str1 = "abc"; 
  String str2 = "abc"; 
  str1 = "bcd"; 
  String str3 = str1; 
  System.out.println(str3);  //bcd 
  String str4 = "bcd"; 
  System.out.println(str1 == str4);  //true 
  str3 這個對象的引用直接指向str1所指向的對象(注意,str3並沒有創建新對象)。當str1改完其值后,再創建一個String的引用str4,並指向因str1修改值而創建的新的對象。可以發現,這回str4也沒有創建新的對象,從而再次實現棧中數據的共享。 
  我們再接着看以下的代碼。 
  String str1 = new String("abc"); 
  String str2 = "abc"; 
  System.out.println(str1==str2);  //false 
  創建了兩個引用。創建了兩個對象。兩個引用分別指向不同的兩個對象。 
  String str1 = "abc"; 
  String str2 = new String("abc"); 
  System.out.println(str1==str2);  //false 
  創建了兩個引用。創建了兩個對象。兩個引用分別指向不同的兩個對象。 
  以上兩段代碼說明,只要是用new()來新建對象的,都會在堆中創建,而且其字符串是單獨存值的,即使與棧中的數據相同,也不會與棧中的數據共享。 
  6. 數據類型包裝類的值不可修改。不僅僅是String類的值不可修改,所有的數據類型包裝類都不能更改其內部的值。 
  7. 結論與建議: 
  (1)我們在使用諸如String str = "abc";的格式定義類時,總是想當然地認為,我們創建了String類的對象str。擔心陷阱!對象可能並沒有被創建!唯一可以肯定的是,指向 String類的引用被創建了。至於這個引用到底是否指向了一個新的對象,必須根據上下文來考慮,除非你通過new()方法來顯要地創建一個新的對象。因此,更為准確的說法是,我們創建了一個指向String類的對象的引用變量str,這個對象引用變量指向了某個值為"abc"的String類。清醒地認識到這一點對排除程序中難以發現的bug是很有幫助的。 
  (2)使用String str = "abc";的方式,可以在一定程度上提高程序的運行速度,因為JVM會自動根據棧中數據的實際情況來決定是否有必要創建新對象。而對於String str = new String("abc");的代碼,則一概在堆中創建新對象,而不管其字符串值是否相等,是否有必要創建新對象,從而加重了程序的負擔。這個思想應該是享元模式的思想,但JDK的內部在這里實現是否應用了這個模式,不得而知。 
  (3)當比較包裝類里面的數值是否相等時,用equals()方法;當測試兩個包裝類的引用是否指向同一個對象時,用==。 
  (4)由於String類的immutable性質,當String變量需要經常變換其值時,應該考慮使用StringBuffer類,以提高程序效率。 
如果java不能成功分配heap的空間,將拋出OutOfMemoryError

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM