자바 가상 머신(JVM, Java Virtual Machine) 이란?
자바 가상 머신(JVM, Java Virtual Machine)은 자바 프로그램 실행환경을 만들어주는 소프트웨어이다.
이 포스트와 함께 다루고 싶지만 내용이 너무 길어져 나누어 작성하게 되었다. 불편하시더라도 자바 가상 머신에 대해서는 아래 포스트를 참고 부탁드립니다! 자바 가상 머신 내 메모리 구조만 알고 있어도 물론 좋겠지만 메모리 구조를 알기 전에 JVM이 뭔지 제대로 알면 더 좋을 것 같다. 숲이 아닌 나무를 보다 보면 결국 나중에는 나무만 알고 전체적인 숲의 모습을 알기 힘들어지는 법. (내가 이 블로그를 쓰고 있는 이유 😂)
런타임 데이터 영역(Runtime Data Area)
자바 가상 머신 내 런타임 데이터 영역은 실제 클래스 파일이 적재되는 곳으로 자바 가상 머신이 OS로부터 자바 프로그램 실행을 위한 데이터와 명령어를 저장하기 위해 할당받는 메모리 공간이다. JVM의 메모리 구조라하면 이 공간을 의미한다.
런타임 데이터 영역은 위 그림과 같이 크게 Method Area, Heap, Stack, PC Register, Native Method Stack로 나누어진다.
이 영역들은 모두 같은 단위가 아니라 2가지 단위로 나누어지는데 JVM 단위와 Thread 단위이다.
JVM 단위는 JVM이 시작될 때 단 하나만 생성되며, 모든 스레드가 공유한다. Method Aread와 Heap 영역이 JVM 단위를 사용한다. 반면, Thread 단위는 Thread 마다 하나씩 생성되며 Stack, PC Register, Native Method Stack이 여기에 해당한다.각 영역에 대해 조금 더 자세히 살펴보자.
메소드 영역 (Method Area)
클래스(Class), 스태틱(Static) 영역이라고도 불리는 메소드 영역은 자바 가상 머신이 시작될 때 생성되는 공간이다.
클래스 로더(Class Loader)에 의해 로드된클래스 정보를 처음 메모리 공간에 올릴 때 초기화 되는 대상을 저장하는 공간이다. 자바 가상 머신이 동작하고 클래스가 로드될 때 적재되서 프로그램이 종료될 때까지 저장된다.
- 가장 먼저 데이터가 저장된다.
- 모든 스레드에서 정보가 공유된다.
- 명시적 Null 선언 시 GC가 청소한다.
상세하게는 아래와 같은 내용이 저장되며 간단하게는 정적 필드와 클래스 구조만을 가지고 있다고 할 수 있다.
- 타입 정보(Type Info): 클래스(Class)인지 인터페이스(Interface)인지 여부 저장, Type의 속성, 이름, Super Class 이름
- 필드 정보(Field Info): 멤버 변수 이름, 데이터 타입, 접근 제어자 정보
- 메소드 정보(Method Info): 메소드 이름, 리턴 타입, 접근 제어자 정보
💡 런타임 상수 풀(Runtime Constant Pool)
메소드 영역에 존재하는 별도의 관리 영역으로 각 클래스/인터페이스마다 별도로 존재한다. 클래스를 생성할 때 참조해야할 정보들을 상수로 가지고 있는 영역이다. 자바 가상 머신이 이 영역을 통해 메소드나 필드의 실제 메모리 상 주소를 찾아 참조한다.
힙(Heap)
힙 영역은 모든 스레드가 공유하며 JVM이 관리하는 프로그램 상에서 데이터를 저장하기 위해 런타임 동적으로 할당하여 사용하는 영역이다. new 연산자로 생성되는 객체(인스턴스)와 배열 타입 등 Reference Type이 저장되는 곳이다.
이 영역의 메모리 해제는 오직 GC(Garbage Collector)에 의해 수행된다.
- 모든 스레드에서 정보가 공유된다.
- 주기적으로 GC가 메모리를 해제하는 영역으로 객체가 더 이상 쓰이지 않거나 명시적 null 선언 시 GC가 청소한다.
- 힙의 참조 주소는 스택(Stack)이 갖고 있고 해당 객체를 통해서만 힙 영역에 있는 인스턴스를 핸들링할 수 있다.
유의할 점은 힙 영역에 생성된 객체와 배열은 참조형 타입(Reference Type)으로 스택(Stack) 영역의 변수나 다른 객체의 필드에서 참조된다는 점이다. 즉, 힙의 참조 주소는 "스택"이 갖고 있고 해당 객체를 통해서만 힙 영역에 있는 인스턴스를 핸들링할 수 있는 것이다.
위와 같은 구조에서 참조하는 변수나 필드가 없다면 의미 없는 객체임을 의미한다. 자바 가상 머신은 이런 객체를 쓰레기로 취급하고 자바 가상 머신의 쓰레기 수집기인 가비지 컬렉션(GC, Garbage Collector)를 실행시켜 쓰레기 객체를 자동으로 힙 영역에서 제거한다.
가비지 컬렉션의 대상인 힙 영역은 효율적인 가비지 컬렉션 수행을 위해 아래와 같이 5가지 영역으로 나뉜다.
위와 같이 4가지 영역으로 나뉜 힙 영역은 다시 물리적으로 Young Generation 과 Old Generation 영역으로 구분된다.
- Young Generation : 생명 주기가 짧은 객체를 GC 대상으로 하는 영역이다.
- Eden: new를 통해 새로 생성된 객체가 위치하며 정기적인 쓰레기 수집 후 살아남은 객체들은 Survivor로 이동한다.
- Survivor 0 / Survivor 1 : 각 영역이 채워지게 되면 살아남은 객체는 비워진 Survivor로 순차적으로 이동한다.
- Old Generation : 생명 주기가 긴 객체를 GC 대상으로 하는 영역. Youn Generation에서 마지막까지 살아남은 객체가 이동
스택(Stack)
스택 영역은 int, long, boolean 등 기본 자료형을 생성할 때 저장하는 공간으로, 임시적으로 사용되는 변수나 정보들이 저장되는 영역이다.
- 각 스레드마다 하나씩 존재하며 스레드가 시작될 때 할당된다.
- 메소드 호출 시 메모리에 FILO로 삽입되고 종료 시 메모리에서 LOFI로 제거된다.
- 메서드 호출 시마다 각각의 스택 프레임(그 메서드만을 위한 공간)이 생성되고 각 스택 프레임은 하나의 메소드에 대한 정보를 저장한다.
- 프로세스가 메모리에 로드 될 때 스택 사이즈가 고정되어 있어, 런타임 시에 스택 사이즈를 바꿀 수는 없다.
- 만일 고정된 크기의 JVM 스택에서 프로그램 실행 중 메모리 크기가 충분하지 않다면 StackOverFlowError가 발생하게 된다.
💡 스택 프레임(stack frame)
메소드가 호출될 때마다 프레임이 만들어지고 호출 범위가 종료되면 스택에서 제거된다.
현재 실행중인 메소드 상태 정보를 저장하는 곳으로 메소드의 매개변수, 지역변수, 리턴값, 연산시 결과값 등의 데이터가 쌓여있다.
참고로 데이터의 타입에 따라 스택(stack) 과 힙(haeap)에 저장되는 방식이 다르다는 점은 유의해야 한다.
기본(원시)타입 변수는 스택 영역에 직접 값을 가지지만 참조타입 변수는 힙 영역이나 메소드 영역의 객체 주소를 가진다.
PC 레지스터(PC Register)
PC 레지스터는 스레드가 시작될 때 생성되며, 현재 수행중인 JVM 명령어 주소를 저장하는 공간이다. JVM 명령의 주소는 스레드가 어떤 부분을 무슨 명령으로 실행해야할지에 대한 기록을 가지고 있다.
일반적으로 프로그램의 실행은 CPU에서 명령어(Instruction)을 수행하는 과정으로 이루어진다.
이때 CPU는 연산을 수행하는 동안 필요한 정보를 레지스터라고 하는 CPU 내의 기억장치를 이용하게 된다.
예를들어, A와 B라는 데이터와 피연산 값인 Operand가 있고 이를 더하라는 연산 Instruction이 있다고 하자.
A와 B, 그리고 더하라는 연산이 순차적으로 진행이 되게 되는데, 이때 A를 받고 B를 받는 동안 이 값을 CPU가 어딘가에 기억해 두어야 할 필요가 생긴다. 이 공간이 바로 CPU 내의 기억장치 Register이다.
하지만 자바의 PC Register는 위의 cpu Register와 다르다. 자바는 OS나 CPU의 입장에서는 하나의 프로세스이기 때문에 가상 머신(JVM)의 리소스를 이용해야 한다.
그래서 자바는 CPU에 직접 연산을 수행하도록 하는 것이 아닌, 현재 작업하는 내용을 CPU에게 연산으로 제공해야 하며, 이를 위한 버퍼 공간으로 PC Register라는 메모리 영역을 만들게 된 것이다. 따라서 JVM은 스택에서 피연산값 Operand를 뽑아 별도의 메모리 공간인 PC Register에 저장하는 방식을 취한다.
만약에 스레드가 자바 메소드를 수행하고 있으면 JVM 명령(Instruction)의 주소를 PC Register에 저장한다.
만약에 스레드가 자바 메소드를 수행하고 있으면 JVM 명령(Instruction)의 주소를 PC Register에 저장한다. 그러다 만약 자바가 아닌 다른 언어(C언어, 어셈블리)의 메소드를 수행하고 있다면, undefined 상태가 된다. 왜냐하면 자바에서는 이 두 경우를 따로 처리하기 때문이다. 이 부분이 바로 뒤에 언급하게 될 Native Method Stack 공간이다.
네이티브 메소드 스택 (Native Method Stack)
네이티브 메소드 스택는 자바 코드가 컴파일되어 생성되는 바이트 코드가 아닌 실제 실행할 수 있는 기계어로 작성된 프로그램을 실행시키는 영역이다. 또한 자바 이외의 언어(C, C++, 어셈블리 등)로 작성된 네이티브 코드를 실행하기 위한 공간이기도 하다. 사용되는 메모리 영역으로는 일반적인 C 스택을 사용한다. JIT 컴파일러에 의해 변환된 Native Code 역시 여기에서 실행이 된다고 보면 된다.
일반적으로 메소드를 실행하는 경우 JVM 스택에 쌓이다가 해당 메소드 내부에 네이티브 방식을 사용하는 메소드가 있다면 해당 메소드는 네이티브 스택에 쌓인다. 그리고 네이티브 메소드가 수행이 끝나면 다시 자바 스택으로 돌아와 다시 작업을 수행한다. 그래서 네이티브 코드로 되어 있는 함수의 호출을 자바 프로그램 내에서도 직접 수행할 수 있고 그 결과를 받아올 수도 있는 것이다.
네이티브 메소드 스택은 바로 다음에 배울 JNI와 연결되어 있는데, JNI가 사용되면 네이티브 메서드 스택에 바이트 코드로 전환되어 저장되게 된다.
글을 마치며
자바 런타임 영역..자바 개발을 하면서 힙 영역이라는 단어를 안 들을 가능성이 사실 상 희박하기 때문에 문제가 생기거나 궁금할 때마다 찾아봤던 주제지만 메소드 영역, PC 레지스터, 네이티브 메소드까지 이렇게 자세히 알아본 적은 사실 처음이다. 알면 알수록 어려운 Java. 역시 공부는 끝이 없다. 이번 정리로 사실 전체가 다 이해되진 않았지만 헷갈릴 때마다 이 포스트를 읽어봐야겠다. 이상하게 남이 쓴 글보다는 내가 쓴 글이 더 눈에 잘 들어온다. 내 눈에 맞게 써서 그런건지는 모르겠지만 이 맛에 블로그 정리를 한다~
참고 자료 및 사이트