DEV ℧ Developer Diary

[EffectiveJava] item06 - 불필요한 객체 생성을 피하라.

불필요한 객체 생성을 피하라.

모두가 어렴풋이 알고있지만 쉽게 실천하기 어려운 그것. 불필요한 객체 생성을 피하는 방법을 알아보자.

똑같은 기능의 객체를 매번 생성하기보다는 객체 하나를 재사용 하는편이 더나을 때가있다. 특히 불변객체(final)은 언제든지 재활용이 가능하다!

다음엔 극단적으로 하지말아야할 예시를 들어 보겠다. 먼저 대표적인 불변객체인 String을 통해서 설명해보자.

String str = new String("야근 힘들다..");

String str = "야근 쉽지않다..";

둘의 차이점은 무엇일까?

눈에 보이는대로 간단하게 적어보자면, new를 통해 String의 새로운 인스턴스를 선언하는 방법과, 리터럴(“”) 을 통해 String객체를 선언하는 방법을 예시로 들었다.

String을 new를 통해 인스턴스화 할 경우 String pool을 이용하는 것이 아닌 heap메모리에 생성되므로, 빈번하게 호출되는 곳에있다면, 메모리에 정말 수백만개의 new String이 들어있을 지도 모른다.

반면에, 리터럴(““)안에 들어있는 String코드는 하나의 인스턴스를 사용한다. 더나아가 이방식을 사용한다면, 같은 JVM에서 같은 문자열 리터럴을 사용하는 모든 코드가 같은 객체를 재사용함이 보장된다.

생성자 대신 정적 팩터리 메서드를 제공하는 불변 클래스는 정적 팩터리 메서드를 사용해 불필요한 객체 생성을 피할 수 있다. 간단한 예시를 든다면, Boolean(String) 생성자 대신에 Boolean.valueOf(String) 팩터리 메서드를 사용 하는 것이 좋다.

생성자는 호출할 때마다 새로운 객체를 만들지만, 팩터리 메서드는 그렇지 않고 재사용하기 때문이다.

만일 연산식이 복잡해 무거운 객체가 있고, 반복해서 호출해야 한다면 캐싱하여 재사용하는것이 좋다.

하지만 여기서 의문이 들것이다. 어떤 객체가 비싼객체지?

모든 예시를 말할 수는 없지만 대표적인 예시로 matches가 있다.

String.matches는 정규표현식으로 문자열 형태를 확인하는 가장 쉬운 방법이지만, 성능이 중요한 상황에서는 반복해 사용하기에는 적합하지 않다.

그 이유는 이 메서드 내부에서 만드는 정규표현용 Pattern 인스턴스는, 한번쓰고 버려져서 곧바로 GC(가비지 컬렉션)의 대상이 되고, Pattern은 입력받은 정규표현식에 해당하는 유한상태머신?(finite state machine)을 만들기 때문에인스턴스 생성 비용이 높다.

유한상태머신? 상태를 갖는 동작을 표현/이해/설명하고, 설계하기 위한, 체계적이고 수학적인 방법의 틀을 제공 이라고한다.. 말이 어렵다. 쉽게 요약하자면, 변경할 결과물들과 그 결과물을 만들기 위한 조건들의 집합 요소라고 할 수 있다.

그렇다면 어떻게 바꾸면 성능을 개선 할 수 있을까?

먼저, (불변인) Pattern 인스턴스를 클래스 초기화 과정에서 직접 캐싱하고, 나중에 isRomanNumeral 메서드가 호출될 때마다 이 인스턴스를 재사용 하면 된다.

/* 나쁜 예 */
static boolean isRomanNumeral(String s) {
    return s.matches("^(?=.)M*(C[MD]|D?C{0,3})"
            + "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$");
}

/* 좋은 예 */
public class RomanNumerals {
    private static final Pattern ROMAN = Pattern.compile(
            "^(?=.)M*(C[MD]|D?C{0,3})"
            + "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$");

    static boolean isRomanNumeral(String s) {
        return ROMAN.matcher(s).matches();
    }
}

위의 예제 코드처럼 개선한다면 isRomanNumeral이 빈번히 호출되는 상황에서 성능을 상당히 끌어올릴 수 있다.

하지만, 좋은 예시의 isRomanNumeral 방식의 클래스가 초기화 된후 이 메서드를 한번도 호출하지 않는다면 ROMAN 필드는 쓸데없이 초기화가 된 꼴이다.

불필요한 객체를 만들어내는 또다른 예로 오토박싱(Auto boxing)이 있다.

오토박싱(Auto boxing)이란? 기본타입과 박싱된 기본타입을 섞어 쓸때 자동으로 변환해주는 기술이다. ex) Integer <-> int

오토박싱은 기본타입과 그 변환된 타입의 구분을 쉽게 흐려지게 하지만, 완전히 없애주지는 않는다. 즉, 값으로써는 같지만 객체로써는 다르다.

private static long sum() {
    Long sum = 0L;
    for (long i = 0; i <= Integer.MAX_VALUE; i++)
        sum += i;

    return sum;
}

위의 예제 코드는 반환하는 값은 정확하나 제대로 된 구현보다는 성능이 느리다. lL의 한글자 차이 때문에 말이다.

sum 변수를 long이 아닌 Long으로 선언해서 불필요한 Long 인스턴스가 약 2³¹ int의 MAX_VALUE만큼 만들어졌다.

그러므로 박싱된 기본타입보다는 언박싱된 기본타입을 사용하고, 의도치 않은 오토박싱을 사용하지 않도록 주의하자.

이번에 오해하지 말아야 할것은 그렇다고 “객체 생성은 비싸니 피해야 한다.”가 아니다. 요즈~음 콤푸타 놈들은 성능이 좋아서 JVM 에서는 별다른 일을 안하는 객체를 생성하고 회수하는 일이 크게 부담되지는 않는다. 오히려 프로그램의 명확성, 간결성 기능을 위해서 객체를 추가로 생성하는 것이라면 일반적으로 좋다.

이번 아이템은 곧 다시 배울 방어적 복사(defensive copy)를 다루는 item50과 대조적이다. 다만 방어적 복사가 필요한 상황에서 객체를 재사용했을 때의 피해가, 필요없는 객체를 반복생성했을 때 피해보다 훨씬 크다는 사실을 기억하고 있자. 불필요한 객체를 만드는것도 중요하지만, 재사용은 더 위험 할수도 있다는 뜻이다.

방어적 복사에 실패하면 미지의 버그와 마주칠지도 모른다. 하지만 불필요한 객체는 다만 성능에 영향을 줄뿐이다.

결론적으로는, 무조건적으로 새로운 객체만 만드는것을 피하지는 말자, 정말 어렵지만 상황에 따라 객체를 재사용할지 새로 생성할지를 정하는 안목을 기르는것이 중요하다.