객체 판별

JAVA

whyWhale 2021. 10. 18. 19:38

Equals를 재정의하려거든 Hashcode도 재정의하라

🔎hash table 간략 설명

- 해쉬 테이블이란 ? - key,value 쌍으로 이루어진 자료구조

좋은 해시함수란?

- 데이터를 고르게 분포하여 충돌을 최소화 할 수 있는 함수.
- 종류
    - String 
    - Char [] ch
    ....

Cache를 이용한 성능 향상

자주 hit하는 데이터에 대해서 바로 데이터를 찾게함으로써 성능을 간단하게 향상 시킬 수 있다.

해쉬 코드를 정의 하지 않으면 계속 새로운 데이터의 삽입이 발생한다.
결국 조회해야할 대상이 전혀 존재하지 않는 NULL 값이 반환된다.
해쉬 코드 재정의( 동일한 상수값 반환 )
- 모든 객체에 대해 똑같은 해시코드를 반환할 시 모든 객체가 같은 버킷에 담겨 LinkedList 처럼 동작
- 평균 수행시간 O(1) 에서 O(N)으로 느려져 성능이 매우 낮아지고 overFlow 위험이 존재하여 데이터의 누락이 발생할 수 있다.

1. Objects.hash() : 내부적으로 AutoBoxing이 일어나 성능이 떨어진다.
2. Lombok의 @EqualsAndHashCode
3. Google의 @AutoValue

불변 객체에 대해서는 hashcode 생성비용이 많이 든다면, hashcode를 캐싱하는 것도 고려한다
- 스레드 안전성까지 고려해야 한다.
성능을 높인답시고 hashcode를 계산할 떄 핵심필드를 생략해서는 안된다.
- 속도는 빨라지겠지만, hash품질이 나빠져 해시테이블 성능을 떨어뜨릴 수 있다 (Hashing Collision)
hashcode 생성규칙을 API사용자에게 공표하지 말자
- 그래야 클라이언트가 hashcode값에 의지한 코드를 짜지 않는다.
- 다음 릴리즈 시, 성능을 개선할 여지가 있다.