이 장에서는 ‘통계를 처리하는 방법과 분산 환경에서 집계 시 주의점’ **에 대해 다룰 예정입니다.

5.1 집계

일반적인 통계 프로그램은 데이터를 하둡이나 RDBMS에 적재하고 배치 처리하는 방식을 사용하고 있습니다.

반면, 엘라스틱 서치는 데이터를 분산하여 관리하고 있습니다. 그래서 문서가 늘어나도 배치 처리보다 실시간에 가갑게 처리할 수 있습니다.

엘라스틱서치가 SQL 보다 강력한 집계 기능을 제공하는 점들은 다음과 같습니다.

다음으로는 엘라스틱서치가 집계에 사용하는 기술들에 대해 알아보겠습니다.

캐시

집계에서 사용하는 필드 중 문자열 형태의 필드를 사용한다면 Keyword 타입으로 지정해야 합니다.