[Environment Variables]
Script 내, Elasticsearch
JVM이 시작될 때 넘겨지는 JAVA_OPTS를 포함하고 있다. 그중 가장 중요한 설정은 프로세스의 maximum memory를 다루는 -Xmx와 minimum memory를 다루는 -Xms이다. (일반적으로 더 많은 메모리가 할당될 수록 더 좋다.)
대부분의 경우, JAVA_OPTS를 기본값으로 남겨두는 것이 더 좋다. 그리고 JVM의 설정이나 파라미터를 설정/변경하고자 하는 경우에는 ES_JAVA_OPTS를 사용하라.
ES_HEAP_SIZE 환경 변수는 elasticsearch java process의 heap memory 설정에 사용한다. 별로 추천하고 싶지 않지만, ES_MIN_MEM (default : 256 MB), ES_MAX_MEM
(default : 1 GB) 값을 명시적으로 설정할 수 있다. 하지만, ES_HEAP_SIZE를 이용하면 min, max 값 모두 동일한 값을 가지게 된다.
Min, Max 값을 동일하게 설정하고, mlockall (http://www.elastic.co/guide/en/elasticsearch/reference/current/setup-configuration.html#setup-configuration-memory) 가능하도록 설정하는 것을 추천한다.
[System Configuration]
Elasticsearch를 실행하는 machine의 open files descriptors 숫자를 증가시켜라. 32k나 64k로 설정하는 것을 추천한다.
Process가 얼마나 많은 file을 오픈했는지 테스트하려면 -Des.max-open-files 값을
true로 설정하고 시작하라. Process가 시작 시, 사용할 수 있는 open files 숫자를 표시할 것이다.
아니면, 각각의 node에서 다음과 같은 nodes Info API를 사용하여 max_file_descriptors 값을 얻을 수 있다.
curl localhost:9200/_nodes/process?pretty
Elasticsearch는 index를 저장하는데 hybrid mmapfs / niofs directory (http://www.elastic.co/guide/en/elasticsearch/reference/current/index-modules-store.html#default_fs) 를 기본적으로 사용한다. OS의 mmap count에 대한 제한값은 너무 작기 때문에 out of memory
exception이 발생한다. Linux에서는 root 계정으로 다음 command를 실행하여 limit값을 증가시킬 수 있다.
sysctl -w vm.max_map_count=262144
이 값을 영구적으로 반영하기 위해서는 /etc/sysctl.conf에
vm.max_map_count 항목을 업데이트하라.
[NOTE]
패키지(.deb, rpm)를 이용하여 Elasticsearch를 설치했다면 자동으로 이 값이 변경되어 있을 것이다. 확인해 보려면 sysctl
vm.max_map_count를 실행해 보라.
Linux Kernel은 file system cache에 될 수 있으면 많은 메모리를 사용하고 사용하지 않은 application memory, 즉
Elasticsearch process로 인해 swap된 memory를 열심히 swap하려고 한다. Swapping은 성능상, node 안정성 측면에서 아주 좋지 않으므로 피해야 한다.
3가지 옵션이 있다.
가장 간단한 옵션은 swap을 사용할 수 없도록 하는 것이다. 일반적으로 Elasticsearch는 한 box (서버)안에서 실행되는 유일한 서비스다. 그리고 메모리 사용량은 ES_HEAP_SIZE 환경 변수로 제어할 수 있다. Swap을 사용할 필요가 없다. Linux System에서 실sudo swapoff -a를 실행하여 일시적으로 swap을 사용하지 않도록 할 수 있다. 영구적으로 적용하려면 /etc/fstab file을 편집하여 swap을 포함하고 있는 line들을 주석처리 하면 된다.
두번째 옵션은 sysctl의 vm.swappiness의 값을 0으로 설정하는 것이다. 이것은 kernel이 swap하려고 하는 추세를 감소시키고, 일반적인 환경에서는 swap을 하려고 하지 않는다. 하지만, 긴급상황에서는 여전히 전체 시스템을 swap하려고 할 것이다.
[NOTE]
Kernel version 3.5-rc1과 그 윗버전부터 swappiness를 0으로 하면 swapping을 허용하는 대신에 OOM killer가 process를 죽이려고 할 것이다. 긴급 상황에서 swapping을 허용하려면 swappiness를 1로 설정할 필요가 있다.
세번째 옵션은 Linux/Unix 시스템에서만 사용할 수 있는데, RAM내 process address space를 mlockall을 사용해 Lock하는 것이다. 이것을 사용하면 Elasticsearch의 어떤 메모리도 swap하는 것을 막을 수 있다. config/elasticsearch.yml 파일에 다음 라인을 추가하면 된다.
bootstrap.mlockall: true
Elasticsearch를 시작할 이후, 다음 request를 통해서 mlockall 값을 확인함으로써 성공적으로 적용되었는지를 확인할 수 있다.
curl http://localhost:9200/_nodes/process?pretty
만약 mlockall 값이 false라면 mlockall
request가 실패했음을 의미한다. 대부분의 경우에 memory lock 권한이 없는 user가 Elasticsearch를 실행했을 경우에 발생한다. Elasticsearch를 실행하기 전에 root 계정으로 ulimit -1 unlimited를 실행하여 권한을 줄 수 있다.
또 다른 가능성 있는 이유로는 temporary directory (일반적으로 /tmp)가 noexec 옵션으로 mount되었을 경우에 발생한다. 다음과 같이 Elasticsearch를 실행하여 새로운 temp directory를 지정함으로 해결할 수 있다.
./bin/elasticsearch -Djna.tmpdir=/path/to/new/dir
[WARNING]
mlockall은 이용할 수 있는 이상의 메모리를 할당하려고 한다면 JVM이나 shell session에서 빠져나갈 것이다.
Elasticsearch configuration file은 ES_HOME/config 폴더에 있다. 이 폴더에는 2개의 파일이 있는데, elasticsearch.yml은 Elasticsearch의 다른 모듈에 대한 설정이, logging.yml에는 Elasticsearch의 logging에 대한 설정이 있다.
Configuration format은 YAML (http://www.yaml.org/) 이다. 모든 네트워크 기반 모듈들이 바인딩하여 사용하는 주소를 변경하는 예제는 다음과 같다.
network :
host : 10.0.0.4
Production의 경우, Data와 Log file의 Path를 변경하고 싶을 것이다.
path:
logs: /var/log/elasticsearch
data: /var/data/elasticsearch
또한, 다른 node가 자동으로 cluster에 참여할 수 있도록 production cluster name을 주는 것을 잊지 말라.
cluster:
name: <NAME OF YOUR CLUSTER>
각각의 node가 hostname을 표시하는데 사용하는 Default node name을 변경하고자 할 경우가 있다. 기본적으로 Elasticsearch는 node가 시작될 때, 3000개의 Marvel Character name 리스트 중에서 Random하게 사용한다.
node:
name: <NAME OF YOUR NODE>
Configuration styles
내부적으로 모든 설정들은
"namespaced" 설정으로 접근할 수 있다. 예를 들어, 위의 설정은 node.name으로 접근할 수 있다. 이것은 다른 형태의 configuration format-JSON과 같은-을 쉽게 지원할 수 있음을 의미한다. Configuration
format으로 JSON을 더 선호하면, 간단하게 elasticsearch.yml을
elasticsearch.json으로 변경하고 다음 내용을 추가하면 된다.
{
"network" : {
"host" : "10.0.0.4"
}
}
또한 다음과 같이 ES_JAVA_OPTS나 elasticsearch command에 parameter를 이용하여 외부에서 설정을 쉽게 제공할 수 있다.
$ elasticsearch -Des.network.host=10.0.0.4
또다른 옵션은 es. Prefix 대신에
es.default. Prefix를 사용하는 것이다. 이것은 configuration
file내에 명시적인 설정이 없을 경우에만 default 설정을 사용함을 의미한다.
또다른 옵션은 ${…..} notation을 configuration file안에 사용하는 것이다. 다음과 같이 환경 설정 변수를 사용할 수 있다.
{
"network" : {
"host" : "${ES_NET_HOST}"
}
}
Configuration file의 위치는 system property를 사용하여 외부에서 설정할 수 있다.
$ elasticsearch -Des.config=/path/to/config/file
Cluster에 생성된 index들은 각자 설정을 가질 수 있다. 예를 들어, 다음은 기본적인 파일 시스템 기반 대신에 메모리 기반 index를 생성한다. (포맷은 YAML / JSON 모두 가능하다.)
$ curl -XPUT http://localhost:9200/kimchy/ -d \
'
index :
store:
type: memory
'
Index level 설정은 elasticsearch.yml 파일내 다음과 같이 node level에 설정될 수 있다.
index :
store:
type: memory
이것은 위에 언급된 configuration으로 시작된 특정 node에서 생성된 모든 index는 분명하게 설정되지 않으면 메모리에 index를 저장한다는 것을 의미한다. 다시 말하면, node configuration에 설정된 것이 무엇이건 간에 index level은 재정의가 가능하다는 것이다. 물론, 위의 경우에는 다음과 같은 "collapsed" 설정이 가능하다.
$ elasticsearch -Des.index.store.type=memory
Index level configuration의 모든 것은 각 index module (http://www.elastic.co/guide/en/elasticsearch/reference/current/index-modules.html) 에 있다.
Elasticsearch는 내부의 logging
abstraction을 이용하여 log4j 설정을 적용한다. YAML을 사용하여 log4j 설정을 간단하게 적용할 수 있다. (로그 설정 파일은 config/logging.yml 이다.)
JSON과 properties 포맷 또한 지원된다. 더 자세한 내용은 log4j document (http://logging.apache.org/log4j/1.2/manual.html) 를 참조하라. 추가로 log4j-extras에서 제공하는 다른 Appender나 logging
class도 사용할 수 있다.
댓글을 달아 주세요
댓글 RSS 주소 : http://www.yongbi.net/rss/comment/710