[Batch Processing]

개별 document index, update, delete하기 위하여 elasticsearch _bulk API 통해서 batch 위의 작업을 수행할 있는 기능을 제공한다. 기능은 가능한 적은 network roundtrip (왕복)으로 가능한 빠르게 여러 작업을 효율적으로 수행하기 위한 메커니즘을 제공하는데 중요하다.


빠른 예제로, 다음 예제는 2개의 document 하나의 bulk 작업으로 index한다. (ID 1 : John Doe, ID 2 : Jane Doe)


curl -XPOST 'localhost:9200/customer/external/_bulk?pretty' -d '
{"index":{"_id":"1"}}
{"name": "John Doe" }
{"index":{"_id":"2"}}
{"name": "Jane Doe" }
'


다음 예제는 ID 1 첫번째 document 업데이트하고, ID 2 두번째 document 삭제하는 하나의 bulk operation이다.


curl -XPOST 'localhost:9200/customer/external/_bulk?pretty' -d '
{"update":{"_id":"1"}}
{"doc": { "name": "John Doe becomes Jane Doe" } }
{"delete":{"_id":"2"}}
'


위의 delete action 대하여 삭제할 document ID 필요하고, source document 대한 다른 내용이 없음을 주목하라.


Bulk API 순차적으로 모든 action 실행한다. 어떤 이유에서건 하나의 action 실패하면 다음에 남아 있는 operation 계속해서 진행한다. Bulk API 작업이 완료되면, action 대한 status 제공한다. 따라서, 어느 action 성공하고 실패했는지 있다.

받은 트랙백이 없고, 댓글이 없습니다.

댓글+트랙백 RSS :: http://www.yongbi.net/rss/response/697

[Deleting Documents]

Document 삭제하는 것은 정말 간단하다. 다음 예제는 ID 2 이전 customer document 어떻게 삭제하는지를 보여준다.


curl -XDELETE 'localhost:9200/customer/external/2?pretty'


Query 조건을 입력하여 매칭되는 여러 document 한번에 삭제할 수도 있다. 다음 예제는 "John"이라는 이름을 가진 모든 customer 어떻게 삭제하는지를 보여준다.


curl -XDELETE 'localhost:9200/customer/external/_query?pretty' -d '
{
  "query": { "match": { "name": "John" } }
}'


위의 URI query 의해 삭제됨을 의미하는 _query 변경되었음에 유의하라. 삭제할 query body 있다. 그러나 여전히 DELETE를 사용한다. Query 문법에 대해서는 걱정하지 않아도 된다. tutorial 뒤에서 다룰 것이다.


받은 트랙백이 없고, 댓글이 없습니다.

댓글+트랙백 RSS :: http://www.yongbi.net/rss/response/696

[Updating Documents]

Document index하고 replace 있을 뿐만 아니라, 또한 document update 수도 있다. Elasticsearch 실제로는 제자리 (이전 데이터를 덮어쓰는) 업데이트를 하지 않는다. Elasticsearch old document 삭제하고, 한번 업데이트 했다는 내용이 적용된 새로운 document index한다.


다음 예제는 이전 document (ID 1) 어떻게 이름을 "Jane Doe" 변경한 새로운 document 업데이트 되는지를 보여준다.


curl -XPOST 'localhost:9200/customer/external/1/_update?pretty' -d '
{
  "doc": { "name": "Jane Doe" }
}'


다음 예제는 이전 document (ID 1) 어떻게 이름을 "Jane Doe" 변경하고 age 필드가 새로 추가된 새로운 document 업데이트 되는지를 보여준다.


curl -XPOST 'localhost:9200/customer/external/1/_update?pretty' -d '
{
  "doc": { "name": "Jane Doe", "age": 20 }
}'


업데이트는 간단한 스크립트로 수행될 수도 있다. 다음에 나타나는 dynamic script 1.4.3에서는 기본적으로 사용할 없다. 자세한 내용은 Scripting Docs (http://www.elastic.co/guide/en/elasticsearch/reference/current/modules-scripting.html)에서 확인할 있다. 다음 예제는 script 나이를 5 증가시키는 것이다.


curl -XPOST 'localhost:9200/customer/external/1/_update?pretty' -d '
{
  "script" : "ctx._source.age += 5"
}'


위의 예제에서 ctx._source 업데이트 되는 현재 source document 나타낸다.

스크립트는 한번에 하나의 document 대해서만 update 수행할 있다. 나중에는 elasticsearch에서 주어진 query 조건에 따라 여러 document update하는 기능을 지원할 것이다. (SQL문의 Update - Where 문과 유사한 기능 제공 예정)

받은 트랙백이 없고, 댓글이 없습니다.

댓글+트랙백 RSS :: http://www.yongbi.net/rss/response/695

Elasticsearch data manipulation 실시간 (near realtime) 검색 기능을 제공한다. 기본적으로 실제로 data  index/update/delete 시점에서 검색 결과로 나타나기까지 1 delay (refresh interval) 발생한다. 이것은 transaction 완료된 이후에 즉시 data 나타나는 SQL 같은 다른 platform 가장 중요한 차이점이다.


[Indexing/Replacing Documents]

앞에서 어떻게 single document index하는지 살펴보았다. 그때 command 다시 호출해 보자.


curl -XPUT 'localhost:9200/customer/external/1?pretty' -d '
{
  "name": "John Doe"
}'


위의 command customer index external type으로 ID 1 document index 것이다. 만약 다른 document (혹은 같은) 위의 command 다시 실행하면, elasticsecarh 기존에 존재하는 ID 1 새로운 document replace 것이다.


curl -XPUT 'localhost:9200/customer/external/1?pretty' -d '
{
  "name": "Jane Doe"
}'


위의 command ID 1 document 내용 중에서 이름을 "John Doe"에서 "Jane Doe" 변경한다. 다른 한편, 만약 다른 ID 사용한다면, 새로운 document index되고, 기존에 입력한 document 변경되지 않고 남아 있게 된다.


curl -XPUT 'localhost:9200/customer/external/2?pretty' -d '
{
  "name": "Jane Doe"
}'


위의 결과로 ID 2 가지는 새로운 document index된다.


Index , ID part optional이다. ID 지정되지 않으면 elasticsearch random ID 생성하고 그것을 이용해 document를 index한다. Elasticsearch 생성한 ID (이전에 명시적으로 지정한 ID 마찬가지로) index API call 부분으로 리턴된다.


명시적인 ID 지정하지 않고 document index하기 위한 예제는 다음과 같다.


curl -XPOST 'localhost:9200/customer/external?pretty' -d '
{
  "name": "Jane Doe"
}'


명시적으로 ID 지정하지 않을 때는 PUT 대신 POST 사용한다.

받은 트랙백이 없고, 댓글이 없습니다.

댓글+트랙백 RSS :: http://www.yongbi.net/rss/response/694

[Delete an Index]

이제 앞에서 생성했던 index 삭제하고 다시 index list 조회해 보자.


curl -XDELETE 'localhost:9200/customer?pretty'
curl
'localhost:9200/_cat/indices?v'


응답 결과는 다음과 같다.


curl -XDELETE 'localhost:9200/customer?pretty'
{
 
"acknowledged" : true
}
curl
'localhost:9200/_cat/indices?v'
health index pri rep docs
.count docs.deleted store.size pri.store.size


Index 성공적으로 삭제되었음을 나타낸다. 그리고 아무것도 없이 cluster 시작되었을 때로 되돌아 갔음을 있다. 이동하기 전에, API command 대해서 조금 깊이 들어가서 배워 보자.


curl -XPUT 'localhost:9200/customer'
curl
-XPUT 'localhost:9200/customer/external/1' -d '
{
  "name": "John Doe"
}'

curl
'localhost:9200/customer/external/1'
curl
-XDELETE 'localhost:9200/customer'


위의 command 주의 깊게 살펴보면, elasticsearch에서 어떻게 data access하는지 있다. 다음과 같은 패턴으로 요약될 있다.


curl -X<REST Verb> <Node>:<Port>/<Index>/<Type>/<ID>


이러한 REST access 패턴은 모든 API command 구석구석 숨어 있다. 여러분이 이것을 기억하고 있다면, 좋은 머리로elasticsearch 마스터할 있다.

받은 트랙백이 없고, 댓글이 없습니다.

댓글+트랙백 RSS :: http://www.yongbi.net/rss/response/693