Optimering af import i Elasticsearch

Når jeg arbejder med Elasticsearch sker det af og til at der skal reindexeres data for at ændre mappingen. Hvis der er meget data der skal ind igen, kan det tage noget tid. For at optimere dette kan man med fordel opdatere settings på indexet til ikke at lave refresh. Dette betyder at det ikke er muligt at se ændringer i indexet før der igen bliver lavet et refresh.

curl -XPUT http://elastic.server:9200/mit_index/_settings -d '{ "index" : { "refresh_interval" : "-1" } }'

Dette vil sætte refresh inderval til -1 som også er lig med aldrig. Nu vil du kunne importerer væsentligt hurtigere, men du kan ikke finde de data der bliver importeret før du igen ændre refresh.

curl -XPUT http://elastic.server:9200/mit_index/_settings -d '{ "index" : { "refresh_interval" : "1s" } }'

Nu er refresh intervallet blevet sat til 1 sec.

Leave a comment

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *

This site uses Akismet to reduce spam. Learn how your comment data is processed.