
Elasticsearch Àr en mycket kraftfull sök- och analysmotor som kan skala extremt bra. Med det hÀr verktyget har du grunden för att visualisera enorma mÀngder data. Men nÀr du börjar skala Elasticsearch för att möta kraven frÄn big data, kommer du att vilja anvÀnda mer Àn en server. NÀr du börjar skala upp för att möta företagens krav, skulle en enda server kvÀvas av den mÀngden data.
Mer om datacenter
SÄ vad gör du? Du distribuerar ett kluster av Elasticsearch-servrar. Jag ska visa dig hur du gör just det. NÀr du Àr klar har du den kraft som krÀvs för att börja bygga otroliga datavisualiseringsverktyg som kan hantera enorma mÀngder data.
SE: Snowflake datalagerplattform: Ett fuskark (gratis PDF) (TechRepublic)
Vad du behöver
Jag kommer att demonstrera detta pÄ tvÄ instanser av Ubuntu Server 20.04, men du kan rulla ut det till ett sÄ stort kluster som du behöver. Förutom de tvÄ instanserna av Ubuntu Server, behöver du ocksÄ en anvÀndare med sudo-privilegier. Det Àr allt. LÄt oss distribuera.
Hur man installerar Java
Du kommer att behöva minst Java 8 installerat pÄ varje server, sÄ vi kommer att installera standard JRE med kommandot:
sudo apt-get install default-jre -y
NÀr det vÀl Àr installerat pÄ bÄda vÄra testmaskiner kan vi installera Elasticsearch.
Hur man installerar Elasticsearch
Detta mÄste göras pÄ bÄda maskinerna. Installera först Elasticsearch GPG-nyckeln:
wget -qO – https://artifacts.elastic.co/GPG-KEY-elasticsearch | sudo apt-key add –
Installera sedan apt-transport-https med:
sudo apt-get installera apt-transport-https
LÀgg till det nödvÀndiga arkivet med kommandot:
echo “deb https://artifacts.elastic.co/packages/6.x/apt stabil main” | sudo tee -a /etc/apt/sources.list.d/elastic-6.x.list
Slutligen, uppdatera apt och installera Elasticsearch:
sudo apt-get updatesudo apt-get install elasticsearch -y
Starta och aktivera Elasticsearch:
sudo systemctl starta elasticsearchsudo systemctl aktivera elasticsearch
Hur man konfigurerar Elasticsearch
Du kommer att göra detta pĂ„ bĂ„da servrarna, se bara till att Ă€ndra konfigurationen sĂ„ att den passar varje maskin. Vi anropar den första maskinstyrenheten-1 och den andra maskinnoden-1. Ăppna konfigurationsfilen med kommandot:
sudo nano /etc/elasticsearch/elasticsearch.yml
I den filen vill du redigera följande rader. Vissa av dessa rader kommer att kommenteras bort, sÄ du mÄste först ta bort det inledande #-tecknet. Raderna som ska redigeras Àr (allt i fetstil ska redigeras efter behov):
- kluster.namn: Àlgkluster
- node.name: “styrenhet-1“
- network.host: 192.168.1.80
- http.port: 9200
- discovery.zen.ping.unicast.hosts: [â192.168.1.80â, â192.168.1.81â]
I mitt fall Àr styrenheten pÄ 192.168.1.80 och noden pÄ 192.168.1.81.
Spara och stÀng filen. Starta om Elasticsearch pÄ bÄda maskinerna:
sudo systemctl starta om elasticsearch
Hur man testar klustret
Du mÄste ge Elasticsearch nÄgra minuter för att komma upp. Du kan testa det med kommandot:
curl -XGET ‘http://192.168.1.80:9200/_cluster/state?pretty’
Se till att redigera IP-adressen ovan till antingen din kontroller eller nod. Om du testar styrenheten, anvÀnd styrenhetens IP, och om du testar noden, anvÀnd nodens IP.
NÀr Elasticsearch Àntligen körs bör du se ganska mycket utdata som inkluderar:
{
“cluster_name” : “monkeypantz”,
“cluster_uuid” : “rGzNNmm_Rteel0Xg3xqw9w”,
“version” : 6,
“state_uuid” : “WVx5O6Q7SfOqZf_wxaPOKQ”,
“master_node” : “2NI9_pDYS1WvJYQz-XY3KQ”,
“blocks” : { },
“knutpunkter” : {
“yV2TBoxVTvKbh7E1ZngpbA” : {
“name” : “nod-1”,
“ephemeral_id” : “pkb3vapLTd2yFLrXO64ENA”,
“transport_address” : “192.168.1.81:9300”,
“attribut” : {
“ml.machine_memory” : “3137888256”,
“ml.max_open_jobs” : “20”,
“xpack.installed” : “true”,
“ml.enabled” : “true”
}
},
NÀr bÄde styrenheten och noden Àr igÄng, testa klustret med kommandot:
curl -XGET ‘192.168.1.80:9200/_cluster/health?pretty’
Se till att redigera IP-adressen sÄ att den matchar IP-adressen för maskinen du kör kommandot pÄ. UtgÄngen bör innehÄlla:
{
“cluster_name” : “monkeypantz”,
“status” : “grön”,
“timed_out” : false,
“antal_noder” : 2,
“antal_data_noder” : 2,
“active_primary_shards” : 0,
“active_shards” : 0,
“relocating_shards” : 0,
“initializing_shards” : 0,
“unassigned_shards” : 0,
“delayed_unassigned_shards” : 0,
“antal_pĂ„gĂ„ende_uppgifter” : 0,
“number_of_in_flight_fetch” : 0,
“task_max_waiting_in_queue_millis” : 0,
“active_shards_percent_as_number” : 100,0
}
De viktiga raderna att notera Àr:
“status” : “grön”,
“timed_out” : false,
“antal_noder” : 2,
“antal_data_noder” : 2,
Du kan ocksÄ kontrollera noder frÄn styrenheten med kommandot (kör pÄ styrenheten):
curl -XGET ‘192.168.1.81:9200/_nodes/?pretty
Se till att ersÀtta IP-adressen ovan för din Elasticsearch-nod. Du kan ocksÄ peka en webblÀsare till http://SERVER:9200 (dÀr SERVER Àr din kontrollers IP-adress) och du bör se utdata som liknar den i Bild A.
Bild A

Grattis, du har nu ett Elasticsearch-kluster igÄng och redo för dina utvecklare att anvÀnda för datavisualisering.