2016-08-04 22 views
1

Ich versuche, JSON Stream (Zeilen von JSON-Objekte Datei) durch logstash zu ElasticSearch zu laden. Einige meiner json-Objektfelder enthalten Unicode, wie Sie unten sehen können.Laden JSON-Stream von Logstash zu Elasticsearch

{"status_link": "https://www.facebook.com/asia/videos/1118055131588324/", "num_loves": "4", "num_sads": "0", "num_wows": "0", "num_angrys": "0", "num_comments": "6", "num_reactions": "46", "num_hahas": "0", "link_name": "", "num_likes": "42", "timestamp": "2016-07-25 02:07:38", "num_shares": "8", "_id": "156915824368931_1118055131588324", "status_message": "\"\u0411\u0440\u0438\u0433\u0430\u0434\" \u0440\u0435\u0430\u043b\u0438\u0442\u0438 \u0448\u043e\u0443\u043d\u044b \u0448\u0438\u043d\u044d \u0434\u0443\u0433\u0430\u0430\u0440 07-\u0440 \u0441\u0430\u0440\u044b\u043d 28-\u043d\u044b \u043f\u04af\u0440\u044d\u0432 \u0433\u0430\u0440\u0430\u0433\u0438\u0439\u043d \u043e\u0440\u043e\u0439 18:00 \u0446\u0430\u0433\u0430\u0430\u0441", "status_type": "video"} 

Als ich logstash beginnen, es gibt mir eine Fehlermeldung:

"status"=>400, "error"=>{"type"=>"mapper_parsing_exception", "reason"=>"failed to parse", "caused_by"=>{"type"=>"illegal_state_exception", "reason"=>"Mixing up field types: class org.elasticsearch.index.mapper.core.StringFieldMapper$StringFieldType != class org.elasticsearch.index.mapper.internal.IdFieldMapper$IdFieldType on field _id"}}}}, :level=>:warn} 

Mein logstash.conf:

input 
{ 
    file 
    { 
     path => "test.json" 
     start_position => "beginning" 
     sincedb_path => "/dev/null" 
     exclude => "*.gz" 
     type => "posts" 
     codec => "json" 
    } 
} 

filter { 
    json { 
    source => "message" 
    } 
} 

output { 
    elasticsearch { 
    hosts => ["localhost:9200"] 
    index => "fb" 
    codec => "json" 
    } 
} 

ich ohne Unicode-JSON-Objekt zu laden versucht, es parst erfolgreich und Indizes in elasticsearch.

Antwort

2

Das Problem ist, Sie haben ein _id Feld in Ihrem Dokument. _id ist ein erhaltenes Feld. Sie müssen es also entweder entfernen oder umbenennen.

+0

Später lade ich Kommentare und mache es Eltern-Kind-Beziehung mit den Beiträgen. Ist also nicht das Feld _id field only, das die Verbindung zwischen Posts und Kommentaren herstellt? – KevinOelen

+1

Wenn Sie '_id' als Ihre Dokument-ID verwenden möchten, meinen Vorschlag, benennen Sie es als ID um und verwenden Sie' document_id => "% {[event] [id]}" 'in Ihrer elasticsearch-Ausgabe. – alpert