2016-04-20 8 views

Antwort

1

Aber warum MapReduce. Sie benötigen pdf zuerst mit tika den Link unten

http://www.tutorialspoint.com/tika/tika_extracting_pdf.htm

erhalten metedata Namen und ihre Werte und erstellen JSON beziehen zu extrahieren. so etwas wie

pdftitle: zwei Staaten

Autor: Chetan Bhagat

zu

{ "pdftitle": "Zwei Staaten", "Autor": "Chetan Bhagat" }