Ich habe eine Reihe von Textdokumenten, die Krankheiten beschreiben. Diese Dokumente sind meist sehr kurz und enthalten oft nur einen einzigen Satz. Ein Beispiel ist hier gegeben:Krankheit namens Entität Anerkennung
primäre pulmonale Hypertonie ist eine progressive Erkrankung, bei der weit verbreitete Okklusion der kleinsten Lungenarterien führt pulmonalen Gefäßwiderstand und anschließend Rechtsherzversagen erhöht.
Was ich brauche, ist ein Werkzeug, das alle Krankheits Bedingungen (zum Beispiel „pulmonale Hypertonie“ in diesem Fall) in den Sätzen findet und ordnet sie einen kontrollierten Vokabular wie MeSH.
Vielen Dank im Voraus für Ihre Antworten!
Das klingt sehr spezifisch und kein Programmierproblem * per se *. Zumindest nicht wie hier ausgedrückt. –
Scheint dies eher eine Frage Data Mining? – Harpal