2013-09-05 4 views
9

Ich mag Wu und Palmer Methode zur Berechnung von Ähnlichkeitsmaß in wordnet,Was ist "am wenigsten gemeinsamen Subsumer" und wie berechnet man es?

wp = (2 X depth(lcs))/(depth(synset1) + depth(synset2)) 

verwenden, wo lcs den "kleinsten gemeinsamen subsumer" ist von synset1 und synset2

Meine Frage ist:

  1. Was ist "am wenigsten gemeinsamer Subsumer"?
  2. Wie berechnet man es?
+0

verwenden können, was Sie versucht haben? Und was sind Ihrer Meinung nach die Dateien, die für diese Aufgabe benötigt werden? – justhalf

+0

Ich möchte wissen, was ist "am wenigsten gemeinsame Subsumer"? –

+1

Ihre Frage ist also: "Was ist ein am wenigsten üblicher Subsumer?". In diesem Fall sollten Sie das klar sagen, und danach fragen Sie nur, wie Sie das berechnen. – justhalf

Antwort

15

Nach dieser paper, kleinste gemeinsame Subsumer von zwei Konzepten A und B ist „das spezifische Konzept, das ein Vorfahre der beiden A und B“, wobei der Begriff Baum durch das is-a Beziehung definiert ist. Ein Konzept ist so definiert, dass es ein Vorfahre eines anderen Konzepts ist, genau wie die Definition eines Vorfahren im menschlichen Stammbaum, der das andere Konzept, die Großeltern, usw. ist. Zum Beispiel:

  1. Ein Auto ist ein Automobil, ein Kraftfahrzeug und ein Fahrzeug
  2. Ein Boot ein Fahrzeug ist.
  3. Fahrzeug ist ein Objekt.

Und das Diagramm:

 
    Object 
     | 
    Vehicle 
     | 
    --------- 
    |  | 
Boat Automobile 
      | 
     Car 

In diesem Fall „Automobil“ die Haupt (und auch Vorfahren) von „Auto“, während „Fahrzeug“ ist ein Vorfahre von „Auto“. "Fahrzeug" ist auch ein Vorfahre von "Boot". In diesem Fall ist das LCS von "Boot" und "Auto" "Fahrzeug", da es das spezifischste Konzept ist, das ein Vorfahre von sowohl "Boot" als auch "Auto" ist. Beachten Sie, dass "Objekt" eine gemeinsame Subsumer sowohl von "Boot" und "Auto" ist, es ist nicht zuletzt, da es immer noch ein Kind von "Objekt" (in diesem Fall ist es "Fahrzeug"), die auch eine gemeinsame ist Subsumer von "Auto" und "Boot". "Automobile" ist nicht der kleinste Subsumer, da es kein Vorfahre von "Boot" ist.

Um das Ähnlichkeitsmaß zu berechnen, empfehle ich Ihnen, die verfügbare Bibliothek zu verwenden, andernfalls müssen Sie das Konzeptdiagramm selbst erstellen, was mühsam ist.

In Perl können Sie WordNet::Similarity package

In Python verwenden, können Sie nltk Paket verwenden, insbesondere die wup_similarity

In Java Sie ws4j package

+0

Danke für Ihre Antwort, jetzt möchte ich wissen, was ist die Tiefe von LCS (Boot, Auto)?Ist es 3 oder 4? –

+2

Ich schlage vor, Sie lesen mehr über Tree (http://en.wikipedia.org/wiki/Tree_(data_structure)). Grundsätzlich wird die Tiefe von der Wurzel des Baumes berechnet. Mit meinem Graphen ist die Wurzel "Objekt". Also, die Tiefe von 'Objekt' ist 0. Nun,' LCS (Boot, Auto) 'ist' Fahrzeug', also ist die Tiefe 1. – justhalf

+0

Es sollte "das spezifischste Konzept" sein, also ist es am weitesten unten, was immer noch 'Vehicle' ist – justhalf