Ich habe eine Frage zum WordNet Dateiformat. Die wndb (5) Handbuchseite sagt teilweise:Hilfe mit WordNet Dateiformat
Das Quelle/Zielfeld unterscheidet lexikalische und semantische Zeiger. Es ist ein Vier-Byte-Feld, das zwei zweistellige hexadezimale Ganzzahlen enthält. Die ersten beiden Ziffern geben die Wortnummer im aktuellen (Quell-) Synset an, die letzten beiden Ziffern geben die Wortnummer im Ziel-Synset an. Ein Wert von 0000 bedeutet, dass Zeigerzeichen eine semantische Beziehung zwischen dem aktuellen (Quell-) Synset und dem durch synset_offset angegebenen Ziel-Synset darstellt.
Eine lexikalische Beziehung zwischen zwei Wörtern in verschiedenen Synsets wird durch Werte ungleich Null in den Quell- und Zielwortnummern dargestellt. Die ersten und letzten zwei Bytes dieses Feldes geben die Wortnummern in den Quellen- bzw. Ziel-Synsets an, zwischen denen die Beziehung gilt. Wortnummern sind mit den Wortfeldern in einem Synset zugewiesen, von links nach rechts, beginnend mit 1.
ich den zweiten Absatz zu verstehen, wenn die Quell-/Ziel Zahlen ungleich Null sind, aber die Bedeutung von, wenn die Quelle/target sind "0000" ist mir immer noch nicht klar.
Lassen Sie mich ein Beispiel für das Wort "Aristokrat" nehmen. Der index.noun
Eintrag:
aristocrat n 1 4 @ ~ # m + 1 0 09807754
und data.noun Eintrag Entsprechendes:
09807754 18 n 03 0 aristocrat blue_blood 0 Patrizier 0 013 @ 09623038 n 0000 #m 08388207 n 0000 + 01590484 a 0306 + 01590484 a 0102 ~ 09840639 n 0000 ~ 09872782 n 0000 ~ 10083823 n 0000 ~ 10175090 n 0000 ~ 10285135 n 0000 ~ 10472799 n 0000 ~ 10474064 n 0000 ~ 10505732 n 0000 ~ 10506642 n 0000 | ein Mitglied des Adels
die erste "PTR", für die:
@ 09.623.038 n 0000
und dass data.noun
Eintrag beginnt mit:
09623038 18 n 01 führer 0 058 @ 00007846 n 0000 ...
Was mir nicht klar ist, für welche Wörter diese Beziehung ist. Hat die Hypernym ("@") Beziehung nur für das ursprüngliche Wort ("aristrocrat") zu allen Wörtern im Ziel-Synset (in diesem Fall gibt es nur "Leader")?
Oder gilt die Beziehung für alle Wörter im Quell-Synset ("Aristokrat", "Blaues Blut" und "Patrizier") für alle Wörter im Ziel-Synset?