2016-06-07 9 views
1

Ich baute und lief Syntaxnet erfolgreich auf einer Menge von 1400 Tweets. Ich habe Schwierigkeiten zu verstehen, was jeder Parameter in der geparsten Datei bedeutet. Zum Beispiel habe ich den Satz:Anmerkungen verstehen - Syntaxnet

Shoutout @Aetna for covering my doctor visit. Love you! 

, für die die analysierten Dateiinhalte sind:

1  Shoutout  _  NOUN NNP  _  9  nsubj _  _ 
2  @  _  ADP  IN  _  1  prep _  _ 
3  Aetna _  NOUN NNP  _  2  pobj _  _ 
4  for  _  ADP  IN  _  1  prep _  _ 
5  covering  _  VERB VBG  _  4  pcomp _  _ 
6  my  _  PRON PRP$ _  8  poss _  _ 
7  doctor _  NOUN NN  _  8  nn  _  _ 
8  visit. _  NOUN NN  _  5  dobj _  _ 
9  Love _  VERB VBP  _  0  ROOT _  _ 
10  you  _  PRON PRP  _  9  dobj _  _ 
11  !  _  .  .  _  9  punct _  _ 

Was jeder Spalte genau meinen? Warum gibt es Leerzeichen und Zahlen außer den POS-Tags?

Antwort

1

Diese Art von Format wird CoNLL-Format genannt. Es gibt verschiedene Versionen davon. Die Bedeutung jeder Spalte wird beschrieben here