7

Was ist Bedingtes Zufallsfeld? Wie funktioniert genau Bedingtes Zufallsfeld identifizieren Eigennamen als Person, Organisation oder Ort in einem strukturierten oder unstrukturierten Text?Bedingte Zufallsfelder für die Erkennung genannter Entitäten verwenden

Zum Beispiel: Dieses Produkt wurde von Stackoverflow Inc. bestellt

Was ist Conditional Random Field tun Stackoverflow Inc. als Organisation zu identifizieren?

Antwort

16

Ein CRF ist ein diskriminierendes Batch-Tagging-Modell in der gleichen Familie wie ein Maximum-Entropie-Markov-Modell.

Eine vollständige Erklärung ist Buchlänge.

Eine kurze Erläuterung ist wie folgt:

  1. Humans Anmerkungen versehen 200-500K Wörter des Textes, Kennzeichnung der Einheiten.
  2. Menschen wählen eine Reihe von Funktionen, die sie auf Entitäten hoffen. Dinge wie Großschreibung, oder ob das Wort im Training mit einem Tag gesehen wurde.
  3. Ein Trainingsprozedur zählt alle Vorkommen der Features.
  4. Das Fleisch des CRF-Algorithmus sucht den Raum aller möglichen Modelle, die zu den Zählungen passen, um einen ziemlich guten zu finden.
  5. Zur Laufzeit betrachtet ein Decoder (wahrscheinlich ein Viterbi-Decoder) einen Satz und entscheidet, welches Tag jedem Wort zugewiesen werden soll.

Die harten Teile davon sind Merkmalsauswahl und der Suchalgorithmus in Schritt 4

0

Gut zu verstehen, dass Sie eine Menge Dinge zu studieren, bekommen.
Zum Start

Verstehen Sie die Grundlagen von Markov und Bayesian Netzwerken.
Online-Kurs in Coursera von Seidelbast Coller
https://class.coursera.org/pgm/lecture/index

CRF ist eine spezielle Art von markov Netzwerk, in dem wir die Beobachtung und versteckte Zustände haben.
Ziel ist es, die beste Zustandszuordnung zu den unbeobachteten Variablen zu finden, die auch als MAP-Problem bekannt ist.
Seien Sie auf eine große Wahrscheinlichkeit und Optimierung vorbereitet. :-)