Ich bin neugierig, ob jemand versteht, weiß oder kann mich auf umfangreiche Literatur oder Quellcode auf, wie Google ihre beliebte Passage Blöcke Feature erstellt. Wenn Sie jedoch eine andere Anwendung kennen, die das gleiche tun kann, schreiben Sie bitte auch Ihre Antwort.Wie wurde das beliebte Passage-Feature von Google Books entwickelt?
Wenn Sie nicht wissen, was ich über here is a link to an example Popular Passages schreibe. Wenn Sie an der Übersicht über das Buch aussehen die rechtliche Entscheidungsprozess-Anwendungen für Informationstechnologie Modellierung ... Von Georgios N. Yannopoulos kann man so etwas sehen:
Beliebte Passagen
.. Richtung, unbestimmt. Wir haben nicht abgerechnet, weil wir nicht antizipiert haben, die Frage, die durch den nichtvisierten Fall ausgelöst wird, wenn es auftritt; ob ein gewisses Maß an Frieden im Park ist geopfert zu, oder verteidigt gegen diese Kinder, deren Freude oder Interesse es ist, diese Dinge zu verwenden. Wenn die nicht angezeigten Fall auftritt, wir konfrontieren die Fragen auf dem Spiel und können dann die Frage durch die Wahl zwischen den konkurrierenden Interessen in der Weise, die uns am besten erfüllt. In tut ... Page 86
Appears in 15 books from 1968-2003
Dies wäre eine Welt fit für "mechanische" Jurisprudenz sein. Einfach diese Welt ist nicht unsere Welt; Mensch Gesetzgeber können keine solche Kenntnisse haben aller möglichen Kombinationen von Umstände, die die Zukunft bringen kann. Diese Unfähigkeit zu antizipieren bringt eine relative Unbestimmtheit des Ziels mit sich. Wenn wir fett sind genug, um eine allgemeine Regel des Verhaltens Rahmen (zB, die in der Regel kein Fahrzeug in den Park genommen werden kann), die Sprache in diesem Zusammenhang verwendet behebt notwendige Bedingungen, die etwas erfüllen müssen ... Page 86
Es muss ein intensives Musteranpassungsverfahren sein. Ich kann nur an N-Gramm-Modelle, Textkorpus, automatische Plagisrismus-Erkennung denken. Aber manchmal sind N-Gramme probabilistische Modelle für die Vorhersage des nächsten Elements in einer Sequenz und Textkorpus (nach meinem Wissen) werden manuell erstellt. Und in diesem speziellen Fall, populären Passagen, kann es eine Menge Worte geben.
Ich bin wirklich verloren. Wenn ich ein solches Feature erstellen möchte, wie oder wo soll ich anfangen? Enthalten Sie in Ihrer Antwort auch, welche Programmiersprachen für diese Dinge am besten geeignet sind: F # oder andere funktionale Sprachen, PERL, Python, Java ...(Ich bin immer ein F # Fan selbst)
PS: kann jemand das Tag automatisch-Plagiat-Erkennung enthalten, weil ich kann nicht
Ich habe versucht, das Tag hinzuzufügen, aber es sieht aus wie SO-Tags sind auf 25 Zeichen begrenzt. – outis
* automatische Plagiatserkennung * als Tag, scheint esoterisch. Ich bezweifle, dass jemand als Suchkriterium verwenden würde. Vielleicht möchten Sie sich etwas Generalisierteres einfallen lassen. – ichiban
Nun, so habe ich die Industrie gesehen, die das Zeug markiert. Ich glaube nicht, dass ich die Autorität habe, es zu ändern. Gehen Sie voran und versuchen Sie eine Suche und Sie werden einige Ergebnisse finden unter: ieee.org und acm.org und das MOSS Projekt in Stanford, um nur einige zu nennen. – dde