2009-08-09 20 views

Antwort

11

Sie die Antwort in den mailing list archives finden:

Die Jitter-Funktion im Visualize Panel kommt noch hinzu, künstliche Zufall Rauschen zu den Koordinaten der gezeichneten Punkte, um die Daten ein wenig auszubreiten (damit Sie Punkte sehen können, die von anderen verdeckt worden sein konnten).

+1

Laden Sie das Kontaktlinsenbeispiel von Weka und visualisieren Sie es. In der ersten Handlung sind einige Punkte genau übereinander. Durch Hinzufügen von Jitter können Sie sehen, wie viele Punkte für jede Kombination vorhanden sind. Dies funktioniert bei größeren Datensätzen nicht so gut, aber Sie können trotzdem einen Eindruck gewinnen. Für diskrete Werte ist das ziemlich wichtig. –

0

Ich kenne die Produkte nicht, die Sie erwähnen, aber jittering bedeutet im Allgemeinen Randomisierung der Probenpositionen. Bei der Raytracing-Methode würden Sie normalerweise jeden Pixel auf dem Bildschirm anzeigen. Jittering fügt jedem Strahl einen zufälligen Offset hinzu, um Probleme zu reduzieren, die durch reguläres Aliasing verursacht werden.

2

Ich weiß nicht Weka, aber im Allgemeinen ist Jitter ein Ausdruck für die Variation eines periodischen Signals zu einem Referenzintervall. Ich schätze, der Schieberegler ermöglicht es Ihnen, einen Bereich oder einen Schwellenwert festzulegen, unterhalb dessen Datenpunkte als regulär behandelt werden, oder die Ausgabe zu ändern, um eine gewisse Variation zu erzielen. Der Eintrag wikipedia kann Ihnen einen Hintergrund geben.

Update: von this pdf, ist der Jitter-Schieber für diesen Zweck:

„Jitter“ Option mit nominalen Attributen umgehen (und „versteckt“ Datenpunkte zu erkennen)

Basierend auf die begleitende Folie sieht so aus, als würde sie einige Variationen in der Visualisierung einführen, vielleicht um zu zeigen, wenn sich zwei Datenpunkte überlappen.

Update 2: Dieser google books extract (Data Mining von Ian H. Witten, Eibe Frank) scheint meine Vermutung zu bestätigen:

[Jitter] ist eine zufällige Verschiebung X und Y-Wert Punkte zu trennen die liegen übereinander. Ohne Jitter, 1000 Fälle mit dem gleichen Datenpunkt aussehen würden genau die gleiche wie 1 Instanz