Ich erzeuge ein Streudiagramm von ~ 300k Datenpunkten und habe das Problem, dass es an manchen Stellen so überfüllt ist, dass keine Struktur sichtbar ist - also hatte ich einen Gedanken !Plot Konturen für den dichtesten Bereich eines Streudiagramms
Ich möchte, dass das Plot ein Konturdiagramm für die dichtesten Teile erzeugt und die weniger dichten Bereiche mit den scatter()
Datenpunkten belässt.
Also habe ich versucht, für jeden der Datenpunkte einen nächsten Nachbarabstand einzeln zu berechnen und dann, wenn dieser Abstand einen bestimmten Wert erreicht, eine Kontur zeichnen und füllen, dann wenn es einen viel größeren Wert trifft (weniger dicht) tun Sie einfach die Streuung ...
Ich habe versucht und versagt seit ein paar Tagen, ich bin mir nicht sicher, dass das konventionelle Konturdiagramm in diesem Fall funktioniert.
Ich würde Code zur Verfügung stellen, aber es ist so chaotisch und würde wahrscheinlich nur das Problem verwirren. Und es ist so rechenintensiv, dass es wahrscheinlich nur meinen PC zum Absturz bringen würde, wenn es funktionieren würde!
Vielen Dank im Voraus!
p.s. Ich habe gesucht und nach einer Antwort gesucht! Ich bin überzeugt, dass es nicht einmal für alle Ergebnisse möglich ist!
Edit: Also die Idee davon ist zu sehen, wo einige bestimmte Punkte innerhalb der Struktur der 300k Probe liegen. Hier ist ein Beispieldiagramm, meine Punkte sind in drei Diff verteilt. Farben.
Ich werde versuchen, 1000 Datenpunkte aus meinen Daten nach dem Zufallsprinzip zu probieren und es als Textdatei hochladen. Cheers Stapler. :)
Edit: Hey, Hier sind einige Beispieldaten 1000 Zeilen - nur zwei Spalten [X,Y]
(oder [g-i,i]
von Plot oben) Raum begrenzt. Danke euch allen! the data
Je nachdem, wie voll diese Werte sind, könnten Sie wahrscheinlich eine gewisse Struktur herauszukitzeln von nur tun, 'Streuung (x, y, alpha = 0,1)' oder einen geeigneten kleinen Wert. Um das zu tun, was Sie vorschlagen, würde ich eine Kernel-Dichte-Schätzung erstellen (siehe 'scipy.stats.kde'). – chthonicdaemon
Warum verwenden Sie kein 2D-Histogramm, um Ihre Daten anzuzeigen? –
@FriskyGrub Sie können nur zufällige Daten des gleichen Typs/Form/etc als Ihre realen Daten liefern - Sie müssen nicht immer die komplizierten Schritte posten, die die echten Daten an erster Stelle generiert haben. Es erleichtert uns, Ihnen nützliche Antworten zu geben. – YXD