Ich habe eine Verteilung mit numpy Histogramm und digitalisieren Funktionen erstellt.Pandas Merge Bins
_, bins = np.histogram(x, bins=bins)
arr = np.digitize(x, bins) - 1
x = bins[arr[:]]
Oder vielleicht:
x = pandas.cut(x, bins=bins)
jedoch die Verteilung sehr verzerrt ist, auch nach Ausreißern zu entfernen, gibt es viele Behälter mit sehr wenig Beobachtungen. Ich möchte Bins verschmelzen, etwas ähnlich:
Das Verfahren würde möglicherweise Pandas groupby beinhalten und dann die Gruppe verschmelzenden Größen von weniger als n
zu ihren benachbarten Werten. Gibt es einen Weg, dies in Pandas/Numpy zu erreichen?
Kannst du 'pd.cut' verwenden? –
@ JonClements Ich glaube nicht, wie das in diesem Fall helfen kann – user113531
Yeah war nicht sicher, ob Sie nur 'cut' verwenden und es die Anzahl der Bins, so dass Sie eine automatische Verteilung erhalten ... aber das wird nicht Arbeit, wenn Sie * Mülleimer definiert haben ... –