2016-04-28 21 views
-1

Ich arbeite sehr hart, um zu verstehen, wie Daten in Python bin. Bisher habe ich gearbeitet, wie die Kanten erhalten mit:Binning-Daten in Python

edges = pylab.hist(data, bins=10)[1] 

Ich bin nicht sicher, ob dies die ideale Methode, aber es hat funktioniert! Gibt mir eine Liste von 11 Nummern, die benötigt werden, um 10 Behälter zu machen. Das Problem ist, dass ich nicht weiß, wie ich Daten in Bins klassifizieren soll. Ich habe versucht, mit:

digitized = np.digitize(data, edges) 

Aber das gab mir nur einen Fehler, „Valueerror: zero-size Array in dem Absenkbetrieb Minimum, die keine Identität hat“. Ich muss Bins irgendwie machen, bevor ich pandas value_counts benutze (ich habe den Teil auch schon runter).

Jede Hilfe würde super geschätzt werden!

+1

Mögliche Duplikat [Python identifizieren, in welchem ​​Intervall die Zahlen] (http://stackoverflow.com/questions/36479374/python-identify-in-which-interval- the-numbers-sind) Die Antwort auf diese Frage zeigt Ihnen, wie Sie dies tun. – ChrisP

+0

Ich habe das schon probiert, ich hätte das hier drin einbauen sollen, damit es nicht gleich abgeschossen wird. Es tut uns leid. – user3023715

+1

Es wäre nützlich, ein Spielzeugbeispiel von Daten zu enthalten –

Antwort

1

Die Antwort lautet:

digitized = np.digitize(data, edges)