kann ich eine boxplot einer Gehaltsspalte in einer Pandas Dataframe bekommen ...Wie man benutzerdefinierte Spaltenreihenfolge auf Pandas Boxplot anwendet?
train.boxplot(column='PredictionError',by='Category',sym='')
... aber ich kann nicht herausfinden, wie die Index-Ordnung auf Spalte ‚Kategorie‘ verwendet, um zu definieren - I möchte meinen eigenen kundenspezifischen Auftrag liefern, nach einem anderen Kriterium:
category_order_by_mean_salary = train.groupby('Category')['Salary'].mean().order().keys()
Wie kann ich meine benutzerdefinierte Spalte, um die boxplot Spalten anwenden? (außer hässlich Klonierung der Spaltennamen mit einem Präfix, um die Reihenfolge zu erzwingen)
'Kategorie' ist eine Zeichenkettenspalte mit 27 verschiedenen Werten: ['Accounting & Finance Jobs','Admin Jobs',...,'Travel Jobs']
. So kann es leicht mit pd.Categorical.from_array()
Bei der Inspektion Faktoren zerlegt werden, ist die Begrenzung innerhalb pandas.tools.plotting.py:boxplot()
, die, ohne dass die Bestellung der Spalte Objekt konvertiert:
- pandas.core.frame.py.boxplot() ist ein Pass-Through zu
- pandas.tools.plotting.py:boxplot() was instanziiert ...
- matplotlib.pyplot.py:boxplot() die instanziiert ...
- matplotlib.axes.py:boxplot()
Ich glaube, ich könnte entweder eine benutzerdefinierte Version von Pandas boxplot() zerhacken, oder in die Interna des Objekts erreichen. Und auch eine Erweiterungsanforderung einreichen.
BEARBEITEN: diese Frage entstand mit Pandas ~ 0.13 und ist wahrscheinlich von den letzten (0.19+?) Versionen gemäß @ Cireos späte Antwort veraltet worden.
Added Details für Sie und Ideen zu Workarounds. Das Hinzufügen einer separaten Standalone-Integer-Spalte ergibt kein anständiges Diagramm, da Ihre Spaltenbeschriftungen jetzt (unlesbare) Ganzzahlen sind und kein Text. (Das Einfügen eines Textpräfixes in Kategorienamen, um eine benutzerdefinierte Sortierreihenfolge zu erzwingen, ist vielleicht der schnellste Hack. Aber immer noch hässlich) – smci
[Pandas DataFrame kann keine kategorische Spalte verarbeiten] (http://stackoverflow.com/questions/15356433/how-to -generate-pandas-dataframe-Spalte-of-categorical-from-string-column), im Gegensatz zu R. – smci
nicht dort, wo ich hinging. Normalerweise verwende ich 'apply' nur mit einer fest codierten Nachschlagetabelle. Siehe meine bearbeitete Antwort für einen anderen Ansatz. –