Ich suche die effizienteste Art und Weise mehrere Spalten von einem Datenrahmen zu wählen:Effiziente Spalte Indizierung und Selektion in PANDA
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(4,8), columns = list('abcdefgh'))
I Spalten die folgenden Spalten ein auswählen möchten, c, e, f, g nur, die unter Verwendung von Indizierung durchgeführt werden kann:
df.ix[:,[0,2,4,5,6]]
Für einen großen Datenrahmen von vielen Säulen, scheint dies eine ineffiziente Methode, und ich würde mu ch angeben eher aufeinanderfolgende Spaltenindizes durch Bereich, wenn überhaupt möglich, aber Versuche, wie die folgenden, beide Syntaxfehler werfen:
df.ix[:,[0,2,4:6]]
oder
df.ix[:,[0,2,[4:6]]]
ausgezeichnet, Ihre Antwort hat mich auch mehr über die Flexibilität der ‚Reichweite‘ Befehl zu entdecken! http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-integer – thescoop