Ich frage mich:
Suche nach bestimmten Zeichenfolge innerhalb einer Spalte und die Suche nach dem max zu dieser Zeichenfolge entspricht
1.), wie ich diese Zeichenfolge eine bestimmte Zeichenfolge in einer Spalte
2.) gegeben finden Sie, wie würde ich finde, es entspricht max
3.) Wie kann ich die Anzahl der Saiten für jede Zeile zählen in dieser Spalte
ich eine cSV-Datei mit dem Namen sports.csv
import pandas as pd
import numpy as np
#loading the data into data frame
X = pd.read_csv('sports.csv')
die beiden Spalten von Interesse sind die Totals
und Gym
Säule:
Total Gym
40 Football|Baseball|Hockey|Running|Basketball|Swimming|Cycling|Volleyball|Tennis|Ballet
37 Baseball|Tennis
61 Basketball|Baseball|Ballet
12 Swimming|Ballet|Cycling|Basketball|Volleyball|Hockey|Running|Tennis|Baseball|Football
78 Swimming|Basketball
29 Baseball|Tennis|Ballet|Cycling|Basketball|Football|Volleyball|Swimming
31 Tennis
54 Tennis|Football|Ballet|Cycling|Running|Swimming|Baseball|Basketball|Volleyball
33 Baseball|Hockey|Swimming|Cycling
17 Football|Hockey|Volleyball
Beachten Sie, dass die Gym
Spalte mehrere Strings für jede entsprechende sport.I'm versuchen, einen Weg zu finden, hat all die Fitness-Studios zu finden, die Baseball haben und finde den mit der maximalen Summe. Aber ich bin nur daran interessiert, in Fitness-Studios, die mindestens zwei andere Sportarten haben also würde ich nicht in Betracht ziehen:
Total Gym
37 Baseball|Tennis
Ist das tatsächlich, wie Sie Ihre Datei aussieht? –
Ja, jede Sportart für diese Spalte ist durch ein "|" Symbol – M3105
Ich sehe etwas Platz nach einem Pfeifen-Zeichen, das '| Schwimmen | Radfahren |', ist das auch in Ihrer Datei oder einem Tippfehler? –