Ich habe die folgende gekürzte dataframe:Pandas: Reihen von geraden Anzahl Jahre Einfügen
df1 = pd.DataFrame({'end': [2007, 2013, 2014, 2013, 2014], 'id.thomas'\
: ['136', '136', '136', '172', '172'], 'years_exp': ['14', '20', '21', \
'14', '15']}, index=[2,3,4,5,6])
end id.thomas years_exp
2 2007 136 14
3 2013 136 20
4 2014 136 21
5 2013 172 14
6 2014 172 15
wo end
Vertreter von Jahren. Ich möchte die end
und years_exp
Spalte erweitern Konto für die fehlenden Jahre zu berücksichtigen:
end id.thomas years_exp
2 2007 136 14
3 2008 136 15
4 2009 136 16
5 2010 136 17
6 2011 136 18
7 2012 136 19
8 2013 136 20
9 2014 136 21
10 2013 172 14
11 2014 172 15
Ich habe etwa 20 Stunden lang auf dieser gearbeitet und versucht, ‚Ingenieur‘ ein Update. Kennt jemand ein einfaches Python/Pandas Werkzeug/Methode um diese Aufgabe zu erfüllen?
Haben Sie über den Index, um das interessieren? Werden die Spalten "id.thomas" und "years_exp" berechnet oder ist es in Ordnung, dass sie leer sind? –
@Nathan Clement: Danke für Ihre Antwort. Die Indexreihenfolge interessiert mich nicht. Es ist wichtig, dass das 'id.thomas' beibehalten wird. 'years_exp' ist meine Hauptbeschäftigung von der Operation. Es wird später zu einer anderen Datenbank zusammengeführt. 'years_exp'hat bereits von einem anderen [Datenrahmen] berechnet worden (https://github.com/108michael/ms_thesis/blob/master/yearsofserv) –
Also im Grunde, was Sie wollen, ist eine neue Reihe von" Ende "Zeilen, die beginnt mit dem ersten Jahr und endet mit dem letzten Jahr, aber überspringt keine Jahre? –