Ich möchte zwei verschiedene Berechnungen über aufeinanderfolgende Spalten in einem Pandas- oder Pyspark-Dataframe durchführen.Tatsächliche und prozentuale Differenz in aufeinanderfolgenden Spalten in einem Pandas- oder Pyspark-Dataframe
Spalten sind Wochen und die Metriken werden als Zeilen angezeigt. Ich möchte die tatsächlichen und prozentualen Unterschiede über die Spalten berechnen.
Die Eingangs-/Ausgangstabellen inkl. Die in Excel verwendeten Berechnungen werden in der folgenden Abbildung angezeigt. Ich möchte diese Berechnungen auf einem Pandas oder Pyspark-Datenrahmen replizieren.
Rohdaten angebaute:
Metrics Week20 Week21 Week22 Week23 Week24 Week25 Week26 Week27
Sales 20301 21132 20059 23062 19610 22734 22140 20699
TRXs 739 729 690 779 701 736 762 655
Attachment Rate 4.47 4.44 4.28 4.56 4.41 4.58 4.55 4.96
AOV 27.47 28.99 29.07 29.6 27.97 30.89 29.06 31.6
Profit 5177 5389 5115 5881 5001 5797 5646 5278
Profit per TRX 7.01 7.39 7.41 7.55 7.13 7.88 7.41 8.06
Idealfall sollten Sie Rohdaten und Code anstatt Bilder enthalten müssen – EdChum