Ich habe ein einfaches numpy-Array, für jedes Datum gibt es einen Datenpunkt. Etwas wie folgt aus:Gibt es in Python einen einfachen Weg, Datenpunkte in die Zukunft zu extrapolieren?
>>> import numpy as np
>>> from datetime import date
>>> from datetime import date
>>> x = np.array([(date(2008,3,5), 4800), (date(2008,3,15), 4000), (date(2008,3,
20), 3500), (date(2008,4,5), 3000) ])
Gibt es einfache Möglichkeit, Datenpunkte in die Zukunft zu extrapolieren: Datum (2008,5,1), Datum (2008, 5, 20) etc? Ich verstehe, dass es mit mathematischen Algorithmen gemacht werden kann. Aber hier suche ich nach etwas tief hängenden Früchten. Eigentlich gefällt mir, was numpy.linalg.solve macht, aber es scheint für die Extrapolation nicht anwendbar zu sein. Vielleicht liege ich absolut falsch.
Um genauer zu sein, ich baue ein Burn-Down-Diagramm (xp Begriff): "x = Datum und y = Volumen der Arbeit zu tun", so habe ich die bereits durchgeführten Sprints und ich möchte visualisieren wie die zukünftigen Sprints gehen werden, wenn die aktuelle Situation anhält. Und schließlich möchte ich das Veröffentlichungsdatum vorhersagen. Die Art von "zu bewältigender Arbeitsmenge" ist also immer auf Burn-Down-Charts zurückzuführen. Ich möchte auch das extrapolierte Veröffentlichungsdatum erhalten: Datum, an dem das Volumen zu Null wird.
Das ist alles, um dem Entwicklerteam zu zeigen, wie es läuft. Die Genauigkeit ist hier nicht so wichtig :) Die Motivation des Entwicklerteams ist der Hauptfaktor. Das bedeutet, dass mir die approximative Extrapolationstechnik absolut recht ist.
Wenn Sie für "Statistik Python" gegoogled was haben Sie gefunden? Haben Sie Fragen zu einem der statistischen Pakete, die Sie gefunden haben? –
Es ist schwierig, über eine Extrapolation zu sprechen, ohne die Art der fraglichen Daten zu kennen. Das Obige kann, soweit man sehen kann, alles sein (ohne zufällige Werte auszuschließen), so dass man über irgendeinen praktischen Ansatz spekulieren könnte. Verfeinere die Frage. – Rook
Sie haben absolut Recht! raffiniert. – maplpro