Ich versuche distance correlation zwischen den Spalten zu finden, schauen Sie sich den unten stehenden Code. Die meiste Zeit ist es höher als 1 Ergebnis, was nicht möglich ist, da die Distanzkorrelation zwischen 0 und 1 liegt. Sie können über die Distanzkorrelation von scipy lesen here.Scipy: Abstand Korrelation ist höher als 1
import numpy as np
from scipy.spatial import distance
x = np.random.uniform(-1, 1, 10000)
print distance.correlation(x, x**2)
1,00210811815
Was ist hier falsch oder wie kann ich es messen?
UPD1:Link to issue auf Github
Das sieht komisch aus. Ich habe es in R mit dem Energiepaket ausprobiert und habe immer Werte um 0.49, so scheint es, dass ein Faktor 0,5 fehlt. Keine Ahnung ... wäre es vielleicht wert, ein Problem auf ihrer GitHub-Seite zu öffnen. – Cleb
@Cleb, Sicher, ich werde ein Problem öffnen – Rocketq
@ Rocketq: Warum denkst du, dass die Funktion Distanzkorrelation berechnen soll --- die Dokumentation sagt, es ist Rechenkorrelationsentfernung --- was ist vielleicht eine ganz andere Sache? –