2016-05-12 34 views
-1

Ich habe einen Datensatz mit diesen Funktionen: Dauer-Verbindung, IP, Dauer-LogIn.Korrelationsmatrix diskrete kontinuierliche Variablen R

Dauer-Verbindung und Dauer-LogIn sind kontinuierliche Variable, aber IP ist eine kretorische Variable, die die IP-Adresse des Computers enthalten.

Ich möchte eine Korrelationsmatrix für diese Funktionen erstellen. Aber ich bin nicht sicher, dass cor() mit IP-Funktion als eine nicht kontinuierliche Variable arbeiten wird.

Irgendeine Idee für dieses Problem.

Vielen Dank

+0

Willkommen bei Stack Overflow! Bitte lesen Sie die Informationen über [wie man eine gute Frage stellt] (http://stackoverflow.com/help/how-to-ask) und wie man ein [reproduzierbares Beispiel gibt] (http://stackoverflow.com/questions/ 5963269). Dies wird es anderen sehr erleichtern, Ihnen zu helfen. – zx8754

Antwort

0

Es wird nicht funktionieren; nur versuchen,

> cor(iris) 
Error in cor(iris) : 'x' must be numeric 

Sie könnten Ihre IP-Adressen in numerische Daten transformieren (zB die numerischen Werte mit den Faktorstufen als numerische Werte zugeordnet verwenden), aber das Problem dabei ist, dass es nicht viel Sinn in Computing (Pearsson) Korrelation zu IP-Adressen. Z.B. Was ist der Durchschnitt einer Reihe von IP-Adressen? (Dh es ist ein ungeordneter Satz ohne eine Abstandsmetrik.)

Je nachdem, was Sie tun möchten, würde ich entweder die IP-Adressen aus Korrelationsberechnung schließen (und vielleicht eine Hierarchie von IP-Adress-Sets entlang einiger einrichten) Logik und vergleichen Sie für diese) oder cluster die kontinuierlichen Variablen und sehen, was dies auf die IP-Adressen bedeutet. Auch hier kommt es auf Ihr Ziel an, aber ich denke, das ist kein reines Problem der R-Mechanik.