2016-07-13 24 views
2

Ich versuche, TraMineR zu verwenden, bin aber offen für Feedback/Referenzen/Links zu mehr Informationen darüber, wie man mehrkanalige oder hierarchische Ereignissequenzen und Algorithmen darstellt, die damit umgehen.wie Multichannel-Event-Sequenzen darzustellen

Ich habe eine komplexe Event-Struktur, die ich versuche herauszufinden, wie man als eine Sequenz darstellt. Es gibt verschiedene Arten von Ereignissen. Jeder Ereignistyp kann einen anderen Satz von Feldern (und eine unterschiedliche Anzahl von Feldern) haben. Zum Beispiel könnte das Alter ein Feld in einem Ereignistyp sein, während die Höhe ein Feld in einem anderen Ereignistyp sein könnte. Mein erster Instinkt (und ich glaube, ein gemeinsamer Ansatz) bestand darin, alles "abzuflachen", z. Jede mögliche Kombination von Werten für ein Ereignis ist ein eindeutiger Ereignistyp. Dies kann jedoch Muster in den generischen Ereignistypen verpassen.

Zum Beispiel, sagen wir, ich bin ein Hundezüchter und trinke viel Kaffee und ich möchte sehen, ob es Muster in meinen Kaffee/Hund Kaufgewohnheiten gibt (ja, dummes Beispiel). Ich hätte Ereignisse wie:

- Bought dog 
- Breed: hound 
- Sex: female 

- Bought coffee 
- Store: Starbucks 
- Roast: dark 

- Bought dog 
- Breed: hound 
- Sex: female 

- Bought coffee 
- Store: Starbucks 
- Roast: light 

- Bought dog 
- Breed: Doberman pincher 
- Sex: male 

Um die Daten zu glätten ich sagen kann, dass jede einzigartige Kombination aus Speicher und Braten eine einzigartige Kaffee kaufen Veranstaltung. Außerdem ist jede einzigartige Kombination von Rasse und Geschlecht eine einzigartige Hundekaufveranstaltung. Dieser Ansatz würde das obige Beispiel in 5 verschiedene Ereignistypen umwandeln (anstatt 2 Ereignistypen mit Feldern). Diese Darstellung könnte Muster wie die folgenden erkennen: Wenn ich 2 dunkle Röstkaffees von Starbucks trinke, dann bin ich eher von einem männlichen Dobermann Pincher.

Diese Darstellung kann jedoch allgemeinere Muster übersehen, die nicht von Feldwerten in den Ereignissen abhängen. Zum Beispiel kann es sein, dass ich einfach einen Hund kaufe, nachdem ich im Allgemeinen zwei Kaffee getrunken habe.

Ich möchte in der Lage sein, Muster auf beiden "Ebenen" zu erkennen und bin mir unsicher, wie ich die Ereignisse dafür darstellen soll. Natürlich wäre ein Ansatz, beide Darstellungen zu verwenden und dann einfach die Ergebnisse der beiden zu kombinieren.

So sind Fragen: 1. Irgendwelche Verbindungen/Zitate zu den Papieren, die sich damit beschäftigen? 2. Ist das ein häufiges Problem? 3. Gibt es Empfehlungen zur Darstellung dieser Ereignisse? 4. Irgendwelche Empfehlungen, wie man mit ihnen in TraMineR arbeitet 5. Irgendwelche Empfehlungen/Verbindungen/Verweise auf Algorithmen, die sich mit so etwas beschäftigen? 6. Irgendwelche Ideen?

Danke !!!

+0

Hat sich schon mal jemand mit diesem Problem beschäftigt? Ist das einzigartig? Ich finde das schwer zu glauben, aber ich habe nichts bekommen. – jojo

Antwort

2

Dies ist auf die Frage tatsächlich ähnlich hier gefragt (obwohl sie nicht wissen, „Multichannel“ zu verweisen, und der Titel war vage): Multiple events in traminer

Traminer Unterstützung wie für den Umgang mit mehrkanaligen Sequenzen mit Funktionen: seqdistmc

Der allgemeine Ansatz, glaube ich, ist genau das zu tun, was ich als unsere "flatten" Lösung umschrieb. In diesem Fall kombinieren Sie die Werte für jeden Kanal zu einem Ereignistyp. z.B. In meinem Beispiel würde dog.hound.female ein Ereignis mit einem Kanal/Feld sein, um das erste Ereignis in meinem Beispiel zu ersetzen, das 3 separate Felder/Kanäle hat. Sie verwenden dann die typischen Funktionen zum Auffinden von Distanzen, Subsequenzen usw. Sie haben jedoch Möglichkeiten, Substitutionskosten einzurichten und Entfernungen zu finden. Daher gibt es einige zusätzliche Optionen für diesen Multi-Channel-Ansatz. Es behandelt auch fehlende Werte, wenn Sie Kanäle mit unterschiedlicher Länge oder Lücken haben.

Dies ist auch ähnlich zu dem, was in der Antwort auf das oben verlinkte Thema vorgeschlagen wird, mit der nativen R-Funktion interaction.