2011-01-02 12 views
1

Ich habe einige Hausaufgaben in Themenerhebungen und Diagrammen. Die erste Aufgabe besteht darin, die Eingabe einer Umfrage zu normalisieren, da sich die Struktur der Daten von Zeit zu Zeit ändert. So gibt es drei Arten von Umfragen:Umfrage Statistik Diagramm Ideen

  • statische Felder, in denen Text
  • dynamische diejenigen gespeichert ist, in dem der Benutzer eine Option
  • und Mehrfachauswahl Felder auswählen können, in denen der Benutzer mehrere Optionen auswählen können

Also ich bin nicht wirklich ein Statistik-Typ, also habe ich wirklich keine Ahnung, was ich mit diesen eingehenden Daten tun kann.

Also die Daten, die ich habe, sind in einer riesigen XML-Datei von dort gespeichert. Ich kann leicht herausfinden, wie oft eine Umfrage ausgefüllt wurde und wie oft ein Feld ausgefüllt wurde, also kann ich (zB auf einem Kreisdiagramm) zeigen die Beziehung von gefüllt oder nicht gefüllt). Die zweite Idee besteht darin, die Beziehung zwischen dem Inhalt eines Multioptionselements mit Hilfe eines Balkendiagramms oder so darzustellen.

Im Fall der Multi-Option-Elemente habe ich die Idee, Daten implizit von einer Option zu zeigen. Aber die Frage ist, was könnte gezeigt werden?

Das andere Problem sind die statischen Elemente (Textfelder und so). Welche Daten könnten von einem einzelnen Feld dargestellt werden?

Die Daten im XML-Bereich werden von 2001 bis 2005 gesammelt. Vielleicht kann ich mit den Daten der Umfragen arbeiten, aber wie gesagt, ich weiß nicht wirklich, wie man die Daten verarbeitet, um so viel wie zu sammeln möglich, um wirklich viele Diagramme zu erstellen.

Antwort

0

Nach Ihren Daten zu normalisieren (die schwieriger als die Sichtbarmachung Teil Ihrer Arbeit sein könnte), können Sie das Folgende tun:

  • Ihre statischen Felder anzuzeigen, die Texte enthält, könnten Sie theese Text recode zu neuen Variablen, die weniger Kategorien enthalten, die auf ein Diagramm/Diagramm passen könnten. Eine andere Möglichkeit besteht darin, Wortwolken der Texte zu erstellen - wie auf wordle.net.
  • Die dynamischen Felder, die jeweils nur eine Antwort enthalten, können am einfachsten angezeigt werden. Sie könnten ein Kreisdiagramm erstellen, um die Prozentsätze der Attribute anzuzeigen, oder vielmehr ein Balkendiagramm, das auch Prozentsätze/Dichten oder Häufigkeiten anzeigen kann (siehe z. B. das ggplot2-Paket in R).
  • Um die Multiselect-Felder anzuzeigen, sollten Sie das Datum in das entsprechende Format umstrukturieren (ich weiß nicht, wie es jetzt aussieht). Dies könnte durch verschiedene Tabellen geschehen, die die Zählungen (Häufigkeiten) für jede Kategorie in allen Variablen anzeigen. Zum Beispiel: 187 Leute aßen Schokolade, 160 aßen Brot und 50 Leute aßen gestern Pizza. Sie können dann die Werte einfach per Balkendiagramm anzeigen. Achten Sie darauf: Die Summe dieser Werte stimmt nicht mit der Stichprobengröße überein, da jeder mehrere Werte auswählen kann, so dass ein Tortendiagramm eine wirklich schlechte Wahl wäre.

Ich hoffe, ich könnte helfen.

0

Ich würde Tortendiagramme nicht empfehlen. Verwenden Sie stattdessen Balkendiagramme oder Punktdiagramme. Es ist viel einfacher, ähnliche Frequenzen für verschiedene Kategorien in ihnen zu unterscheiden. Es ist fast immer auch eine gute Idee, die Kategorien nach Frequenzen zu sortieren. Hier finden Sie einen kurzen Artikel über warum Pie Charts Are Bad.

3D-Diagramme können gut aussehen und sind eine nette Möglichkeit, Leute mit wenig Wissen über Datenvisualisierung zu beeindrucken (was vielleicht das ist, was Sie brauchen ;-)). Aber sie werden von den meisten Experten als schlechte Praxis angesehen, weil die Verwendung zusätzlicher Dimensionen, die nicht unbedingt benötigt werden, den Leser von den tatsächlichen Daten ablenkt.

Persönlich denke ich, dass Kreuztabellen und scatter plots ziemlich selbsterklärende Möglichkeiten der Darstellung von Beziehungen zwischen zwei Dimensionen von Daten sind.

Es ist oft eine gute Idee, einige grundlegende Statistiken zusammen mit Diagrammen zu erstellen, aber stellen Sie sicher, dass Sie dies nur tun, wenn es angemessen ist. Sehen Sie diese Wikipedia article, wenn Sie lernen möchten, welche univariaten Statistiken (wie ein Mittelwert zum Beispiel) für welche Daten geeignet sind.

Wenn Sie ernsthaft über Datenvisualisierung lernen wollen, kann ich die books by Edward Tufte über das Thema sehr empfehlen. Sie sind wirklich eine Freude zu lesen. Obwohl sie auf einer soliden wissenschaftlichen Grundlage stehen, sind sie leicht zu verstehen, selbst wenn sie wenig oder keinen Hintergrund in diesem Bereich haben.

Viel Glück, Alex