-1

Ich arbeite an einigen Spielzeugmodellen für die aktuelle US-Präsidentschaftswahl. Es gibt vier Kandidaten und jeder wird einige Prozent der Stimmen gewinnen. Es ist mein Ziel, den Prozentsatz jedes Kandidaten vorherzusagen.Machine Learning - Vorhersage mehrerer Variablen, die zu 100% ergeben

Bis jetzt habe ich versucht, einen Datensatz mit einer gelernten Variablen (% vote rec'd) und mehreren Dutzend abhängigen Variablen zu erstellen. Mit WEKA habe ich mit MLP und mehreren anderen Lernmethoden experimentiert. Mein Problem ist, dass, sobald ich ein Modell für vote% lerne, meine Vorhersagen für jeden Kandidatenanteil der Stimme nie 100% ergeben.

Offensichtlich ist es in diesem Fall eine Notwendigkeit, dass der Gesamt% der erhaltenen Stimmen zu 100% addiert. Komme ich das Problem falsch an? Was kann ich tun, um meine Methode zu verbessern?

+0

Sie Normalisierung tun können, um die Daten zu standardisieren. Es stellt sicher, dass% summe 100 ist. – abhiieor

Antwort

0

Dies passiert, da die Interdependenz der Prozentsätze nicht in Ihren Gleichungen eingebettet scheint. Wenn Sie es von Grund auf neu schreiben würden, würden Sie irgendwo eine Gleichung einfügen, die v0 + v1 + v2 + v3 = 1 erzwingt. Diese werden Constraints genannt und sie werden verwendet, um Ihrer Gleichung etwas zugrunde liegende Physik aufzuzwingen, die sie ansonsten nicht respektieren würden .

Ich widersetze nicht abhiieors Antwort jedoch. Wenn Sie ein Modell haben, das Ihnen logisch erscheint, ist die Skalierung eine gute Option.

v0 = v0 * 100/(v0 + v1 + v2 + v3) usw.