2012-10-09 6 views
5

Ich brauche Ihre Hilfe bezüglich der Gewichte in Weka. Ich mache einige Experimente mit großen Datenmengen: Ich übersetze die Daten in Instanzen und benutze verschiedene Klassifikatoren, um zu studieren. Nun möchte ich untersuchen, wie sich das Beziehen von Gewichten auf Instanzen auf das Studieren auswirkt - manchmal möchte ich eine Instanz mit einem Gewicht und manchmal auch nicht mit einem Gewicht versehen. Meine Frage ist:Wie benutzt man Gewichte in Weka?

  1. Was ist der Bereich der Gewichte möglich?
  2. Weicht der Gewichtsunterschied von Klassifikator zu Klassifikator ab?
  3. Gibt es ein Standardgewicht (ich sah irgendwo, dass es 1 sein könnte, aber ich möchte es beruhigen)?
  4. Jede Bezugnahme auf relevante Informationen würde :)

Antwort

7

Die Antwort geschätzt werden beeinflusst auf Frage 2 „ja“, und dass auch die Antwort 1. Grundsätzlich in Frage zu stellen, geht Weka nur die Gewichte auf den tatsächlichen Klassifizierungsalgorithmus Der Bereich der zulässigen Gewichtungen und ihre Verwendung hängt vollständig von der Implementierung des Klassifikators ab. In Bezug auf Frage 3 wird das Standardgewicht allen Instanzen das gleiche Gewicht geben, die tatsächliche Anzahl ist nicht so wichtig.

Zum Beispiel ignoriert der Nächste-Nachbarn-Klassifikator die Gewichte vollständig, obwohl er alle Gewichtswerte annehmen wird. Theoretisch könnten Nearest Neighbour-Klassifikatoren implementiert werden, um Gewichtungen zu berücksichtigen, aber dies ist nicht der Fall. Die Antwort auf Frage 2 wäre also, dass es sogar noch mehr auf die spezielle Implementierung des Klassifikators ankommt als der Klassifikatoralgorithmus.

1

ich eine XRFF-Datei mit folgendem Inhalt:

<dataset name="Weka" version="3.7.13-SNAPSHOT"> 
    <header> 
     <attributes> 
     <attribute name="Nombre" type="nominal"> 
      <labels> 
       <label>Alcohol</label> 
       <label>Opioides</label> 
       <label>Cannabinoides</label> 
       <label>Benzodiacepinas</label> 
       <label>Cocaina</label> 
       <label>Anfetaminas_y_derivados</label> 
      </labels> 
      <metadata> 
        <property name="weight">0.2</property> 
      </metadata> 
     </attribute> 
     <attribute name="Tendencia_a_discutir" type="nominal"> 
      <labels> 
       <label>No</label> 
       <label>Yes</label> 
      </labels> 
      <metadata> 
        <property name="weight">0.5</property> 
      </metadata> 
     </attribute> 
     <attribute name="Agresion" type="nominal"> 
      <labels> 
       <label>No</label> 
       <label>Yes</label> 
      </labels> 
      <metadata> 
        <property name="weight">0.5</property> 
      </metadata> 
     </attribute> 
. 
. 
. 
     <instance> 
      <value>Anfetaminas_y_derivados</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>No</value> 
      <value>No</value> 
      <value>Yes</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>Yes</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>No</value> 
      <value>No</value> 
      <value>Yes</value> 
      <value>No</value> 
      <value>No</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>Yes</value> 
      <value>No</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
     </instance> 
     </instances> 
    </body> 
</dataset> 

Aber ich kann sehen, ob Weka die Gewichte verwendet, wenn ich NaivesBayes anwenden. Meine folgenden schlagen vor, sie ändern den Code des Algorithmus AttributeSelectedClassifier, Gewichte zu verwenden.