2016-06-10 15 views
0

Ich kann kein einfaches Pareto-Diagramm zeichnen.Erstellen eines Pareto-Diagramms in RapidMiner

Meine Daten wie folgt aussieht:

enter image description here

und wenn ich versuche, ein Pareto-Diagramm zu erstellen, bekomme ich einen leeren Raum, kann ich auch keinen Wert auswählen, für „Wert Count“:

enter image description here

Was fehlt mir hier? Meine Beispieldaten werden in diesem XML gespeichert:

<?xml version="1.0" encoding="UTF-8" standalone="no"?> 
<process version="5.3.015"> 
    <context> 
    <input/> 
    <output/> 
    <macros/> 
    </context> 
    <operator activated="true" class="process" compatibility="5.3.015" expanded="true" name="Process"> 
    <process expanded="true"> 
     <operator activated="true" class="generate_data_user_specification" compatibility="5.3.015" expanded="true" height="60" name="Generate Data by User Specification" width="90" x="447" y="75"> 
     <list key="attribute_values"> 
      <parameter key="category" value="&quot;black&quot;"/> 
      <parameter key="Incidents" value="10"/> 
     </list> 
     <list key="set_additional_roles"/> 
     </operator> 
     <operator activated="true" class="generate_data_user_specification" compatibility="5.3.015" expanded="true" height="60" name="Generate Data by User Specification (2)" width="90" x="447" y="390"> 
     <list key="attribute_values"> 
      <parameter key="category" value="&quot;blue&quot;"/> 
      <parameter key="Incidents" value="2"/> 
     </list> 
     <list key="set_additional_roles"/> 
     </operator> 
     <operator activated="true" class="generate_data_user_specification" compatibility="5.3.015" expanded="true" height="60" name="Generate Data by User Specification (3)" width="90" x="447" y="210"> 
     <list key="attribute_values"> 
      <parameter key="category" value="&quot;green&quot;"/> 
      <parameter key="Incidents" value="7"/> 
     </list> 
     <list key="set_additional_roles"/> 
     </operator> 
     <operator activated="true" class="generate_data_user_specification" compatibility="5.3.015" expanded="true" height="60" name="Generate Data by User Specification (4)" width="90" x="447" y="165"> 
     <list key="attribute_values"> 
      <parameter key="category" value="&quot;white&quot;"/> 
      <parameter key="Incidents" value="8"/> 
     </list> 
     <list key="set_additional_roles"/> 
     </operator> 
     <operator activated="true" class="generate_data_user_specification" compatibility="5.3.015" expanded="true" height="60" name="Generate Data by User Specification (5)" width="90" x="447" y="300"> 
     <list key="attribute_values"> 
      <parameter key="category" value="&quot;red&quot;"/> 
      <parameter key="Incidents" value="2"/> 
     </list> 
     <list key="set_additional_roles"/> 
     </operator> 
     <operator activated="true" class="generate_data_user_specification" compatibility="5.3.015" expanded="true" height="60" name="Generate Data by User Specification (6)" width="90" x="447" y="480"> 
     <list key="attribute_values"> 
      <parameter key="category" value="&quot;Yellow&quot;"/> 
      <parameter key="Incidents" value="1"/> 
     </list> 
     <list key="set_additional_roles"/> 
     </operator> 
     <operator activated="true" class="generate_data_user_specification" compatibility="5.3.015" expanded="true" height="60" name="Generate Data by User Specification (7)" width="90" x="447" y="705"> 
     <list key="attribute_values"> 
      <parameter key="category" value="&quot;Gray&quot;"/> 
      <parameter key="Incidents" value="1"/> 
     </list> 
     <list key="set_additional_roles"/> 
     </operator> 
     <operator activated="true" class="generate_data_user_specification" compatibility="5.3.015" expanded="true" height="60" name="Generate Data by User Specification (8)" width="90" x="447" y="840"> 
     <list key="attribute_values"> 
      <parameter key="category" value="&quot;Navy&quot;"/> 
      <parameter key="Incidents" value="1"/> 
     </list> 
     <list key="set_additional_roles"/> 
     </operator> 
     <operator activated="true" class="generate_data_user_specification" compatibility="5.3.015" expanded="true" height="60" name="Generate Data by User Specification (9)" width="90" x="447" y="570"> 
     <list key="attribute_values"> 
      <parameter key="category" value="&quot;Purple&quot;"/> 
      <parameter key="Incidents" value="1"/> 
     </list> 
     <list key="set_additional_roles"/> 
     </operator> 
     <operator activated="true" class="append" compatibility="5.3.015" expanded="true" height="220" name="Append" width="90" x="715" y="120"/> 
     <connect from_op="Generate Data by User Specification" from_port="output" to_op="Append" to_port="example set 1"/> 
     <connect from_op="Generate Data by User Specification (2)" from_port="output" to_op="Append" to_port="example set 5"/> 
     <connect from_op="Generate Data by User Specification (3)" from_port="output" to_op="Append" to_port="example set 4"/> 
     <connect from_op="Generate Data by User Specification (4)" from_port="output" to_op="Append" to_port="example set 2"/> 
     <connect from_op="Generate Data by User Specification (5)" from_port="output" to_op="Append" to_port="example set 3"/> 
     <connect from_op="Generate Data by User Specification (6)" from_port="output" to_op="Append" to_port="example set 6"/> 
     <connect from_op="Generate Data by User Specification (7)" from_port="output" to_op="Append" to_port="example set 9"/> 
     <connect from_op="Generate Data by User Specification (8)" from_port="output" to_op="Append" to_port="example set 7"/> 
     <connect from_op="Generate Data by User Specification (9)" from_port="output" to_op="Append" to_port="example set 8"/> 
     <connect from_op="Append" from_port="merged set" to_port="result 1"/> 
     <portSpacing port="source_input 1" spacing="0"/> 
     <portSpacing port="sink_result 1" spacing="0"/> 
     <portSpacing port="sink_result 2" spacing="0"/> 
    </process> 
    </operator> 
</process> 
+0

Verwenden Sie die neueste Version von RapidMiner? – awchisholm

+0

Ich verwende hauptsächlich RapidMiner 5.3.15, aber ich habe gerade den Prozess auf RapidMiner 7.1.1 mit dem gleichen Ergebnis versucht. – Ali

+0

Incidents ist ein numerisches Attribut - es sieht so aus, als ob der Pareto-Plotter polynominale Attribute benötigt. – awchisholm

Antwort

0

So fand ich eine Abhilfe (dank Andrew), die für dieses Beispiel nur gesetzt, arbeitet.

Ich musste es "aggregieren" und ein neues Polynom-Attribut mit dem gleichen Wert für jedes Beispiel hinzufügen.

Dann könnte ich ein Pareto-Diagramm, gruppieren nach 'Kategorie' und setzen Sie die Count-Spalte auf das neue Attribut.

enter image description here

Blei zu diesem Diagramm:

enter image description here

Als ich dies mit meinem Dataset erhalte ich diese Grafik:

enter image description here

Ich denke, ohne in der Lage zu konfigurieren Sie das Pareto - Diagramm, es ist wirklich schlecht für viele verschiedene Werte in der Gruppierung nach Kategorie.