Ich werde beschreiben, was ich hier genauer im Detail meine. Angenommen, ich ein Datenblatt haben, die wie folgt aussieht: für Stackoverflow-FormatierungWie würde ich Zeilen basierend auf einem Wert in einer Spalte reduzieren?
+-----------+---------+---------+---------+---------+---------+---------+--------------+
| | Person1 | Person2 | Person4 | Person4 | Person5 | Person6 | City |
+-----------+---------+---------+---------+---------+---------+---------+--------------+
| January | - | - | Yes | - | Yes | - | SanFrancisco |
| Febuary | Yes | - | - | - | - | - | SanFrancisco |
| March | - | - | - | - | - | - | SanFrancisco |
| April | - | - | - | - | - | - | NewYork |
| May | Yes | - | - | - | - | - | NewYork |
| June | - | - | - | - | - | - | NewYork |
| July | - | - | - | - | Yes | - | NewYork |
| August | - | - | - | - | - | - | NewYork |
| September | - | - | - | - | - | - | Miami |
| November | - | - | - | - | - | Yes | Miami |
| December | - | - | - | - | - | - | Miami |
+-----------+---------+---------+---------+---------+---------+---------+--------------+
Ignorieren der ascii, Es ist eine einfache Tabelle, die 6 Personen verfolgt, basierend auf welcher Stadt sie waren in welchen Monaten.
Was ich nur wissen will ist, welche Leute welche Städte besucht haben. Effektiv die Liste kondensieren, um so zu sehen:
+---------+---------+---------+---------+---------+---------+--------------+
| Person1 | Person2 | Person4 | Person4 | Person5 | Person6 | City |
+---------+---------+---------+---------+---------+---------+--------------+
| Yes | - | Yes | - | Yes | - | SanFrancisco |
| Yes | - | - | - | Yes | - | NewYork |
| - | - | - | - | - | Yes | Miami |
+---------+---------+---------+---------+---------+---------+--------------+
Jede Reihe ist nur EINE Stadt und enthält, welche Leute sie besucht haben. Gibt es einen optimalen Weg dies zu tun, oder eher, gibt es eine Art von tr (squeeze)/sed-Werkzeug, das dies bereits tut? Wenn ich das programmieren müsste, was wäre dann die optimale Logik?
Sind die Zeilen 'Januar' und' SanFransisco' (zum Beispiel) konstant? Ich meine, kann eine Person in einer anderen Stadt im Januar oder nur in San Francisco sein? Zweitens, wie werden Ihre Daten dargestellt? Ist es ein Excel-Blatt? Eine Matrix? Eine 3D-Liste? –
Sie sind nicht konstant, und ihre aktuelle Lage ist nicht bekannt .. es ist nur "berühmte Städte, die Sie besucht haben" in diesem Jahr. Die Liste ist eine einfache TSV oder CSV in einem Excel-Blatt. Ich plane, mit einem Python-Skript daran zu arbeiten. Die ASCII-Zeichen sind hier zur besseren Übersicht dargestellt, weil SO aus irgendeinem Grund keine Tabellen einfügen kann. – Tom
Entschuldigung, dass ich das Problem nicht gut verstehe, aber was, wenn zum Beispiel Person 6 im Januar in Miami war? Wie wird es dargestellt? –