Ich habe eine Reihe von Daten, die wie dieseSuche nach mehreren konditionierten String mit awk
col1 col2 col3 col4
ABC1 DEF1 GHI1 cond1
ABC2 DEF2 GHI2 cond1-cond2
ABC3 DEF3 GHI3 cond2/cond1
ABC4 DEF4 GHI4 cond2 cond1
ABC5 DEF5 GHI5 cond4/cond1
ABC6 DEF6 GHI6 cond1
ABC7 DEF7 GHI7 mcond1
ABC8 DEF8 GHI8 cond2
ABC9 DEF9 GHI9 cond1 at 50
ABCa DEFa GHIa con cond1
ABCb DEFb GHIb no. cond1
ABCc DEFc GHIc cond1 something
ABCc DEFc GHIc Mcond1
ein paar Befehle zu schreiben Ich versuche, sieht die Daten zu trennen nach dem „col4“ zu bekommen:
Eine Datei, die die Zeichenfolge "cond1" mit ALLEN davor oder danach enthält, außer für die Buchstaben "M" und "m". Ich bin derzeit mit diesem Befehl (nicht M und m nicht ausschließt, natürlich) dafür:
awk 'BEGIN{IGNORECASE=1} $4 ~ /.cond1/ || $4 ~ /cond1./ ' /filepath.tab
bitte auch nicht, dass die 4., 9. und dem 11. Datenzeilen enthält Leerzeichen zwischen „cond1“ und andere Strings, ich möchte dies in der Datei enthalten. (Nicht der „“ in dem Befehl Leerzeichen?)
ich einen Befehl schrieb eine Datei zu erhalten, die ‚cond1‘ nur in dem ‚col4‘
awk 'BEGIN{IGNORECASE=1} $4 ~ /^cond1$/ ' /filepath.tab
es enthält funktioniert gut mit dem meisten obwohl die Daten, ich bin immer diese 2 Fehler in den Ergebnissen:
ABC9 DEF9 GHI9 cond1 at 50 ABCc DEFc GHIc cond1 something
Kann jemand bitte helfen Sie mir mit diesen 2 Befehlen? Danke.
ich für eine Leistung von 3 Dateien suchen, die keine Duplikate enthält, hier ein Beispiel: File1 (enthält alle Kombinationen mit cond1):
col1 col2 col3 col4
ABC2 DEF2 GHI2 cond1-cond2
ABC3 DEF3 GHI3 cond2/cond1
ABC4 DEF4 GHI4 cond2 cond1
ABC5 DEF5 GHI5 cond4/cond1
ABC9 DEF9 GHI9 cond1 at 50
ABCa DEFa GHIa con cond1
ABCb DEFb GHIb no. cond1
ABCc DEFc GHIc cond1 something
File2 (mit cond1 allein):
col1 col2 col3 col4
ABC1 DEF1 GHI1 cond1
ABC6 DEF6 GHI6 cond1
File3 (enthält alles, was nicht in file1 und file2 enthalten war):
col1 col2 col3 col4
ABC7 DEF7 GHI7 mcond1
ABC8 DEF8 GHI8 cond2
ABCc DEFc GHIc Mcond1
Beachten Sie, dass die Gesamtzahl der Zeilen der 3 Dateien der Originaldatei entspricht. Es tut mir leid, wenn das ziemlich kompliziert klingt, aber das ist der Fall, den ich tatsächlich habe.
Was ist Ihr Wunsch Ausgabe! –
Was ist der Separator zwischen den Säulen? ist es tab? wenn seine Spalte in der 11. Zeile in der 4. Spalte nicht 'cond1' enthält. Es ist 5. Spalte dort –
Ja, es ist eine Tab-getrennte Datei, und manchmal gibt es einen einzigen Abstand zwischen Wörtern. (und ich bin mir sicher, dass es keine anderen Spalten ist, da dies eine große Datei war und ich Schnitt verwendete, um diese 4 Spalten herauszunehmen) – Error404