Suchen Sie nach einem awk (oder sed) Einzeiler, um Zeilen aus der Ausgabe zu entfernen, wenn das erste Feld ein Duplikat ist.Zeile entfernen, wenn das Feld doppelt vorhanden ist
Ein Beispiel zum Entfernen von doppelten Zeilen ich gesehen habe, ist:
awk 'a !~ $0; {a=$0}'
Versuchte es für eine Basis ohne Glück mit (Ich dachte, das Ändern der in $ 0 $ 1 ist würde den Trick tun, aber schien nicht zu funktionieren).
Sie fragte Linien zu entfernen ‚wenn der erste Feld Streichhölzer‘ ... was? Ich habe 'denselben Wert wie das erste Feld in einer vorherigen Eingabezeile' angenommen; eine andere Person nahm "ein bestimmtes Muster an". Was hast du vor? –
Ihre geänderte Version 'awk 'a! ~ $ 1; {a = $ 1} '' * funktioniert für mich * für benachbarte Duplikate (z. B. eine sortierte Datei). ** Die Version ** von Jonathan Leffler hat den Vorteil, dass Duplikate in einer unsortierten Datei entfernt werden, aber auf Kosten der Erstellung eines potenziell großen Arrays. –
Ich denke, mein Hauptproblem war, dass ich mit ein paar verschiedenen Arten von Feldtrennern zu tun hatte und FS nicht richtig definierte. – Kyle