Wie kann ich mit der UNIX-Shell zählen, wie oft ein Buchstabe in einer Textdatei angezeigt wird?

Ich habe ein paar Textdateien und ich möchte zählen, wie oft ein Buchstabe in jedem erscheint?Wie kann ich mit der UNIX-Shell zählen, wie oft ein Buchstabe in einer Textdatei angezeigt wird?

Insbesondere möchte ich die UNIX-Shell dazu verwenden, in Form von: Cat-Datei | .... mach was ...

Gibt es eine Möglichkeit, dass ich den wc-Befehl dazu bringen kann?

Quelle

2009-09-02 samoz

cat Datei | ist ein Nein, nein, denke nicht einmal daran. Meist wird es mit weniger oder Grep verwendet, wo die Katze nicht benötigt wird. Bitte verwenden Sie nicht cat, wenn Sie die Datei nicht einfach ausgeben wollen. –

cat ist tatsächlich nützlich, um die RAM-Nutzung auf ein Minimum zu beschränken. Es ist nützlich, wenn Sie mit großen Dateien arbeiten, da es zeilenweise durch die Pipeline fließt. – Goran

grep char -o filename | wc -l

Quelle

2009-09-02 15:59:50 SilentGhost

Hinweis für diejenigen, die zunächst wie ich verwirrt sind, ersetzen Sie "char" durch das Zeichen oder die Zeichenfolge, die Sie suchen. – rlorenzo

Außerdem haben die meisten grep-Implementierungen eine "-c" -Option zum Zählen. –

Das obige funktioniert auch für Strings, also 'grep -o | wc -l ist die generische Version. ZB: 'grep, -o myfile.txt | wc -l zählt die Anzahl der Kommas in myfile.txt und 'grep abcd -o myfile.txt | wc -l zählt die Anzahl von 'abcd's in myfile.txt – arun

versuchen Sie es mit

grep [PATTERN] -o [FILE] | wc -l

und benutzen Sie bitte Katze nicht, wenn nicht benötigt.

Quelle

2009-09-02 16:02:52

Was ist falsch mit der Verwendung von Katze? – samoz

es zählt nicht mehrere Zeichen pro Zeile – SilentGhost

@samoz: Katze ist falsch, da es die gelesene Datei in ein anderes Programm eingeben sollte - das andere Programm ist in der Lage, die Datei selbst zu lesen, so dass die Verwendung von Cat nicht benötigt wird und kompliziert die Codezeile. @SilentGhost: Ihr Recht. –

Alternative zu grep:

sed 's/[^x]//g' filename | tr -d '\012' | wc -c

wo x das Zeichen, das Sie zählen wollen, ist.

Quelle

2009-09-02 16:12:17 hlovdal

gibt es auch awk:

$ echo -e "hello world\nbye all" | awk -Fl '{c += NF - 1} END {print c}' 
5

ändern -Fl zu -F<your character>.

von -F angegeben Dies funktioniert, indem das Feld Trennzeichen das Zeichen Einstellung, dann in jeder Zeile die Anzahl der Felder akkumulieren - 1 (denn wenn es ein Trennzeichen ist, gibt zwei Felder sind - aber wir sollten nur 1 zählen).

Quelle

2009-09-02 16:21:30

Eine weitere Alternative:

tr -d -C X <infile | wc -c

wobei X das Zeichen oder die Zeichenfolge, die Sie wollen, zu zählen und infile ist die Eingabedatei.

Quelle

2009-09-02 17:04:17

Dies ist sauberer als die angenommene Antwort (die auf der Tatsache beruht, dass die Ausgabe von 'grep -o' durch Zeilentrenner getrennt ist). Dies funktioniert auch mit jedem Zeichen (einschließlich '\ n') – Camusensei

ist hier eine andere Art und Weise

cat input_file | \ 
awk 'BEGIN {FS="x"; var=0 } \ 
{if (NF>0){ var=var + (NF-1) } } \ 
END{print var}'

wobei X das Zeichen oder die Zeichenfolge, die Sie wollen, zu zählen und infile ist die Eingabedatei

Quelle

2012-07-12 06:33:49 user1011046

Nizza' UUOC' dort – Camusensei

awk '{ printf "%s\n", gsub("ur_char", "oth_char", $0) }' <your_file_name> output.txt

Sie Anzahl der aktuellen Zeilennummer hinzufügen können, um bekomme die Zeilennummern auch in awk.

Quelle

2012-08-29 15:50:30 dantesan

Echo "a/b/c/d/e/f/g" | awk -F "/" '{print NF}'

dies wird die Anzahl des Auftretens von Zeichen "/"

Quelle

2013-07-10 13:38:05 aravinda

Dies funktioniert nicht mit mehrzeiligen Eingabe – Camusensei

In diesem Fall geben, i'am den Charakter zu zählen "|":

expr `wc -c < filename` \- `tr -d \| < filename | wc -c`

Quelle

2015-02-26 16:29:34 Vinicius

Sie können ganz einfach versuchen: grep -c 'YOUR LETTER' YOUR FILE

Quelle

2017-08-21 13:58:27

die Nummer wird auf der Shell angezeigt, in der Newline –

Wie kann ich mit der UNIX-Shell zählen, wie oft ein Buchstabe in einer Textdatei angezeigt wird?

Antwort

Verwandte Themen