Ich muss eine Reihe von Statistiken aus Text analysieren, und sie sind alle als Zahlen formatiert.Regex, das alles vor einem bestimmten Zeichen entspricht?
Zum Beispiel dieser Absatz:
Insgesamt 81,8 Prozent von New York Stadt Schüler der Klassen 3 bis 8 sind erfüllt oder übertrifft Grade-Niveau Mathematik Standards, im Vergleich zu 88,9 Prozent der Studenten im Rest des Staates.
Ich möchte nur die 81 und 88 Zahlen, nicht die ".8" und ".9", die folgen.
Wie kann ich das tun? Ich habe den Begriff Rückverweis oder Look-Ahead oder sowas gehört. Wird irgendwas davon helfen?
Ich benutze C#.
Edit: Es ist erforderlich, dass ich die "3" und die "8" im obigen Beispiel erhalten. Es ist nur ein einfaches Beispiel, aber ich brauche so ziemlich alle Zahlen.
Die Zahlen hinter dem Komma sind statistisch signifikant über eine große Bevölkerung. Ich würde den Ausdruck "Prozent" verwenden, um die relativen Zahlen zu finden. – Craig
Craig - Ich verstehe nicht, was du meinst - ich habe das nur als Beispiel benutzt - meine reellen Zahlen sind keine Prozentsätze. Ich muss nur die Zeichen entfernen, die nach dem "." und andere Muster, wie "e +". Dies war nur ein sehr einfaches Beispiel. –