Ich habe eine Spalte innerhalb eines Datenrahmens Langtextsequenzen enthalten (oft in den Tausenden von Zeichen) des Format:Wie ersetzen Sie Textfolgen, die in einem festen Muster enden, innerhalb einer langen Textzeichenfolge in R?
abab(VR) | ddee(NR) | def(NR) | fff(VR) | oqq | pqq | ppf(VR)
dh eine Schnur, ein Suffix in Klammern, dann ein Begrenzungszeichen
I ist versucht, die Syntax in R zu arbeiten, um die Elemente zu löschen, die in (VR) zu beenden, einschließlich des hinteren Rohr falls vorhanden, so dass ich mit links bin:
ddee(NR) | def(NR) | oqq | pqq
ich kann das nicht funktionieren Re gular expression (oder gsub), die diese Einträge entfernt und möchte anfordern, wenn mir bitte jemand helfen könnte.
Ich weiß, dass ich auch Einträge haben, wo es nur einen einzigen Eintrag gibt, d. H. Kein Rohrtrennzeichen. Gibt es eine einfache Möglichkeit, die Methode zu ändern, um "einzelne" Elemente zu berücksichtigen? z.B. "abc" ODER "abc (VR)" – Jon
@Jon Ich habe den Code so geändert, dass er für diese Situation funktioniert. – lmo