In meinem C# -Programm habe ich eine Google-Suchfunktion geschrieben, bei der die Quelle von jeder Seite abgerufen und die URLs über Regex abgerufen werden.Regex für URL C#
Meine eigentliche Regex ist:
(?:(?:(?:http)://)(?:w{3}\\.)?(?:[a-zA-Z0-9/;\\?&=:\\-_\\$\\+!\\*'\\(\\|\\\\~\\[\\]#%\\.])+)
Dies ist im Moment gut funktioniert, aber ich beispielsweise URLs wie http://www.example.com/forums/arcade.php?efdf=332
Ich mag einfach die URL in diesem Fall erhalten, ohne die ?efdf=332
bei der Ende.
Also, wie sollte ich die Regex ändern?
Hallo Omegavirus, willkommen zu Stack Overflow. Ich habe bemerkt, dass Sie sich viel Mühe gegeben haben, um Ihre Regex korrekt zu formatieren, aber Sie hätten es viel einfacher haben können. Fügen Sie einfach den Originalregex ein, markieren Sie ihn und drücken Sie Strg-K. Dies formatiert den Text als wörtlichen Text (wie HTML 'pre' Tag). Viel weniger Fehlerpotenzial. –
oh ich wusste das nicht, danke;) und die Regex ist von meinem C# -Programm so sind maskiert. vergaß das zu sagen. – Omegavirus
Verwenden Sie in C# Verbatim-Zeichenfolgen ('@" foo "') mit Regexes. Dann müssen Sie Ihren Backlashes nicht entkommen. Du wirst sonst verrückt werden. Regexes sind hart genug, um schon zu lesen ... –