ich die AWS CLI bin mit Dateien aus einem S3-Bucket meiner RBG kopieren einen Befehl wie unten verwenden:Wie AWS CLI zu verwenden, zu kopieren, nur Dateien in S3 Eimern, die ein bestimmtes Zeichenfolge Muster entsprechen
system(
"aws s3 cp s3://my_bucket_location/ ~/my_r_location/ --recursive --exclude '*' --include '*trans*' --region us-east-1"
)
Dies funktioniert wie erwartet, dh es kopiert alle Dateien in my_bucket_location, die "trans" im Dateinamen an dieser Stelle haben.
Das Problem, mit dem ich konfrontiert bin, ist, dass ich andere Dateien mit ähnlichen Namenskonventionen habe, die ich in diesem Schritt nicht importieren möchte. Als Beispiel in der Liste unten Ich möchte nur die ersten beiden Dateien kopieren, nicht die letzten beiden:
File list
trans_120215.csv
trans_130215.csv
sum_trans_120215.csv
sum_trans_130215.csv
Wenn ich regex wurde mit Ich konnte es wie "^trans_\\d+"
präziser machen nur die ersten beiden zu bringen Dateien, aber dies scheint mit AWS CLI nicht möglich zu sein. Also meine Frage ist, gibt es eine Möglichkeit, komplexere Musterabgleich mit AWS CLI wie unten zu haben?
system(
"aws s3 cp s3://my_bucket_location/ ~/my_r_location/ --recursive --exclude '*' --include '^trans_\\d+' --region us-east-1"
)
Bitte beachten Sie, dass ich nur Informationen über die betreffende Datei verwenden kann, das heißt, dass ich mit dem Muster eine Datei importieren möge "^trans_\\d+"
, ich nicht die Tatsache, dass die anderen unerwünschten Dateien zu Beginn sum_ enthalten kann , weil dies nur ein Beispiel ist, könnte es andere Dateien mit ähnlichen Namen wie "check_trans_120215.csv" geben.
Ich habe wie unter anderen Alternativen in Betracht gezogen, aber gehofft, es ist ein Weg, um den Kopierbefehl anzupassen eine dieser Strecken zu vermeiden hinunter:
- alle Artikel im Eimer Listing> mit regex in R geben Sie die Dateien, die ich will> nur die Dateien importieren
- den Kopierbefehl zu halten, wie es ist> löschen unerwünschte Dateien auf der R-Maschine nach der Kopie
ah ok, das ist eine Schande. Danke für die Information –