1
ich eine Textdatei müssen tokenize tokenize wo Token durch "[a-zA-Z] +" Folgende Arbeiten sind definiert:Verwenden Scanner eine Datei
Pattern WORD = Pattern.compile("[a-zA-Z]+");
File f = new File(...);
FileInputStream inputStream = new FileInputStream(f);
Scanner scanner = new Scanner(inputStream); e problem is
String word = null;
while((word = scanner.findWithinHorizon(WORD, (int)f.length())) != null) {
// process the word
}
Das Problem ist, dass findWithinHorizon
int
erfordert als der Horizont, während die Dateilänge vom Typ long
ist.
Was ist eine sinnvolle Möglichkeit, eine große Datei mit einem Scanner zu tokenisieren?