Ich versuche, UTF-8 aus einer Textdatei zu lesen und einige tokenization zu tun, aber ich habe Probleme mit der Codierung:Lesen von Daten von UTF-8-Textdatei und tokenize
try {
fis = new FileInputStream(fName);
} catch (FileNotFoundException ex) {
//...
}
DataInputStream myInput = new DataInputStream(fis);
try {
while (thisLine = myInput.readLine()) != null) {
StringTokenizer st = new StringTokenizer(thisLine, ";");
while (st.hasMoreElements()) {
// do something with st.nextToken();
}
}
} catch (Exception e) {
//...
}
und Datainputstream hat keine Parameter um die Kodierung einzustellen!
Eine grobe Orientierung zu Java-Zeichencodierung: http://illegalargumentexception.blogspot.com/2009/05/java-rough-guide-to-character-encoding.html – McDowell