Ich suche nach einer Textanalyse in einem Programm, das ich schreibe. Ich suche nach alternativen Textquellen in seiner rohen Form, ähnlich wie bei den Wikipedia-Dumps (download.wikimedia.com).Wo finde ich einen Absturz von Rohtext im Internet?
Ich würde lieber nicht durch die Mühe gehen Webseiten crawlen, die HTML zu analysieren versucht, extrahieren Text etc ..
+1 Ich kam hierher, um PG zu veröffentlichen. – Joe